SAIL-VL2
Définition
Modèle fondateur de génération image-à-texte conçu pour une compréhension et un raisonnement multimodaux complets. Il atteint des performances de pointe dans divers tests de performance grâce à la curation des données, à l'entraînement progressif et à l'architecture de mixture d'experts creuse.
Voir aussi entraînement
Français
SAIL-VL2
Anglais
SAIL-VL2
Vision-language foundation model for comprehensive multimodal understanding and reasoning. It achieves state-of-the-art performance across diverse benchmarks through data curation, progressive training, and sparse MoE architecture.
Sources
Contributeurs: Arianne Arel, wiki





