« SAIL-VL2 » : différence entre les versions

Version du 10 mars 2026 à 21:20

Définition

Modèle fondateur de génération image-à-texte conçu pour une compréhension et un raisonnement multimodaux complets. Il atteint des performances de pointe dans divers tests de performance grâce à la curation des données, à l'entraînement progressif et à l'architecture de mixture d'experts creuse.

Voir aussi entraînement

Français

SAIL-VL2

Anglais

SAIL-VL2

Vision-language foundation model for comprehensive multimodal understanding and reasoning. It achieves state-of-the-art performance across diverse benchmarks through data curation, progressive training, and sparse MoE architecture.

Sources

Source : arxiv

Source : GitHub

Source : huggingface

Version du 10 mars 2026 à 13:45 (voir la source) Arianne (discussion \| contributions) Aucun résumé des modifications ← Modification précédente		Version du 10 mars 2026 à 21:20 (voir la source) Pitpitt (discussion \| contributions) Aucun résumé des modifications Modification suivante →
Ligne 20 :		Ligne 20 :
	[https://huggingface.co/papers/2509.14033 Source : huggingface]		[https://huggingface.co/papers/2509.14033 Source : huggingface]

	[[Catégorie:~~publication~~]]		[[Catégorie:GRAND LEXIQUE FRANÇAIS]]

« SAIL-VL2 » : différence entre les versions