« ThinkAct » : différence entre les versions

Version du 27 février 2026 à 14:40

en construction

Définition

Architecture de raisonnement vision-langage-action ou VLA qui entraîne un grand modèle de langues multimodal à générer des plans de raisonnement guidés par des récompenses visuelles alignées.

Voir aussi alignement de l'IA

Français

ThinkAct

Anglais

ThinkAct

A reasoning vision-language-action framework that trains a multimodal large language model to generate embodied reasoning plans guided by reinforcing action-aligned visual rewards based on goal completion and trajectory consistency.

Sources

Source : GitHub.io

Source : huggingface

Version du 12 octobre 2025 à 11:52 (voir la source) Arianne (discussion \| contributions) Aucun résumé des modifications ← Modification précédente		Version du 27 février 2026 à 14:40 (voir la source) Arianne (discussion \| contributions) Aucun résumé des modifications Modification suivante →
Ligne 19 :		Ligne 19 :
	[https://huggingface.co/papers/2507.16815l Source : huggingface]		[https://huggingface.co/papers/2507.16815l Source : huggingface]

	[[Catégorie:~~vocabulary~~]]		[[Catégorie:publication]]

« ThinkAct » : différence entre les versions