ThinkAct
en construction
Définition
Architecture de raisonnement vision-langage-action ou VLA qui entraîne un grand modèle de langues multimodal à générer des plans de raisonnement guidés par des récompenses visuelles alignées.
Français
ThinkAct
Anglais
ThinkAct
A reasoning vision-language-action framework that trains a multimodal large language model to generate embodied reasoning plans guided by reinforcing action-aligned visual rewards based on goal completion and trajectory consistency.
Sources
Contributeurs: Arianne Arel, wiki
