« ThinkAct » : différence entre les versions

Version du 12 octobre 2025 à 11:52

en construction

Définition

Architecture de raisonnement vision-langage-action ou VLA qui entraîne un grand modèle de langues multimodal à générer des plans de raisonnement guidés par des récompenses visuelles alignées.

Voir aussi alignement de l'IA

Français

ThinkAct

Anglais

ThinkAct

A reasoning vision-language-action framework that trains a multimodal large language model to generate embodied reasoning plans guided by reinforcing action-aligned visual rewards based on goal completion and trajectory consistency.

Sources

Source : GitHub.io

Source : huggingface

@@ Ligne 3 : / Ligne 3 : @@
 == Définition ==
 Architecture de raisonnement ''vision-langage-action'' ou VLA qui entraîne un '''[[grand modèle de langues multimodal]]''' à générer des plans de raisonnement guidés par des récompenses visuelles alignées.
+Voir aussi '''[[alignement de l'IA]]'''
 == Français ==

« ThinkAct » : différence entre les versions