« LongVILA » : historique des versions


Sélection du diff : cochez les boutons radio des versions à comparer et appuyez sur entrée ou sur le bouton en bas.
Légende : (actu) = différence avec la dernière version, (diff) = différence avec la version précédente, m = modification mineure.

14 juillet 2025

  • actudiff 09:1514 juillet 2025 à 09:15Pitpitt discussion contributions 720 octets +720 Page créée avec « ==en construction== == Définition == XXXXXXXXX == Français == ''' LongVILA''' == Anglais == '''LongVILA''' A comprehensive framework that enables vision-language models to perform complex reasoning on long videos using reinforcement learning. The work addresses the significant challenge of understanding hour-long videos that require temporal, spatial, goal-oriented, and narrative reasoning capabilities.  A framework for scaling vision-language models... »
Récupérée de « https://datafranca.org/wiki/LongVILA »