« UniVideo » : différence entre les versions
(Page créée avec « == EN CONSTRUCTION == == Définition == xxxxx == Français == '''UniVideo''' == Anglais == '''xxxUniVideoxx ''' A unified framework that combines video understanding, generation, and editing capabilities within a single model. Unlike existing approaches that handle these tasks separately, UniVideo can interpret complex multimodal instructions and perform diverse video operations through a dual-stream architecture. The system demonstrates strong performance a... ») |
Aucun résumé des modifications |
||
| (Une version intermédiaire par un autre utilisateur non affichée) | |||
| Ligne 8 : | Ligne 8 : | ||
== Anglais == | == Anglais == | ||
''' | '''UniVideo ''' | ||
<!--Framework for unederstanding generation and editing in the video domain with a dual-stream design, combining a Multimodal Large Language Model (MLLM) for instruction understanding with a Multimodal DiT (MMDiT) for video generation.--> | |||
==Sources== | ==Sources== | ||
[https://huggingface.co/papers/2510.08377 | [https://arxiv.org/abs/2510.08377 Source : arxiv] | ||
[https://huggingface.co/papers/2510.08377 Source : huggingface] | |||
[https://congwei1230.github.io/UniVideo/ Source : UniVideo, GitHub.io] | |||
[[Catégorie:vocabulary]] | [[Catégorie:vocabulary]] | ||
Dernière version du 24 février 2026 à 10:58
EN CONSTRUCTION
Définition
xxxxx
Français
UniVideo
Anglais
UniVideo
Sources
Contributeurs: Arianne Arel, wiki





