UniVideo


EN CONSTRUCTION

Définition

Cadre permettant de comprendre la génération automatique d'image et le montage du domaine de la vidéo grâce à une architecture à double flux, combinant un grand modèle de langues (GML) pour la compréhension des instructions et un modèle DiT multimodal (MMDiT) pour la génération d'image.

Français

UniVideo

Anglais

UniVideo


Sources

Source : arxiv

Source : huggingface

Source : UniVideo, GitHub.io

Contributeurs: Arianne Arel, wiki