« LongVie » : différence entre les versions

Dernière version du 12 octobre 2025 à 11:23

en construction

Définition

Architecture pour la génération de vidéos ultra-longues qui traite la cohérence temporelle et la dégradation visuelle dans la génération de telles vidéos. LongVie est guidé à la fois par des signaux de contrôle denses et creux, avec une stratégie d'entraînement tenant compte de la dégradation afin d'équilibrer la contribution des modalités.

Les principales limites rencontrées lors de l'application des modèles actuels à la génération de vidéos longues sont l'incohérence temporelle et la dégradation de la qualité.

Français

LongVie

Anglais

LongVie

Controllable ultra-long video generation framework that addresses temporal consistency and visual degradation in ultra-long video generation. It is guided by both dense and sparse control signals, with a degradation-aware training strategy to balance the contribution of the modalities.

The primary limitations encountered when applying current controllable models to long video generation are temporal inconsistency and quality degradation.

Sources

Source : arxiv

Source : huggingface

@@ Ligne 2 : / Ligne 2 : @@
 == Définition ==
-XXXXXXXXX
+Architecture pour la génération de vidéos ultra-longues qui traite la cohérence temporelle et la dégradation visuelle dans la génération de telles vidéos. LongVie est guidé à la fois par des signaux de contrôle denses et creux, avec une stratégie d'entraînement tenant compte de la dégradation afin d'équilibrer la contribution des modalités.
+Les principales limites rencontrées lors de l'application des modèles actuels à la génération de vidéos longues sont l'incohérence temporelle et la dégradation de la qualité.
 == Français ==
@@ Ligne 10 : / Ligne 12 : @@
 '''LongVie'''
- A framework for generating controllable long videos lasting up to one minute. The method addresses key challenges in extending video generation beyond short clips, specifically temporal inconsistency and visual degradation that occur when generating longer sequences. The paper proposes a multi-modal control approach that combines dense and sparse guidance signals to maintain both visual quality and temporal coherence across extended video sequences
+''Controllable ultra-long video generation framework that addresses temporal consistency and visual degradation in ultra-long video generation. It is guided by both dense and sparse control signals, with a degradation-aware training strategy to balance the contribution of the modalities.''
+''The primary limitations encountered when applying current controllable models to long video generation are temporal inconsistency and quality degradation.''
-== Source ==
+== Sources ==
+[https://arxiv.org/html/2508.03694v1   Source : arxiv]
 [https://huggingface.co/papers/2508.03694  Source : huggingface]

« LongVie » : différence entre les versions