« LongVie » : différence entre les versions
(Page créée avec « ==en construction== == Définition == XXXXXXXXX == Français == ''' LongVie''' == Anglais == '''LongVie''' A framework for generating controllable long videos lasting up to one minute. The method addresses key challenges in extending video generation beyond short clips, specifically temporal inconsistency and visual degradation that occur when generating longer sequences. The paper proposes a multi-modal control approach that combines dense and sparse guidan... ») |
Aucun résumé des modifications |
||
Ligne 2 : | Ligne 2 : | ||
== Définition == | == Définition == | ||
Architecture pour la génération de vidéos ultra-longues qui traite la cohérence temporelle et la dégradation visuelle dans la génération de telles vidéos. LongVie est guidé à la fois par des signaux de contrôle denses et creux, avec une stratégie d'entraînement tenant compte de la dégradation afin d'équilibrer la contribution des modalités. | |||
Les principales limites rencontrées lors de l'application des modèles actuels à la génération de vidéos longues sont l'incohérence temporelle et la dégradation de la qualité. | |||
== Français == | == Français == | ||
Ligne 10 : | Ligne 12 : | ||
'''LongVie''' | '''LongVie''' | ||
''Controllable ultra-long video generation framework that addresses temporal consistency and visual degradation in ultra-long video generation. It is guided by both dense and sparse control signals, with a degradation-aware training strategy to balance the contribution of the modalities.'' | |||
''The primary limitations encountered when applying current controllable models to long video generation are temporal inconsistency and quality degradation.'' | |||
== | == Sources == | ||
[https://arxiv.org/html/2508.03694v1 Source : arxiv] | |||
[https://huggingface.co/papers/2508.03694 Source : huggingface] | [https://huggingface.co/papers/2508.03694 Source : huggingface] |
Dernière version du 12 octobre 2025 à 12:23
en construction
Définition
Architecture pour la génération de vidéos ultra-longues qui traite la cohérence temporelle et la dégradation visuelle dans la génération de telles vidéos. LongVie est guidé à la fois par des signaux de contrôle denses et creux, avec une stratégie d'entraînement tenant compte de la dégradation afin d'équilibrer la contribution des modalités.
Les principales limites rencontrées lors de l'application des modèles actuels à la génération de vidéos longues sont l'incohérence temporelle et la dégradation de la qualité.
Français
LongVie
Anglais
LongVie
Controllable ultra-long video generation framework that addresses temporal consistency and visual degradation in ultra-long video generation. It is guided by both dense and sparse control signals, with a degradation-aware training strategy to balance the contribution of the modalities.
The primary limitations encountered when applying current controllable models to long video generation are temporal inconsistency and quality degradation.
Sources
Contributeurs: Arianne Arel, wiki
