« Omni-Effects » : différence entre les versions
(Page créée avec « ==en construction== == Définition == XXXXXXXXX == Français == ''' XXXXXXXXX ''' == Anglais == '''Omni-Effects'''à A unified framework for generating customized visual effects (VFX) in videos. Unlike existing methods that require separate models for each effect, this approach can generate multiple visual effects simultaneously while providing precise spatial control over where each effect appears in the video. == Source == [https://huggingface.co/papers/... ») |
Aucun résumé des modifications |
||
Ligne 2 : | Ligne 2 : | ||
== Définition == | == Définition == | ||
Infrastructure unifiée permettant la génération d'effets visuels (VFX) composites qui peuvent être contrôlés spatialement et qui sont guidés par des '''[[Requête générative|requêtes]]''', et ce, à l'aide d'une '''[[mixture d'experts]]''' basé sur l''''[[adaptation par modèle auxiliaire]]''' (LoRA-MoE) et d'une requête sensible à l'espace (SPA) avec un flux d'informations indépendant (IIF). | |||
LoRA-MoE intègre divers effets dans un modèle unifié tout en atténuant efficacement les interférences entre les tâches alors que la SPA (alimentée par IIF) intègre des informations de masque spatial dans le '''[[segment textuel]]''', assurant un contrôle spatial précis. | |||
Voir aussi '''[[masquage de segment textuel]]''' | |||
== Français == | == Français == | ||
Ligne 8 : | Ligne 12 : | ||
== Anglais == | == Anglais == | ||
'''Omni-Effects''' | '''Omni-Effects''' | ||
''Unified framework that enables the generation of prompt-guided and spatially controllable composite visual effects (VFX) in videos, using LoRA-based Mixture of Experts (LoRA-MoE) and Spatial-Aware Prompt (SPA) with Independent-Information Flow. LoRA-MoE integrates diverse effects within a unified model while effectively mitigating cross-task interference and SPA incorporates spatial mask information into the text token, enabling precise spatial control.'' | |||
== | == Sources == | ||
[https://arxiv.org/abs/2508.07981 Source : arxiv] | |||
[https://huggingface.co/papers/2508.07981 Source : huggingface] | [https://huggingface.co/papers/2508.07981 Source : huggingface] |
Dernière version du 8 octobre 2025 à 11:31
en construction
Définition
Infrastructure unifiée permettant la génération d'effets visuels (VFX) composites qui peuvent être contrôlés spatialement et qui sont guidés par des requêtes, et ce, à l'aide d'une mixture d'experts basé sur l'adaptation par modèle auxiliaire (LoRA-MoE) et d'une requête sensible à l'espace (SPA) avec un flux d'informations indépendant (IIF).
LoRA-MoE intègre divers effets dans un modèle unifié tout en atténuant efficacement les interférences entre les tâches alors que la SPA (alimentée par IIF) intègre des informations de masque spatial dans le segment textuel, assurant un contrôle spatial précis.
Voir aussi masquage de segment textuel
Français
XXXXXXXXX
Anglais
Omni-Effects
Unified framework that enables the generation of prompt-guided and spatially controllable composite visual effects (VFX) in videos, using LoRA-based Mixture of Experts (LoRA-MoE) and Spatial-Aware Prompt (SPA) with Independent-Information Flow. LoRA-MoE integrates diverse effects within a unified model while effectively mitigating cross-task interference and SPA incorporates spatial mask information into the text token, enabling precise spatial control.
Sources
Contributeurs: Arianne Arel, wiki
