« Ovis-U1 » : différence entre les versions
(Page créée avec « ==en construction== == Définition == XXXXXXXXX == Français == ''' Ovis-U1''' == Anglais == '''Ovis-U1''' Ovis-U1, a 3-billion-parameter model, combines multimodal understanding, text-to-image generation, and image editing, achieving state-of-the-art performance in various benchmarks. == Source == [https://huggingface.co/papers/2506.23044 Source : huggingface] Catégorie:vocabulary ») |
Aucun résumé des modifications |
||
Ligne 2 : | Ligne 2 : | ||
== Définition == | == Définition == | ||
'''[[Modèle]]''' capable de comprendre simultanément des images, d'en générer de nouvelles à partir de descriptions textuelles et de modifier des images existantes. Il est entraîné simultanément sur un mélange de '''[[données]]''' variées telles que des données de compréhension, de génération et de modification. | |||
Il excelle dans les scénarios de traitement d'une seule image ou de plusieurs images, ainsi que dans un large éventail d'applications, de la création de contenu à l'analyse et à l'amélioration d'images. | |||
Voir aussi '''[[Ovis]]''' | |||
== Français == | == Français == | ||
Ligne 10 : | Ligne 14 : | ||
'''Ovis-U1''' | '''Ovis-U1''' | ||
''Model that can simultaneously understand images, generate new visuals from text descriptions, and edit existing images. It is trained on a diverse mix of understanding, generation, and editing data simultaneously. It excels in both single and multi-image processing scenarios, and also in wide range of applications from content creation to image analysis and enhancement.'' | |||
== Source == | == Source == | ||
[https://arxiv.org/abs/2506.23044 Source : arxiv] | |||
[https://github.com/AIDC-AI/Ovis-U1 Source : GitHub] | |||
[https://huggingface.co/papers/2506.23044 Source : huggingface] | [https://huggingface.co/papers/2506.23044 Source : huggingface] | ||
[https://ovis-u1.com/ Source : Ovis-U1] | |||
[[Catégorie:vocabulary]] | [[Catégorie:vocabulary]] |
Dernière version du 8 octobre 2025 à 11:46
en construction
Définition
Modèle capable de comprendre simultanément des images, d'en générer de nouvelles à partir de descriptions textuelles et de modifier des images existantes. Il est entraîné simultanément sur un mélange de données variées telles que des données de compréhension, de génération et de modification.
Il excelle dans les scénarios de traitement d'une seule image ou de plusieurs images, ainsi que dans un large éventail d'applications, de la création de contenu à l'analyse et à l'amélioration d'images.
Voir aussi Ovis
Français
Ovis-U1
Anglais
Ovis-U1
Model that can simultaneously understand images, generate new visuals from text descriptions, and edit existing images. It is trained on a diverse mix of understanding, generation, and editing data simultaneously. It excels in both single and multi-image processing scenarios, and also in wide range of applications from content creation to image analysis and enhancement.
Source
Contributeurs: Arianne Arel, wiki
