Ovis-U1


Révision datée du 8 octobre 2025 à 11:46 par Arianne (discussion | contributions)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)

en construction

Définition

Modèle capable de comprendre simultanément des images, d'en générer de nouvelles à partir de descriptions textuelles et de modifier des images existantes. Il est entraîné simultanément sur un mélange de données variées telles que des données de compréhension, de génération et de modification.

Il excelle dans les scénarios de traitement d'une seule image ou de plusieurs images, ainsi que dans un large éventail d'applications, de la création de contenu à l'analyse et à l'amélioration d'images.

Voir aussi Ovis

Français

Ovis-U1

Anglais

Ovis-U1

Model that can simultaneously understand images, generate new visuals from text descriptions, and edit existing images. It is trained on a diverse mix of understanding, generation, and editing data simultaneously. It excels in both single and multi-image processing scenarios, and also in wide range of applications from content creation to image analysis and enhancement.

Source

Source : arxiv

Source : GitHub

Source : huggingface

Source : Ovis-U1

Contributeurs: Arianne Arel, wiki