« PixNerd » : différence entre les versions
Aucun résumé des modifications |
Aucun résumé des modifications |
||
| (Une version intermédiaire par un autre utilisateur non affichée) | |||
| Ligne 1 : | Ligne 1 : | ||
== Définition == | == Définition == | ||
'''[[Réseau autoattentif]]''' '''[[Modèle à bruit statistique|à bruit statistique]]''' de pixels pour la '''[[Génération automatique d'image|génération d'images]]''' qui permet d'obtenir des images de haute qualité en une seule étape et à échelle unique, sans '''[[Mécanisme d'attention|mécanismes d'attention]]''' ni de pipelines complexes. | |||
Il utilise un '''[[réseau neuronal]]''' pour améliorer la modélisation, remplaçant la projection linéaire. PixNerd peut aussi être utilisé pour la '''[[génération texte-à-image]]'''. | Il utilise un '''[[réseau neuronal]]''' pour améliorer la modélisation, remplaçant la projection linéaire. PixNerd peut aussi être utilisé pour la '''[[génération texte-à-image]]'''. | ||
| Ligne 23 : | Ligne 21 : | ||
[https://huggingface.co/papers/2507.23268 Source : huggingface] | [https://huggingface.co/papers/2507.23268 Source : huggingface] | ||
[[Catégorie:GRAND LEXIQUE FRANÇAIS]] | |||
[[Catégorie: | |||
Dernière version du 3 mars 2026 à 21:02
Définition
Réseau autoattentif à bruit statistique de pixels pour la génération d'images qui permet d'obtenir des images de haute qualité en une seule étape et à échelle unique, sans mécanismes d'attention ni de pipelines complexes.
Il utilise un réseau neuronal pour améliorer la modélisation, remplaçant la projection linéaire. PixNerd peut aussi être utilisé pour la génération texte-à-image.
Voir aussi DINO
Français
PixNerd
Anglais
PixNerd
A pixel-space diffusion transformer for image generation that achieves high-quality image generation in a single-scale, single-stage process without VAEs or complex pipelines. It employs a neural field to improve the high frequency modeling and replaces the final linear projection with a neural field to model the large patch details. It also extends to text-to-image applications.
Sources
Contributeurs: Arianne Arel, wiki





