« Génération augmentée d'information applicative (GAIA) » : différence entre les versions
Aucun résumé des modifications |
Aucun résumé des modifications |
||
Ligne 7 : | Ligne 7 : | ||
Pour cela, on prépare la documentation de l'application en la divisant en morceaux qui sont indexés avec des [[vecteur sémantique distributionnel compact|vecteurs sémantiques contextuels compacts]] (''embeddings''). Ces [[vecteur sémantique compact|vecteurs sémantiques compacts]] sont stockés dans une base de données vectorielles. | Pour cela, on prépare la documentation de l'application en la divisant en morceaux qui sont indexés avec des [[vecteur sémantique distributionnel compact|vecteurs sémantiques contextuels compacts]] (''embeddings''). Ces [[vecteur sémantique compact|vecteurs sémantiques compacts]] sont stockés dans une base de données vectorielles. | ||
Puis lorsqu'un utilisateur fait une requête, on encode celle-ci avec les mêmes [[Vecteur sémantique compact|vecteurs sémantiques compacts]] puis on filtre les extraits des documents pour retenir ceux qui ont une forte proximité sémantique avec la requête avec un algorithme qui applique une | Puis lorsqu'un utilisateur fait une requête, on encode celle-ci avec les mêmes [[Vecteur sémantique compact|vecteurs sémantiques compacts]] puis on filtre les extraits des documents pour retenir ceux qui ont une forte proximité sémantique avec la requête avec un algorithme qui applique une mesure de similarité du genre [[métrique cosinus]]. Plus précisément, ces extraits sont ajoutés au contexte de la requête. Enfin, l'algorithme GAIA soumet la requête enrichie avec les extraits identifiés au [[robot conversationnel génératif]] et à son [[grand modèle de langues]] pour fournir un contexte leur permettant de mieux répondre à la requête. | ||
== Français == | == Français == | ||
Ligne 44 : | Ligne 44 : | ||
[[Catégorie:GRAND LEXIQUE FRANÇAIS]] | [[Catégorie:GRAND LEXIQUE FRANÇAIS]] | ||
[[Catégorie:101]] | [[Catégorie:101]] | ||
[[Catégorie: | [[Catégorie:Publication]] |
Version du 4 mai 2025 à 10:13
Définition
Méthode d'adaptation et de peaufinage des résultats d'un grand modèle de langues par enrichissement des requêtes génératives avec des sources d'informations externes et à jour afin de générer des résultats plus précis et plus utiles.
Compléments
L'algorithme GAIA ne touche pas au grand modèle de langues, mais enrichit la requête générative d'extraits pertinents à cette requête provenant de la documentation de l'application.
Pour cela, on prépare la documentation de l'application en la divisant en morceaux qui sont indexés avec des vecteurs sémantiques contextuels compacts (embeddings). Ces vecteurs sémantiques compacts sont stockés dans une base de données vectorielles.
Puis lorsqu'un utilisateur fait une requête, on encode celle-ci avec les mêmes vecteurs sémantiques compacts puis on filtre les extraits des documents pour retenir ceux qui ont une forte proximité sémantique avec la requête avec un algorithme qui applique une mesure de similarité du genre métrique cosinus. Plus précisément, ces extraits sont ajoutés au contexte de la requête. Enfin, l'algorithme GAIA soumet la requête enrichie avec les extraits identifiés au robot conversationnel génératif et à son grand modèle de langues pour fournir un contexte leur permettant de mieux répondre à la requête.
Français
génération augmentée d'information applicative
GAIA
génération augmentée d'information contextuelle
GAIC
adaptation par enrichissement contextuel
AEC
peaufinage par enrichissement contextuel
PEC
enrichissement contextuel
génération augmentée par récupération
Anglais
retrieval augmented generation
RAG
Sources
Contributeurs: Arianne , Claude Coulombe, Patrick Drouin, wiki
