« Génération augmentée d'information applicative (GAIA) » : différence entre les versions


Aucun résumé des modifications
Aucun résumé des modifications
Ligne 1 : Ligne 1 :
== Définition ==
== Définition ==
Méthode d'adaptation et de [[peaufinage]] des résultats d'un [[grand modèle de langues]] par enrichissement des requêtes avec des sources d'informations externes et à jour afin de générer des résultats plus précis et utiles.
Méthode d'adaptation et de [[peaufinage]] des résultats d'un [[grand modèle de langues]] par enrichissement des [[requête générative|requêtes génératives]] avec des sources d'informations externes à jour afin de générer des résultats plus précis et plus utiles.


== Compléments ==
== Compléments ==
On ne touche pas au grand modèle de langues, mais on enrichit les requêtes en encodant les données d’entrée avec des [[Vecteur sémantique distributionnel compact|vecteurs sémantiques contextuels compacts]] (''embeddings'') du domaine d’application. Ces [[vecteur sémantique compact|vecteurs sémantiques compacts]] proviennent d'une base de données vectorielles.
L'algorithme GAIA ne touche pas au [[grand modèle de langues]], mais enrichit la [[requête générative]] d'extraits pertinents à cette requête provenant de la documentation de l'application.  
<hr/>
Ici, on ne modifie pas le modèle de langues, mais on ajoute un contexte supplémentaire à la requête permettant au [[grand modèle de langues]] de répondre aux questions avec des informations sur le sujet.  


Lorsqu'un utilisateur fait une requête, celle-ci est enrichie à l'aide de [[vecteur sémantique compact|vecteurs sémantiques compacts]] similaires retrouvées dans la base de données vectorielles par l'[[Algorithme des k plus proches voisins|algorithme des k plus proches voisins]] ([[métrique de similarité cosinus]]). Une fois que nous avons trouvé des [[vecteur sémantique compact|vecteur sémantique compact]] similaires, nous soumettons une requête avec les données associées pour fournir un contexte permettant au [[grand modèle de langues]] de mieux répondre à la question.
Pour cela, on prépare la documentation de l'application en la divisant en morceaux qui sont indexés avec des [[vecteur sémantique distributionnel compact|vecteurs sémantiques contextuels compacts]] (''embeddings''). Ces [[vecteur sémantique compact|vecteurs sémantiques compacts]] sont stockés dans une base de données vectorielles.


Puis lorsqu'un utilisateur fait une requête, on encode celle-ci avec les mêmes [[Vecteur sémantique compact|vecteurs sémantiques compacts]] puis on filtre les extraits des documents pour retenir ceux qui ont une forte proximité sémantique avec la requête avec un algorithme du genre [[Algorithme des k plus proches voisins|k plus proches voisins]] ([[métrique de similarité cosinus]]). Plus précisément, ces extraits sont ajoutés au contexte de la requête. Enfin, l'algorithme GAIA soumet la requête enrichie avec les extraits identifiés au [[robot conversationnel génératif]] et à son [[grand modèle de langues]] pour fournir un contexte leur permettant de mieux répondre à la requête.
== Français ==
== Français ==



Version du 4 mai 2025 à 10:08

Définition

Méthode d'adaptation et de peaufinage des résultats d'un grand modèle de langues par enrichissement des requêtes génératives avec des sources d'informations externes à jour afin de générer des résultats plus précis et plus utiles.

Compléments

L'algorithme GAIA ne touche pas au grand modèle de langues, mais enrichit la requête générative d'extraits pertinents à cette requête provenant de la documentation de l'application.

Pour cela, on prépare la documentation de l'application en la divisant en morceaux qui sont indexés avec des vecteurs sémantiques contextuels compacts (embeddings). Ces vecteurs sémantiques compacts sont stockés dans une base de données vectorielles.

Puis lorsqu'un utilisateur fait une requête, on encode celle-ci avec les mêmes vecteurs sémantiques compacts puis on filtre les extraits des documents pour retenir ceux qui ont une forte proximité sémantique avec la requête avec un algorithme du genre k plus proches voisins (métrique de similarité cosinus). Plus précisément, ces extraits sont ajoutés au contexte de la requête. Enfin, l'algorithme GAIA soumet la requête enrichie avec les extraits identifiés au robot conversationnel génératif et à son grand modèle de langues pour fournir un contexte leur permettant de mieux répondre à la requête.

Français

génération augmentée d'information applicative

GAIA

génération augmentée d'information contextuelle

GAIC

adaptation par enrichissement contextuel

AEC

peaufinage par enrichissement contextuel

PEC

enrichissement contextuel

génération augmentée par récupération

Anglais

retrieval augmented generation

RAG

Sources

Source : towardsdatascience

Source : research.ibm.com

Source: Meta