« Génération augmentée d'information applicative (GAIA) » : différence entre les versions


Aucun résumé des modifications
 
(20 versions intermédiaires par 3 utilisateurs non affichées)
Ligne 1 : Ligne 1 :
== Définition ==
== Définition ==
Méthode d'adaptation, [[peaufinage]] des résultats d'un [[grand modèle de langues]] par enrichissement des requêtes avec des sources d'informations externes et à jour afin de générer des résultats plus précis et plus utiles.
Méthode d'adaptation et de [[peaufinage]] des résultats d'un [[grand modèle de langues]] par enrichissement des [[requête générative|requêtes génératives]] avec des sources d'informations externes et à jour afin de générer des résultats plus précis et plus utiles.


== Compléments ==
== Compléments ==
On ne touche pas au grand modèle de langues, mais on enrichit les requêtes en encodant les données d’entrée avec des [[vecteur contextuel compact|vecteurs contextuels compacts]] (''embeddings'') du domaine d’application. Ces [[vecteur contextuel compact|vecteurs contextuels compacts]] proviennent d'une base de données vectorielles.
L'algorithme GAIA ne touche pas au [[grand modèle de langues]], mais enrichit la [[requête générative]] d'extraits pertinents à cette requête provenant de la documentation de l'application.  
<hr/>
Ici, on ne modifie pas le modèle de langues, mais on ajoute un contexte supplémentaire à la requête permettant au [[grand modèle de langues]] de répondre aux questions avec des informations sur le sujet.  


Lorsqu'un utilisateur fait une requête, celle-ci est enrichie à l'aide de [[vecteur contextuel compact|vecteurs contextuels compacts]] similaires retrouvées dans la base de données vectorielles par l'[[Algorithme des k plus proches voisins|algorithme des k plus proches voisins]] ([[métrique de similarité cosinus]]). Une fois que nous avons trouvé des [[vecteur contextuel compact|vecteur contextuel compact]] similaires, nous soumettons une requête avec les données associées pour fournir un contexte permettant au [[grand modèle de langues]] de mieux répondre à la question.
Dans une phase préalable, l'algorithme GAIA prépare la documentation de l'application en la divisant en morceaux qui sont indexés avec des [[vecteur sémantique distributionnel compact|vecteurs sémantiques contextuels compacts]] (en anglais, ''embeddings''). Ces [[vecteur sémantique compact|vecteurs sémantiques compacts]] sont stockés dans une base de données vectorielles.


Puis lorsqu'un utilisateur fait une requête, l'algorithme GAIA encode celle-ci avec les mêmes [[Vecteur sémantique compact|vecteurs sémantiques compacts]] puis on retrouve et filtre les extraits des documents pour retenir ceux qui ont une forte proximité sémantique avec la requête en appliquant une mesure de similarité du genre [[métrique cosinus]]. Plus précisément, ces extraits sont ajoutés au contexte de la requête. Enfin, l'algorithme GAIA soumet la requête enrichie au [[robot conversationnel génératif]] et à son [[grand modèle de langues]] leur fournissant ainsi un contexte permettant de mieux répondre à la requête.
== Français ==
== Français ==
'''génération augmentée d'information applicative'''
'''GAIA'''


'''génération augmentée d'information contextuelle'''
'''génération augmentée d'information contextuelle'''
Ligne 24 : Ligne 27 :


'''enrichissement contextuel'''
'''enrichissement contextuel'''
'''génération augmentée par récupération'''


== Anglais ==
== Anglais ==
Ligne 29 : Ligne 34 :


'''RAG'''
'''RAG'''


==Sources==
==Sources==
Ligne 37 : Ligne 41 :


[https://arxiv.org/abs/2005.11401v4 Source: Meta]
[https://arxiv.org/abs/2005.11401v4 Source: Meta]
 
[[Catégorie:Intelligence artificielle]]
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]
[[Catégorie:101]]

Dernière version du 5 mai 2025 à 15:15

Définition

Méthode d'adaptation et de peaufinage des résultats d'un grand modèle de langues par enrichissement des requêtes génératives avec des sources d'informations externes et à jour afin de générer des résultats plus précis et plus utiles.

Compléments

L'algorithme GAIA ne touche pas au grand modèle de langues, mais enrichit la requête générative d'extraits pertinents à cette requête provenant de la documentation de l'application.

Dans une phase préalable, l'algorithme GAIA prépare la documentation de l'application en la divisant en morceaux qui sont indexés avec des vecteurs sémantiques contextuels compacts (en anglais, embeddings). Ces vecteurs sémantiques compacts sont stockés dans une base de données vectorielles.

Puis lorsqu'un utilisateur fait une requête, l'algorithme GAIA encode celle-ci avec les mêmes vecteurs sémantiques compacts puis on retrouve et filtre les extraits des documents pour retenir ceux qui ont une forte proximité sémantique avec la requête en appliquant une mesure de similarité du genre métrique cosinus. Plus précisément, ces extraits sont ajoutés au contexte de la requête. Enfin, l'algorithme GAIA soumet la requête enrichie au robot conversationnel génératif et à son grand modèle de langues leur fournissant ainsi un contexte permettant de mieux répondre à la requête.

Français

génération augmentée d'information applicative

GAIA

génération augmentée d'information contextuelle

GAIC

adaptation par enrichissement contextuel

AEC

peaufinage par enrichissement contextuel

PEC

enrichissement contextuel

génération augmentée par récupération

Anglais

retrieval augmented generation

RAG

Sources

Source : towardsdatascience

Source : research.ibm.com

Source: Meta