« Génération augmentée d'information applicative (GAIA) » : différence entre les versions


Aucun résumé des modifications
Aucun résumé des modifications
 
(31 versions intermédiaires par 3 utilisateurs non affichées)
Ligne 1 : Ligne 1 :
== Définition ==
== Définition ==
Méthode d'adaptation, [[peaufinage]] des résultats d'un [[grand modèle de langues]] par enrichissement des requêtes avec des sources d'informations externes et à jour afin de générer des résultats plus précis et plus utiles.
Méthode d'adaptation et de [[peaufinage]] des résultats d'un [[grand modèle de langues]] par enrichissement des [[requête générative|requêtes génératives]] avec des sources d'informations externes et à jour afin de générer des résultats plus précis et plus utiles.


== Compléments ==
== Compléments ==
On ne touche pas au grand modèle de langues, mais on enrichit les requêtes en encodant les données d’entrée avec des [[vecteur contextuel compact|vecteurs contextuels compacts]] (''embeddings'') du domaine d’application. Ces [[vecteur contextuel compact|vecteurs contextuels compacts]] proviennent d'une base de données vectorielles.
L'algorithme GAIA ne touche pas au [[grand modèle de langues]], mais enrichit la [[requête générative]] d'extraits pertinents à cette requête provenant de la documentation de l'application.  
<hr/>
Ici, on ne modifie pas le modèle de langues, mais on ajoute un contexte supplémentaire à la requête permettant au [[grand modèle de langues]] de répondre aux questions avec des informations sur le sujet.  


Lorsqu'un utilisateur fait une requête, celle-ci est enrichie à l'aide de [[vecteur contextuel compact|vecteurs contextuels compacts]] similaires retrouvées dans la base de données vectorielles par l'[[Algorithme des k plus proches voisins|algorithme des k plus proches voisins]] ([[métrique de similarité cosinus]]). Une fois que nous avons trouvé des [[vecteur contextuel compact|vecteur contextuel compact]] similaires, nous soumettons une requête avec les données associées pour fournir un contexte permettant au [[grand modèle de langues]] de mieux répondre à la question.
Dans une phase préalable, l'algorithme GAIA prépare la documentation de l'application en la divisant en morceaux qui sont indexés avec des [[vecteur sémantique distributionnel compact|vecteurs sémantiques compacts]] (en anglais, ''embeddings''). Ces [[vecteur sémantique compact|vecteurs sémantiques compacts]] sont stockés dans une base de données vectorielles. On peut aussi utiliser des connaissances, des [[GAIA-Graphe|graphes]], des tableaux de données, etc.


Puis lorsqu'un utilisateur fait une requête, l'algorithme GAIA encode celle-ci avec les mêmes [[vecteur sémantique distributionnel compact|vecteurs sémantiques compacts]] puis on retrouve et filtre les extraits des documents pour retenir ceux qui ont une forte proximité sémantique avec la requête en appliquant une mesure de similarité du genre [[métrique cosinus]]. Plus précisément, ces extraits sont ajoutés au contexte de la requête. Enfin, l'algorithme GAIA soumet la requête enrichie au [[robot conversationnel génératif]] et à son [[grand modèle de langues]] leur fournissant ainsi un contexte permettant de mieux répondre à la [[requête générative|requête]].
== Français ==
== Français ==


'''génération augmentée d'information contextuelle'''
'''génération augmentée d'information(s) applicative(s)'''
 
'''GAIA'''
 
'''génération augmentée d'information(s) contextuelle(s)'''


'''GAIC'''
'''GAIC'''


'''adaptation par enrichissement contextuel'''
'''adaptation par enrichissement contextuel'''
'''AEC'''


'''peaufinage par enrichissement contextuel'''
'''peaufinage par enrichissement contextuel'''


'''PEC'''
'''enrichissement contextuel'''


'''enrichissement contextuel'''
'''génération augmentée par récupération'''


== Anglais ==
== Anglais ==
Ligne 30 : Ligne 31 :
'''RAG'''
'''RAG'''


<small>
'''knowledge augmented generation'''
 
'''table augmented generation'''
 
==Sources==
[https://towardsdatascience.com/retrieval-augmented-generation-rag-from-theory-to-langchain-implementation-4e9bd5f6a4f2  Source : towardsdatascience]


[https://research.ibm.com/blog/retrieval-augmented-generation-RAG  Source : research.ibm.com]
[https://research.ibm.com/blog/retrieval-augmented-generation-RAG  Source : research.ibm.com]


[https://arxiv.org/abs/2005.11401v4 Source: Meta]
[https://arxiv.org/abs/2005.11401v4 Source: Meta]
 
[[Catégorie:Intelligence artificielle]]
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]
[[Catégorie:101]]

Dernière version du 7 juin 2025 à 13:49

Définition

Méthode d'adaptation et de peaufinage des résultats d'un grand modèle de langues par enrichissement des requêtes génératives avec des sources d'informations externes et à jour afin de générer des résultats plus précis et plus utiles.

Compléments

L'algorithme GAIA ne touche pas au grand modèle de langues, mais enrichit la requête générative d'extraits pertinents à cette requête provenant de la documentation de l'application.

Dans une phase préalable, l'algorithme GAIA prépare la documentation de l'application en la divisant en morceaux qui sont indexés avec des vecteurs sémantiques compacts (en anglais, embeddings). Ces vecteurs sémantiques compacts sont stockés dans une base de données vectorielles. On peut aussi utiliser des connaissances, des graphes, des tableaux de données, etc.

Puis lorsqu'un utilisateur fait une requête, l'algorithme GAIA encode celle-ci avec les mêmes vecteurs sémantiques compacts puis on retrouve et filtre les extraits des documents pour retenir ceux qui ont une forte proximité sémantique avec la requête en appliquant une mesure de similarité du genre métrique cosinus. Plus précisément, ces extraits sont ajoutés au contexte de la requête. Enfin, l'algorithme GAIA soumet la requête enrichie au robot conversationnel génératif et à son grand modèle de langues leur fournissant ainsi un contexte permettant de mieux répondre à la requête.

Français

génération augmentée d'information(s) applicative(s)

GAIA

génération augmentée d'information(s) contextuelle(s)

GAIC

adaptation par enrichissement contextuel

peaufinage par enrichissement contextuel

enrichissement contextuel

génération augmentée par récupération

Anglais

retrieval augmented generation

RAG

knowledge augmented generation

table augmented generation

Sources

Source : towardsdatascience

Source : research.ibm.com

Source: Meta