« Génération augmentée d'information applicative (GAIA) » : différence entre les versions


m (Patrickdrouin a déplacé la page RAG vers Génération augmentée d'information contextuelle)
Aucun résumé des modifications
 
(39 versions intermédiaires par 3 utilisateurs non affichées)
Ligne 1 : Ligne 1 :
== Définition ==
== Définition ==
Méthode d'Adaptation, [[peaufinage]] des résultats d'un [[grand modèle de langues]] en encodant les données d’entrée avec des [[représentation contextuelle compacte|représentations contextuelles compactes]] (''embeddings'') du domaine d’application contenues dans une base de données vectorielles.
Méthode d'adaptation et de [[peaufinage]] des résultats d'un [[grand modèle de langues]] par enrichissement des [[requête générative|requêtes génératives]] avec des sources d'informations externes et à jour afin de générer des résultats plus précis et plus utiles.


== Compléments ==
== Compléments ==
Ici, on ne modifie pas le modèle de langues, mais on ajoute un contexte supplémentaire à la requête permettant au [[grand modèle de langues]] de répondre aux questions avec des informations sur le sujet.  
L'algorithme GAIA ne touche pas au [[grand modèle de langues]], mais enrichit la [[requête générative]] d'extraits pertinents à cette requête provenant de la documentation de l'application.  


Lorsqu'un utilisateur fait une requête, celle-ci est enrichie à l'aide de [[représentation contextuelle compacte|représentations contextuelles compactes]] similaires retrouvées dans la base de données vectorielles par l'[[Algorithme des k plus proches voisins|algorithme des k plus proches voisins]] ([[métrique de similarité cosinus]]). Une fois que nous avons trouvé des [[représentation contextuelle compacte|représentations contextuelles compactes]] similaires, nous soumettons une requête avec les données associées pour fournir un contexte permettant au [[grand modèle de langues]] de mieux répondre à la question.
Dans une phase préalable, l'algorithme GAIA prépare la documentation de l'application en la divisant en morceaux qui sont indexés avec des [[vecteur sémantique distributionnel compact|vecteurs sémantiques compacts]] (en anglais, ''embeddings''). Ces [[vecteur sémantique compact|vecteurs sémantiques compacts]] sont stockés dans une base de données vectorielles. On peut aussi utiliser des connaissances, des [[GAIA-Graphe|graphes]], des tableaux de données, etc.


Puis lorsqu'un utilisateur fait une requête, l'algorithme GAIA encode celle-ci avec les mêmes [[vecteur sémantique distributionnel compact|vecteurs sémantiques compacts]] puis on retrouve et filtre les extraits des documents pour retenir ceux qui ont une forte proximité sémantique avec la requête en appliquant une mesure de similarité du genre [[métrique cosinus]]. Plus précisément, ces extraits sont ajoutés au contexte de la requête. Enfin, l'algorithme GAIA soumet la requête enrichie au [[robot conversationnel génératif]] et à son [[grand modèle de langues]] leur fournissant ainsi un contexte permettant de mieux répondre à la [[requête générative|requête]].
== Français ==
== Français ==
'''génération augmentée d'information contextuelle'''
 
'''génération augmentée d'information(s) applicative(s)'''
 
'''GAIA'''
 
'''génération augmentée d'information(s) contextuelle(s)'''


'''GAIC'''
'''GAIC'''
'''adaptation par enrichissement contextuel'''
'''peaufinage par enrichissement contextuel'''
'''enrichissement contextuel'''
'''génération augmentée par récupération'''


== Anglais ==
== Anglais ==
Ligne 17 : Ligne 31 :
'''RAG'''
'''RAG'''


<small>
'''knowledge augmented generation'''
 
'''table augmented generation'''
 
==Sources==
[https://towardsdatascience.com/retrieval-augmented-generation-rag-from-theory-to-langchain-implementation-4e9bd5f6a4f2  Source : towardsdatascience]


[https://research.ibm.com/blog/retrieval-augmented-generation-RAG  Source : research.ibm.com]


[[Catégorie:Publication]]
[https://arxiv.org/abs/2005.11401v4 Source: Meta]
[[Catégorie:Intelligence artificielle]]
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]
[[Catégorie:101]]

Dernière version du 7 juin 2025 à 13:49

Définition

Méthode d'adaptation et de peaufinage des résultats d'un grand modèle de langues par enrichissement des requêtes génératives avec des sources d'informations externes et à jour afin de générer des résultats plus précis et plus utiles.

Compléments

L'algorithme GAIA ne touche pas au grand modèle de langues, mais enrichit la requête générative d'extraits pertinents à cette requête provenant de la documentation de l'application.

Dans une phase préalable, l'algorithme GAIA prépare la documentation de l'application en la divisant en morceaux qui sont indexés avec des vecteurs sémantiques compacts (en anglais, embeddings). Ces vecteurs sémantiques compacts sont stockés dans une base de données vectorielles. On peut aussi utiliser des connaissances, des graphes, des tableaux de données, etc.

Puis lorsqu'un utilisateur fait une requête, l'algorithme GAIA encode celle-ci avec les mêmes vecteurs sémantiques compacts puis on retrouve et filtre les extraits des documents pour retenir ceux qui ont une forte proximité sémantique avec la requête en appliquant une mesure de similarité du genre métrique cosinus. Plus précisément, ces extraits sont ajoutés au contexte de la requête. Enfin, l'algorithme GAIA soumet la requête enrichie au robot conversationnel génératif et à son grand modèle de langues leur fournissant ainsi un contexte permettant de mieux répondre à la requête.

Français

génération augmentée d'information(s) applicative(s)

GAIA

génération augmentée d'information(s) contextuelle(s)

GAIC

adaptation par enrichissement contextuel

peaufinage par enrichissement contextuel

enrichissement contextuel

génération augmentée par récupération

Anglais

retrieval augmented generation

RAG

knowledge augmented generation

table augmented generation

Sources

Source : towardsdatascience

Source : research.ibm.com

Source: Meta