« Représentation sémantique distributionnelle compacte » : différence entre les versions

Dernière version du 23 septembre 2025 à 19:58

Définition

En apprentissage profond, une représentation sémantique distributionnelle compacte (en anglais, embedding) fait référence à une représentation sémantique vectorielle dense et de faible dimension d’un objet de dimension supérieure.

Elle est basée sur l’hypothèse de la sémantique distributionnelle de Harris et Firth qui postule que le sens d'un mot est déterminé par son contexte d'utilisation.

Cette représentation résulte de l'application d'un algorithme qui permet de passer d'une représentation en haute dimension et habituellement de son contexte, à une représentation vectorielle compacte, soit de plus faible dimension et continue, soit des nombres réels.

Il en découle que des objets similaires possèdent des vecteurs correspondants qui sont proches selon une distance ou une métrique dans l'espace vectoriel où sont définis ces objets. Il s'agit donc d'une représentation distribuée qui décrit la « sémantique » d'un objet en considérant ses relations avec d'autres objets de son contexte.

Typiquement, on crée une représentation sémantique distributionnelle compacte avec un algorithme qui réduit la dimension de la représentation afin de rapprocher les objets similaires et d'éloigner les objets différents.

Voir aussi vecteur contextuel

Compléments

La représentation sémantique distributionnelle compacte est basée sur l’hypothèse distributionnelle de [Harris 1954], [Firth 1957]. Elle repose sur l'idée que le sens d'un mot est déterminé par son contexte d'utilisation. En d'autres termes, la signification d'un mot est intrinsèquement liée aux autres mots avec lesquels il a tendance à apparaître dans un corpus linguistique. Plus la distribution statistique des contextes de deux mots est différente, plus leur sens tend à différer. Réciproquement les mots sémantiquement proches partagent un plus grand nombre de contextes.

L'algorithme de création d'une représentation sémantique distributionnelle compacte procède par approximation pour passer d'une représentation discrète qui prend en compte un objet et son contexte (statique ou dynamique, plus ou moins étendu) vers une représentation contextuelle compacte (c.-à-d. de plus faible dimension) et continue (c.-à-d. vecteur de nombres réels). D'où la proposition du terme équivalent « vecteur sémantique distributionnel compact » ou encore « vecteur sémantique contextuel compact ». À discuter...

Attention! En français, on retrouve souvent le terme « plongement neuronal ». La notion mathématique de plongement, bien que proche, car elle implique une réduction de la dimension de la représentation, ne couvre pas l'ensemble des concepts sous-jacents. Par exemple, la notion de contexte ou voisinage. Aussi le plongement est davantage assimilée à une opération de création d'un sous-ensemble qu'à une opération de réduction de la dimension obtenue par approximation. À discuter...

La modélisation par vecteur sémantique distributionnel compact, bien que souvent appliquée aux mots, vecteur-mot (word embedding), ne se limite pas à des mots et peut être appliquée à des phrases, des documents, des paragraphes, etc. La représentation par vecteur sémantique contextuel compact peut également s'appliquer à d'autres représentations catégorielles comme les différentes marchandises dans un magasin.

Un vecteur sémantique distributionnel compact peut également être « utilisée » comme représentation latente. À discuter...

On distingue trois principaux usages des vecteurs sémantiques distributionnels:

identifier les plus proches voisins d'un objet ou d'un concept;
enrichir l'entrée de données d'un algorithme d'apprentissage;
visualiser des objets ou des concepts et leurs relations.

Français

représentation sémantique distributionnelle compacte

représentation sémantique distributionnelle

représentation sémantique contextuelle compacte

représentation sémantique contextuelle

vecteur sémantique distributionnel compact

vecteur sémantique distributionnel

vecteur sémantique contextuel compact

plongement neuronal

plongement

vecteur sémantique

vecteur contextuel

Anglais

embedding

neural embedding

compact distributional semantic representation

compact distributional semantic vector

compact contextual semantic vector

Español

representación semántica compacta

En aprendizaje profundo, una representación semántica compacta (en inglés, embedding) se refiere a una representación semántica vectorial densa y de baja dimensión de un objeto de mayor dimensión.

Esta representación resulta de la aplicación de un algoritmo que permite pasar de una representación de alta dimensión, normalmente descontextualizada, a una representación vectorial compacta, bien de dimensión inferior y continua, bien de números reales.

De ello se deduce que los objetos similares tienen vectores correspondientes que están próximos según una distancia o métrica en el espacio vectorial en el que se definen estos objetos. Se trata, por tanto, de una representación distribuida que describe la «semántica» de un objeto teniendo en cuenta sus relaciones con otros objetos de su contexto.

Normalmente, una representación semántica compacta se crea mediante un algoritmo que reduce la dimensión de la representación para acercar objetos similares y distanciar objetos diferentes.

Sources

Géron, Aurélien (2017) Machine Learning avec Scikit-Learn - Mise en oeuvre et cas concrets, Paris, Dunod, 256 pages.

Goodfellow, Ian; Bengio, Yoshua et Aaron Courville (2018), Apprentissage profond, Paris, Massot éditions, 800 pages.

Google, Glossaire du machine learning.

Firth, J. R. (1957). A synopsis of linguistic theory, 1930-1955. Studies in Linguistic Analysis - "You shall know a word by the company it keeps"

Harris, 1954 Harris, Z. S. (1954). Distributional structure. Word, 10(2–3), 146–162 - "difference of meaning correlates with difference of distribution"

101 MOTS DE L' IA
Ce terme est sélectionné pour le livre « Les 101 mots de l'intelligence artificielle »

@@ Ligne 1 : / Ligne 1 : @@
 ==Définition==
-Représentation résultant de l'opération mathématique qui permet de passer d'une représentation catégorielle et habituellement de son contexte à une représentation vectorielle contextuelle compacte (c.-à-d. de plus faible dimension) et continue (c.-à-d. des nombres réels).
+En [[apprentissage profond]], une représentation sémantique distributionnelle compacte (en anglais, ''embedding'') fait référence à une représentation sémantique vectorielle dense et de faible dimension d’un objet de dimension supérieure.
-Il en découle que des objets similaires possèdent des vecteurs correspondants qui sont proches selon une distance (ou métrique) dans l'espace vectoriel où sont définis ces objets.
+Elle est basée sur l’hypothèse de la sémantique distributionnelle de Harris et Firth qui postule que le sens d'un mot est déterminé par son contexte d'utilisation.
-Il s'agit d'une représentation distribuée qui tente de décrire la « sémantique » d'un objet en considérant ses relations avec d'autres objets de son contexte.
+Cette représentation résulte de l'application d'un [[algorithme]] qui permet de passer d'une représentation en haute dimension et habituellement de son contexte, à une représentation vectorielle compacte, soit de plus faible dimension et continue, soit des nombres réels.
-Typiquement, on crée une représentation contextuelle compacte avec un algorithme qui réduit la dimension de la représentation afin de rapprocher les objets similaires et d'éloigner les objets différents.
+Il en découle que des objets similaires possèdent des vecteurs correspondants qui sont proches selon une distance ou une métrique dans l'espace vectoriel où sont définis ces objets. Il s'agit donc d'une représentation distribuée qui décrit la « sémantique » d'un objet en considérant ses relations avec d'autres objets de son contexte.
+Typiquement, on crée une représentation sémantique distributionnelle compacte avec un algorithme qui réduit la dimension de la représentation afin de rapprocher les objets similaires et d'éloigner les objets différents.
+Voir aussi [[vecteur contextuel]]
 ==Compléments==
-L'algorithme de création d'un vecteur contextuel compact procède par approximation pour passer d'une représentation discrète qui prend en compte un objet et son contexte (statique ou dynamique, plus ou moins étendu) vers une représentation contextuelle compacte (c.-à-d. de plus faible dimension) et continue (c.-à-d. vecteur de nombres réels). D'où la proposition du terme « vecteur contextuel compact » ou encore « représentation contextuelle compacte ». À discuter...
+La représentation sémantique distributionnelle compacte est basée sur l’hypothèse distributionnelle de [Harris 1954], [Firth 1957]. Elle repose sur l'idée que le sens d'un mot est déterminé par son contexte d'utilisation. En d'autres termes, la signification d'un mot est intrinsèquement liée aux autres mots avec lesquels il a tendance à apparaître dans un corpus linguistique. Plus la distribution statistique des contextes de deux mots est différente, plus leur sens tend à différer. Réciproquement les mots sémantiquement proches partagent un plus grand nombre de contextes.
+<hr/>
+L'algorithme de création d'une représentation sémantique distributionnelle compacte procède par approximation pour passer d'une représentation discrète qui prend en compte un objet et son contexte (statique ou dynamique, plus ou moins étendu) vers une représentation contextuelle compacte (c.-à-d. de plus faible dimension) et continue (c.-à-d. vecteur de nombres réels). D'où la proposition du terme équivalent « vecteur sémantique distributionnel compact » ou encore « vecteur sémantique contextuel compact ». À discuter...
 <hr/>
 Attention! En français, on retrouve souvent le terme « plongement neuronal ». La notion mathématique de plongement, bien que proche, car elle implique une réduction de la dimension de la représentation, ne couvre pas l'ensemble des concepts sous-jacents. Par exemple, la notion de contexte ou voisinage. Aussi le plongement est davantage assimilée à une opération de création d'un sous-ensemble qu'à une opération de réduction de la dimension obtenue par approximation. À discuter...
 <hr/>
-La modélisation par vecteur contextuel compact, bien que souvent appliquée aux mots, [[vecteur-mot]] (word embedding), ne se limite pas à des mots et peut être appliquée à des phrases, des documents, des paragraphes, etc. La représentation par vecteur contextuel compact peut également s'appliquer à d'autres représentations catégorielles comme les différentes marchandises dans un magasin.
+La modélisation par vecteur sémantique distributionnel compact, bien que souvent appliquée aux mots, [[vecteur-mot]] (word embedding), ne se limite pas à des mots et peut être appliquée à des phrases, des documents, des paragraphes, etc. La représentation par vecteur sémantique contextuel compact peut également s'appliquer à d'autres représentations catégorielles comme les différentes marchandises dans un magasin.
 <hr/>
-Un vecteur contextuel compact peut également être « utilisée » comme représentation latente. À discuter...
+Un vecteur sémantique distributionnel compact peut également être « utilisée » comme représentation latente. À discuter...
 <hr/>
-On distingue trois principaux usages des vecteurs contextuels compacts:
+On distingue trois principaux usages des vecteurs sémantiques distributionnels:
 *identifier les plus proches voisins d'un objet ou d'un concept;
-*enrichir l'entrée de données d'un algorithme;
+*enrichir l'entrée de données d'un algorithme d'apprentissage;
 *visualiser des objets ou des concepts et leurs relations.
 ==Français==
-'''vecteur contextuel compact'''
+'''représentation sémantique distributionnelle compacte'''
+'''représentation sémantique distributionnelle'''
+'''représentation sémantique contextuelle compacte'''
+'''représentation sémantique contextuelle'''
-'''représentation contextuelle compacte'''
+'''vecteur sémantique distributionnel compact'''
+'''vecteur sémantique distributionnel'''
+'''vecteur sémantique contextuel compact'''
 '''plongement neuronal'''
@@ Ligne 34 : / Ligne 50 : @@
 '''plongement'''
-'''représentation vectorielle compacte'''
+'''vecteur sémantique'''
 '''vecteur contextuel'''
@@ Ligne 43 : / Ligne 59 : @@
 '''neural embedding'''
-<small>
+'''compact distributional semantic representation'''
+'''compact distributional semantic vector'''
+'''compact contextual semantic vector'''
+==Español==
+[[Catégorie:es]]
+''''' representación semántica compacta '''''
+''En aprendizaje profundo, una representación semántica compacta (en inglés, embedding) se refiere a una representación semántica vectorial densa y de baja dimensión de un objeto de mayor dimensión.''
+''Esta representación resulta de la aplicación de un algoritmo que permite pasar de una representación de alta dimensión, normalmente descontextualizada, a una representación vectorial compacta, bien de dimensión inferior y continua, bien de números reales.''
+''De ello se deduce que los objetos similares tienen vectores correspondientes que están próximos según una distancia o métrica en el espacio vectorial en el que se definen estos objetos. Se trata, por tanto, de una representación distribuida que describe la «semántica» de un objeto teniendo en cuenta sus relaciones con otros objetos de su contexto.''
+''Normalmente, una representación semántica compacta se crea mediante un algoritmo que reduce la dimensión de la representación para acercar objetos similares y distanciar objetos diferentes.''
+==Sources==
+Géron, Aurélien (2017) ''Machine Learning avec Scikit-Learn - Mise en oeuvre et cas concrets'', Paris, Dunod, 256 pages.
+Goodfellow, Ian; Bengio, Yoshua et Aaron Courville (2018), ''Apprentissage profond'', Paris, Massot éditions, 800 pages.
+[https://developers.google.com/machine-learning/crash-course/glossary ''Google, Glossaire du machine learning''.]
-Source: Géron, Aurélien (2017) ''Machine Learning avec Scikit-Learn - Mise en oeuvre et cas concrets'', Paris, Dunod, 256 pages.
+[https://cs.brown.edu/courses/csci2952d/readings/lecture1-firth.pdf Firth, J. R. (1957). A synopsis of linguistic theory, 1930-1955. Studies in Linguistic Analysis - "You shall know a word by the company it keeps"]
-Source: Goodfellow, Ian; Bengio, Yoshua et Aaron Courville (2018), ''Apprentissage profond'', Paris, Massot éditions, 800 pages.
+[http://www.tandfonline.com/doi/pdf/10.1080/00437956.1954.11659520 Harris, 1954 Harris, Z. S. (1954). Distributional structure. Word, 10(2–3), 146–162 - "difference of meaning correlates with difference of distribution"]
-[https://developers.google.com/machine-learning/crash-course/glossary Source: ''Google, Glossaire du machine learning''.]
-[[Category:Intelligence artificielle]]
+{{Modèle:101}}
-[[Category:Apprentissage profond]]
+[[Catégorie:Intelligence artificielle]]
-[[Category:Termino 2019]]
+[[Catégorie:GRAND LEXIQUE FRANÇAIS]]
-[[Category:GRAND LEXIQUE FRANÇAIS]]
+[[Catégorie:101]]

« Représentation sémantique distributionnelle compacte » : différence entre les versions