« Indice de Jaccard » : différence entre les versions
(Page créée avec « == en construction == == Définition == XXXXXX == Français == ''' Indice de Jaccard''' '''IoU''' == Anglais == ''' Jaccard Similarity''' ''' Jaccard Similarity Index''' ''' Jaccard Index''' ''' Intersection Over Union''' ''' IoU''' == Sources == [https://www.geeksforgeeks.org/how-to-calculate-jaccard-similarity-in-python/ Source : Geeks for Geeks] [https://www.kdnuggets.com/2017/02/natural-language-processing-key-terms-explained.html Source : KDnug... ») |
Aucun résumé des modifications |
||
(2 versions intermédiaires par 2 utilisateurs non affichées) | |||
Ligne 1 : | Ligne 1 : | ||
== | == Définition == | ||
'''[[Statistique]]''' utilisée pour mesurer la similarité entre deux '''[[Jeu de données|ensembles de données]]'''. Sa valeur est comprise entre 0 et 1, où 0 signifie que nous avons le même ensemble de données et 0 que nous avons des ensembles de données complètement différents. Elle est mesurée comme la taille de l'intersection de deux ensembles divisée par la taille de leur union. | |||
== | En '''[[traitement automatique de la langue naturelle (TALN)]]''', les documents sont généralement des ensembles de mots (textes) auxquels l'indice de Jaccard peut s'appliquer et ce dernier nous indique dans quelle mesure les deux textes sont proches l'un de l'autre en termes de contexte. Plus simplement, en TALN, l'indice de Jaccard détermine combien de mots communs existent sur l'ensemble des mots. | ||
== Compléments == | |||
L'indice de Jaccard est largement utilisé dans l'analyse de texte, les '''[[Système de recommandation|systèmes de recommandation]]''', la déduplication des données, l'analyse des réseaux sociaux et la '''[[Analyse génomique|génomique]]'''. | |||
== Français == | == Français == | ||
Ligne 29 : | Ligne 32 : | ||
[https://fr.wikipedia.org/wiki/Indice_et_distance_de_Jaccard Source : Wikipédia] | [https://fr.wikipedia.org/wiki/Indice_et_distance_de_Jaccard Source : Wikipédia] | ||
[[Catégorie: | [[Catégorie:GRAND_LEXIQUE_FRANÇAIS]] |
Dernière version du 4 août 2025 à 21:09
Définition
Statistique utilisée pour mesurer la similarité entre deux ensembles de données. Sa valeur est comprise entre 0 et 1, où 0 signifie que nous avons le même ensemble de données et 0 que nous avons des ensembles de données complètement différents. Elle est mesurée comme la taille de l'intersection de deux ensembles divisée par la taille de leur union.
En traitement automatique de la langue naturelle (TALN), les documents sont généralement des ensembles de mots (textes) auxquels l'indice de Jaccard peut s'appliquer et ce dernier nous indique dans quelle mesure les deux textes sont proches l'un de l'autre en termes de contexte. Plus simplement, en TALN, l'indice de Jaccard détermine combien de mots communs existent sur l'ensemble des mots.
Compléments
L'indice de Jaccard est largement utilisé dans l'analyse de texte, les systèmes de recommandation, la déduplication des données, l'analyse des réseaux sociaux et la génomique.
Français
Indice de Jaccard
IoU
Anglais
Jaccard Similarity
Jaccard Similarity Index
Jaccard Index
Intersection Over Union
IoU
Sources
Contributeurs: Arianne Arel, wiki
