« Forêt d'isolation » : différence entre les versions
Aucun résumé des modifications |
Aucun résumé des modifications |
||
Ligne 3 : | Ligne 3 : | ||
== Compléments == | == Compléments == | ||
L'algorithme construit un ensemble d'arbres de décision aléatoires (la ''forêt''). Pour chaque point de données, il mesure le nombre de partitions nécessaires pour l'isoler dans ces arbres. Il repose donc sur le principe que les anomalies sont ''isolables'', c'est-à-dire qu'elles nécessitent moins de partitions pour être isolées dans un arbre de décision. | |||
<hr/> | |||
Ce type d'algorithme est souvent utilisé pour la détection de fraudes (transactions bancaires, etc.), la détection d'intrusions dans les réseaux, la détection d'erreurs dans les données, etc. | Ce type d'algorithme est souvent utilisé pour la détection de fraudes (transactions bancaires, etc.), la détection d'intrusions dans les réseaux, la détection d'erreurs dans les données, etc. | ||
En bref, il est utile dans n'importe quelle application où la détection de valeurs atypiques (anomalies) a un intérêt. | En bref, il est utile dans n'importe quelle application où la détection de valeurs atypiques (anomalies) a un intérêt. | ||
== Français == | == Français == |
Version du 22 avril 2025 à 14:46
Définition
Algorithme d'apprentissage automatique non supervisé qui permet la détection d'anomalies dans un ensemble de données, et ce, par l'isolation des données atypiques ou aberrantes.
Compléments
L'algorithme construit un ensemble d'arbres de décision aléatoires (la forêt). Pour chaque point de données, il mesure le nombre de partitions nécessaires pour l'isoler dans ces arbres. Il repose donc sur le principe que les anomalies sont isolables, c'est-à-dire qu'elles nécessitent moins de partitions pour être isolées dans un arbre de décision.
Ce type d'algorithme est souvent utilisé pour la détection de fraudes (transactions bancaires, etc.), la détection d'intrusions dans les réseaux, la détection d'erreurs dans les données, etc. En bref, il est utile dans n'importe quelle application où la détection de valeurs atypiques (anomalies) a un intérêt.
Français
forêt d'isolation
Anglais
isolation forest
IForest
Sources
Yepmo et al. (2023) Vers un partitionnement des données à partir d'une forêt d'isolation
Contributeurs: Claude Coulombe, Imane Meziani, Jean Benoît Morel, Patrick Drouin, wiki
