« Forêt d'isolation » : différence entre les versions


Aucun résumé des modifications
Aucun résumé des modifications
Ligne 1 : Ligne 1 :
== Définition ==
== Définition ==
Algorithme d'[[apprentissage automatique]] [[apprentissage non supervisé|non supervisé]] qui permet la [[détection d'anomalies]] dans un [[ensemble de données]], et ce, par l'isolation des [[donnée aberrante|données atypiques ou aberrantes]].
Algorithme d'[[apprentissage automatique]] [[apprentissage non supervisé|non supervisé]] qui permet la [[détection d'anomalies]] dans un [[ensemble de données]], et ce, par l'isolation des [[donnée aberrante|données atypiques ou aberrantes]].
== Compléments ==
Ce type d'algorithme est souvent utilisé pour la  détection de fraudes (transactions bancaires, etc.), la détection d'intrusions dans les réseaux, la détection d'erreurs dans les données, etc.
En bref, il est utile dans n'importe quelle application où la détection de valeurs atypiques (anomalies) a un intérêt.
<hr/>
L'algorithme construit un ensemble d'arbres de décision aléatoires (la ''forêt''). Pour chaque point de données, il mesure le nombre de partitions nécessaires pour l'isoler dans ces arbres. Il repose donc sur le principe que les anomalies sont ''isolables'', c'est-à-dire qu'elles nécessitent moins de partitions pour être isolées dans un arbre de décision.


== Français ==
== Français ==

Version du 22 avril 2025 à 14:45

Définition

Algorithme d'apprentissage automatique non supervisé qui permet la détection d'anomalies dans un ensemble de données, et ce, par l'isolation des données atypiques ou aberrantes.

Compléments

Ce type d'algorithme est souvent utilisé pour la détection de fraudes (transactions bancaires, etc.), la détection d'intrusions dans les réseaux, la détection d'erreurs dans les données, etc. En bref, il est utile dans n'importe quelle application où la détection de valeurs atypiques (anomalies) a un intérêt.


L'algorithme construit un ensemble d'arbres de décision aléatoires (la forêt). Pour chaque point de données, il mesure le nombre de partitions nécessaires pour l'isoler dans ces arbres. Il repose donc sur le principe que les anomalies sont isolables, c'est-à-dire qu'elles nécessitent moins de partitions pour être isolées dans un arbre de décision.

Français

forêt d'isolation

Anglais

isolation forest

IForest

Sources

Yepmo et al. (2023) Vers un partitionnement des données à partir d'une forêt d'isolation

Fouad Jabiri (2020) Applications de méthodes de classification non supervisées à la détection d'anomalies

Wikipedia - isolation forest

IsolationForest - scikit learn