« Forêt d'isolation » : différence entre les versions


Aucun résumé des modifications
Aucun résumé des modifications
 
Ligne 26 : Ligne 26 :
[https://scikit-learn.org/stable/auto_examples/ensemble/plot_isolation_forest.html IsolationForest - scikit learn]
[https://scikit-learn.org/stable/auto_examples/ensemble/plot_isolation_forest.html IsolationForest - scikit learn]


[[Catégorie:Publication]]
 
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]

Dernière version du 23 avril 2025 à 23:31

Définition

Algorithme d'apprentissage automatique non supervisé qui permet la détection d'anomalies dans un ensemble de données, et ce, par l'isolation des données atypiques ou aberrantes.

Compléments

L'algorithme construit un ensemble d'arbres de décision aléatoires (la forêt). Pour chaque donnée, il mesure le nombre de partitions nécessaires pour l'isoler dans la forêt. Il repose donc sur le principe que les anomalies sont isolables, c'est-à-dire qu'elles nécessitent moins de partitions pour être isolées dans une forêt d'arbres de décision.


Ce type d'algorithme est souvent utilisé pour la détection de fraudes (par exemples les transactions bancaires), la détection d'intrusions dans les réseaux, la détection d'erreurs dans les données, etc. En bref, il est utile dans n'importe quelle application où la détection de valeurs atypiques (anomalies) a un intérêt.

Français

forêt d'isolation

Anglais

isolation forest

IForest

Sources

Yepmo et al. (2023) Vers un partitionnement des données à partir d'une forêt d'isolation

Fouad Jabiri (2020) Applications de méthodes de classification non supervisées à la détection d'anomalies

Wikipedia - isolation forest

IsolationForest - scikit learn