« Forêt d'isolation » : différence entre les versions


Aucun résumé des modifications
Aucun résumé des modifications
 
(5 versions intermédiaires par 2 utilisateurs non affichées)
Ligne 1 : Ligne 1 :
== Définition ==
== Définition ==
Algorithme d'[[apprentissage automatique]] [[apprentissage non supervisé|non supervisé]] qui permet la [[détection d'anomalies]] dans un [[ensemble de données]], et ce, par l'isolation des [[donnée aberrante|données atypiques ou aberrantes]].
Algorithme d'[[apprentissage automatique]] [[apprentissage non supervisé|non supervisé]] qui permet la [[détection d'anomalies]] dans un [[ensemble de données]], et ce, par l'isolation des [[donnée aberrante|données atypiques ou aberrantes]].
== Compléments ==
L'algorithme construit un ensemble d'arbres de décision aléatoires (la ''forêt''). Pour chaque donnée, il mesure le nombre de partitions nécessaires pour l'isoler dans la forêt. Il repose donc sur le principe que les anomalies sont ''isolables'', c'est-à-dire qu'elles nécessitent moins de partitions pour être isolées dans une forêt d'arbres de décision.
<hr/>
Ce type d'algorithme est souvent utilisé pour la  détection de fraudes (par exemples les transactions bancaires), la détection d'intrusions dans les réseaux, la détection d'erreurs dans les données, etc.
En bref, il est utile dans n'importe quelle application où la détection de valeurs atypiques (anomalies) a un intérêt.


== Français ==
== Français ==
Ligne 9 : Ligne 15 :


'''IForest'''
'''IForest'''


==Sources==
==Sources==
[https://en.wikipedia.org/wiki/Isolation_forest Wikipedia]


[https://hal.science/hal-03972677/document Yepmo et al. (2023) ''Vers un partitionnement des données à partir d'une forêt d'isolation'']
[https://hal.science/hal-03972677/document Yepmo et al. (2023) ''Vers un partitionnement des données à partir d'une forêt d'isolation'']
Ligne 19 : Ligne 22 :
[https://corpus.ulaval.ca/server/api/core/bitstreams/26f9dfde-f937-4f41-be24-dae801c53585/content Fouad Jabiri (2020) ''Applications de méthodes de classification non supervisées à la détection d'anomalies'']
[https://corpus.ulaval.ca/server/api/core/bitstreams/26f9dfde-f937-4f41-be24-dae801c53585/content Fouad Jabiri (2020) ''Applications de méthodes de classification non supervisées à la détection d'anomalies'']


[[Catégorie:Publication]]
[https://en.wikipedia.org/wiki/Isolation_forest Wikipedia - isolation forest]
 
[https://scikit-learn.org/stable/auto_examples/ensemble/plot_isolation_forest.html IsolationForest - scikit learn]
 
 
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]

Dernière version du 23 avril 2025 à 23:31

Définition

Algorithme d'apprentissage automatique non supervisé qui permet la détection d'anomalies dans un ensemble de données, et ce, par l'isolation des données atypiques ou aberrantes.

Compléments

L'algorithme construit un ensemble d'arbres de décision aléatoires (la forêt). Pour chaque donnée, il mesure le nombre de partitions nécessaires pour l'isoler dans la forêt. Il repose donc sur le principe que les anomalies sont isolables, c'est-à-dire qu'elles nécessitent moins de partitions pour être isolées dans une forêt d'arbres de décision.


Ce type d'algorithme est souvent utilisé pour la détection de fraudes (par exemples les transactions bancaires), la détection d'intrusions dans les réseaux, la détection d'erreurs dans les données, etc. En bref, il est utile dans n'importe quelle application où la détection de valeurs atypiques (anomalies) a un intérêt.

Français

forêt d'isolation

Anglais

isolation forest

IForest

Sources

Yepmo et al. (2023) Vers un partitionnement des données à partir d'une forêt d'isolation

Fouad Jabiri (2020) Applications de méthodes de classification non supervisées à la détection d'anomalies

Wikipedia - isolation forest

IsolationForest - scikit learn