« Agrégation par ré-échantillonnage avec remise » : différence entre les versions


Aucun résumé des modifications
Aucun résumé des modifications
Ligne 2 : Ligne 2 :
Méta-algorithme d'apprentissage ensembliste qui ré-échantillonne au hasard avec remise les données d'entraînement pour créer un ensemble de modèles où chaque sous-échantillon correspond à un modèle distinct.
Méta-algorithme d'apprentissage ensembliste qui ré-échantillonne au hasard avec remise les données d'entraînement pour créer un ensemble de modèles où chaque sous-échantillon correspond à un modèle distinct.


Note: le résultat sera obtenu par le calcul de la moyenne pour une régression (prédiction d'un nombre) ou par un vote majoritaire dans le cas d'une classification (prédiction d'une classe). Typiquement, le ré-échantillonnage ensembliste aide à réduire la variance et le sur-ajustement. L'algorithme de la forêt aléatoire ''(random forest)'' est une extension très utilisée du ré-échantillonnage ensembliste.
==Compléments==
Ré-échantillonnage désigne le processus de création d'un nouvel échantillon de données à partir d'un jeu de données existant, souvent avec remise.
<hr/>
Note: le résultat sera obtenu par le calcul de la moyenne pour une régression (prévision d'un nombre) ou par un vote majoritaire dans le cas d'une classification (prévision d'une classe).  
<hr/>
Typiquement, le ré-échantillonnage ensembliste aide à réduire la variance et le sur-ajustement. L'algorithme de la [[forêt aléatoire]] (en anglais, ''random forest'') est une extension très utilisée du ré-échantillonnage avec remise ensembliste.


Voir: '''[[Ré-échantillonnage avec remise]]'''
Voir: '''[[Ré-échantillonnage avec remise]]'''
<hr/>
L'empilement de modèles (en anglais, stacking) et l'[[amplification de gradient]] (en anglais, ''gradient boosting'') sont d'autres méthodes pour combiner les résultats d'ensembles de modèles (par exemple, à partir de différents jeux de données utilisés pour l'entraînement des modèles).


==Français==
==Français==
Ligne 13 : Ligne 20 :
'''agrégation par la méthode de Cyrano'''  
'''agrégation par la méthode de Cyrano'''  


'''agrégation de circuit fermé'''
'''agrégation en circuit fermé'''


==Anglais==
==Anglais==
Ligne 20 : Ligne 27 :
'''bootstrap aggregation'''
'''bootstrap aggregation'''


'''Gradient Bagging'''
'''gradient bagging'''


==Sources==
==Sources==


[https://www150.statcan.gc.ca/n1/pub/12-001-x/2014002/article/14118-fra.htm  Source: Wang, Jianqiang C ; Jean D. Opsomer et Haonan Wang (2014). ''L’agrégation bootstrap des estimateurs non différenciables dans les enquêtes complexes'', Statistique Canada.]  
[https://www150.statcan.gc.ca/n1/pub/12-001-x/2014002/article/14118-fra.htm  Article - Wang, Jianqiang C ; Jean D. Opsomer et Haonan Wang (2014). ''L’agrégation bootstrap des estimateurs non différenciables dans les enquêtes complexes'', Statistique Canada. - agrégation bootstrap]  


[[Utilisateur:Claude COULOMBE | Source: Claude Coulombe, Datafranca.org]]         
[[Utilisateur:Claude COULOMBE | Source: Claude Coulombe, Datafranca.org]]         
Ligne 30 : Ligne 37 :
[[Utilisateur:Patrickdrouin  | Source: Termino]]
[[Utilisateur:Patrickdrouin  | Source: Termino]]


[[Catégorie:GRAND LEXIQUE FRANÇAIS]]


 
[[Catégorie:Publication]]
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]

Version du 27 avril 2025 à 06:58

Définition

Méta-algorithme d'apprentissage ensembliste qui ré-échantillonne au hasard avec remise les données d'entraînement pour créer un ensemble de modèles où chaque sous-échantillon correspond à un modèle distinct.

Compléments

Ré-échantillonnage désigne le processus de création d'un nouvel échantillon de données à partir d'un jeu de données existant, souvent avec remise.


Note: le résultat sera obtenu par le calcul de la moyenne pour une régression (prévision d'un nombre) ou par un vote majoritaire dans le cas d'une classification (prévision d'une classe).


Typiquement, le ré-échantillonnage ensembliste aide à réduire la variance et le sur-ajustement. L'algorithme de la forêt aléatoire (en anglais, random forest) est une extension très utilisée du ré-échantillonnage avec remise ensembliste.

Voir: Ré-échantillonnage avec remise


L'empilement de modèles (en anglais, stacking) et l'amplification de gradient (en anglais, gradient boosting) sont d'autres méthodes pour combiner les résultats d'ensembles de modèles (par exemple, à partir de différents jeux de données utilisés pour l'entraînement des modèles).

Français

ré-échantillonnage avec remise ensembliste

ré-échantillonnage avec remise

agrégation par la méthode de Cyrano

agrégation en circuit fermé

Anglais

bagging

bootstrap aggregation

gradient bagging

Sources

Article - Wang, Jianqiang C ; Jean D. Opsomer et Haonan Wang (2014). L’agrégation bootstrap des estimateurs non différenciables dans les enquêtes complexes, Statistique Canada. - agrégation bootstrap

Source: Claude Coulombe, Datafranca.org

Source: Termino