« Agrégation par ré-échantillonnage avec remise » : différence entre les versions


Aucun résumé des modifications
Balise : Éditeur de wikicode 2017
Aucun résumé des modifications
 
(49 versions intermédiaires par 4 utilisateurs non affichées)
Ligne 1 : Ligne 1 :
== Domaine ==
==Définition==
Méta-algorithme d'[[apprentissage ensembliste]] qui ré-échantillonne au hasard avec remise les [[données d'entraînement]] pour créer un ensemble de modèles où chaque sous-échantillon correspond à un modèle distinct.


[[Category:Vocabulaire]]
==Compléments==
[[Category:Intelligence artificielle]]Intelligence artificielle<br />
Le ré-échantillonnage désigne le processus de création d'un nouvel échantillon de données à partir d'un jeu de données existant, souvent avec remise.
<hr/>
Note: le résultat sera obtenu par le calcul de la moyenne pour une [[régression]] (prévision d'un nombre) ou par un vote majoritaire dans le cas d'une [[classification]] (prévision d'une classe).
<hr/>
Typiquement, l'agrégation par ré-échantillonnage avec remise aide à réduire la variance et le [[surapprentissage]]. L'algorithme de la [[forêt aléatoire]] (en anglais, ''random forest'') est une application très utilisée de l'agrégation par ré-échantillonnage avec remise.


Voir: '''[[Ré-échantillonnage avec remise]]'''
<hr/>
L'[[empilement de modèles]] (en anglais, stacking) et l'[[amplification de gradient]] (en anglais, ''gradient boosting'') sont d'autres méthodes pour combiner les résultats d'ensembles de modèles (par exemple, à partir de différents jeux de données utilisés pour l'entraînement des modèles).


==Français==
'''agrégation par ré-échantillonnage avec remise'''


[[Category:Termino 2019]]
'''agrégation ensembliste par ré-échantillonnage avec remise'''
[[Category:Scotty]]


'''agrégation par la méthode de Cyrano'''


'''agrégation en circuit fermé'''


<br>
'''agrégation bootstrap'''


'''ré-échantillonnage avec remise ensembliste''' 


'''BAGage'''


== Définition ==
==Anglais==
Méta-algorithme d'apprentissage ensembliste qui ré-échantillonne au hasard avec remise les données d'entraînement pour créer un ensemble de modèles où chaque sous-échantillon correspond à un modèle distinct.
'''bagging'''
 
<br>
 


'''bootstrap aggregation'''


== Français ==
'''bootstrap aggregating'''


'''ré-échantillonnage avec remise ensembliste'''
'''gradient bagging'''
<br>


'''agrégation par bootstrap'''
==Sources==
<br>


'''agrégation par la méthode de Cyrano'''
[https://french.stackexchange.com/questions/32714/french-translation-of-bagging-in-the-case-of-artificial-intelligence/55774#55774 StackExchange - agrégation par ré-échantillonnage avec remise]


<br>
[https://www150.statcan.gc.ca/n1/pub/12-001-x/2014002/article/14118-fra.htm  Article - Wang, Jianqiang C ; Jean D. Opsomer et Haonan Wang (2014). ''L’agrégation bootstrap des estimateurs non différenciables dans les enquêtes complexes'', Statistique Canada. - agrégation bootstrap]


Note<br>
[https://accromath.uqam.ca/2008/07/comment-compter-les-cerfs/ Article de Christian Genest et Louis-Paul Rivest - Comment compter les cerfs? - méthode de Cyrano. ]


Le résultat sera obtenu par le calcul de la moyenne pour une régression (prédiction d'un nombre) ou par un vote majoritaire dans le cas d'une classification (prédiction d'une classe). Typiquement, le ré-échantillonnage ensembliste aide à réduire la variance et le sur-ajustement. L'algorithme de la forêt aléatoire (en anglais, "random forest") est une extension très utilisée du ré-échantillonnage ensembliste.
[[Utilisateur:Claude COULOMBE | Claude Coulombe, Datafranca.org]]       
 
 
<br>
 
 
== Anglais ==
 
'''bagging'''
 
'''bootstrap aggregation'''


<br>
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]

Dernière version du 5 mai 2025 à 15:15

Définition

Méta-algorithme d'apprentissage ensembliste qui ré-échantillonne au hasard avec remise les données d'entraînement pour créer un ensemble de modèles où chaque sous-échantillon correspond à un modèle distinct.

Compléments

Le ré-échantillonnage désigne le processus de création d'un nouvel échantillon de données à partir d'un jeu de données existant, souvent avec remise.


Note: le résultat sera obtenu par le calcul de la moyenne pour une régression (prévision d'un nombre) ou par un vote majoritaire dans le cas d'une classification (prévision d'une classe).


Typiquement, l'agrégation par ré-échantillonnage avec remise aide à réduire la variance et le surapprentissage. L'algorithme de la forêt aléatoire (en anglais, random forest) est une application très utilisée de l'agrégation par ré-échantillonnage avec remise.

Voir: Ré-échantillonnage avec remise


L'empilement de modèles (en anglais, stacking) et l'amplification de gradient (en anglais, gradient boosting) sont d'autres méthodes pour combiner les résultats d'ensembles de modèles (par exemple, à partir de différents jeux de données utilisés pour l'entraînement des modèles).

Français

agrégation par ré-échantillonnage avec remise

agrégation ensembliste par ré-échantillonnage avec remise

agrégation par la méthode de Cyrano

agrégation en circuit fermé

agrégation bootstrap

ré-échantillonnage avec remise ensembliste

BAGage

Anglais

bagging

bootstrap aggregation

bootstrap aggregating

gradient bagging

Sources

StackExchange - agrégation par ré-échantillonnage avec remise

Article - Wang, Jianqiang C ; Jean D. Opsomer et Haonan Wang (2014). L’agrégation bootstrap des estimateurs non différenciables dans les enquêtes complexes, Statistique Canada. - agrégation bootstrap

Article de Christian Genest et Louis-Paul Rivest - Comment compter les cerfs? - méthode de Cyrano.

Claude Coulombe, Datafranca.org