« Contamination des données par indiscrétion » : différence entre les versions


Aucun résumé des modifications
Aucun résumé des modifications
 
(18 versions intermédiaires par 4 utilisateurs non affichées)
Ligne 1 : Ligne 1 :
<!-- Vocabulaire -->
[[Category:Intelligence artificielle]]
[[Category:Termino 2019]]
==Définition==
==Définition==
Risque de contamination volontaire ou non d'information provenant de l'ensemble de données de test qui a une influence sur les résultats d'apprentissage.
Risque de contamination volontaire ou non d'information provenant de l'[[Données de test|ensemble de données de test]] qui a une influence sur les résultats d'apprentissage. Par exemple, la contamination peut se produire en choisissant un [[modèle]] en fonction des résultats obtenus par d'autres chercheurs sur les données de test. Cette façon de choisir le modèle rend le modèle surajusté non seulement sur les données d'entraînement, mais également sur les données du jeu de test.
 
Note: par exemple, la contamination peut se produire en choisissant un modèle en fonction des résultats obtenus par d'autres chercheur sur les données de test. Cette façon de choisir le modèle rend le modèle surajusté non seulement sur les données d'entraînement, mais également sur les données du jeu de test.


==Français==
==Français==
'''contamination des données par furetage'''  loc. nom. f.


'''contamination des données par indiscrétion'''  loc. nom. f.
'''contamination des données par indiscrétion'''   


'''contamination par les données'''  loc. nom. f.
'''contamination des données par furetage'''   


==Anglais==
==Anglais==
'''compositionality'''
'''compositionality contamination '''
 
==Español==


''''' contaminación de datos por indiscreción '''''


''Riesgo de contaminación, intencional o inadvertida, de la información del conjunto de datos de prueba que influye en los resultados de entrenamiento. Por ejemplo, la contaminación puede ocurrir al elegir un modelo basándose en los resultados obtenidos por otros investigadores con los datos de prueba. Esta forma de elegir el modelo provoca un sobreajuste del modelo no solo con los datos de entrenamiento, sino también con los datos del conjunto de prueba.''


==Sources==


<small>


[[Utilisateur:Claude COULOMBE | Source: Claude Coulombe, Datafranca.org]]         
[[Utilisateur:Claude COULOMBE | Source: Claude Coulombe, Datafranca.org]]         
    
    
[[Utilisateur:Patrickdrouin  | Source: Termino]]
[[Utilisateur:Patrickdrouin  | Source: Termino]]
{{Modèle:101}}
[[Category:Intelligence artificielle]]
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]
[[Catégorie:101]]

Dernière version du 21 juillet 2025 à 16:10

Définition

Risque de contamination volontaire ou non d'information provenant de l'ensemble de données de test qui a une influence sur les résultats d'apprentissage. Par exemple, la contamination peut se produire en choisissant un modèle en fonction des résultats obtenus par d'autres chercheurs sur les données de test. Cette façon de choisir le modèle rend le modèle surajusté non seulement sur les données d'entraînement, mais également sur les données du jeu de test.

Français

contamination des données par indiscrétion

contamination des données par furetage

Anglais

compositionality contamination

Español

contaminación de datos por indiscreción

Riesgo de contaminación, intencional o inadvertida, de la información del conjunto de datos de prueba que influye en los resultados de entrenamiento. Por ejemplo, la contaminación puede ocurrir al elegir un modelo basándose en los resultados obtenidos por otros investigadores con los datos de prueba. Esta forma de elegir el modelo provoca un sobreajuste del modelo no solo con los datos de entrenamiento, sino también con los datos del conjunto de prueba.

Sources

Source: Claude Coulombe, Datafranca.org

Source: Termino

101 MOTS DE L' IA
Ce terme est sélectionné pour le livre « Les 101 mots de l'intelligence artificielle » Ligne bleue2.jpg