« Préparation de données » : différence entre les versions


(Page créée avec « ==Définition== Traitement automatisé de mégadonnées brutes qui consiste à les mettre en forme pour permettre leur analyse grâce aux méthodes de la science des données. == Compléments == Le triturage de données peut inclure des changements de format, des corrections d’erreurs, des filtrages des données. ==Français== '''triturage des données''' ==Anglais== '''data crunching''' ==Sources== [https://datafranca.org/wiki/images/50_termes_de_... »)
 
Aucun résumé des modifications
 
(12 versions intermédiaires par 4 utilisateurs non affichées)
Ligne 1 : Ligne 1 :
==Définition==
==Définition==
Traitement automatisé de [[mégadonnées]] brutes qui consiste à les mettre en forme pour permettre leur analyse grâce aux méthodes de la [[science des données]].  
La préparation de données est un processus qui précède celui de l'[[analyse de données]]. Il est constitué de plusieurs tâches comme la collecte, le [[Nettoyage des données|nettoyage]], l'enrichissement incluant l'[[Annotation des données|annotation]], la fusion de données et enfin le formatage.


== Compléments ==
== Compléments ==
Le triturage de données peut inclure des changements de format, des corrections d’erreurs, des filtrages des données.
Au cours du processus, les données « [[Données brutes|brutes]] » sont soumises à différents traitements afin de les rendre exploitables pour l'étape d'[[exploration des données]], puis celle de [[Forage de données|forage]] dans le but d'en extraire des connaissances et enfin la construction de [[Modèle|modèles d'apprentissage]].
 
La préparation des données est l’étape clé, car la fiabilité de l'analyse dépend en très grande partie de la qualité des données.
 
<hr/>
Cette étape de préparation correspond au T dans l'acronyme [[ETC]] (extraction transformation chargement).
 
<hr/>
Bien que certains suggèrent l'équivalent ''[[data crunching]]'', nous suggérons plutôt d'utiliser ''[[traitement de données]]'' pour ce dernier concept.


==Français==
==Français==
'''préparation de données'''
'''préparation des données'''
'''prétraitement de données'''
'''prétraitement des données'''
'''triturage de données'''
'''triturage des données'''
'''triturage des données'''


==Anglais==
==Anglais==
'''data crunching'''
'''data wrangling'''
 
'''data munging'''
 
'''data preprocessing'''
 
==Español==
 
''''' preparación de datos '''''
 
''La preparación de datos es un proceso que precede al análisis de datos. Consta de una serie de tareas, como la recogida de datos, la limpieza, el enriquecimiento, incluida la anotación, la fusión de datos y, por último, el formateo.''
 
''Durante el proceso, los datos «en bruto» se someten a diversos tratamientos para hacerlos utilizables en la fase de análisis exploratorio de datos, luego en la de perforación para extraer conocimientos y, por último, en la construcción de modelos de aprendizaje.''
''
La preparación de los datos es la etapa clave, porque la fiabilidad del análisis depende en gran medida de la calidad de los datos.''  


==Sources==
==Sources==
[https://fr.wikipedia.org/wiki/Pr%C3%A9paration_des_donn%C3%A9es  Wikipedia, Préparation des données.]
[https://fr.talend.com/resources/what-is-data-preparation/ Talend.com, What is data preparation.]
[https://en.wikipedia.org/wiki/Data_wrangling Wikipedia, Data wrangling.]
[https://www.trifacta.com/blog/quest-ce-que-le-data-wrangling Trifacta.com, Victor Coustenoble, Qu’est ce que le Data Wrangling ? ]
[https://datafranca.org/wiki/images/50_termes_de_l'IA-2025.pdf  ''50 termes clés de l'intelligence artificielle'', Ministère de la culture, Commission d'enrichissement de la langue française (2025). - Triturage de données]
[https://datafranca.org/wiki/images/50_termes_de_l'IA-2025.pdf  ''50 termes clés de l'intelligence artificielle'', Ministère de la culture, Commission d'enrichissement de la langue française (2025). - Triturage de données]


{{Modèle:101}}
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]
[[Catégorie:101]]

Dernière version du 23 juillet 2025 à 09:43

Définition

La préparation de données est un processus qui précède celui de l'analyse de données. Il est constitué de plusieurs tâches comme la collecte, le nettoyage, l'enrichissement incluant l'annotation, la fusion de données et enfin le formatage.

Compléments

Au cours du processus, les données « brutes » sont soumises à différents traitements afin de les rendre exploitables pour l'étape d'exploration des données, puis celle de forage dans le but d'en extraire des connaissances et enfin la construction de modèles d'apprentissage.

La préparation des données est l’étape clé, car la fiabilité de l'analyse dépend en très grande partie de la qualité des données.


Cette étape de préparation correspond au T dans l'acronyme ETC (extraction transformation chargement).


Bien que certains suggèrent l'équivalent data crunching, nous suggérons plutôt d'utiliser traitement de données pour ce dernier concept.

Français

préparation de données

préparation des données

prétraitement de données

prétraitement des données

triturage de données

triturage des données

Anglais

data wrangling

data munging

data preprocessing

Español

preparación de datos

La preparación de datos es un proceso que precede al análisis de datos. Consta de una serie de tareas, como la recogida de datos, la limpieza, el enriquecimiento, incluida la anotación, la fusión de datos y, por último, el formateo.

Durante el proceso, los datos «en bruto» se someten a diversos tratamientos para hacerlos utilizables en la fase de análisis exploratorio de datos, luego en la de perforación para extraer conocimientos y, por último, en la construcción de modelos de aprendizaje. La preparación de los datos es la etapa clave, porque la fiabilidad del análisis depende en gran medida de la calidad de los datos.

Sources

Wikipedia, Préparation des données.

Talend.com, What is data preparation.

Wikipedia, Data wrangling.

Trifacta.com, Victor Coustenoble, Qu’est ce que le Data Wrangling ?

50 termes clés de l'intelligence artificielle, Ministère de la culture, Commission d'enrichissement de la langue française (2025). - Triturage de données

101 MOTS DE L' IA
Ce terme est sélectionné pour le livre « Les 101 mots de l'intelligence artificielle » Ligne bleue2.jpg