Science des données


Définition

La science des données est un domaine multidisciplinaire qui se situe à la croisée de la statistique, de l’informatique et d’un domaine d’application.

On exclut généralement l’apprentissage automatique de la science des données que l’on considère comme un domaine autonome. Cela demeure un choix arbitraire, car l’apprentissage automatique se base essentiellement sur les données.

La science des données s’occupe de l’acquisition, de la préparation, de l’exploration, de l’analyse et de la visualisation des données, incluant la recherche de relations et les statistiques descriptives. Ainsi définie, la science des données s’arrête là où débute l’apprentissage automatique proprement dit.

Sur le plan technique, la science des données couvre l’ensemble des domaines liés à l’exploitation, la gestion, la préparation et l’analyse de données massives, de données structurées et non structurées dans le but d’en extraire de l’information pertinente ou des connaissances.

Compléments

Bien qu’on rencontre parfois des mentions au pluriel du terme « les sciences des données », il s’agit d’un usage incorrect puisque de la même façon qu’on ne dit pas les chimies ou les physiques, la science des données est un domaine en soi.

Les statistiques descriptives regroupent le calcul de la fréquence, de la moyenne, de la variance, et de la corrélation.

Français

science des données

Anglais

data science

Español

ciencia de datos

La ciencia de datos es un campo multidisciplinar que se encuentra en la encrucijada de la estadística, la informática y un campo de aplicación. El aprendizaje automático suele excluirse de la ciencia de datos, que se considera un campo independiente.

Se trata de una elección arbitraria, ya que el aprendizaje automático se basa esencialmente en los datos. La ciencia de datos se ocupa de la adquisición, preparación, exploración, análisis y visualización de datos, incluida la búsqueda de relaciones y la estadística descriptiva. Definida de este modo, la ciencia de datos termina donde empieza el aprendizaje automático propiamente dicho.

En términos técnicos, la ciencia de datos abarca todos los campos vinculados a la explotación, gestión, preparación y análisis de datos masivos, datos estructurados y no estructurados, con el objetivo de extraer información o conocimientos pertinentes.


Sources

Source : Wikipedia, Science des données.

Source : 24pm Academy

Source : GDT - Traitement des données


101 MOTS DE L' IA
Ce terme est sélectionné pour le livre « Les 101 mots de l'intelligence artificielle » Ligne bleue2.jpg