Fléau de la dimension


Définition

Phénomènes observés lors de l'analyse ou de l'organisation de données dans des espaces de grande dimension qui ne se manifestent pas dans des espaces de dimension moindre.

Compléments

Ici, il est utile de distinguer entre la dimension d'une données qui se rapporte au nombre d'attributs de chaque donnée d'un jeu de données et le concept de dimensionnalité qui est un concept technique plus abstrait qui se réfère à la nature multidimensionnelle et la complexité d'un jeu de données, d'un modèle, d'une représentation, d'un algorithme ou d'une méthode d'analyse.


Le terme fléau de la dimensionnalité (curse of dimensionality) a été utilisé pour la première fois par Richard Bellman. Il fait référence au problème de l'augmentation exponentielle du volume associé à l'ajout de dimensions supplémentaires à un espace mathématique.

À mesure que la dimension augmente, les données disponibles deviennent rares et nécessitent une quantité toujours plus grande de données pour produire un résultat d'apprentissage statistiquement significatif.

La réduction de la dimensionnalité permet de réduire la complexité d’un problème d’apprentissage automatique à plusieurs niveaux: d’un point de vue théorique, cela entraîne automatiquement une amélioration des propriétés de stabilité et de robustesse des algorithmes.

Français

fléau de la dimensionnalité

fléau de la dimension

fléau de la haute dimension

problème de la dimensionnalité

Anglais

curse of dimensionality

Sources

Source : IGI Global, What is Curse of Dimensionality

Source : Data Analytics Post, Réduction de la dimensionnalité

Source : Michel Delecroix, Le fléau de la dimension et ses parades