Nouvelles pages
- 17 mai 2025 à 20:48 MiMo (hist | modifier) [579 octets] Pitpitt (discussion | contributions) (Page créée avec « ==en construction== == Définition == XXXXXXXXX == Français == ''' MiMo-7B'' == Anglais == '''MiMo-7B''' MiMo-7B, a large language model specifically designed for reasoning tasks. The model is optimized across both pre-training and post-training stages to unlock its reasoning potential. Despite having only 7 billion parameters, MiMo-7B achieves superior performance on mathematics and code reasoning tasks, outperforming even much larger models including Open... »)
- 13 mai 2025 à 15:01 Analyse en composantes indépendantes (hist | modifier) [1 639 octets] Patrickdrouin (discussion | contributions) (Page créée avec « == Définition == Dans le domaine du traitement des signaux, l'analyse en composantes indépendantes (ICA) est un traitement statistique permettant de séparer un signal multivarié en sous-composantes indépendantes. == Compléments == L'illustration classique de l'usage de l'analyse en composantes indépendantes est celle de la soirée cocktail (''cocktail party problem'') où les discussions se superposent. Grâce à L'ACI, il est possible d'isoler la voix... ») créé initialement avec le titre « Independent Components Analysis »
- 10 mai 2025 à 13:32 Token Masking (hist | modifier) [918 octets] Arianne (discussion | contributions) (Page créée avec « == en construction == == Définition == XXXXXXX Voir aussi '''grand modèle de langues''', '''BERT''', '''segmentation''' == Français == ''' XXXXXXXX''' == Anglais == ''' Token Masking''' ''Masking sensitive tokens from users’ data helps reduce the privacy risks and prevent any personal information being leaked or extracted from adversaries. Such token masking task shall be performed without human-in-the-loop since practitioners are not allowe... »)
- 30 avril 2025 à 06:35 Prédicteur faible (hist | modifier) [4 723 octets] Claude COULOMBE (discussion | contributions) (Page créée avec « == Définition == Dans le contexte de l'apprentissage automatique et plus précisément de l'apprentissage ensembliste, un ''prédicteur faible'' désigne un modèle ou un algorithme d'apprentissage dont les performances sur une tâche donnée, typiquement la classification, sont seulement légèrement supérieures à celles obtenues par un choix aléatoire. ==Compléments== Pour une tâche de classification binaire,... ») créé initialement avec le titre « Weak learner »
- 29 avril 2025 à 15:04 Licence en paramètres ouverts (hist | modifier) [1 297 octets] Patrickdrouin (discussion | contributions) (Page créée avec « ==Définition== Un logiciel libre ou logiciel à code source ouvert est un logiciel distribué selon une licence ouverte qui permet à différents degrés selon la licence de lire, d'exécuter, de copier, de distribuer, d'étudier, de modifier et d'améliorer le logiciel dont le code source est disponible. ==Français== '''logiciel libre''' '''code source ouvert ''' ==Anglais== '''Open-source software ''' ==Sources== [https://wiki.facil.qc.ca/... ») créé initialement avec le titre « Open weights license »
- 29 avril 2025 à 14:47 Paramètres ouverts (hist | modifier) [1 810 octets] Patrickdrouin (discussion | contributions) (Page créée avec « ==Définition== Mode d'innovation selon lequel les résultats, les mécanismes, les méthodologies, etc. sont rendus publics et distribués gratuitement. == Compléments == En intelligence artificielle, certains grands modèles de langues sont distribués sous la bannière de l'innovation ouverte. Cependant, il est important de noter que seuls les paramètres (poids) des modèles sont diffusés à la communauté sous une licence avec... »)
- 28 avril 2025 à 03:21 Régresseur (hist | modifier) [634 octets] Claude COULOMBE (discussion | contributions) (Page créée avec « ==Définition== '''Fonction mathématique''' ou '''modèle prédictif''' qui repose sur un '''algorithme''' de régression qui associe des données en entrée à une valeur numérique (typiquement un nombre réel), en sortie. ==Français== '''régresseur''' ==Anglais== '''regressor''' ==Sources== [https://www.dunod.com/sciences-techniques/machine-learning-avec-scikit-learn-mise-en-oeuvre-et-cas-concrets-1" - Livre Aurélien Géron - ''M... »)
- 26 avril 2025 à 11:43 Model Decay (hist | modifier) [713 octets] Pitpitt (discussion | contributions) (Page créée avec « ==en construction== == Définition == XXXXXXXXX == Français == ''' XXXXXXXXX ''' == Anglais == '''Model Decay'' If a model remains static while the outside world continues to evolve, its performance will gradually decline. This performance decrease is known as decay. Decay is caused by drift, either in the features’ data coming in or in the relationships between the features and the target variable. The two main ways that models tend to decay are thro... »)
- 26 avril 2025 à 11:42 Stop Words (hist | modifier) [637 octets] Pitpitt (discussion | contributions) (Page créée avec « ==en construction== == Définition == XXXXXXXXX == Français == ''' XXXXXXXXX ''' == Anglais == '''Stop Words''' Stop words are those words which are filtered out before further processing of text, since these words contribute little to overall meaning, given that they are generally the most common words in a language. For instance, "the," "and," and "a," while all required words in a particular passage, don't generally contribute greatly to one's understan... »)
- 26 avril 2025 à 11:40 Positional Encoding (hist | modifier) [465 octets] Pitpitt (discussion | contributions) (Page créée avec « ==en construction== == Définition == XXXXXXXXX == Français == ''' XXXXXXXXX ''' == Anglais == '''Positional Encoding''' Positional encoding refers to a method in transformer models that helps to maintain the sequential order of words. This is a crucial component for understanding the context within a sentence and between sentences. == Source == [https://www.kdnuggets.com/generative-ai-key-terms-explained Source : kdnuggets] Catégorie:vocabulary »)
- 26 avril 2025 à 11:39 Syntactic Analysis (hist | modifier) [603 octets] Pitpitt (discussion | contributions) (Page créée avec « ==en construction== == Définition == XXXXXXXXX == Français == ''' XXXXXXXXX ''' == Anglais == '''Syntactic Analysis''' Also referred to as parsing, syntactic analysis is the task of analyzing strings as symbols, and ensuring their conformance to a established set of grammatical rules. This step must, out of necessity, come before any further analysis which attempts to extract insight from text -- semantic, sentiment, etc. -- treating it as something beyond... »)
- 26 avril 2025 à 11:35 Model Context Protocol (hist | modifier) [1 160 octets] Pitpitt (discussion | contributions) (Page créée avec « ==en construction== == Définition == XXXXXXXXX == Français == ''' XXXXXXXXX ''' == Anglais == '''Model Context Protocol''' The Model Context Protocol (MCP) is an open standard that standardizes how applications provide context to large language models (LLMs). It acts as a standardized way to connect AI models to different data sources and tools, similar to how USB-C connects devices to various peripherals and accessories.45 In the MCP architecture, a s... »)
- 25 avril 2025 à 03:53 Théorème du gradient de politique (hist | modifier) [801 octets] Claude COULOMBE (discussion | contributions) (Page créée avec « ==Définition== En apprentissage par renforcement, le théorème du gradient de politique permet de simplifier l'apprentissage d'une [politique d'action] en établissant que le gradient (ou dérivée) de la récompense attendue en suivant une [politique d'action] est l'espérance du produit de la récompense attendue par le gradient (ou dérivée) du logarithme de la [politique d'action]. La [politique d'action] est généralement exprimée sous la forme d'u... ») créé initialement avec le titre « Policy Gradient Theorem »
- 25 avril 2025 à 00:47 Méthode du gradient de politique (hist | modifier) [1 393 octets] Claude COULOMBE (discussion | contributions) (Page créée avec « ==Définition== En apprentissage par renforcement la méthode à gradient de politique permet de prévoir la meilleure action à accomplir par un agent dans un état donné de l'environnement. == Compléments == Alors que l’apprentissage par fonction Q vise à prévoir la valeur de la récompense ou la punition d’une action entreprise par un agent dans un certain état, la méthode à gradient de politique prédit directement l’action elle-même.... ») créé initialement avec le titre « Policy gradient »
- 22 avril 2025 à 15:23 Ollama (hist | modifier) [1 403 octets] Patrickdrouin (discussion | contributions) (Page créée avec « ==Définition== Nom propre donné à un outil en code source ouvert qui permet d’exécuter de grands modèles de langues (GML) sur un ordinateur local donc hors ligne. == Compléments == Ollama offre l'avantage de fonctionner sur la plupart des systèmes d'exploitation (Linux, MacOS, Windows) et avec une large éventail de grands modèles de langues en paramètres ouve... »)
- 31 mars 2025 à 12:52 Nonparametric statistics (hist | modifier) [530 octets] Arianne (discussion | contributions) (Page créée avec « == en construction == == Définition == XXXXXX == Anglais == ''' Nonparametric statistics''' == Français == ''' Statistique non paramétrique''' ''' Statistiques non paramétriques''' == Source == [https://en.wikipedia.org/wiki/Nonparametric_statistics Source : Wikipedia] Catégorie:vocabulary »)
- 31 mars 2025 à 12:49 Nearest-neighbor interpolation (hist | modifier) [468 octets] Arianne (discussion | contributions) (Page créée avec « == en construction == == Définition == XXXXXX == Français == ''' Interpolation au plus proche voisin''' == Anglais == ''' Nearest-neighbor interpolation''' == Source == [https://en.wikipedia.org/wiki/Nearest-neighbor_interpolation Source : Wikipedia] Catégorie:vocabulary »)
- 31 mars 2025 à 12:45 Recherche des plus proches voisins (hist | modifier) [888 octets] Arianne (discussion | contributions) (Page créée avec « == en construction == == Définition == XXXXXX == Français == ''' Recherche des plus proches voisins''' == Anglais == ''' Nearest neighbor search''' == Source == [https://en.wikipedia.org/wiki/Nearest_neighbor_search Source : Wikipedia] Catégorie:vocabulary ») créé initialement avec le titre « Nearest neighbor search »
- 23 mars 2025 à 06:10 Élimination progressive d'attributs (hist | modifier) [1 771 octets] Claude COULOMBE (discussion | contributions) (Page créée avec « ==Définition== Dans le domaine de l'apprentissage automatique et de la statistique, l'élimination progressive d'attributs est une méthode qui sélectionne les attributs les moins pertinents pour un modèle en les retirant un par un, en fonction de leur plus faible contribution à la performance du modèle. == Compléments == Voir le processus inverse, l'ajout progressif d'attributs. <hr/> L'élimination progressive d'attributs peut avoir du mal à gé... »)
- 23 mars 2025 à 06:03 Ajout progressif d'attributs (hist | modifier) [1 822 octets] Claude COULOMBE (discussion | contributions) (Page créée avec « ==Définition== Dans le domaine de l'apprentissage automatique et de la statistique, l'ajout progressif d'attributs est une méthode qui sélectionne les attributs les plus pertinents pour un modèle en les ajoutant un par un, en fonction de leur contribution à la performance du modèle. == Compléments == Voir le processus inverse, l'élimination progressive d'attributs. <hr/> L'ajout progressif d'attributs peut avoir du mal à gérer les situations o... ») créé initialement avec le titre « Forward Feature Selection »
- 20 mars 2025 à 04:33 Dimensionnalité (hist | modifier) [917 octets] Claude COULOMBE (discussion | contributions) (Page créée avec « ==Définition== Concept technique abstrait qui se réfère à ce qui possède une dimension, plus précisément à la nature multidimensionnelle et la complexité d'un jeu de données, d'un modèle, d'une représentation, d'un algorithme ou d'une méthode d'analyse. == Compléments == Ici, il est utile de distinguer avec la dimension d'une données qui se rapporte au nombre d'attributs de chaque donnée d'un jeu de données. ==Français== '''dimensionnalité''... ») créé initialement avec le titre « Dimensionality »
- 10 mars 2025 à 20:40 Peaufinage par apprentissage supervisé (hist | modifier) [905 octets] Claude COULOMBE (discussion | contributions) (Page créée avec « == Définition == Application de l'apprentissage superviséà l'amélioration des performances d'un modèle d'apprentissage. == Français == '''peaufinage par apprentissage supervisé''' '''réglage fin par apprentissage supervisé''' '''ajustement fin par apprentissage supervisé''' '''adaptation par apprentissage supervisé''' == Anglais == '''supervised fine-tuning''' '''supervised fine tuning''' '''supervised finetunin... »)
- 4 mars 2025 à 16:11 Préparation de données (hist | modifier) [2 317 octets] Patrickdrouin (discussion | contributions) (Page créée avec « ==Définition== Traitement automatisé de mégadonnées brutes qui consiste à les mettre en forme pour permettre leur analyse grâce aux méthodes de la science des données. == Compléments == Le triturage de données peut inclure des changements de format, des corrections d’erreurs, des filtrages des données. ==Français== '''triturage des données''' ==Anglais== '''data crunching''' ==Sources== [https://datafranca.org/wiki/images/50_termes_de_... ») créé initialement avec le titre « Data crunching »
- 25 février 2025 à 15:34 Plateforme de données centralisée (hist | modifier) [849 octets] Patrickdrouin (discussion | contributions) (Page créée avec « ==Définition== Infrastructure logicielle qui regroupe des données, en général structurées, liées à un domaine d’activité et qui les rend disponibles pour l’exploitation. == Compléments == Les données sont hébergées dans un ou plusieurs centres de données. Les plateformes de données permettent de regrouper par exemple des données relatives à la santé ou à l’éducation. ==Français== '''plateforme de données centralisée''' '''platefor... ») créé initialement avec le titre « Data hub »
- 25 février 2025 à 15:22 Objet connecté (hist | modifier) [984 octets] Patrickdrouin (discussion | contributions) (Page créée avec « ==Définition== Objet qui est capable, outre sa fonction principale, d’envoyer ou de recevoir des informations par l’intermédiaire d’un réseau de télécommunication. == Compléments == La capacité à envoyer ou à recevoir des informations permet, dans certains cas, d’étendre ou de diversifier les fonctions de l’objet. Les objets connectés relèvent par exemple des domaines du transport (véhicule connecté), de la santé (automesure connectée... ») créé initialement avec le titre « Connected object »
- 18 février 2025 à 16:35 Modèle génératif de résolution de problèmes (hist | modifier) [1 481 octets] Claude COULOMBE (discussion | contributions) (Page créée avec « ==Définition== Lorem occurrence dolor sit amet, consectetur adipiscing elit, == Compléments == Pour éviter l’anthropomorphisme, utilisez « modèle de résolution de problèmes» ou « modèle de résolution » comme équivalent aux termes « reasoning model » ou « chain of thought model » . <hr> Il existe un équivalent en intelligence artificielle symbolique qui consiste à résoudre un problème avec des gabarits de raisonnement... ») créé initialement avec le titre « Reasoning model »
- 18 février 2025 à 16:15 Requête par chaîne de résolution (hist | modifier) [2 552 octets] Claude COULOMBE (discussion | contributions) (Page créée avec « == Définition == Requête ayant pour but de demander à un robot conversationnel génératif de répondre en décomposant un problème sous la forme d'une chaîne de résolution. == Compléments == Nous recommandons « résolution » plutôt que « raisonnement », « pensée » ou « réflexion » pour éviter l'anthropomorphisme. <br/> La question de savoir si les grands modèles de langue raisonnent ''vraiment'' est une q... ») créé initialement avec le titre « CoT prompting »
