Contributions de Pitpitt
25 août 2025
- 10:0625 août 2025 à 10:06 diff hist +628 m Proven SEO Company UK Strategies Révocation des modifications de TessaCoventry2 (discussion) vers la dernière version créée par EzequielLapp actuelle Balise : Révocation
- 08:3125 août 2025 à 08:31 diff hist +829 N Ovis Page créée avec « ==en construction== == Définition == XXXXXXXXX == Français == '''Ovis 2,5''' == Anglais == '''Ovis 2,5''' An advanced multimodal large language model designed to process images at their native resolutions while incorporating reasoning capabilities. The model addresses two key limitations in current vision-language systems: the degradation caused by fixed-resolution image processing and the lack of reflective reasoning beyond simple chain-of-thought approac... » actuelle
- 08:2925 août 2025 à 08:29 diff hist +37 N Nemotron Nano Pitpitt a déplacé la page Nemotron Nano vers Nvidia Nemotron Nano actuelle Balise : Nouvelle redirection
- 08:2925 août 2025 à 08:29 diff hist 0 m Nvidia Nemotron Nano Pitpitt a déplacé la page Nemotron Nano vers Nvidia Nemotron Nano actuelle
- 08:2825 août 2025 à 08:28 diff hist +672 N Nvidia Nemotron Nano Page créée avec « ==en construction== == Définition == XXXXXXXXX == Français == ''' Nemotron Nano 2 ''' == Anglais == '''Nemotron Nano 2 ''' A hybrid Mamba-Transformer language model that combines high accuracy with significantly improved inference speed for reasoning tasks. The model achieves comparable or better performance than existing models while delivering up to 6× higher throughput for generation-heavy scenarios. This work demonstrates how architectural innovati... »
- 08:2725 août 2025 à 08:27 diff hist +813 N ComoRAG Page créée avec « ==en construction== == Définition == XXXXXXXXX == Français == ''' ComoRAG''' == Anglais == '''ComoRAG''' ComoRAG, an iterative retrieval-based approach, enhances long-context narrative comprehension by dynamically updating memory and generating probing queries, outperforming traditional RAG methods. ComoRAG presents a cognitively-inspired approach to long narrative comprehension that addresses the stateless limitations of conventional RAG methods. By impl... » actuelle
- 08:2525 août 2025 à 08:25 diff hist +1 Meta CLIP Aucun résumé des modifications actuelle
- 08:2425 août 2025 à 08:24 diff hist +1 013 N Meta CLIP Page créée avec « ==en construction== == Définition == XXXXXXXXX == Français == ''' Meta CLIP 2''' == Anglais == ''' Meta CLIP 2''' The first recipe for training CLIP models from scratch on worldwide web-scale image-text pairs spanning 300+ languages. The work addresses the challenge of scaling CLIP beyond English-only data while avoiding the "curse of multilinguality" - where multilingual models perform worse on English tasks than their English-only counterparts. Meta... »
24 août 2025
- 15:2724 août 2025 à 15:27 diff hist −71 Réseau de neurones à propagation avant Aucun résumé des modifications actuelle
- 10:3324 août 2025 à 10:33 diff hist +6 Perceptron Aucun résumé des modifications actuelle
- 10:2324 août 2025 à 10:23 diff hist +33 Mégadonnées Aucun résumé des modifications actuelle
23 août 2025
- 15:1723 août 2025 à 15:17 diff hist +12 Génération automatique d'audio Aucun résumé des modifications actuelle
- 11:3723 août 2025 à 11:37 diff hist +1 Annotation des données Aucun résumé des modifications actuelle
21 août 2025
- 08:4421 août 2025 à 08:44 diff hist +1 Catégorie:Publication Aucun résumé des modifications actuelle
- 08:4421 août 2025 à 08:44 diff hist −1 Catégorie:Publication Aucun résumé des modifications
- 08:4321 août 2025 à 08:43 diff hist +3 Catégorie:Publication Aucun résumé des modifications
- 08:4221 août 2025 à 08:42 diff hist −4 Catégorie:Publication Aucun résumé des modifications
- 08:4121 août 2025 à 08:41 diff hist −8 Catégorie:Publication Aucun résumé des modifications
20 août 2025
- 19:5120 août 2025 à 19:51 diff hist −27 Apprentissage par renforcement avec rétroaction humaine Aucun résumé des modifications actuelle
- 19:5020 août 2025 à 19:50 diff hist −40 Apprentissage par renforcement Aucun résumé des modifications actuelle
- 19:5020 août 2025 à 19:50 diff hist +87 N Apprentissage par interaction Page redirigée vers Apprentissage par renforcement actuelle Balise : Nouvelle redirection
- 19:4920 août 2025 à 19:49 diff hist +74 N Anthropomorphisation Page redirigée vers Anthropomorphisme actuelle Balise : Nouvelle redirection
- 19:4820 août 2025 à 19:48 diff hist −27 Anthropomorphisme Aucun résumé des modifications actuelle
- 19:4820 août 2025 à 19:48 diff hist −27 Algorithme prédictif Aucun résumé des modifications actuelle
- 19:4720 août 2025 à 19:47 diff hist +12 Agentivité Aucun résumé des modifications actuelle
- 19:4520 août 2025 à 19:45 diff hist −27 Robot conversationnel Aucun résumé des modifications actuelle
- 10:1420 août 2025 à 10:14 diff hist +1 Thyme Aucun résumé des modifications actuelle
- 10:1420 août 2025 à 10:14 diff hist +728 N Thyme Page créée avec « ==en construction== == Définition == XXXXXXXXX == Français == ''' Thyme''' == Anglais == '''Thyme''' '''Think Beyond Images''' A novel approach that enables multimodal large language models to autonomously generate and execute code for diverse image processing operations and mathematical computations. Unlike existing "think with images" methods that are limited to simple cropping or image generation, Thyme provides rich functionality including rotation, c... »
18 août 2025
- 21:5218 août 2025 à 21:52 diff hist −28 Architecture à vecteurs sémantiques joints Aucun résumé des modifications actuelle
- 21:5118 août 2025 à 21:51 diff hist −28 Attention éclair Aucun résumé des modifications
- 21:5018 août 2025 à 21:50 diff hist +12 Normalisation du gradient Aucun résumé des modifications actuelle
- 09:3718 août 2025 à 09:37 diff hist +1 349 N DINO Page créée avec « ==en construction== == Définition == XXXXXXXXX == Français == ''' DINO v3 ''' == Anglais == '''DINO v3''' A self-supervised model trained without the need for manual data annotations. The method leverages simple yet effective strategies to scale both dataset and model size, achieving state-of-the-art performance across a broad range of vision tasks without requiring fine-tuning. The paper presents a versatile vision foundation model that significantly outp... » actuelle
- 09:3618 août 2025 à 09:36 diff hist +1 101 N Mol-R1 Page créée avec « ==en construction== == Définition == XXXXXXXXX == Français == ''' Mol-R1''' == Anglais == '''Mol-R1''' Mol-R1 framework enhances molecule discovery by improving reasoning performance and explainability through PRID and MoIA strategies. A framework that enhances the reasoning capabilities of large language models for molecule discovery. The work addresses the challenge of generating molecular structures from text descriptions while providing clear, step-by... » actuelle
15 août 2025
- 09:3515 août 2025 à 09:35 diff hist +10 Catégorie:Publication Aucun résumé des modifications
- 09:3015 août 2025 à 09:30 diff hist +18 Catégorie:Publication Aucun résumé des modifications
- 09:2415 août 2025 à 09:24 diff hist +1 013 N R-Zero Page créée avec « ==en construction== == Définition == XXXXXXXXX == Français == ''' R-Zero''' == Anglais == '''R-Zero''' A framework that enables large language models to improve their reasoning abilities without requiring any human-labeled training data. The method creates a self-evolving system where two AI models work together - one generates challenging questions while the other learns to solve them, creating an autonomous learning loop that starts from scratch. R-Z... » actuelle
- 09:2315 août 2025 à 09:23 diff hist +617 N GLM Page créée avec « ==en construction== == Définition == XXXXXXXXX == Français == ''' XXXXXXXXX ''' == Anglais == '''GLM-4.5''' '''GLM''' GLM-4.5 represents a significant advancement in creating unified AI models that excel across multiple domains. By combining efficient MoE architecture, multi-stage training, and expert model iteration, the paper demonstrates that a single model can achieve strong performance in agentic tasks, reasoning, and coding without requiring the mas... » actuelle
- 09:2015 août 2025 à 09:20 diff hist +531 N Omni-Effects Page créée avec « ==en construction== == Définition == XXXXXXXXX == Français == ''' XXXXXXXXX ''' == Anglais == '''Omni-Effects'''à A unified framework for generating customized visual effects (VFX) in videos. Unlike existing methods that require separate models for each effect, this approach can generate multiple visual effects simultaneously while providing precise spatial control over where each effect appears in the video. == Source == [https://huggingface.co/papers/... » actuelle
- 09:1915 août 2025 à 09:19 diff hist +528 N WebWatcher Page créée avec « ==en construction== == Définition == XXXXXXXXX == Français == ''' XXXXXXXXX ''' == Anglais == '''WebWatcher''' A multimodal AI agent designed for deep research tasks that handles both visual and textual understanding. While existing web agents excel at text-based research, they struggle with real-world scenarios that involve visual information like scientific diagrams, charts, or visually rich web interfaces. == Source == [https://huggingface.co/papers/2... » actuelle
12 août 2025
- 09:5512 août 2025 à 09:55 diff hist +93 MetaCLIP Aucun résumé des modifications actuelle
- 09:5212 août 2025 à 09:52 diff hist +1 MetaCLIP Aucun résumé des modifications
- 09:5212 août 2025 à 09:52 diff hist +905 N MetaCLIP Page créée avec « ==en construction== == Définition == XXXXXXXXX == Français == ''' MetaCLIP''' == Anglais == '''MetaCLIP''' The first recipe for training CLIP models from scratch on worldwide web-scale image-text pairs spanning 300+ languages. The work addresses the challenge of scaling CLIP beyond English-only data while avoiding the "curse of multilinguality" - where multilingual models perform worse on English tasks than their English-only counterparts. The paper demonst... »
- 09:5012 août 2025 à 09:50 diff hist +672 N LongVie Page créée avec « ==en construction== == Définition == XXXXXXXXX == Français == ''' LongVie''' == Anglais == '''LongVie''' A framework for generating controllable long videos lasting up to one minute. The method addresses key challenges in extending video generation beyond short clips, specifically temporal inconsistency and visual degradation that occur when generating longer sequences. The paper proposes a multi-modal control approach that combines dense and sparse guidan... » actuelle
- 09:4912 août 2025 à 09:49 diff hist +689 N PixNerd Page créée avec « ==en construction== == Définition == XXXXXXXXX == Français == ''' PixNerd''' == Anglais == '''PixNerd''' A novel approach to image generation that operates directly in pixel space rather than compressed latent representations. The method addresses limitations of current diffusion models that rely on variational autoencoders (VAEs), which can introduce artifacts and require complex two-stage training. By combining diffusion transformers with neural field re... » actuelle
9 août 2025
- 12:089 août 2025 à 12:08 diff hist +6 Catégorie:101Q Aucun résumé des modifications actuelle
- 12:089 août 2025 à 12:08 diff hist +33 Catégorie:101Q Aucun résumé des modifications
- 12:079 août 2025 à 12:07 diff hist +4 Catégorie:101Q Aucun résumé des modifications
- 12:079 août 2025 à 12:07 diff hist −20 Catégorie:101Q Aucun résumé des modifications
- 12:069 août 2025 à 12:06 diff hist −1 Catégorie:101Q Aucun résumé des modifications
- 12:069 août 2025 à 12:06 diff hist −11 Catégorie:101Q Aucun résumé des modifications
