Contributions de Pitpitt


Rechercher des contributionsaffichermasquer
⧼contribs-top⧽
⧼contribs-date⧽

16 septembre 2025

15 septembre 2025

14 septembre 2025

9 septembre 2025

8 septembre 2025

6 septembre 2025

5 septembre 2025

4 septembre 2025

  • 09:504 septembre 2025 à 09:50 diff hist +3 Requête générative systèmeAucun résumé des modifications
  • 09:504 septembre 2025 à 09:50 diff hist +1 273 N Requête générative systèmePage créée avec « ==en construction== == Définition == XXXXXXXXX == Français == ''' XXXXXXXXX ''' == Anglais == '''System prompts''' A system prompt is a way to instruct an LLM, such as GPT-5, to perform a specific task. This is different from a user prompt, which is the first prompt to the LLM after the system prompt is inserted. System prompts serve as the foundational instructions that dictate an AI's behavior. They establish the framework for how the AI will inte... »
  • 09:474 septembre 2025 à 09:47 diff hist +1 032 N Group Sequence Policy OptimizationPage créée avec « ==en construction== == Définition == XXXXXXXXX == Français == ''' XXXXXXXXX ''' == Anglais == '''Group Sequence Policy Optimization''' '''GSPO''' A new reinforcement learning algorithm for training large language models that addresses critical stability issues in existing methods. Current state-of-the-art algorithms like GRPO exhibit severe stability issues when training gigantic language model that can lead to catastrophic model collapse. GSPO resolves t... »

3 septembre 2025

31 août 2025