Contributions de Pitpitt


Rechercher des contributionsaffichermasquer
⧼contribs-top⧽
⧼contribs-date⧽
(les plus récentes | les plus anciennes) Voir (50 plus récentes | ) (20 | 50 | 100 | 250 | 500)

5 septembre 2025

4 septembre 2025

  • 09:504 septembre 2025 à 09:50 diff hist +3 System promptsAucun résumé des modifications actuelle
  • 09:504 septembre 2025 à 09:50 diff hist +1 273 N System promptsPage créée avec « ==en construction== == Définition == XXXXXXXXX == Français == ''' XXXXXXXXX ''' == Anglais == '''System prompts''' A system prompt is a way to instruct an LLM, such as GPT-5, to perform a specific task. This is different from a user prompt, which is the first prompt to the LLM after the system prompt is inserted. System prompts serve as the foundational instructions that dictate an AI's behavior. They establish the framework for how the AI will inte... »
  • 09:474 septembre 2025 à 09:47 diff hist +1 032 N Group Sequence Policy OptimizationPage créée avec « ==en construction== == Définition == XXXXXXXXX == Français == ''' XXXXXXXXX ''' == Anglais == '''Group Sequence Policy Optimization''' '''GSPO''' A new reinforcement learning algorithm for training large language models that addresses critical stability issues in existing methods. Current state-of-the-art algorithms like GRPO exhibit severe stability issues when training gigantic language model that can lead to catastrophic model collapse. GSPO resolves t... » actuelle

3 septembre 2025

31 août 2025

30 août 2025

28 août 2025

25 août 2025

(les plus récentes | les plus anciennes) Voir (50 plus récentes | ) (20 | 50 | 100 | 250 | 500)