Contributions de Patrickdrouin
4 novembre 2025
- 15:134 novembre 2025 à 15:13 diff hist +58 Empoisonnement de modèle Aucun résumé des modifications
- 15:054 novembre 2025 à 15:05 diff hist +92 Apprentissage éphémère contextuel Aucun résumé des modifications
- 15:034 novembre 2025 à 15:03 diff hist −27 Apprentissage éphémère contextuel Aucun résumé des modifications
- 15:034 novembre 2025 à 15:03 diff hist −1 Apprentissage éphémère contextuel Aucun résumé des modifications
- 15:024 novembre 2025 à 15:02 diff hist +131 Apprentissage éphémère contextuel Aucun résumé des modifications
- 14:594 novembre 2025 à 14:59 diff hist +36 Apprentissage éphémère contextuel Aucun résumé des modifications
- 14:584 novembre 2025 à 14:58 diff hist +25 Apprentissage éphémère contextuel Aucun résumé des modifications
- 14:554 novembre 2025 à 14:55 diff hist +153 Apprentissage éphémère contextuel Aucun résumé des modifications
- 14:534 novembre 2025 à 14:53 diff hist +53 N In-context learning Patrickdrouin a déplacé la page In-context learning vers Apprentissage éphémère contextuel actuelle Balise : Nouvelle redirection
- 14:534 novembre 2025 à 14:53 diff hist 0 m Apprentissage éphémère contextuel Patrickdrouin a déplacé la page In-context learning vers Apprentissage éphémère contextuel
- 14:534 novembre 2025 à 14:53 diff hist +77 Apprentissage éphémère contextuel Aucun résumé des modifications
- 14:514 novembre 2025 à 14:51 diff hist +843 N Apprentissage éphémère contextuel Page créée avec « == Définition == L'apprentissage transitoire contextuel est aussi connu sous le nom d'apprentissage en quelques coups. La technique consiste à orienter l'inférence à l'aide de la requête en donnant au modèle des exemples plus ou moins nombreux afin de guider sa réponse. == Compléments == Contrairement à un apprentissage permanent (par exemple en apprentissage supervisé ou post-entraînement), le résultat de l'inférence est éphémère et... »
21 octobre 2025
- 08:5121 octobre 2025 à 08:51 diff hist +34 Mésinformation Aucun résumé des modifications
- 08:4421 octobre 2025 à 08:44 diff hist +20 Mésinformation Aucun résumé des modifications
15 octobre 2025
- 11:3815 octobre 2025 à 11:38 diff hist +14 IA générative Aucun résumé des modifications
- 11:3715 octobre 2025 à 11:37 diff hist −13 Intelligence artificielle générale Aucun résumé des modifications actuelle Balise : Révocation manuelle
- 11:3715 octobre 2025 à 11:37 diff hist +13 Intelligence artificielle générale Aucun résumé des modifications Balise : Révoqué
14 octobre 2025
- 14:3714 octobre 2025 à 14:37 diff hist +49 N Top-p sampling Patrickdrouin a déplacé la page Top-p sampling vers Échantillonnage des p-meilleurs actuelle Balise : Nouvelle redirection
- 14:3714 octobre 2025 à 14:37 diff hist 0 m Échantillonnage des p-meilleurs Patrickdrouin a déplacé la page Top-p sampling vers Échantillonnage des p-meilleurs
- 14:3614 octobre 2025 à 14:36 diff hist +429 Échantillonnage des p-meilleurs Aucun résumé des modifications
- 14:2614 octobre 2025 à 14:26 diff hist +41 Échantillonnage des p-meilleurs Aucun résumé des modifications
- 14:2214 octobre 2025 à 14:22 diff hist +45 N Red-teaming Patrickdrouin a déplacé la page Red-teaming vers Approche par l'équipe rouge actuelle Balise : Nouvelle redirection
- 14:2214 octobre 2025 à 14:22 diff hist 0 m Approche par l'équipe rouge Patrickdrouin a déplacé la page Red-teaming vers Approche par l'équipe rouge
- 14:2114 octobre 2025 à 14:21 diff hist +1 Approche par l'équipe rouge Aucun résumé des modifications
- 14:2114 octobre 2025 à 14:21 diff hist +1 Approche par l'équipe rouge Aucun résumé des modifications
- 14:2114 octobre 2025 à 14:21 diff hist +383 Approche par l'équipe rouge Aucun résumé des modifications
- 14:1314 octobre 2025 à 14:13 diff hist −39 Contenu synthétique Aucun résumé des modifications
- 14:1214 octobre 2025 à 14:12 diff hist +1 Contenu synthétique Aucun résumé des modifications
- 14:0914 octobre 2025 à 14:09 diff hist +76 Appauvrissement des connaissances Aucun résumé des modifications
- 14:0314 octobre 2025 à 14:03 diff hist +42 Appauvrissement des connaissances Aucun résumé des modifications
- 13:5914 octobre 2025 à 13:59 diff hist +35 N Knoweldge Collapse Patrickdrouin a déplacé la page Knoweldge Collapse vers Knowledge Collapse actuelle Balise : Nouvelle redirection
- 13:5914 octobre 2025 à 13:59 diff hist 0 m Appauvrissement des connaissances Patrickdrouin a déplacé la page Knoweldge Collapse vers Knowledge Collapse
- 13:5314 octobre 2025 à 13:53 diff hist −2 Travail fantôme Aucun résumé des modifications
- 13:5014 octobre 2025 à 13:50 diff hist +26 Travail fantôme Aucun résumé des modifications
- 13:5014 octobre 2025 à 13:50 diff hist +33 N Ghost work Patrickdrouin a déplacé la page Ghost work vers Travail fantôme Balise : Nouvelle redirection
- 13:5014 octobre 2025 à 13:50 diff hist 0 m Travail fantôme Patrickdrouin a déplacé la page Ghost work vers Travail fantôme
- 13:4914 octobre 2025 à 13:49 diff hist +8 Travail fantôme Aucun résumé des modifications
- 13:4914 octobre 2025 à 13:49 diff hist +28 Travail fantôme Aucun résumé des modifications
- 13:4814 octobre 2025 à 13:48 diff hist −15 Travail fantôme Aucun résumé des modifications
- 13:4714 octobre 2025 à 13:47 diff hist +135 Travail fantôme Aucun résumé des modifications
- 13:4614 octobre 2025 à 13:46 diff hist +19 Travail fantôme Aucun résumé des modifications
- 13:4514 octobre 2025 à 13:45 diff hist +245 Travail fantôme Aucun résumé des modifications
- 13:3914 octobre 2025 à 13:39 diff hist −68 Travail fantôme Aucun résumé des modifications
- 13:2814 octobre 2025 à 13:28 diff hist +91 Common Crawl Aucun résumé des modifications
7 octobre 2025
- 14:387 octobre 2025 à 14:38 diff hist +59 N Reinforcement Learning with Verifiable Rewards Patrickdrouin a déplacé la page Reinforcement Learning with Verifiable Rewards vers Apprentissage par renforcement vérifiable actuelle Balise : Nouvelle redirection
- 14:387 octobre 2025 à 14:38 diff hist 0 m Apprentissage par renforcement vérifiable Patrickdrouin a déplacé la page Reinforcement Learning with Verifiable Rewards vers Apprentissage par renforcement vérifiable
- 14:377 octobre 2025 à 14:37 diff hist −26 Apprentissage par renforcement vérifiable Aucun résumé des modifications
- 14:357 octobre 2025 à 14:35 diff hist +149 Apprentissage par renforcement vérifiable Aucun résumé des modifications
- 14:297 octobre 2025 à 14:29 diff hist +1 312 N Apprentissage par renforcement vérifiable Page créée avec « == En construction == == Définition == Reinforcement learning (RL) in verifiable domains uses models that learn to solve problems in areas like programming and math by receiving feedback (rewards or penalties) on their performance, which is verified by external systems. This approach enhances AI reasoning capabilities by allowing agents to test their own solutions, learn from mistakes, and improve through a self-correcting cycle, leading to emergent behaviors a... »
- 14:097 octobre 2025 à 14:09 diff hist +81 Post-entraînement Aucun résumé des modifications





