Contributions de Patrickdrouin

Rechercher des contributionsaffichermasquer

⧼contribs-top⧽

Adresse IP ou nom d’utilisateur :

Espace de noms :

Inverser la sélection

Espace de noms associé

Filtrer les balises :

Ne montrer que les contributions qui sont les dernières des articles

Afficher uniquement les modifications qui sont des créations de page

Masquer les modifications mineures

⧼contribs-date⧽

À partir du :

Jusqu’au :

15:134 novembre 2025 à 15:13 diff hist +58‎ Empoisonnement de modèle ‎Aucun résumé des modifications
15:054 novembre 2025 à 15:05 diff hist +92‎ Apprentissage éphémère contextuel ‎Aucun résumé des modifications
15:034 novembre 2025 à 15:03 diff hist −27‎ Apprentissage éphémère contextuel ‎Aucun résumé des modifications
15:034 novembre 2025 à 15:03 diff hist −1‎ Apprentissage éphémère contextuel ‎Aucun résumé des modifications
15:024 novembre 2025 à 15:02 diff hist +131‎ Apprentissage éphémère contextuel ‎Aucun résumé des modifications
14:594 novembre 2025 à 14:59 diff hist +36‎ Apprentissage éphémère contextuel ‎Aucun résumé des modifications
14:584 novembre 2025 à 14:58 diff hist +25‎ Apprentissage éphémère contextuel ‎Aucun résumé des modifications
14:554 novembre 2025 à 14:55 diff hist +153‎ Apprentissage éphémère contextuel ‎Aucun résumé des modifications
14:534 novembre 2025 à 14:53 diff hist +53‎ N In-context learning ‎ Patrickdrouin a déplacé la page In-context learning vers Apprentissage éphémère contextuel actuelle Balise : Nouvelle redirection
14:534 novembre 2025 à 14:53 diff hist 0‎ m Apprentissage éphémère contextuel ‎ Patrickdrouin a déplacé la page In-context learning vers Apprentissage éphémère contextuel
14:534 novembre 2025 à 14:53 diff hist +77‎ Apprentissage éphémère contextuel ‎Aucun résumé des modifications
14:514 novembre 2025 à 14:51 diff hist +843‎ N Apprentissage éphémère contextuel ‎ Page créée avec « == Définition == L'apprentissage transitoire contextuel est aussi connu sous le nom d'apprentissage en quelques coups. La technique consiste à orienter l'inférence à l'aide de la requête en donnant au modèle des exemples plus ou moins nombreux afin de guider sa réponse. == Compléments == Contrairement à un apprentissage permanent (par exemple en apprentissage supervisé ou post-entraînement), le résultat de l'inférence est éphémère et... »

08:5121 octobre 2025 à 08:51 diff hist +34‎ Mésinformation ‎Aucun résumé des modifications
08:4421 octobre 2025 à 08:44 diff hist +20‎ Mésinformation ‎Aucun résumé des modifications

11:3815 octobre 2025 à 11:38 diff hist +14‎ IA générative ‎Aucun résumé des modifications
11:3715 octobre 2025 à 11:37 diff hist −13‎ Intelligence artificielle générale ‎Aucun résumé des modifications actuelle Balise : Révocation manuelle
11:3715 octobre 2025 à 11:37 diff hist +13‎ Intelligence artificielle générale ‎Aucun résumé des modifications Balise : Révoqué

14:3714 octobre 2025 à 14:37 diff hist +49‎ N Top-p sampling ‎ Patrickdrouin a déplacé la page Top-p sampling vers Échantillonnage des p-meilleurs actuelle Balise : Nouvelle redirection
14:3714 octobre 2025 à 14:37 diff hist 0‎ m Échantillonnage des p-meilleurs ‎ Patrickdrouin a déplacé la page Top-p sampling vers Échantillonnage des p-meilleurs
14:3614 octobre 2025 à 14:36 diff hist +429‎ Échantillonnage des p-meilleurs ‎Aucun résumé des modifications
14:2614 octobre 2025 à 14:26 diff hist +41‎ Échantillonnage des p-meilleurs ‎Aucun résumé des modifications
14:2214 octobre 2025 à 14:22 diff hist +45‎ N Red-teaming ‎ Patrickdrouin a déplacé la page Red-teaming vers Approche par l'équipe rouge actuelle Balise : Nouvelle redirection
14:2214 octobre 2025 à 14:22 diff hist 0‎ m Approche par l'équipe rouge ‎ Patrickdrouin a déplacé la page Red-teaming vers Approche par l'équipe rouge
14:2114 octobre 2025 à 14:21 diff hist +1‎ Approche par l'équipe rouge ‎Aucun résumé des modifications
14:2114 octobre 2025 à 14:21 diff hist +1‎ Approche par l'équipe rouge ‎Aucun résumé des modifications
14:2114 octobre 2025 à 14:21 diff hist +383‎ Approche par l'équipe rouge ‎Aucun résumé des modifications
14:1314 octobre 2025 à 14:13 diff hist −39‎ Contenu synthétique ‎Aucun résumé des modifications
14:1214 octobre 2025 à 14:12 diff hist +1‎ Contenu synthétique ‎Aucun résumé des modifications
14:0914 octobre 2025 à 14:09 diff hist +76‎ Appauvrissement des connaissances ‎Aucun résumé des modifications
14:0314 octobre 2025 à 14:03 diff hist +42‎ Appauvrissement des connaissances ‎Aucun résumé des modifications
13:5914 octobre 2025 à 13:59 diff hist +35‎ N Knoweldge Collapse ‎ Patrickdrouin a déplacé la page Knoweldge Collapse vers Knowledge Collapse actuelle Balise : Nouvelle redirection
13:5914 octobre 2025 à 13:59 diff hist 0‎ m Appauvrissement des connaissances ‎ Patrickdrouin a déplacé la page Knoweldge Collapse vers Knowledge Collapse
13:5314 octobre 2025 à 13:53 diff hist −2‎ Travail fantôme ‎Aucun résumé des modifications
13:5014 octobre 2025 à 13:50 diff hist +26‎ Travail fantôme ‎Aucun résumé des modifications
13:5014 octobre 2025 à 13:50 diff hist +33‎ N Ghost work ‎ Patrickdrouin a déplacé la page Ghost work vers Travail fantôme Balise : Nouvelle redirection
13:5014 octobre 2025 à 13:50 diff hist 0‎ m Travail fantôme ‎ Patrickdrouin a déplacé la page Ghost work vers Travail fantôme
13:4914 octobre 2025 à 13:49 diff hist +8‎ Travail fantôme ‎Aucun résumé des modifications
13:4914 octobre 2025 à 13:49 diff hist +28‎ Travail fantôme ‎Aucun résumé des modifications
13:4814 octobre 2025 à 13:48 diff hist −15‎ Travail fantôme ‎Aucun résumé des modifications
13:4714 octobre 2025 à 13:47 diff hist +135‎ Travail fantôme ‎Aucun résumé des modifications
13:4614 octobre 2025 à 13:46 diff hist +19‎ Travail fantôme ‎Aucun résumé des modifications
13:4514 octobre 2025 à 13:45 diff hist +245‎ Travail fantôme ‎Aucun résumé des modifications
13:3914 octobre 2025 à 13:39 diff hist −68‎ Travail fantôme ‎Aucun résumé des modifications
13:2814 octobre 2025 à 13:28 diff hist +91‎ Common Crawl ‎Aucun résumé des modifications

14:387 octobre 2025 à 14:38 diff hist +59‎ N Reinforcement Learning with Verifiable Rewards ‎ Patrickdrouin a déplacé la page Reinforcement Learning with Verifiable Rewards vers Apprentissage par renforcement vérifiable actuelle Balise : Nouvelle redirection
14:387 octobre 2025 à 14:38 diff hist 0‎ m Apprentissage par renforcement vérifiable ‎ Patrickdrouin a déplacé la page Reinforcement Learning with Verifiable Rewards vers Apprentissage par renforcement vérifiable
14:377 octobre 2025 à 14:37 diff hist −26‎ Apprentissage par renforcement vérifiable ‎Aucun résumé des modifications
14:357 octobre 2025 à 14:35 diff hist +149‎ Apprentissage par renforcement vérifiable ‎Aucun résumé des modifications
14:297 octobre 2025 à 14:29 diff hist +1 312‎ N Apprentissage par renforcement vérifiable ‎ Page créée avec « == En construction == == Définition == Reinforcement learning (RL) in verifiable domains uses models that learn to solve problems in areas like programming and math by receiving feedback (rewards or penalties) on their performance, which is verified by external systems. This approach enhances AI reasoning capabilities by allowing agents to test their own solutions, learn from mistakes, and improve through a self-correcting cycle, leading to emergent behaviors a... »
14:097 octobre 2025 à 14:09 diff hist +81‎ Post-entraînement ‎Aucun résumé des modifications

Contributions de Patrickdrouin

4 novembre 2025

21 octobre 2025

15 octobre 2025

14 octobre 2025

7 octobre 2025