« Modèle génératif de résolution de problèmes » : différence entre les versions


Aucun résumé des modifications
Aucun résumé des modifications
 
(2 versions intermédiaires par le même utilisateur non affichées)
Ligne 1 : Ligne 1 :
==Définition==
==Définition==
Modèle obtenu par [[peaufinage|peaufinage]] d'un [[grand modèle de langues]] entraîné sur différentes approches de [[Requête par chaîne de résolution|résolution de problèmes en plusieurs étapes]] à l'aide de [[apprentissage par renforcement|l'apprentissage par renforcement]]  
Modèle obtenu par [[peaufinage|peaufinage]] d'un [[grand modèle de langues]] entraîné sur différentes approches de [[Requête par chaîne de résolution|résolution de problèmes en plusieurs étapes]] à l'aide de différentes techniques dont [[apprentissage par renforcement|l'apprentissage par renforcement pur]], [[Apprentissage par renforcement avec rétroaction humaine|l'apprentissage par renforcement avec rétroaction humaine]] et le [[peaufinage par apprentissage supervisé]].


== Compléments ==
== Compléments ==
Ligne 29 : Ligne 29 :


[[Categorie:GRAND LEXIQUE FRANÇAIS]]
[[Categorie:GRAND LEXIQUE FRANÇAIS]]
[[Categorie:Publication]]

Dernière version du 10 mars 2025 à 20:30

Définition

Modèle obtenu par peaufinage d'un grand modèle de langues entraîné sur différentes approches de résolution de problèmes en plusieurs étapes à l'aide de différentes techniques dont l'apprentissage par renforcement pur, l'apprentissage par renforcement avec rétroaction humaine et le peaufinage par apprentissage supervisé.

Compléments

Pour éviter l’anthropomorphisme, utilisez « modèle de résolution de problèmes» ou « modèle de résolution » comme équivalent aux termes « reasoning model » ou « chain-of-thought model » .


Il existe un équivalent en intelligence artificielle symbolique qui consiste à résoudre un problème avec des gabarits de raisonnement logique. Voir Termium

Français

modèle génératif de résolution de problèmes

modèle de résolution de problèmes

modèle de résolution

modèle de raisonnement anthropomorphisme, calque de l'anglais

Anglais

reasoning model

chain-of-thought model

Sources

OpenAI - reasoning model

Categorie:GRAND LEXIQUE FRANÇAIS Categorie:Publication

Contributeurs: Claude Coulombe, wiki