« Modèle génératif de résolution de problèmes » : différence entre les versions
Aucun résumé des modifications |
Aucun résumé des modifications |
||
(5 versions intermédiaires par 2 utilisateurs non affichées) | |||
Ligne 1 : | Ligne 1 : | ||
==Définition== | ==Définition== | ||
Modèle obtenu par [[peaufinage|peaufinage]] d'un [[grand modèle de langues]] entraîné sur différentes approches de résolution de problèmes à l'aide de [[apprentissage par renforcement|l'apprentissage par renforcement]] | Modèle obtenu par [[peaufinage|peaufinage]] d'un [[grand modèle de langues]] entraîné sur différentes approches de [[Requête par chaîne de résolution|résolution de problèmes en plusieurs étapes]] à l'aide de différentes techniques dont [[apprentissage par renforcement|l'apprentissage par renforcement pur]], [[Apprentissage par renforcement avec rétroaction humaine|l'apprentissage par renforcement avec rétroaction humaine]] et le [[peaufinage par apprentissage supervisé]]. | ||
== Compléments == | == Compléments == | ||
Ligne 31 : | Ligne 29 : | ||
[[Categorie:GRAND LEXIQUE FRANÇAIS]] | [[Categorie:GRAND LEXIQUE FRANÇAIS]] | ||
[[ | [[Categorie:Publication]] |
Dernière version du 10 mars 2025 à 20:30
Définition
Modèle obtenu par peaufinage d'un grand modèle de langues entraîné sur différentes approches de résolution de problèmes en plusieurs étapes à l'aide de différentes techniques dont l'apprentissage par renforcement pur, l'apprentissage par renforcement avec rétroaction humaine et le peaufinage par apprentissage supervisé.
Compléments
Pour éviter l’anthropomorphisme, utilisez « modèle de résolution de problèmes» ou « modèle de résolution » comme équivalent aux termes « reasoning model » ou « chain-of-thought model » .
Il existe un équivalent en intelligence artificielle symbolique qui consiste à résoudre un problème avec des gabarits de raisonnement logique. Voir Termium
Français
modèle génératif de résolution de problèmes
modèle de résolution de problèmes
modèle de résolution
modèle de raisonnement anthropomorphisme, calque de l'anglais
Anglais
reasoning model
chain-of-thought model
Sources
Contributeurs: Claude Coulombe, wiki