OpenAI o1
Définition
Grand modèle de langues publié par la société OpenAI qui se démarque des modèles précédents par un enrichissement dans certains domaines scientifiques et par l'utilisation par défaut de requêtes de résolution par étapes (en anglais, chain-of-thought ou CoT).
Compléments
Le modèle a été lancé par OpenAI le 12 septembre 2024. Au même moment, la société lançait le modèle o1 mini qui est limité aux domaines scientifiques. Ce modèle constitue un changement de marque par rapport aux modèles précédents nommés GPT-x.
L'utilisation par défaut d'une requête de décomposition générée par le modèle permet d'essayer plusieurs approches pour la résolution d'un problème et de fusionner les résultats qui convergent. Ce mode de fonctionnement explique pourquoi le modèle prend d'avantage de temps pour s'exécuter.
Nous hésitons à utiliser le terme raisonnement, lui préférant le terme résolution de problème. La question à savoir si les grands modèles de langues raisonnent vraiment est une question chaudement débattue dans la communauté de l'IA.
Français
OpenAI o1
ChatGPT-o1
Anglais
OpenAI o1
Sources
Contributeurs: Claude Coulombe, Patrick Drouin, wiki