OpenAI o1


Révision datée du 17 septembre 2024 à 16:51 par Claude COULOMBE (discussion | contributions)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)

Définition

Grand modèle de langues publié par la société OpenAI qui se démarque des modèles précédents par un enrichissement dans certains domaines scientifiques et par l'utilisation par défaut de requêtes de résolution par étapes (en anglais, chain-of-thought ou CoT).

Compléments

Le modèle a été lancé par OpenAI le 12 septembre 2024. Au même moment, la société lançait le modèle o1 mini qui est limité aux domaines scientifiques. Ce modèle constitue un changement de marque par rapport aux modèles précédents nommés GPT-x.


L'utilisation par défaut d'une requête de décomposition générée par le modèle permet d'essayer plusieurs approches pour la résolution d'un problème et de fusionner les résultats qui convergent. Ce mode de fonctionnement explique pourquoi le modèle prend d'avantage de temps pour s'exécuter.


Nous hésitons à utiliser le terme raisonnement, lui préférant le terme résolution de problème. La question à savoir si les grands modèles de langues raisonnent vraiment est une question chaudement débattue dans la communauté de l'IA.

Français

OpenAI o1

ChatGPT-o1

Anglais

OpenAI o1

Sources

Source : Wikipedia - OpenAI o1

Source: Tendances Trends

Source: OpenAI o1

Source : Wikipedia - OpenAI o1