« LlaMA 2 » : différence entre les versions
Aucun résumé des modifications |
m (Remplacement de texte : « ↵<small> » par « ==Sources== ») |
||
(4 versions intermédiaires par 2 utilisateurs non affichées) | |||
Ligne 1 : | Ligne 1 : | ||
== Définition == | == Définition == | ||
Version 2 du [[grand modèle de langues]] [[LLaMA]] | Version 2 du [[grand modèle de langues]] de la société META (voir [[LLaMA]]) . | ||
== Compléments == | == Compléments == | ||
Ce qui différencie Llama 2, c'est que ses modèles sont [[Modèle préentraîné|pré-entraînés]] et qu'ils ont été | Ce qui différencie Llama 2, c'est que ses modèles sont [[Modèle préentraîné|pré-entraînés]] et qu'ils ont été [[Peaufinage|peaufinés]] par [[apprentissage par renforcement et rétroaction humaine]] (en anglais ''RHFL''). | ||
Les paramètres (poids) de l'architecture de LLaMA sont divulgués publiquement, mais le code source d'entraînement demeure la propriété de la société META. | |||
== Français == | == Français == | ||
''' | ''' LLaMA 2''' | ||
== Anglais == | == Anglais == | ||
''' | ''' LLaMA 2''' | ||
<!-- what differentiates the Llama 2 suite from many other LLMs is that the models come as standard pretrained models and chat models that have been finetuned via reinforcement learning with human feedback (RLHF, the method used to create ChatGPT) to follow human instructions similar to ChatGPT — RLHF-finetuned models are still rare. | <!-- what differentiates the Llama 2 suite from many other LLMs is that the models come as standard pretrained models and chat models that have been finetuned via reinforcement learning with human feedback (RLHF, the method used to create ChatGPT) to follow human instructions similar to ChatGPT — RLHF-finetuned models are still rare. | ||
Ligne 15 : | Ligne 17 : | ||
==Sources== | |||
== Sources == | == Sources == | ||
Ligne 23 : | Ligne 26 : | ||
[[Catégorie:ENGLISH]] | |||
[[Catégorie: | [[Catégorie:GRAND LEXIQUE FRANÇAIS]] |
Dernière version du 28 janvier 2024 à 09:51
Définition
Version 2 du grand modèle de langues de la société META (voir LLaMA) .
Compléments
Ce qui différencie Llama 2, c'est que ses modèles sont pré-entraînés et qu'ils ont été peaufinés par apprentissage par renforcement et rétroaction humaine (en anglais RHFL).
Les paramètres (poids) de l'architecture de LLaMA sont divulgués publiquement, mais le code source d'entraînement demeure la propriété de la société META.
Français
LLaMA 2
Anglais
LLaMA 2
Sources
Sources
Contributeurs: Patrick Drouin, wiki