« LlaMA 2 » : différence entre les versions


Aucun résumé des modifications
Aucun résumé des modifications
Ligne 1 : Ligne 1 :
== Définition ==
== Définition ==
Version 2 du [[grand modèle de langues]] [[LLaMA]].
Version 2 du [[grand modèle de langues]] de la société META.


== Compléments ==  
== Compléments ==  
Ce qui différencie Llama 2, c'est que ses modèles sont [[Modèle préentraîné|pré-entraînés]] et qu'ils ont été affinés par [[apprentissage par renforcement et rétroaction humaine]] (en anglais ''RHFL'').
Ce qui différencie Llama 2, c'est que ses modèles sont [[Modèle préentraîné|pré-entraînés]] et qu'ils ont été [[Peaufinage|peaufinés]] par [[apprentissage par renforcement et rétroaction humaine]] (en anglais ''RHFL'').
 
Les paramètres (poids) de l'architecture de LLaMA sont divulgués publiquement, mais le code source d'entraînement demeure la propriété de la société META.  


== Français ==
== Français ==
''' LlaMA 2'''
''' LLaMA 2'''


== Anglais ==
== Anglais ==
''' LlaMA 2'''
''' LLaMA 2'''


<!-- what differentiates the Llama 2 suite from many other LLMs is that the models come as standard pretrained models and chat models that have been finetuned via reinforcement learning with human feedback (RLHF, the method used to create ChatGPT) to follow human instructions similar to ChatGPT — RLHF-finetuned models are still rare.
<!-- what differentiates the Llama 2 suite from many other LLMs is that the models come as standard pretrained models and chat models that have been finetuned via reinforcement learning with human feedback (RLHF, the method used to create ChatGPT) to follow human instructions similar to ChatGPT — RLHF-finetuned models are still rare.

Version du 9 janvier 2024 à 15:31

Définition

Version 2 du grand modèle de langues de la société META.

Compléments

Ce qui différencie Llama 2, c'est que ses modèles sont pré-entraînés et qu'ils ont été peaufinés par apprentissage par renforcement et rétroaction humaine (en anglais RHFL).

Les paramètres (poids) de l'architecture de LLaMA sont divulgués publiquement, mais le code source d'entraînement demeure la propriété de la société META.

Français

LLaMA 2

Anglais

LLaMA 2


Sources

Source : arxiv

Source : Radio-Canada

Contributeurs: Patrick Drouin, wiki