« Mistral 7B » : différence entre les versions


m (Remplacement de texte : « ↵<small> » par «  ==Sources== »)
Aucun résumé des modifications
Ligne 2 : Ligne 2 :


== Définition ==
== Définition ==
XXXXXXXXX
Nom donné à un grand modèle de langues en paramètres ouverts comportant 7 milliards de paramètres et réalisé par l'entreprise française Mistral.


== Français ==
== Français ==
Ligne 10 : Ligne 10 :
''' Mistral 7B'''
''' Mistral 7B'''


<!--
   The Mistral 7B paper introduces a compact yet powerful language model that, despite its relatively modest size of 7 billion tokens, outperforms its larger counterparts, such as the 13B Llama 2 model, in various benchmarks. (Next to the two-times larger Qwen 14B, Mistral 7B was also the base model used in the winning solutions of this year's NeurIPS LLM Finetuning & Efficiency challenge.)
   The Mistral 7B paper introduces a compact yet powerful language model that, despite its relatively modest size of 7 billion tokens, outperforms its larger counterparts, such as the 13B Llama 2 model, in various benchmarks. (Next to the two-times larger Qwen 14B, Mistral 7B was also the base model used in the winning solutions of this year's NeurIPS LLM Finetuning & Efficiency challenge.)
 
-->


==Sources==
==Sources==

Version du 30 janvier 2024 à 15:27

en construction

Définition

Nom donné à un grand modèle de langues en paramètres ouverts comportant 7 milliards de paramètres et réalisé par l'entreprise française Mistral.

Français

Mistral 7B

Anglais

Mistral 7B


Sources

Source : arxiv

Contributeurs: Patrick Drouin, wiki