« Compréhension massive et multitâche des langues » : différence entre les versions


(Page créée avec « == en construction == == Définition == xxxxx == Français == ''' XXXXXX''' == Anglais == ''' Massive Multitask Language Understanding''' ''' MMLU''' ==Sources== [https://en.wikipedia.org/wiki/MMLU Source : Wikipédia] Catégorie:vocabulary »)
 
Aucun résumé des modifications
 
(5 versions intermédiaires par le même utilisateur non affichées)
Ligne 1 : Ligne 1 :
== en construction ==
== Définition ==
La compréhension massive et multitâche des langues désigne un type de '''[[test de performances]]''' utilisé pour évaluer les grands modèles de langues en mesurant les connaissances acquises lors du '''[[préentraînement]]'''.


== Définition ==
Voir aussi '''[[grand modèle de langues]]'''
xxxxx


== Français ==
== Français ==
''' XXXXXX'''
''' compréhension massive et multitâche des langues'''


== Anglais ==
== Anglais ==
''' Massive Multitask Language Understanding'''
''' massive multitask language understanding'''


''' MMLU'''
''' MMLU'''
''Massive multitask language understanding is a type of benchmark that measures knowledge acquired during pretraining and it is used for evaluating capabilities of large language models.''


==Sources==
==Sources==
[https://en.wikipedia.org/wiki/MMLU  Source : Wikipédia]
[https://en.wikipedia.org/wiki/MMLU  Source : Wikipédia]
[https://paperswithcode.com/dataset/mmlu  Source : Paper with code]




[[Catégorie:vocabulary]]
[[Catégorie:publication]]

Dernière version du 22 octobre 2024 à 10:35

Définition

La compréhension massive et multitâche des langues désigne un type de test de performances utilisé pour évaluer les grands modèles de langues en mesurant les connaissances acquises lors du préentraînement.

Voir aussi grand modèle de langues

Français

compréhension massive et multitâche des langues

Anglais

massive multitask language understanding

MMLU

Massive multitask language understanding is a type of benchmark that measures knowledge acquired during pretraining and it is used for evaluating capabilities of large language models.

Sources

Source : Wikipédia

Source : Paper with code

Contributeurs: Arianne