« BLEURT » : différence entre les versions
Aucun résumé des modifications |
Aucun résumé des modifications |
||
| Ligne 1 : | Ligne 1 : | ||
== Définition == | == Définition == | ||
Métrique d'évaluation de '''[[traduction automatique]]''' qui | Métrique d'évaluation de '''[[traduction automatique]]''' qui utilise des '''[[Vecteur sémantique compact|vecteurs sémantiques compacts]]''' (comme '''[[BERTScore]]''') et qui ajoute une étape d''''[[entraînement]]''' sur des données d'évaluation humaine. Ainsi, elle permet non seulement de saisir les similitudes sémantiques non triviales entre les phrases (de référence et candidates), mais elle permet aussi au modèle de prédire le score qu'un humain donnerait, capturant des nuances de fluidité et de sens que la simple distance vectorielle ne voit pas toujours. | ||
Voir aussi '''[[BLEU]]''' et '''[[COMET]]''' | Voir aussi '''[[BLEU]]''' et '''[[COMET]]''' | ||
| Ligne 12 : | Ligne 12 : | ||
''' BLEURT''' | ''' BLEURT''' | ||
''A machine translation evaluation metric that uses embeddings (such as BERTScore) and incorporates a training step using human evaluation data. Thus, it not only captures non-trivial semantic similarities between sentences (reference and candidate), but also enables the model to predict the score a human would give, capturing nuances of fluency and meaning that simple vector distance does not always capture.'' | |||
== Sources == | == Sources == | ||
[https://aclanthology.org/2020.acl-main.704/ Source : ACL Anthology] | [https://aclanthology.org/2020.acl-main.704/ Source : ACL Anthology] | ||
Dernière version du 20 mars 2026 à 11:05
Définition
Métrique d'évaluation de traduction automatique qui utilise des vecteurs sémantiques compacts (comme BERTScore) et qui ajoute une étape d'entraînement sur des données d'évaluation humaine. Ainsi, elle permet non seulement de saisir les similitudes sémantiques non triviales entre les phrases (de référence et candidates), mais elle permet aussi au modèle de prédire le score qu'un humain donnerait, capturant des nuances de fluidité et de sens que la simple distance vectorielle ne voit pas toujours.
Français
BLEURT
Anglais
Bilingual Evaluation Understudy with Representations from Transformers
BLEURT
A machine translation evaluation metric that uses embeddings (such as BERTScore) and incorporates a training step using human evaluation data. Thus, it not only captures non-trivial semantic similarities between sentences (reference and candidate), but also enables the model to predict the score a human would give, capturing nuances of fluency and meaning that simple vector distance does not always capture.
Sources
Contributeurs: Arianne Arel, wiki





