BLEURT


Révision datée du 20 mars 2026 à 11:05 par Arianne (discussion | contributions)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)

Définition

Métrique d'évaluation de traduction automatique qui utilise des vecteurs sémantiques compacts (comme BERTScore) et qui ajoute une étape d'entraînement sur des données d'évaluation humaine. Ainsi, elle permet non seulement de saisir les similitudes sémantiques non triviales entre les phrases (de référence et candidates), mais elle permet aussi au modèle de prédire le score qu'un humain donnerait, capturant des nuances de fluidité et de sens que la simple distance vectorielle ne voit pas toujours.

Voir aussi BLEU et COMET

Français

BLEURT

Anglais

Bilingual Evaluation Understudy with Representations from Transformers

BLEURT

A machine translation evaluation metric that uses embeddings (such as BERTScore) and incorporates a training step using human evaluation data. Thus, it not only captures non-trivial semantic similarities between sentences (reference and candidate), but also enables the model to predict the score a human would give, capturing nuances of fluency and meaning that simple vector distance does not always capture.

Sources

Source : ACL Anthology

Source : GitHub

Source : Google Research Blog

Contributeurs: Arianne Arel, wiki