Contributions de Arianne


Rechercher des contributionsaffichermasquer
⧼contribs-top⧽
⧼contribs-date⧽

25 février 2026

24 février 2026

  • 11:2924 février 2026 à 11:29 diff hist +1 197 N NIST (metric)Page créée avec « == en construction == == Définition == xxxxxx Voir aussi '''BLEU''' == Compléments == <!--Compared to BLEU, NIST gives more importance to the less frequent n-grams, also differs from BLEU in its calculation of the brevity penalty insofar as small variations in translation length do not impact the overall score as much. Le nom de la métrique provient du ''National Institute of Standards and Technology''.--> == Français == ''' NIST''' == Anglais == '''... » actuelle
  • 11:2324 février 2026 à 11:23 diff hist +752 N YiSiPage créée avec « == en construction == == Définition == xxxxxxxx Voir aussi '''BLEU''', '''chrF''', '''MEANT''' et '''METEOR''' == Français == ''' YiSi''' == Anglais == ''' YiSi''' <!--A family of semantic machine translation evaluation metrics using sentence representation for languages with different levels of available resources. It calculates the similarity by aggregating the weighted distributional lexical semantic similarities... » actuelle
  • 11:1724 février 2026 à 11:17 diff hist +1 055 N METEORPage créée avec « == en construction == == Définition == xxxxxx Voir aussi '''BLEU''' et '''NIST''' == Compléments == <!--Differs from the BLEU metric in that BLEU seeks correlation at the corpus level.--> == Français == ''' METEOR''' == Anglais == ''' METEOR''' ''' Metric for Evaluation of Translation with Explicit Ordering''' <!--METEOR stands for Metric for Evaluation of Translation with Explicit Ordering and it is used for automatic evaluation of machine tran... » actuelle
  • 11:1124 février 2026 à 11:11 diff hist +1 213 N ROUGEPage créée avec « == en construction == == Définition == xxxxxxxx Voir aussi '''BLEU''' == Compléments == <!-- Peut être calculée à l'aide de librairie SacreBLEU. En raison des points faibles de ROUGE, ROUGE 2.0 à été proposé en 2018. Même s'il s'agit d'un ensemble de métriques, on retrouve souvent la mention ''ROUGE score'' dans les textes.--> == Français == ''' ROUGE''' == Anglais == ''' ROUGE''' '''Recall-Oriented Understudy for Gisting Evaluation''' <!... » actuelle
  • 11:0224 février 2026 à 11:02 diff hist +180 Verbalized SamplingAucun résumé des modifications actuelle
  • 10:5824 février 2026 à 10:58 diff hist −357 UniVideoAucun résumé des modifications actuelle
  • 10:5524 février 2026 à 10:55 diff hist −359 SeedreamAucun résumé des modifications actuelle

23 février 2026

  • 14:1623 février 2026 à 14:16 diff hist −87 SAIL-VL2Aucun résumé des modifications actuelle
  • 14:1423 février 2026 à 14:14 diff hist +576 N Representation autoencoderPage créée avec « == en construction == == Définition == xxxxxx Voir aussi '''DINO''' == Français == ''' XXXXXXXX''' == Anglais == ''' Representation autoencoder''' '''RAE''' <!--A class of autoencoders that reuse pretrained, frozen representation encoders together with lightweight trained decoders to provide high-fidelity, semantically rich latents for diffusion transformers. --> == Sources == [https://arxiv.org/abs/2510.11690 Source : arxiv] [https://github.com/... » actuelle
  • 14:1023 février 2026 à 14:10 diff hist −37 Physical AIAucun résumé des modifications
  • 14:0723 février 2026 à 14:07 diff hist −251 OmniVideoBenchAucun résumé des modifications actuelle
  • 14:0423 février 2026 à 14:04 diff hist −187 LightMemAucun résumé des modifications
  • 14:0123 février 2026 à 14:01 diff hist +1 042 N GML en tant que jugePage créée avec « == en construction == == Définition == xxxxxx == Français == ''' GML en tant que juge''' ''' GML comme juge''' == Anglais == ''' LLM-as-a-judge''' <!--A (family of) technique(s) in natural language processing that uses one large language model (LLM) to evaluate another LLM’s work. A typical LLM-as-a-Judge setup consists of three elements: an input that contains the task context and candidate outputs to be evaluated, a prompt that explains the evaluation... »

22 février 2026

  • 15:1122 février 2026 à 15:11 diff hist +884 N Large Language Model OperationsPage créée avec « == en construction == == Définition == xxxxxxx == Français == ''' XXXXXXX''' == Anglais == ''' Large Language Model Operations''' '''LLMOP''' <!--Set of practices and workflows that speed development, deployment and management of AI models throughout their complete lifecycle, such as le déploiement et la maintenance des modèles, la gestion des données, l’entraînement et le peaufinage des modèles, ainsi que leur surveillance et leur évaluation. Bec... »
  • 15:0722 février 2026 à 15:07 diff hist +784 N Locally typical samplingPage créée avec « == en construction == == Définition == xxxxxxx Voir aussi '''échantillonnage des k-meilleurs''' et '''ergodicité''' == Français == ''' XXXXXX''' == Anglais == ''' Locally typical sampling''' <!--Sampling method that improves text quality and reduces repetitions in probabilistic language generators. The idea is that when you want a text to be perceived as natural, each word should have an information content close to its expected information conte... »
  • 15:0322 février 2026 à 15:03 diff hist +770 N DAPOPage créée avec « == en construction == == Définition == xxxxxxx == Français == ''' XXXXXXXX''' Voir aussi '''optimisation de la politique proximale''' et '''optimisation de la politique relative au groupe''' == Anglais == ''' DAPO''' ''' Decoupled Clip and Dynamic Sampling Policy Optimization''' <!--A reinforcement learning algorithm that reinforces reasoning patterns and also gives rise to new modes of reasoning that facilitate correct problem-solving. One of its... »

29 janvier 2026

27 janvier 2026

  • 17:3727 janvier 2026 à 17:37 diff hist +554 Priority samplingAucun résumé des modifications actuelle
  • 17:3427 janvier 2026 à 17:34 diff hist +302 Greedy samplingAucun résumé des modifications actuelle
  • 17:3027 janvier 2026 à 17:30 diff hist +889 FLOPSAucun résumé des modifications
  • 17:0327 janvier 2026 à 17:03 diff hist +717 Attention sinkAucun résumé des modifications actuelle
  • 16:5027 janvier 2026 à 16:50 diff hist +445 Self-play fine-tuningAucun résumé des modifications actuelle
  • 16:3327 janvier 2026 à 16:33 diff hist +63 FoomAucun résumé des modifications
  • 16:3127 janvier 2026 à 16:31 diff hist +799 N BLEURTPage créée avec « == en construction == == Définition == xxxxxxxx Voir aussi '''BLEU''' == Français == '''XXXXXXXX''' == Anglais == '''Bilingual Evaluation Understudy with Representations from Transformers''' ''' BLEURT''' <!--Trained evaluation metric that takes a pair of sentences as input (a reference and a candidate), and it returns a score that indicates to what extent the candidate is fluent and conveys the meaning of the reference. It can capture non-trivial sem... »
  • 16:2727 janvier 2026 à 16:27 diff hist +776 N TERPage créée avec « == en construction == == Définition == xxxxx == Français == '''XXXXXXXX''' == Anglais == '''Translation Error Rate''' '''TER''' <!--Metric for automatic evaluation of machine translation that calculates the number of edits required to change a machine translation output into one of the references. It measures the insertions, deletions, substitutions, and shifts needed to transform a machine-generated hypothesis into reference translation. A lower TER, clos... »

26 janvier 2026

  • 15:1826 janvier 2026 à 15:18 diff hist +725 N COMETPage créée avec « == en construction == == Définition == xxxxxxxxx == Français == '''COMET''' == Anglais == '''COMET''' <!--A metric for automatic evaluation of machine translation that calculates the similarity between a machine translation output and a reference translation using token or sentence embeddings. Unlike BERTScore, COMET is trained on predicting different types of human judgements in the form of post-editing effort, direct assessment or translation error analy... »
  • 15:1526 janvier 2026 à 15:15 diff hist +1 414 N BERTScorePage créée avec « == en construction == == Définition == xxxxxxx == Français == '''XXXXXXXX''' == Anglais == '''BERTScore''' <!--Metric for automatic evaluation of machine translation that calculates the similarity between a machine translation output and a reference translation using sentence representation. It was invented as an improvement on n-gram-based metrics (see BLEU), and addresses two common pitfalls in these: 1) Such methods often fail to robustly match paraphras... »
  • 15:1126 janvier 2026 à 15:11 diff hist +596 N Character n-gram F-scorePage créée avec « == en construction == == Définition == xxxxxx == Français == '''XXXXXXX''' == Anglais == '''Character n-gram F-score''' '''chrF''' <!--Metric for machine translation evaluation that calculates the similarity between a machine translation output and a reference translation using character n-grams, not word n-grams. It recognizes different forms of a single word. It is language-independent and language-independent.--> == Sources == [https://aclanthology.org... »
  • 15:0426 janvier 2026 à 15:04 diff hist +761 N Priority samplingPage créée avec « == en construction == == Définition == xxxxxx Voir aussi '''échantillonnage des k-meilleurs''', '''échantillonnage des p-meilleurs''' et '''expression rationnelle''' == Français == '''XXXXXXX''' == Anglais == ''' Priority sampling''' <!--Deterministic sampling method that produces unique samples ordered by the model’s confidence. It supports generation based on regular expression that provides a controllable and structured exploration proce... »
  • 15:0026 janvier 2026 à 15:00 diff hist +730 N Greedy samplingPage créée avec « == en construction == == Définition == xxxxx Voir aussi '''échantillonnage des k-meilleurs''' == Français == '''XXXXXXXX''' == Anglais == '''greedy sampling''' <!--Deterministic sampling method that is computationally efficient and straightforward to implement, where the word with the highest conditional probability is selected as the next word in the sentence, given the previous words. This method often results in suboptimal and repetitive sequences.... »
  • 14:5626 janvier 2026 à 14:56 diff hist +1 316 N FLOPSPage créée avec « == en construction == == Définition == xxxxxx == Compléments == Ne pas confondre avec FLOP, qui correspond à une opération arithmétique effectuée sur des nombres décimaux. == Français == ''' XXXXXXXX''' == Anglais == '''Floating-Point Operations per Second''' ''' FLOPS''' <!--FLOPS stands for Floating-Point Operations per Second and it is used to measure the computational cost or complexity of a model or a specific operation within the model. This... »
  • 14:5126 janvier 2026 à 14:51 diff hist +1 344 N Attention sinkPage créée avec « == en construction == == Définition == xxxxx == Compléments == On peut aussi utiliser le terme pour désigner spécifiquement ce genre de '''segment textuel''', on peut alors l'écrire au pluriel en fonction du contexte. == Français == ''' XXXXXXX''' == Anglais == ''' attention sink''' <!--This term can refer to the phenomenon or to the type of token concerned by the phenomenon. This phenomenon is present in all autoregressive large language models, i... »