Suivi des pages liées


Entrer un nom de page pour voir les modifications faites récemment sur des pages liées vers ou depuis cette page (pour voir les membres d’une catégorie, entrez Catégorie:Nom de catégorie). Les modifications des pages de votre liste de suivi sont en gras.

Options des modifications récentes Afficher les 50 | 100 | 250 | 500 dernières modifications effectuées au cours des 1 | 3 | 7 | 14 | 30 derniers jours.
Masquer les utilisateurs enregistrés | Masquer les utilisateurs anonymes | Masquer mes modifications | Afficher les robots | Masquer les modifications mineures
Afficher les nouvelles modifications depuis le 24 février 2026 à 07:13
   
Nom de la page :
Légende des abréviations :
N
Cette modification a créé une nouvelle page (voir aussi la liste des nouvelles pages)
m
Cette modification est mineure.
b
Cette modification a été effectuée par un robot.
(±123)
La taille de la page a changé de ce nombre d’octets.

23 février 2026

     14:16  SAIL-VL2 diffhist −87 Arianne discussion contributions
N    14:14  Representation autoencoder diffhist +576 Arianne discussion contributions (Page créée avec « == en construction == == Définition == xxxxxx Voir aussi '''DINO''' == Français == ''' XXXXXXXX''' == Anglais == ''' Representation autoencoder''' '''RAE''' <!--A class of autoencoders that reuse pretrained, frozen representation encoders together with lightweight trained decoders to provide high-fidelity, semantically rich latents for diffusion transformers. --> == Sources == [https://arxiv.org/abs/2510.11690 Source : arxiv] [https://github.com/... »)
     14:10  Physical AI diffhist −37 Arianne discussion contributions
     14:07  OmniVideoBench diffhist −251 Arianne discussion contributions
     14:04  LightMem diffhist −187 Arianne discussion contributions
N    14:01  LLM-as-a-judge diffhist +1 042 Arianne discussion contributions (Page créée avec « == en construction == == Définition == xxxxxx == Français == ''' GML en tant que juge''' ''' GML comme juge''' == Anglais == ''' LLM-as-a-judge''' <!--A (family of) technique(s) in natural language processing that uses one large language model (LLM) to evaluate another LLM’s work. A typical LLM-as-a-Judge setup consists of three elements: an input that contains the task context and candidate outputs to be evaluated, a prompt that explains the evaluation... »)

22 février 2026

N    15:11  Large Language Model Operations diffhist +884 Arianne discussion contributions (Page créée avec « == en construction == == Définition == xxxxxxx == Français == ''' XXXXXXX''' == Anglais == ''' Large Language Model Operations''' '''LLMOP''' <!--Set of practices and workflows that speed development, deployment and management of AI models throughout their complete lifecycle, such as le déploiement et la maintenance des modèles, la gestion des données, l’entraînement et le peaufinage des modèles, ainsi que leur surveillance et leur évaluation. Bec... »)
N    15:07  Locally typical sampling diffhist +784 Arianne discussion contributions (Page créée avec « == en construction == == Définition == xxxxxxx Voir aussi '''échantillonnage des k-meilleurs''' et '''ergodicité''' == Français == ''' XXXXXX''' == Anglais == ''' Locally typical sampling''' <!--Sampling method that improves text quality and reduces repetitions in probabilistic language generators. The idea is that when you want a text to be perceived as natural, each word should have an information content close to its expected information conte... »)
N    15:03  DAPO diffhist +770 Arianne discussion contributions (Page créée avec « == en construction == == Définition == xxxxxxx == Français == ''' XXXXXXXX''' Voir aussi '''optimisation de la politique proximale''' et '''optimisation de la politique relative au groupe''' == Anglais == ''' DAPO''' ''' Decoupled Clip and Dynamic Sampling Policy Optimization''' <!--A reinforcement learning algorithm that reinforces reasoning patterns and also gives rise to new modes of reasoning that facilitate correct problem-solving. One of its... »)

17 février 2026

     15:49  Self-Evolving Curriculum‎‎ 3 modifications historique +58 [Patrickdrouin‎ (3×)]
     
15:49 (actu | diff) 0 Patrickdrouin discussion contributions
     
15:47 (actu | diff) +13 Patrickdrouin discussion contributions
     
15:43 (actu | diff) +45 Patrickdrouin discussion contributions
     15:47 Journal des renommages Patrickdrouin discussion contributions a déplacé la page Group Relative Policy Optimization vers Optimisation de la politique relative au groupe(optimisation de la politique relative au groupe)
     15:46  Group Relative Policy Optimization diffhist +2 Patrickdrouin discussion contributions
     15:23  Test-Time Scaling diffhist +72 Patrickdrouin discussion contributions
     15:06  Graphical User Interface Agent‎‎ 2 modifications historique +320 [Patrickdrouin‎ (2×)]
     
15:06 (actu | diff) +245 Patrickdrouin discussion contributions
     
15:02 (actu | diff) +75 Patrickdrouin discussion contributions

29 janvier 2026

     11:06  Foom diffhist +157 Arianne discussion contributions
     11:01  TER diffhist +629 Arianne discussion contributions
     10:52  BERTScore diffhist +670 Arianne discussion contributions
     10:41  Character n-gram F-score diffhist +467 Arianne discussion contributions

27 janvier 2026

     17:37  Priority sampling diffhist +554 Arianne discussion contributions
     17:34  Greedy sampling diffhist +302 Arianne discussion contributions
     17:03  Attention sink diffhist +717 Arianne discussion contributions
     16:50  Self-play fine-tuning diffhist +445 Arianne discussion contributions
     16:33  Foom diffhist +63 Arianne discussion contributions
N    16:27  TER diffhist +776 Arianne discussion contributions (Page créée avec « == en construction == == Définition == xxxxx == Français == '''XXXXXXXX''' == Anglais == '''Translation Error Rate''' '''TER''' <!--Metric for automatic evaluation of machine translation that calculates the number of edits required to change a machine translation output into one of the references. It measures the insertions, deletions, substitutions, and shifts needed to transform a machine-generated hypothesis into reference translation. A lower TER, clos... »)

26 janvier 2026

N    15:15  BERTScore diffhist +1 414 Arianne discussion contributions (Page créée avec « == en construction == == Définition == xxxxxxx == Français == '''XXXXXXXX''' == Anglais == '''BERTScore''' <!--Metric for automatic evaluation of machine translation that calculates the similarity between a machine translation output and a reference translation using sentence representation. It was invented as an improvement on n-gram-based metrics (see BLEU), and addresses two common pitfalls in these: 1) Such methods often fail to robustly match paraphras... »)
N    15:11  Character n-gram F-score diffhist +596 Arianne discussion contributions (Page créée avec « == en construction == == Définition == xxxxxx == Français == '''XXXXXXX''' == Anglais == '''Character n-gram F-score''' '''chrF''' <!--Metric for machine translation evaluation that calculates the similarity between a machine translation output and a reference translation using character n-grams, not word n-grams. It recognizes different forms of a single word. It is language-independent and language-independent.--> == Sources == [https://aclanthology.org... »)
N    15:04  Priority sampling diffhist +761 Arianne discussion contributions (Page créée avec « == en construction == == Définition == xxxxxx Voir aussi '''échantillonnage des k-meilleurs''', '''échantillonnage des p-meilleurs''' et '''expression rationnelle''' == Français == '''XXXXXXX''' == Anglais == ''' Priority sampling''' <!--Deterministic sampling method that produces unique samples ordered by the model’s confidence. It supports generation based on regular expression that provides a controllable and structured exploration proce... »)
N    15:00  Greedy sampling diffhist +730 Arianne discussion contributions (Page créée avec « == en construction == == Définition == xxxxx Voir aussi '''échantillonnage des k-meilleurs''' == Français == '''XXXXXXXX''' == Anglais == '''greedy sampling''' <!--Deterministic sampling method that is computationally efficient and straightforward to implement, where the word with the highest conditional probability is selected as the next word in the sentence, given the previous words. This method often results in suboptimal and repetitive sequences.... »)
N    14:51  Attention sink diffhist +1 344 Arianne discussion contributions (Page créée avec « == en construction == == Définition == xxxxx == Compléments == On peut aussi utiliser le terme pour désigner spécifiquement ce genre de '''segment textuel''', on peut alors l'écrire au pluriel en fonction du contexte. == Français == ''' XXXXXXX''' == Anglais == ''' attention sink''' <!--This term can refer to the phenomenon or to the type of token concerned by the phenomenon. This phenomenon is present in all autoregressive large language models, i... »)
N    14:45  Self-play fine-tuning diffhist +720 Arianne discussion contributions (Page créée avec « == en construction == == Définition == xxxxx Voir '''GRPO''' == Français == ''' XXXXXX''' == Anglais == ''' self-play fine-tuning''' ''' self-play fine tuning''' ''' SPIN''' <!--A language model finetuning algorithm for large language models that utilizes a self-play mechanism, allowing LLMs to improve themselves by playing against their previous iterations. This techinique reduces reliance on external preference da... »)