« Locally typical sampling » : différence entre les versions

Dernière version du 5 mars 2026 à 12:29

en construction

Définition

Méthode d'échantillonnage qui améliore la qualité du texte et réduit les répétitions des générateurs de texte probabilistes. L'idée est que, pour qu'un texte soit perçu comme naturel, chaque mot doit avoir un contenu informatif proche de celui attendu d'après le contexte antérieur. Ainsi, lors de l'échantillonnage à partir de générateurs de texte probabilistes, les options sont limitées aux chaînes de caractères qui respectent cette propriété.

Voir aussi échantillonnage des k-meilleurs et ergodicité

Français

XXXXXX

Anglais

Locally typical sampling

Sources

Source : arxiv

Source : Hugging Face

@@ Ligne 2 : / Ligne 2 : @@
 == Définition ==
-xxxxxxx
+Méthode d''''[[échantillonnage]]''' qui améliore la qualité du texte et réduit les répétitions des '''[[Génération de texte|générateurs de texte]]''' '''[[Échantillon aléatoire|probabilistes]]'''. L'idée est que, pour qu'un texte soit perçu comme naturel, chaque mot doit avoir un contenu informatif proche de celui attendu d'après le contexte antérieur. Ainsi, lors de l'échantillonnage à partir de générateurs de texte probabilistes, les options sont limitées aux chaînes de caractères qui respectent cette propriété.
 Voir aussi '''[[échantillonnage des k-meilleurs]]''' et '''[[ergodicité]]'''
@@ Ligne 12 : / Ligne 12 : @@
 ''' Locally typical sampling'''
-<!--Sampling method that improves text quality and reduces repetitions in probabilistic language generators. The idea is that when you want a text to be perceived as natural, each word should have an information content close to its expected information content given prior context. Thus, when sampling from probabilistic language generators, we should limit our options to strings that adhere to this property.-->
+<!--A sampling method that improves text quality and reduces repetitions in probabilistic language generators. The idea is that when you want a text to be perceived as natural, each word should have an information content close to its expected information content given prior context. Thus, when sampling from probabilistic language generators, we should limit our options to strings that adhere to this property.-->
 == Sources ==

« Locally typical sampling » : différence entre les versions