« Locally typical sampling » : différence entre les versions
(Page créée avec « == en construction == == Définition == xxxxxxx Voir aussi '''échantillonnage des k-meilleurs''' et '''ergodicité''' == Français == ''' XXXXXX''' == Anglais == ''' Locally typical sampling''' <!--Sampling method that improves text quality and reduces repetitions in probabilistic language generators. The idea is that when you want a text to be perceived as natural, each word should have an information content close to its expected information conte... ») |
Aucun résumé des modifications |
||
| Ligne 2 : | Ligne 2 : | ||
== Définition == | == Définition == | ||
Méthode d''''[[échantillonnage]]''' qui améliore la qualité du texte et réduit les répétitions des '''[[Génération de texte|générateurs de texte]]''' '''[[Échantillon aléatoire|probabilistes]]'''. L'idée est que, pour qu'un texte soit perçu comme naturel, chaque mot doit avoir un contenu informatif proche de celui attendu d'après le contexte antérieur. Ainsi, lors de l'échantillonnage à partir de générateurs de texte probabilistes, les options sont limitées aux chaînes de caractères qui respectent cette propriété. | |||
Voir aussi '''[[échantillonnage des k-meilleurs]]''' et '''[[ergodicité]]''' | Voir aussi '''[[échantillonnage des k-meilleurs]]''' et '''[[ergodicité]]''' | ||
| Ligne 12 : | Ligne 12 : | ||
''' Locally typical sampling''' | ''' Locally typical sampling''' | ||
<!-- | <!--A sampling method that improves text quality and reduces repetitions in probabilistic language generators. The idea is that when you want a text to be perceived as natural, each word should have an information content close to its expected information content given prior context. Thus, when sampling from probabilistic language generators, we should limit our options to strings that adhere to this property.--> | ||
== Sources == | == Sources == | ||
Dernière version du 5 mars 2026 à 11:29
en construction
Définition
Méthode d'échantillonnage qui améliore la qualité du texte et réduit les répétitions des générateurs de texte probabilistes. L'idée est que, pour qu'un texte soit perçu comme naturel, chaque mot doit avoir un contenu informatif proche de celui attendu d'après le contexte antérieur. Ainsi, lors de l'échantillonnage à partir de générateurs de texte probabilistes, les options sont limitées aux chaînes de caractères qui respectent cette propriété.
Voir aussi échantillonnage des k-meilleurs et ergodicité
Français
XXXXXX
Anglais
Locally typical sampling
Sources
Contributeurs: Arianne Arel





