Requête explicite d'échantillonnage


Révision datée du 28 avril 2026 à 15:27 par Claude COULOMBE (discussion | contributions)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)

Définition

Technique d'ingénierie de requêtes qui améliore la diversité des réponses d'un grand modèle de langues (GML) en demandant explicitement de générer plusieurs réponses avec leurs probabilités, puis d'effectuer un échantillonnage dans cette distribution statistique.

Voir aussi GML comme juge

Compléments

Cette technique ne nécessite aucun apprentissage, elle est indépendante du GML et elle est efficace pour tous les types de tâches. De plus, elle améliore les performances sans compromettre la précision factuelle ni la sécurité des modèles.

Cette méthode est orthogonale à la température du modèle.

Français

requête explicite d'échantillonnage

requête de résultats échantillonnés depuis une distribution

échantillonnage verbalisé calque de l'anglais

Anglais

verbalized sampling

verbalized-sampling

VS

A prompting strategy that improves LLM diversity by asking the model to generate multiple responses with their probabilities, then sampling from this distribution. It is training free, model agnostic and effective across tasks and it improves performance without sacrificing the models’ factual accuracy or safety.

This method is orthogonal to temperature.

Sources

LinkedIn - requête de résultats échantillonnés depuis une distribution

arxiv - verbalized sampling

GitHub - verbalized-sampling

site web - verbalized sampling

Contributeurs: Arianne Arel, Claude Coulombe, wiki