Tous les journaux publics
Affichage combiné de tous les journaux disponibles sur DataFranca. Vous pouvez personnaliser l’affichage en sélectionnant le type de journal, le nom d’utilisateur ou la page concernée (ces deux derniers étant sensibles à la casse).
- 6 mars 2024 à 15:20 Patrickdrouin discussion contributions a créé la page Modèle de récompense (Page créée avec « == Définition == En apprentissage par renforcement, le modèle de récompense donne une récompense ou une pénalité en réponse à une action qui est posée par un agent. == Compléments == Dans un grand modèle de langues, l'action serait une requête Dans le cas d'un agent autonome comme un robot aspirateur, le fait de se buter contre un mur va déclencher une pénalité, ce qui permet au robot d'ajuster son comportement. On rencontre parfois le te... »)