« Fouille arborescente Monte Carlo » : différence entre les versions
Aucun résumé des modifications Balise : Éditeur de wikicode 2017 |
Aucun résumé des modifications Balise : Éditeur de wikicode 2017 |
||
Ligne 2 : | Ligne 2 : | ||
[[Category:Intelligence artificielle]]Intelligence artificielle<br> | [[Category:Intelligence artificielle]]Intelligence artificielle<br> | ||
[[Category:Résolution de problèmes]]Résolution de problèmes<br> | [[Category:Résolution de problèmes]]Résolution de problèmes<br> | ||
[[Category:Algorithme de fouille]] | [[Category:Algorithme de fouille]] | ||
[[Category:Coulombe2]] | [[Category:Coulombe2]] | ||
[[Category:Scotty2]] | [[Category:Scotty2]] | ||
[[Category:GRAND LEXIQUE FRANÇAIS]] | [[Category:GRAND LEXIQUE FRANÇAIS]] | ||
==Définition== | ==Définition== | ||
En intelligence artificielle, la fouille arborescente Monte Carlo est un algorithme de recherche heuristique dans un arbre pour la prise de décision. Il est notamment employé dans les jeux. Chaque nœud de l'arbre de fouille mémorise deux nombres: le nombre de simulations gagnantes, et le nombre de simulations totales. L'algorithme de fouille arborescente Monte Carlo comporte quatre étapes: | En intelligence artificielle, la fouille arborescente Monte Carlo est un algorithme de recherche heuristique dans un arbre pour la prise de décision. Il est notamment employé dans les jeux. Chaque nœud de l'arbre de fouille mémorise deux nombres: le nombre de simulations gagnantes, et le nombre de simulations totales. L'algorithme de fouille arborescente Monte Carlo comporte quatre étapes: | ||
# Sélection: Choix d'un noeud feuille enfant en maintenant un compromis entre l'exploitation des noeuds prometteurs et l'exploration des noeuds moins visités. | |||
# Expansion: Si le noeud feuille visité n'est pas final, création d'un (ou plusieurs) enfant(s) en appliquant les règles du jeu et choix l'un des noeuds enfants. | |||
# Simulation: Simulation d'une partie au hasard depuis le noeud enfant, jusqu'à une configuration finale. | |||
# Rétropropagation (Backpropagation): Mise à jour des informations sur la branche partant du noeud enfant vers la racine en tenant compte du résultat de la simulation de la partie au hasard à l'étape 3. | |||
# On peut citer l'utilisation de la fouille arborescente Monte Carlo en combinaison avec des réseaux de neurones profonds dans le programme AlphaGo de Deepmind qui a battu des champions au jeu de Go. | |||
On peut citer l'utilisation de la fouille arborescente Monte Carlo en combinaison avec des réseaux de neurones profonds dans le programme AlphaGo de Deepmind qui a battu des champions au jeu de Go. | |||
==Français== | ==Français== | ||
'''fouille arborescente Monte Carlo '''locution nominale fém. | '''fouille arborescente Monte Carlo '''locution nominale fém. | ||
'''recherche arborescente Monte Carlo '''loc. nom. fém. | '''recherche arborescente Monte Carlo '''loc. nom. fém. | ||
==Anglais== | ==Anglais== | ||
'''Monte Carlo tree search (MCTS)''' | |||
Ligne 36 : | Ligne 28 : | ||
[https://fr.wikipedia.org/wiki/Recherche_arborescente_Monte-Carlo Source: Wikipedia] | [https://fr.wikipedia.org/wiki/Recherche_arborescente_Monte-Carlo Source: Wikipedia] | ||
[[Utilisateur:Claude COULOMBE | source : Claude Coulombe]] ([[Discussion utilisateur:Claude COULOMBE | discussion]]) | [[Utilisateur:Claude COULOMBE | source : Claude Coulombe]] ([[Discussion utilisateur:Claude COULOMBE | discussion]]) | ||
Version du 15 juin 2019 à 20:36
Domaine
Intelligence artificielle
Résolution de problèmes
Définition
En intelligence artificielle, la fouille arborescente Monte Carlo est un algorithme de recherche heuristique dans un arbre pour la prise de décision. Il est notamment employé dans les jeux. Chaque nœud de l'arbre de fouille mémorise deux nombres: le nombre de simulations gagnantes, et le nombre de simulations totales. L'algorithme de fouille arborescente Monte Carlo comporte quatre étapes:
- Sélection: Choix d'un noeud feuille enfant en maintenant un compromis entre l'exploitation des noeuds prometteurs et l'exploration des noeuds moins visités.
- Expansion: Si le noeud feuille visité n'est pas final, création d'un (ou plusieurs) enfant(s) en appliquant les règles du jeu et choix l'un des noeuds enfants.
- Simulation: Simulation d'une partie au hasard depuis le noeud enfant, jusqu'à une configuration finale.
- Rétropropagation (Backpropagation): Mise à jour des informations sur la branche partant du noeud enfant vers la racine en tenant compte du résultat de la simulation de la partie au hasard à l'étape 3.
- On peut citer l'utilisation de la fouille arborescente Monte Carlo en combinaison avec des réseaux de neurones profonds dans le programme AlphaGo de Deepmind qui a battu des champions au jeu de Go.
Français
fouille arborescente Monte Carlo locution nominale fém.
recherche arborescente Monte Carlo loc. nom. fém.
Anglais
Monte Carlo tree search (MCTS)
Contributeurs: Claude Coulombe, Jacques Barolet, wiki