Aller au contenu

Fichier:Visualization of Thompson sampling.gif

Le contenu de la page n’est pas pris en charge dans d’autres langues.
Une page de Wikipédia, l'encyclopédie libre.

Visualization_of_Thompson_sampling.gif(640 × 480 pixels, taille du fichier : 8,87 Mio, type MIME : image/gif, en boucle, 301 trames, 30 s)

Ce fichier et sa description proviennent de Wikimedia Commons.

Description

Description
English: Visualization of Thompson sampling in a simulated simplified context. We want to evaluate different treatment efficacies (our unknowns) in an efficient way. This is a case of basic multi-arm bandit problem. Outcome is simplified as either success of failure, and each treatment has its own (unknown to us) real probability of success (indicated by rotated squares). At each step, a patient comes in, and Thompson sampling is applied to choose which treatment to give. To that end: 1) for each treatment, a random number is picked following our current bayesian belief for that treatment's actual probability of success; 2) the treatment in which we picked the maximum of these random numbers is chosen (argmax) and applied; 3) once we get the result (success or failure), our belief is updated accordingly, and we can go to the next step.

The number below each treatment's rotated square represents the numbers of patients who received this treatment up until now. The more a treatment is applied, the less uncertainty we have about its probability of success (the distribution is "thinner").

We can see that here, Thompson sampling rapidly abandons the ineffective treatments (T1 and Placebo) and favors the most effective ones (T3 and T4).
Français : Visualisation de l'échantillonnage de Thompson dans un contexte simplifié de simulation. On veut évaluer les efficacités de différents traitements de façon efficiente. C'est un cas simple de bandit manchot. L'issue d'un traitement est simplifiée : soit succès, soit échec, et chaque traitement a sa propre probabilité de succès (inconnue pour nous), indiquée par les carrés pivotés. À chaque tour, un patient arrive, et l'échantillonnage de Thompson est appliqué pour décider du traitement lui donner. Pour cela : 1) pour chaque traitement, un nombre aléatoire est tiré, suivant la distribution actuelle de la croyance sur la probabilité de succès du traitement; 2) le traitement qui a obtenu le nombre aléatoire le plus élevé est choisi (argmax) et appliqué; 3) une fois qu'on reçoit le résultat (succès ou échec), la croyance sur la probabilité de succès de ce traitement est mise à jour, et on peut passer au tour suivant.

Le nombre en dessous de chaque carré pivoté représente le nombre de patients ayant reçu le traitement jusqu'ici. Plus un traitement est appliqué, moins on a d'incertitude sur sa probabilité de succès (la distribution est plus "fine").

On peut voir qu'ici, l'échantillonnage de Thompson abandonne rapidement les traitements inefficaces (T1 et Placebo) et favorise les plus efficaces (T3 et T4).
Date
Source Travail personnel
Auteur Nguiard

Conditions d’utilisation

Moi, en tant que détenteur des droits d’auteur sur cette œuvre, je la publie sous la licence suivante :
w:fr:Creative Commons
paternité
Ce fichier est disponible selon les termes de la licence Creative Commons Attribution 4.0 International.
Vous êtes libre :
  • de partager – de copier, distribuer et transmettre cette œuvre
  • d’adapter – de modifier cette œuvre
Sous les conditions suivantes :
  • paternité – Vous devez donner les informations appropriées concernant l'auteur, fournir un lien vers la licence et indiquer si des modifications ont été faites. Vous pouvez faire cela par tout moyen raisonnable, mais en aucune façon suggérant que l’auteur vous soutient ou approuve l’utilisation que vous en faites.

Légendes

Ajoutez en une ligne la description de ce que représente ce fichier
Concrete example of Thompson sampling applied to simulate treatment efficacy evaluation.

image/gif

Historique du fichier

Cliquer sur une date et heure pour voir le fichier tel qu'il était à ce moment-là.

Date et heureVignetteDimensionsUtilisateurCommentaire
actuel10 novembre 2023 à 11:35Vignette pour la version du 10 novembre 2023 à 11:35640 × 480 (8,87 Mio)NguiardUploaded own work with UploadWizard

La page suivante utilise ce fichier :

Usage global du fichier

Les autres wikis suivants utilisent ce fichier :