Quelques réflexions sur le problème de Monty-Hall

Vous avez probablement déjà entendu parler du fameux problème de Monty-Hall. Ce problème est devenu célèbre depuis que Marilyn Vos Savant, considérée comme « la femme avec le plus haut QI du monde », en a parlé dans un magazine américain en 1975. Dans cet article, nous allons discuter de la solution la plus communément acceptée qui est qu’il faut changer de porte pour avoir plus de chances de gagner la voiture. Nous allons voir que cette solution repose en réalité sur une certaine interprétation du problème, et que la réponse qui consiste à ne pas changer de porte n’est pas si bête qu’elle n’y parait. En réalité, ces deux réponses répondent à des interprétations différentes du problème et l’information disponible au moment de prendre la décision.

Le problème de Monty-hall

Le problème est formulé de la façon suivante : « Supposons que vous êtes à un show TV, où on vous donne le choix entre trois portes. Il y à une voiture derrière une porte, et une chèvre derrière chacune des deux autres portes. Vous choisissez une porte, disons la porte 1, et là le présentateur, qui sait ce qui se cache derrière chaque porte, ouvre une porte que vous n’avez pas choisie, disons la porte 3, et vous montre qu’elle contient une chèvre. Il vous demande alors si vous voulez garder votre choix initial ou changer pour la porte n°2. Devez-vous changer ou pas pour maximiser vos chances de gagner la voiture ?  »

trois portes

La réponse de Marilyn est qu’il est tout à fait rationnel de changer systématiquement de porte, car cela donnerai 2/3 de chance de gagner la voiture, contre seulement 1/2 si on ne change pas de porte.

Son explication peut être comprise de façon assez intuitive en remarquant qu’au moment du choix de changer de porte, si notre porte de départ contient une chèvre, alors changer nous fera tomber sur la voiture, alors que garder la porte nous fera garder la chèvre. À l’inverse, si notre choix de départ contenait bien la voiture, changer nous fera obtenir une chèvre. Ainsi le résultat du changement (voiture ou chèvre) est conditionné par ce qui se cache derrière la porte de notre choix initial.
Or comme au départ, il y a deux portes avec une chèvre et une seule avec une voiture, cela veut dire que nous avions deux chances sur trois de choisir une porte avec une chèvre au début du jeu. Donc si changer lorsqu’on avait une porte avec chèvre donne une voiture, changer donne bien 2 chances sur 3 d’avoir une voiture, alors que ne pas changer donne une chance sur deux (car on a éliminé une porte). Si ce raisonnement informel n’emporte pas votre adhésion, vous pouvez toujours allez voir la démonstration bayésienne, plus formelle, où faire l’exercice mental de reproduire ce raisonnement avec N portes.

On vient ainsi de « démontrer » qu’il est plus rationnel de toujours changer de porte si on veut gagner la voiture ! Mais est-ce vraiment le cas ?

Joueur potentiel ou joueur actuel ?

En réalité, le raisonnement que nous venons de faire repose sur une hypothèse qui n’est pas précisée dans l’énoncé : nous nous plaçons comme si nous connaissions à l’avance l’entière séquence du jeu ! On peut représenter cette séquence en trois étapes :

  • Étape 1 : choisir une porte aléatoire entre les trois possibles.
  • Étape 2 : le présentateur ouvre une porte avec une chèvre.
  • Étape 3 : on nous propose de choisir de changer de porte ou non.

Pour que le raisonnement qui mène à deux chances sur trois fonctionne, nous devons nous placer d’un point de vue du joueur potentiel du jeu, qui devrait décider de la stratégie qu’il choisira à l’étape 3 dés le départ du jeu, en connaissant la séquence du jeu ! Nous devons savoir que le présentateur va forcément ouvrir une porte avec une chèvre, et c’est cette connaissance a priori qui fonde le raisonnement.

Sachant que le présentateur va ouvrir une porte avec une chèvre, nous pouvons ainsi déduire que changer nous permettra d’avoir une voiture si nous avions sélectionné au hasard une chèvre au départ, ce qui arrive dans 2 cas sur 3.

Mais qu’est ce qui nous autorise à avoir un tel point de vue de ce joueur potentiel, qui déciderait de quel choix il va faire à l’étape 3 à l’avance ?

Il existe en réalité une autre façon de comprendre l’énoncé du problème, qui consiste à se placer du point de vue du joueur au moment où il doit faire son choix à l’étape 3. Si on se place du point de vue de ce joueur actuel le raisonnement devient très différent. Dans la situation de ce joueur qui arrive à l’étape 3, on se retrouve avec seulement deux portes, dont l’une contient une chèvre et l’autre une voiture.

Savoir comment nous sommes arrivés à cette situation (par ce que le présentateur a ouvert une porte, par ce qu’une chèvre s’est enfuie et à ouvert la porte, etc) n’a en réalité aucune importance, car c’est de l’information passée. La seule chose qui compte, c’est que nous avons deux portes, et donc une chance sur deux de choisir la voiture.

On peut représenter ces deux visions par le schéma suivant :

La différence fondamentale entre ces deux visions est le point de vue qu’on adopte pour considérer le moment où le joueur décide ce qu’il fait à l’étape 3.

Il n’y a donc pas de « bonne » ou « mauvaise » réponse au problème de Monty-Hall. Les deux réponses (2/3 et 1/2) répondent en réalité à deux problèmes différents. La réponse de 2/3 répond au problème de quoi faire si on se place du point de vue d’un joueur potentiel du jeu, qui en connait le déroulement futur (action du présentateur d’ouvrir une porte) et qui peut intégrer cette information dans son raisonnement. La réponse 1/2 répond quant à-elle à la question du point de vue du joueur actuel du jeu, pour qui l’ouverture d’une porte par le présentateur est une formation passée, qui n’a plus d’importance.

Information a priori ou passée ?

La différence entre les deux points de vue peut paraitre sémantique, mais elle est cruciale. Dans le premier cas, le fait que le présentateur ouvre une porte est une information utile, qui doit être intégrée dans le raisonnement. C’est un événement qui va influencer les possibilités au moment du choix, car en nous plaçant dans la situation du joueur potentiel, le déroulé du jeu des étapes 1 à 3 est devant nous et fait partie du futur.

Dans le second point de vue, en se plaçant du côté du joueur qui arrive à l’étape 3, le fait que le présentateur ai ouvert une porte est de l’information passée, qui n’a plus aucune importance sur le futur du jeu. La bonne réponse ne peut alors être qu’une chance sur deux.

L’énoncé originel ne nous permet pas de savoir avec précision si nous devons voir le problème d’un point de vue du joueur potentiel qui pourrait jouer à un tel jeu en connaissant son déroulement, ou du point de vue du joueur actuel qui doit décider sur le moment de changer ou non de porte.

Le fait qu’il soit extrait d’un courrier de lecteur reproduit dans un magazine, qui s’adresse à la « femme la plus intelligente du monde », nous laisse à penser que l’intention de son auteur était d’illustrer le raisonnement bayésien, et donc que la réponse attendue  était de 2/3. Ce qui est considéré généralement comme la réponse officielle.

Néanmoins, une lecture « stricte » de l’énoncé porte plutôt vers la réponse considérée comme « fausse » de ne pas changer de porte et d’avoir une chance sur deux d’obtenir la voiture. En effet, l’énoncé nous invite à nous mettre à la place du joueur en nous demandant si on doit changer de porte ou non, donc en position de joueur actuel et non de joueur potentiel.

Conclusion

Pour conclure, on peut dire qu’il n’existe pas selon moi de bonne réponse au problème de Monty Hall, car tout dépend de comment on souhaite comprendre l’énoncé. Une lecture stricte fera plutôt pencher la balance vers une réponse consistant à ne pas changer de porte, alors qu’une réponse dans l’esprit de l’auteur du problème consistera à changer de porte, pour illustrer le raisonnement bayésien. Au-delà de savoir quelle réponse est la bonne, il est intéressant de voir que la réponse dépend surtout de façon de voir l’information et le moment de la décision, et que l’énoncé est finalement trop imprécis pour permettre d’identifier de façon certaine une vraie réponse !