Le dilemme du prisonnier - Qu'est-ce que c'est, définition et concept

Table des matières:

Anonim

Le dilemme du prisonnier est un problème de la théorie des jeux. Le dilemme du prisonnier examine les incitations que deux suspects de crime ont à exposer leur partenaire ou à proclamer leur innocence.

C'est un jeu non coopératif, avec une somme non nulle et la catégorie d'équilibre de Nash. Grâce à cet exercice, nous pouvons comprendre à quel point il peut être difficile pour deux personnes de coopérer même si cette coopération est la meilleure option pour les deux. Dans la plupart de ses versions, il s'agit d'un jeu symétrique. C'est-à-dire que les peines pour chaque prisonnier sont les mêmes.

Exemple du dilemme du prisonnier

L'exercice est basé sur deux suspects dans un crime. Pour notre exemple, nous allons les appeler Luis et Mario. La police les arrête et, au commissariat, les place dans deux pièces séparées. Comme il n'y a pas suffisamment de preuves pour les condamner, la police leur offre le même traitement. Ils peuvent choisir entre deux options, trahir leur partenaire ou se dire innocents. Voyons ce qu'il advient de chaque détenu selon l'option qu'il prend :

  • Si Mario dit qu'ils sont innocents :

- Mais Luis le trahit, Mario devra passer 7 ans en prison et Luis sera libéré.

- Et Luis dit aussi que tous les deux sont innocents, ils sont tous les deux reconnus coupables d'un délit et tous les deux devront passer un an en prison.

  • Si Mario accuse Luis :

- Et Luis trahit à son tour Mario, tous deux devront passer 3 ans derrière les barreaux.

- Mais Luis dit qu'ils sont innocents, Mario sera libre mais Luis devra passer 7 ans en prison.

Si nous examinons ce dilemme d'un point de vue coopératif, Ce qui serait avantageux pour eux deux ensemble, ce serait de se comporter comme de bons amis et de dire qu'ils sont innocents, de sorte que les deux n'auront qu'à passer un an en prison.

Cependant, si nous analysons cette situation individuellement la situation change, parce que les deux sont séparés et ne peuvent pas savoir ce que l'autre a répondu. La meilleure solution individuelle serait de blâmer l'autre. Pour mieux le voir, nous allons nous mettre à nouveau dans la peau de Mario.

- Si Luis l'a blâmé et que Mario dit qu'ils sont innocents, il passera 7 ans en prison, mais s'il décide également de blâmer son partenaire, sa situation s'améliore. En blâmant Luis, sa peine est réduite de 7 à 3 ans.

- Si Luis a dit qu'ils sont innocents et Mario aussi, ils passeront tous les deux un an en prison, mais si Mario décide de blâmer Luis, il sera libéré directement. Par conséquent, s'il blâme Luis pour le crime, sa peine est réduite d'un an à zéro, s'améliorant également dans ce cas s'il blâme son partenaire.

Blâmer Luis serait la meilleure réponse rationnelle de Mario (sans tenir compte des émotions, s'il est un ami de Luis ou non). Dans l'image ci-dessus, nous voyons comment Mario s'améliorera toujours si sa réponse est dans la colonne de droite (donner).

Comme chacun poursuit son propre intérêt et ne peut se fier à ce que l'autre dira, la meilleure option pour chacun d'eux est d'adopter la stratégie de la déclaration, ce qui conduit à la situation d'équilibre (3,3) dans laquelle chacun minimise sa perte possible, mais la solution commune est pire. Cet équilibre (3,3) est appelé équilibre de Nash.