Imagine que tu es un criminel et que tu as été arrêté en même temps que ton co-conspirateur. La police vous emmène tous les deux dans des pièces séparées où vous ne pouvez pas communiquer l'un avec l'autre. La police n'a pas assez de preuves pour te condamner pour le chef d'accusation principal, mais elle en a assez pour te condamner pour un chef d'accusation moins grave. Pendant que vous êtes confinés dans la pièce, la police vous propose à tous les deux le même marché : si vous témoignez contre votre co-conspirateur, vous obtiendrez l'immunité ! Qu'est-ce que tu fais ?
Comment aborder cette situation ? Existe-t-il une décision correcte ? Cette expérience de pensée classique s'appelle le dilemme du prisonnier et c'est un jeu classique de la théorie des jeux.
Le dilemme du prisonnier et la théorie des jeux
Enéconomie, la théorie des jeux est utilisée pour étudier les interactions entre des acteurs rationnels et concurrents. Toute interaction entre des joueurs ayant des points de décision peut être modélisée comme un type de jeu.
Lathéorie des jeux est un domaine d'étude qui s'intéresse à l'analyse et à la création de modèles pour les jeux stratégiques.
Fondamentalement, le dilemme du prisonnier est un jeu très simple dans lequel deux joueurs prennent une décision simultanément et sans se consulter. Le scénario est celui de deux co-conspirateurs criminels qui sont interrogés par la police dans des pièces séparées et qui se voient proposer le même marché : avouer le crime et trahir leur co-conspirateur en échange d'une immunité totale. La prise de décision dans ce scénario consiste à peser le pour et le contre de la coopération et de la concurrence.
Les résultats possibles sont les suivants :
Si toi et ton coconspirateur vous trahissez l'un l'autre, vous purgerez tous les deux une peine de deux ans
Si toi et ton co-conspirateur gardez le silence, vous purgerez tous les deux un an (à partir de l'accusation la moins grave).
Si tu trahis ton co-conspirateur mais que celui-ci garde le silence, tu seras libre et ton co-conspirateur purgera une peine de cinq ans.
Si ton complice te trahit mais que tu gardes le silence, ton complice sera libre et tu purgeras une peine de cinq ans.
Un facteur clé ici est que la coopération mutuelle - les deux gardant le silence - aboutit à un meilleur résultat pour les deux joueurs que si les deux joueurs avouent et se trahissent l'un l'autre.
Le dilemme du prisonnier et la théorie des jeux peuvent fournir un modèle et un cadre permettant d'équilibrer la coopération et la concurrence dans divers contextes tels que la fixation du prix des marchandises et la production de produits. Ce jeu se prête à l'analyse de l'oligopole - lorsque plusieurs entreprises du même secteur d'activité doivent déterminer si elles doivent coopérer ou se faire concurrence.
Stratégie optimale du dilemme du prisonnier
Dans unjeu stratégique, les joueurs veulent choisir la stratégie qui maximise leurs gains. Afin de déterminer la meilleure option dans le dilemme du prisonnier, créons une matrice des gains qui montre les résultats de chaque décision. Les options de la personne A sont indiquées dans la colonne la plus à gauche, et les options de la personne B sont indiquées en haut. Comme les gains dans ce jeu sont des années de prison, chaque joueur veut le plus petit nombre possible.
(Personne A, Personne B)
Coopérer (garder le silence)
Trahir (avouer)
Coopérer (garder le silence)
(1, 1)
(5,0)
Trahir (avouer)
(0,5)
(2, 2)
Une stratégie est un plan d'action complet, et la stratégie optimale est celle qui maximise le gain de l'individu. Une stratégie prend la forme suivante :
"Si mon adversaire coopère, alors je vais _____, et si mon adversaire trahit, alors je vais _____."
Que faut-il mettre dans ces cases pour maximiser le profit ? Si tu savais quel choix l'autre joueur allait faire, que ferais-tu ? Remarque que du point de vue de la personne A, si cette dernière considère comme acquis que la personne B coopère, alors le choix de la personne A ressemble à ceci. Soit tu coopères aussi et tu n'auras qu'un an de prison, soit tu trahis ton co-conspirateur et tu obtiens l'immunité ! Le résultat de la personne A est meilleur lorsqu'elle trahit. L'immunité totale est meilleure qu'un an de prison.
De même, si la personne A considère comme acquis que la personne B trahit, alors le choix de la personne A est de coopérer et d'obtenir cinq ans de prison à cause du témoignage de ton adversaire contre toi, ou de le trahir également et de n'obtenir que deux ans de prison. Encore une fois, le résultat pour la personne A est meilleur lorsqu'elle trahit. Deux ans seulement valent mieux que cinq ans de prison. La même chose est vraie en sens inverse pour la personne B.
Tu sais maintenant que la stratégie optimale est la suivante :
"Si mon adversaire coopère, alors je trahirai, et si mon adversaire trahit, alors je trahirai".
La stratégie optimale implique de choisir la même action dans les deux cas. Cela signifie que le choix de trahir est une stratégie dominante dans le dilemme du prisonnier.
Un joueur a une stratégie dominantelorsqu'il existe une action qui aboutira toujours à un meilleur résultat, quel que soit le choix de l'autre personne.
Dans un jeu comme celui-ci où les deux joueurs ont une stratégie dominante, on peut s'attendre à ce que la seule issue rationnelle du jeu soit celle où les deux joueurs jouent leur stratégie dominante.
Implications
Le dilemme du prisonnier illustre un concept contre-intuitif. Puisque les deux joueurs trahissent, le résultat est pire pour les deux joueurs que s'ils avaient coopéré, même si les deux acteurs ont utilisé leur stratégie optimale. Si la personne A et la personne B trahissent toutes les deux, elles passent toutes les deux deux deux ans en prison. Si elles avaient toutes deux coopéré, elles n'auraient passé qu'un an en prison chacune. Cependant, il n'est pas rationnel de choisir de coopérer.
Collectivement, lorsqu'elles passent toutes les deux deux deux ans en prison, cela fait un total de quatre années de prison. Si la personne A et la personne B choisissaient toutes deux de garder le silence, le nombre total d'années de prison ne serait que de 2. Ainsi, même le résultat social total est pire que si elles avaient toutes deux coopéré.
Cela s'explique par le fait que chaque personne ne cherche qu'à défendre ses propres intérêts. Lorsqu'elle agit de façon égoïste, l'incitation à la trahison est suffisamment forte pour empêcher la coopération. Considère une version du dilemme du prisonnier dans laquelle la personne A sait ce que la personne B va choisir de faire. Quel est le choix optimal maintenant ?
La réponse est toujours de trahir. Si la personne A sait que la personne B la trahira, le choix qui permettra à la personne A de passer moins de temps en prison est de trahir également. Si la personne A sait que la personne B gardera le silence, le choix qui permettra à la personne A de passer moins de temps en prison est encore de trahir.
Équilibre de Nash du dilemme du prisonnier
Dans la théorie des jeux, l'issue d'un jeu est un équilibre de Nash si aucun joueur ne peut augmenter son gain en changeant de stratégie, en supposant que les stratégies des autres joueurs restent les mêmes. Le terme a été créé par John Nash, un mathématicien et une figure importante dans l'étude de la théorie des jeux.
L'équilibre de Nashest atteint lorsqu'aucun joueur ne peut améliorer son gain personnel en changeant de stratégie, en supposant que les stratégies des autres joueurs restent les mêmes.
Un raccourci pour déterminer l'équilibre de Nash dans un jeu consiste à ce que tous les joueurs révèlent leur choix aux autres joueurs. Connaissant les choix des autres joueurs, veux-tu modifier ton propre choix ? Si oui, avec ton nouveau choix, les autres joueurs veulent-ils changer le leur ? Une fois qu'aucun joueur n'a intérêt à modifier sa stratégie, l'équilibre de Nash est trouvé.
Équilibre de Nash et stratégie dominante
L'équilibre de Nash et la stratégie dominante sont des termes qui sont souvent abordés ensemble. L'équilibre de Nash décrit un résultat dans lequel aucun joueur ne peut augmenter son gain individuel en changeant de stratégie, en supposant que les stratégies des autres joueurs restent les mêmes. Ce résultat est "stable" dans le sens où personne ne veut changer de stratégie.
Une stratégie dominante est une action qui donne toujours un gain plus élevé, quel que soit le choix de l'autre joueur. Tous les jeux n'ont pas de stratégie dominante. Et tous les joueurs du jeu n'ont pas une stratégie dominante.
Si un jeu a une stratégie dominante pour tous les joueurs, ce résultat est automatiquement un équilibre de Nash.
Un jeu qui n'a pas de stratégie dominante peut quand même avoir un équilibre de Nash. En fait, peu de jeux ont une stratégie dominante, mais presque tous les jeux ont un équilibre de Nash. Il est possible qu'un jeu ait plusieurs équilibres de Nash, et il est possible qu'il n'en ait aucun. Cependant, il est courant d'avoir au moins un résultat qui peut être considéré comme stable au sens de l'équilibre de Nash - que personne ne veut changer, étant donné les choix de stratégie de tous les autres.
Ainsi, un équilibre de Nash peut impliquer un ou plusieurs joueurs jouant une stratégie dominante, mais tous les équilibres de Nash n'impliquent pas une stratégie dominante. Un jeu sans aucune stratégie dominante aura probablement toujours un équilibre de Nash.
Dilemme du prisonnier en économie et exemples
Le dilemme du prisonnier est couramment utilisé comme modèle d'analyse des entreprises concurrentes sur un marché. Par exemple, considérons deux entreprises rivales qui essaient de décider comment fixer le prix de leurs produits concurrents. Si l'une d'entre elles baisse ses prix afin de conquérir davantage de parts de marché, elle obligera l'autre à faire de même. Dans cet exemple, la réduction des prix est analogue à la trahison d'un co-conspirateur.
Pour analyser pleinement cet exemple, construisons une autre matrice de gains. Les gains sont les profits générés par les ventes dans le cadre des stratégies données. Les deux entreprises veulent maximiser leurs propres profits.
(Entreprise A, Entreprise B)
Coopérer(maintenir un prix élevé)
Trahir (réduire le prix)
Coopérer (maintenir le prix élevé)
(500, 500)
(0, 750)
Trahir (réduire le prix)
(750, 0)
(250, 250)
Ce jeu est une version du dilemme du prisonnier car pour toute décision donnée prise par une entreprise, l'autre entreprise a tout intérêt à réduire son prix.
Examinons d'autres exemples du dilemme du prisonnier en économie. Un exemple populaire et réel du dilemme du prisonnier dans le monde des affaires est la publicité. L'efficacité des efforts publicitaires d'une entreprise est partiellement déterminée par les efforts publicitaires d'une entreprise rivale. Si deux entreprises rivales choisissent de dépenser la même somme d'argent en publicité, les publicités de chaque entreprise sont annulées par l'autre. Dans ce scénario, les deux entreprises devraient réduire leurs dépenses publicitaires pour économiser de l'argent.
Cependant, chaque entreprise a le choix : elle peut "coopérer" et réduire ses dépenses publicitaires ou elle peut "trahir" et maintenir ou augmenter sa publicité, ce qui lui permettra de réaliser des profits supplémentaires grâce à l'augmentation de ses ventes. Cette situation est similaire au dilemme du prisonnier, car le bénéfice social total serait en fait le plus élevé si les deux entreprises choisissaient de coopérer et de réduire leurs dépenses publicitaires, mais les incitations individuelles vont à l'encontre de ce choix.
Dilemme du prisonnier - Principaux enseignements
Le dilemme du prisonnier décrit un jeu dans lequel deux criminels doivent décider entre (1) coopérer et garder le silence ou (2) avouer et se trahir l'un l'autre.
Ce jeu montre que même si la coopération entre les deux joueurs produit à la fois le meilleur résultat collectif et de meilleurs résultats individuels que s'ils trahissent tous les deux, leurs motivations individuelles empêchent la coopération.
Une stratégie dominante est une stratégie qui conduit à un meilleur résultat si l'on considère comme donnée toute stratégie particulière que l'autre joueur peut choisir.
Trahir l'autre personne est une stratégie dominante dans le dilemme du prisonnier.
L'équilibre de Nash est atteint lorsqu'aucun joueur ne peut améliorer son gain en changeant de stratégie, en prenant en compte toutes les stratégies des autres joueurs.
Un moyen rapide de déterminer si un jeu est en équilibre de Nash est que tous les joueurs révèlent leur stratégie. Si, avec cette information, aucun joueur n'a intérêt à modifier sa stratégie, on dit que le jeu est en équilibre de Nash.
Dans un jeu où tous les joueurs ont une stratégie dominante, le résultat où tous jouent leur stratégie dominante est un équilibre de Nash.
La fixation des prix en oligopole est un exemple de dilemme du prisonnier. Une entreprise peut choisir de "coopérer" en maintenant un prix élevé ou de "trahir" en réduisant son prix et en volant tout le marché. Le résultat collectif maximisant le profit est que les deux entreprises maintiennent leurs prix élevés, mais leur motivation individuelle est de se trahir l'une l'autre en réduisant leur prix et en volant le marché.
Apprends plus vite avec les 22 fiches sur Dilemme du prisonnier
Inscris-toi gratuitement pour accéder à toutes nos fiches.
Questions fréquemment posées en Dilemme du prisonnier
Qu'est-ce que le dilemme du prisonnier ?
Le dilemme du prisonnier est un jeu théorique où deux individus doivent choisir entre coopérer ou trahir. La meilleure décision collective serait de coopérer, mais l'incertitude pousse souvent les deux à trahir.
Quel est l'intérêt économique du dilemme du prisonnier ?
L'intérêt économique réside dans l'analyse des comportements stratégiques et des décisions prises en situation de conflit d'intérêts, aidant à comprendre et prévoir les décisions dans des contextes compétitifs.
Comment le dilemme du prisonnier s'applique-t-il aux entreprises ?
Il montre comment les entreprises peuvent choisir entre s'entendre pour maximiser les profits collectifs ou se concurrencer, risquant de diminuer leurs gains respectifs.
Quels sont les résultats possibles du dilemme du prisonnier ?
Les résultats possibles incluent les deux coopérant pour un bénéfice mutuel, ou l'un trahissant l'autre, aboutissant à des gains pour le traître et des pertes pour le coopérant, ou les deux trahissant, résultant en pertes pour tous.
How we ensure our content is accurate and trustworthy?
At StudySmarter, we have created a learning platform that serves millions of students. Meet
the people who work hard to deliver fact based content as well as making sure it is verified.
Content Creation Process:
Lily Hulatt
Digital Content Specialist
Lily Hulatt is a Digital Content Specialist with over three years of experience in content strategy and curriculum design. She gained her PhD in English Literature from Durham University in 2022, taught in Durham University’s English Studies Department, and has contributed to a number of publications. Lily specialises in English Literature, English Language, History, and Philosophy.
Gabriel Freitas is an AI Engineer with a solid experience in software development, machine learning algorithms, and generative AI, including large language models’ (LLMs) applications. Graduated in Electrical Engineering at the University of São Paulo, he is currently pursuing an MSc in Computer Engineering at the University of Campinas, specializing in machine learning topics. Gabriel has a strong background in software engineering and has worked on projects involving computer vision, embedded AI, and LLM applications.