la théorie des jeux





La théorie des jeux est l'étude des conflits humains et de la coopération dans une situation concurrentielle. À certains égards, la théorie des jeux est la science de la stratégie, ou du moins la prise de décision optimale des acteurs indépendants et concurrents dans un contexte stratégique. Les principaux pionniers de la théorie des jeux étaient les mathématiciens John von Neumann et John Nash, ainsi que l'économiste Oskar Morgenstern.



La théorie des jeux crée un langage et une structure formelle d'analyse pour prendre des décisions logiques dans des environnements compétitifs. Le terme «jeu» peut être trompeur. Même si la théorie des jeux s'applique aux jeux récréatifs, le concept de «jeu» désigne simplement toute situation interactive dans laquelle les acteurs indépendants partagent des règles et des conséquences plus ou moins formelles.
L'application formelle de la théorie des jeux nécessite la connaissance des détails suivants: identité des acteurs indépendants, leurs préférences, ce qu'ils savent, quels actes stratégiques ils sont autorisés à faire et comment chaque décision influe sur l'issue du jeu. Selon le modèle, d'autres exigences ou hypothèses peuvent être nécessaires. Enfin, on suppose que chaque acteur indépendant est rationnel.

La théorie des jeux a une large gamme d'applications, y compris la psychologie, la biologie évolutionniste, la guerre, la politique, l'économie et les affaires. Malgré ses nombreuses avancées, la théorie des jeux est encore une science jeune et en développement.

Impact sur l'économie et les affaires

La théorie des jeux a provoqué une révolution en économie en abordant des problèmes cruciaux dans des modèles économiques mathématiques antérieurs. Par exemple, l'économie néoclassique a lutté pour comprendre l'anticipation entrepreneuriale et ne pouvait pas gérer la concurrence imparfaite. La théorie des jeux a détourné l'attention de l'équilibre stationnaire vers le processus du marché.

En théorie des jeux, chaque décideur doit anticiper la réaction des personnes touchées par la décision. Dans les affaires, cela signifie que les agents économiques doivent anticiper les réactions des rivaux, des employés, des clients et des investisseurs.

Un exemple de théorie des jeux

Supposons que les dirigeants en charge d'Apple iOS et Google Android sont  décidés ou non de s'entendre et d'exercer un pouvoir duopole sur le marché des logiciels d'exploitation des smartphones. Chaque entreprise sait que s'ils travaillent ensemble et ne se trompent pas, ils seront en mesure de restreindre la production et d'augmenter les prix, bénéficiant ainsi de profits supérieurs à la normale.

Une simple application du dilemme du prisonnier montre qu'Apple et Google ne peuvent pas maintenir un équilibre stable tout en collusion ensemble, même sous l'hypothèse irréaliste qu'aucune autre concurrente du marché n'existe ou pourrait exister. Considérons les quatre scénarios possibles:



1. Apple et Google vendent le montant convenu, ne trichez pas et profitez de profits supérieurs à la normale.

2. Apple vend seulement le montant convenu de logiciel d'exploitation, mais Google vend la quantité à laquelle il reçoit le rendement net maximal (peut-être par des rabais secrets ou la création d'une filiale d'ombre). Google réalise des bénéfices encore plus importants en offrant discrètement des produits à des prix sous-duopolis, et Apple perd des parts de marché.

3. Google ne triche pas, mais Apple réalise encore plus de profits en trichant, et Google perd des parts de marché.

4. Apple et Google rivalisent normalement et réalisent des bénéfices normaux. Qu'il s'agisse ou non de tricheries Google, Apple est mieux à tricher, et vice versa. La même logique est vraie que ce soit discuter des courtiers individuels, des conseillers, des vendeurs ou des entreprises entières.

Le Dilemme du Prisonnier

Le Dilemme du Prisonnier est un jeu en forme stratégique entre deux joueurs. Chaque joueur a deux stratégies, appelées «coopérer» et «défaut», qui sont étiquetées C et D pour le joueur I
Et c et d pour le joueur II, respectivement. (Pour une identification plus simple, les lettres majuscules sont utilisé pour les stratégies du joueur I et des lettres minuscules pour le joueur II).

La figure 1



La figure 1 montre les résultats obtenus dans ce jeu.
Le joueur I choisit une ligne, soit C ou D, et simultanément le joueur II choisit une des colonnes c ou d.
La stratégie de la combinaison (C, c) a une récompense 2 pour chaque joueur,
 et la combinaison (D, d) donne à chaque joueur payeur 1.
 La combinaison (C, d) donne un résultat 0 pour le joueur I et 3 pour le joueur II,
Et quand (D, c) est joué, le joueur I obtient 3 et le joueur II obtient 0.

Tout jeu de deux joueurs en forme stratégique peut être décrit par une table comme celle de
Figure 1, avec des rangées représentant les stratégies du joueur I et des colonnes celles du joueur II.
(Un joueur peut avoir plus de deux stratégies.) Chaque combinaison de stratégie définit un gain paire, comme (3, 0) pour (D, c), qui est donné dans l'entrée de table respective. Chaque cellule du tableau indique le gain au joueur I à la (inférieure) à gauche, et le gain au joueur II à la  droite supérieure. Ces gains échelonnés, en raison de Thomas Schelling, rendent également transparent, quand, comme ici, le jeu est symétrique entre les deux joueurs. Symétrie signifie que le jeu reste le même lorsque les joueurs sont échangés, correspondant à une réflexion longue.
La diagonale est représentée en pointillé sur la figure 2. On notera que dans la forme stratégique, les joueurs agissent simultanément (c'est-à-dire sans autre action), ce qui rend la symétrie possible.

                                   Figure 2


Le jeu de la figure 1 avec des annotations, impliquées par la structure de paiement.
La ligne pointillée montre la symétrie du jeu. Les flèches à gauche et à droite montrent
la stratégie préférée du joueur I lorsque le joueur II joue à gauche ou à droite
Colonne, respectivement. De même, les flèches situées en haut et en bas montrent
Stratégie préférée du joueur II quand le joueur I joue en haut ou en bas.

Dans le jeu du Dilemme du Prisonnier, le «défaut» est une stratégie qui domine «coopérer».
La stratégie D du joueur I domine C puisque si le joueur II choisit c, alors le gain du joueur I est 3 en choisissant D et 2 en choisissant C;
Si le joueur II choisit d, alors le joueur I reçoit 1
Pour D par opposition à 0 pour C. Ces préférences du joueur I sont indiquées par le pointage vers le bas des flèches de la figure 2.
 Donc, D est en effet toujours meilleur et domine C.
De la même manière, la stratégie d domine c pour le joueur II.

Aucun joueur rationnel ne choisira une stratégie dominée car le joueur sera toujours mieux en changeant la stratégie qui la domine. Le résultat unique de ce jeu, comme recommandé aux joueurs maximisant l'utilité, est donc (D, d) avec des gains (1, 1).
 Un peu paradoxalement, c'est moins que le gain (2, 2) qui serait atteint
Quand les joueurs ont choisi (C, c).
L'histoire derrière le nom «Dilemme du prisonnier» est celle de deux prisonniers suspects d'un crime grave. Il n'existe aucune preuve judiciaire pour ce crime, sauf si l'un des prisonniers témoigne contre l'autre. Si l'un d'eux témoigne, il sera récompensé par l'immunité
(Payoff 3), alors que l'autre servira une longue peine de prison      (payoff 0). Si les deux témoignent, leur punition sera moins sévère (payoff 1 pour chacun). Toutefois, si
Ils "coopèrent" les uns avec les autres en ne déclarant pas du tout, ils ne seront emprisonnés
Brièvement, par exemple pour possession d'armes illégales (2 pour chaque paiement). La "défection" de ce résultat mutuellement bénéfique est de témoigner, ce qui donne un rendement plus élevé, peu importe ce que fait l'autre prisonnier, ce qui entraîne un résultat inférieur pour les deux. Cela constitue leur "dilemme."
Les jeux du Dilemme du Prisonnier se posent dans divers contextes où des défections des dépenses des autres entraînent des résultats globalement moins souhaitables. Les exemples incluent les armes des courses, les litiges au lieu d'un règlement, la pollution de l'environnement ou la commercialisation à prix réduit, où le résultat est préjudiciable pour les joueurs. Sa justification théorique du jeu pour des raisons individuelles est parfois prise en considération pour les traités et les lois qui il y a de la coopération.
Les théoriciens du jeu ont essayé de s'attaquer à l'inefficacité évidente du résultat de la
Dilemme du Prisonnier. Par exemple, le jeu est fondamentalement changé en jouant plus d'une fois. Dans un tel jeu répété, des modèles de coopération peuvent être établis comme comportement rationnel quand la peur des joueurs de la punition à l'avenir l'emporte sur leur gain de défection aujourd'hui

L'équilibre de Nash

L'équilibre de Nash est un type de solution – proposé par John Forbes Nash en 1950 – couramment utilisé en théorie des jeux, dont la définition même souligne le caractère autoréalisateur. Un équilibre de Nash est, en effet, une combinaison de décisions individuelles, appelées « stratégies », où chacun anticipe correctement les choix des autres ; il y a autoréalisation, puisque l'issue réalisée est le fruit de décisions prises en pensant qu'elle va se réaliser. En fait, la grande – et seule – question que se pose un joueur au moment de faire son choix est, en théorie des jeux : que va faire l'autre ? Ses croyances concernant le comportement des autres ont donc un rôle essentiel au moment de la décision. À la diversité des croyances peut ainsi correspondre une multiplicité d'équilibres 
Que prédit la théorie concernant les choix des joueurs ? Rien de bien précis, puisque tout dépend de ce que chacun croit que l'autre va faire. En fait, de nombreuses issues d'un jeu peuvent résulter du choix d'individus « raisonnables » : il n'y a donc pas de raison particulière pour privilégier les équilibres. On peut même s'interroger sur l'utilisation du mot « équilibre » pour désigner les solutions de Nash, les règles des jeux excluant tout processus (elles supposent un choix unique et simultané de la part des joueurs).

Exemple:
En éliminant les stratégies dominées (mêmes faiblement dominées) pour chacun des joueurs, nous tombons sur (6 , 4) qui est comme nous le voyons un équilibre de Nash (car c'est celle où aucun joueur n'a intérêt à changer de stratégie).

J1 / J2
S1
S2
S3
S1
5 , 2
4 , 4
6 , 4
S2
3 , 1
2 , 0
5 , 2
Tableau: 13  - Matrice avec équilibre de Nash

Le jeu suivant par contre, ne comporte pas d'équilibre de Nash. Effectivement, quelque soit le couple de stratégies envisagé, l'un des joueurs obtient toujours plus en modifiant son choix.

J1 / J2
S1
S2
S1
1 , 0
0 , 1
S2
0 , 1
1 , 0
Tableau: 14  - Matrice sans équilibre de Nash
Toutefois, pour le moment il apparaît pour le moins prématuré de prescrire aux joueurs le choix d'un équilibre; certes s'il est choisi, la situation a une certaine stabilité, mais il reste trois difficultés :
1. Nous ne sommes pas assurées de l'existence d'un couple de tactiques en équilibre (conjonction des tactiques prudentes)
2. Même en cas d'existence, nous ne sommes pas assurés de l'unicité d'un couple de tactiques en équilibre
3. Même en cas d'existence et d'unicité, nous pouvons prescrire un autre choix 


0 Comments:

Enregistrer un commentaire