La théorie des jeux est l'étude des conflits humains et de
la coopération dans une situation concurrentielle. À certains égards, la
théorie des jeux est la science de la stratégie, ou du moins la prise de
décision optimale des acteurs indépendants et concurrents dans un contexte
stratégique. Les principaux pionniers de la théorie des jeux étaient les
mathématiciens John von Neumann et John Nash, ainsi que l'économiste Oskar
Morgenstern.
La théorie des jeux crée un langage et une structure
formelle d'analyse pour prendre des décisions logiques dans des environnements
compétitifs. Le terme «jeu» peut être trompeur. Même si la théorie des jeux
s'applique aux jeux récréatifs, le concept de «jeu» désigne simplement toute
situation interactive dans laquelle les acteurs indépendants partagent des
règles et des conséquences plus ou moins formelles.
L'application formelle de la théorie des jeux nécessite la
connaissance des détails suivants: identité des acteurs indépendants, leurs
préférences, ce qu'ils savent, quels actes stratégiques ils sont autorisés à
faire et comment chaque décision influe sur l'issue du jeu. Selon le modèle,
d'autres exigences ou hypothèses peuvent être nécessaires. Enfin, on suppose
que chaque acteur indépendant est rationnel.
La théorie des jeux a une large gamme d'applications, y
compris la psychologie, la biologie évolutionniste, la guerre, la politique,
l'économie et les affaires. Malgré ses nombreuses avancées, la théorie des jeux
est encore une science jeune et en développement.
Impact sur l'économie et
les affaires
La théorie des jeux a provoqué une révolution en économie en
abordant des problèmes cruciaux dans des modèles économiques mathématiques
antérieurs. Par exemple, l'économie néoclassique a lutté pour comprendre
l'anticipation entrepreneuriale et ne pouvait pas gérer la concurrence
imparfaite. La théorie des jeux a détourné l'attention de l'équilibre
stationnaire vers le processus du marché.
En théorie des jeux, chaque décideur doit anticiper la
réaction des personnes touchées par la décision. Dans les affaires, cela
signifie que les agents économiques doivent anticiper les réactions des rivaux,
des employés, des clients et des investisseurs.
Un exemple de théorie des
jeux
Supposons que les dirigeants en charge d'Apple iOS et Google
Android sont décidés ou non de
s'entendre et d'exercer un pouvoir duopole sur le marché des logiciels
d'exploitation des smartphones. Chaque entreprise sait que s'ils travaillent
ensemble et ne se trompent pas, ils seront en mesure de restreindre la
production et d'augmenter les prix, bénéficiant ainsi de profits supérieurs à
la normale.
Une simple application du dilemme du prisonnier montre
qu'Apple et Google ne peuvent pas maintenir un équilibre stable tout en
collusion ensemble, même sous l'hypothèse irréaliste qu'aucune autre
concurrente du marché n'existe ou pourrait exister. Considérons les quatre
scénarios possibles:
1. Apple et Google vendent le montant convenu, ne trichez
pas et profitez de profits supérieurs à la normale.
2. Apple vend seulement le montant convenu de logiciel
d'exploitation, mais Google vend la quantité à laquelle il reçoit le rendement
net maximal (peut-être par des rabais secrets ou la création d'une filiale
d'ombre). Google réalise des bénéfices encore plus importants en offrant
discrètement des produits à des prix sous-duopolis, et Apple perd des parts de
marché.
3. Google ne triche pas, mais Apple réalise encore plus de
profits en trichant, et Google perd des parts de marché.
4. Apple et Google rivalisent normalement et réalisent des
bénéfices normaux. Qu'il s'agisse ou non de tricheries Google, Apple est mieux
à tricher, et vice versa. La même logique est vraie que ce soit discuter des
courtiers individuels, des conseillers, des vendeurs ou des entreprises
entières.
Le Dilemme du Prisonnier
Le Dilemme du Prisonnier est un jeu en forme stratégique
entre deux joueurs. Chaque joueur a deux stratégies, appelées «coopérer» et
«défaut», qui sont étiquetées C et D pour le joueur I
Et c et d pour le joueur II, respectivement. (Pour une
identification plus simple, les lettres majuscules sont utilisé pour les
stratégies du joueur I et des lettres minuscules pour le joueur II).
La figure 1
La figure 1 montre les résultats obtenus dans ce jeu.
Le joueur I choisit une ligne, soit C ou D, et simultanément
le joueur II choisit une des colonnes c ou d.
La stratégie de la combinaison (C, c) a une récompense 2
pour chaque joueur,
et la combinaison (D,
d) donne à chaque joueur payeur 1.
La combinaison (C, d)
donne un résultat 0 pour le joueur I et 3 pour le joueur II,
Et quand (D, c) est joué, le joueur I obtient 3 et le joueur
II obtient 0.
Tout jeu de deux joueurs en forme stratégique peut être
décrit par une table comme celle de
Figure 1, avec des rangées représentant les stratégies du
joueur I et des colonnes celles du joueur II.
(Un joueur peut avoir plus de deux stratégies.) Chaque
combinaison de stratégie définit un gain paire, comme (3, 0) pour (D, c), qui
est donné dans l'entrée de table respective. Chaque cellule du tableau indique
le gain au joueur I à la (inférieure) à gauche, et le gain au joueur II à
la droite supérieure. Ces gains
échelonnés, en raison de Thomas Schelling, rendent également transparent,
quand, comme ici, le jeu est symétrique entre les deux joueurs. Symétrie
signifie que le jeu reste le même lorsque les joueurs sont échangés,
correspondant à une réflexion longue.
La diagonale est représentée en pointillé sur la figure 2.
On notera que dans la forme stratégique, les joueurs agissent simultanément
(c'est-à-dire sans autre action), ce qui rend la symétrie possible.
Figure
2
Le jeu de la figure 1 avec des annotations, impliquées par
la structure de paiement.
La ligne pointillée montre la symétrie du jeu. Les flèches à
gauche et à droite montrent
la stratégie préférée du joueur I lorsque le joueur II joue
à gauche ou à droite
Colonne, respectivement. De même, les flèches situées en
haut et en bas montrent
Stratégie préférée du joueur II quand le joueur I joue en
haut ou en bas.
Dans le jeu du Dilemme du Prisonnier, le «défaut» est une
stratégie qui domine «coopérer».
La stratégie D du joueur I domine C puisque si le joueur II
choisit c, alors le gain du joueur I est 3 en choisissant D et 2 en choisissant
C;
Si le joueur II choisit d, alors le joueur I reçoit 1
Pour D par opposition à 0 pour C. Ces préférences du joueur
I sont indiquées par le pointage vers le bas des flèches de la figure 2.
Donc, D est en effet
toujours meilleur et domine C.
De la même manière, la stratégie d domine c pour le joueur
II.
Aucun joueur rationnel ne choisira une stratégie dominée car
le joueur sera toujours mieux en changeant la stratégie qui la domine. Le
résultat unique de ce jeu, comme recommandé aux joueurs maximisant l'utilité,
est donc (D, d) avec des gains (1, 1).
Un peu
paradoxalement, c'est moins que le gain (2, 2) qui serait atteint
Quand les joueurs ont choisi (C, c).
L'histoire derrière le nom «Dilemme du prisonnier» est celle
de deux prisonniers suspects d'un crime grave. Il n'existe aucune preuve
judiciaire pour ce crime, sauf si l'un des prisonniers témoigne contre l'autre.
Si l'un d'eux témoigne, il sera récompensé par l'immunité
(Payoff 3), alors que l'autre servira une longue peine de
prison (payoff 0). Si les deux
témoignent, leur punition sera moins sévère (payoff 1 pour chacun). Toutefois,
si
Ils "coopèrent" les uns avec les autres en ne
déclarant pas du tout, ils ne seront emprisonnés
Brièvement, par exemple pour possession d'armes illégales (2
pour chaque paiement). La "défection" de ce résultat mutuellement
bénéfique est de témoigner, ce qui donne un rendement plus élevé, peu importe ce
que fait l'autre prisonnier, ce qui entraîne un résultat inférieur pour les
deux. Cela constitue leur "dilemme."
Les jeux du Dilemme du Prisonnier se posent dans divers
contextes où des défections des dépenses des autres entraînent des résultats
globalement moins souhaitables. Les exemples incluent les armes des courses,
les litiges au lieu d'un règlement, la pollution de l'environnement ou la
commercialisation à prix réduit, où le résultat est préjudiciable pour les
joueurs. Sa justification théorique du jeu pour des raisons individuelles est
parfois prise en considération pour les traités et les lois qui il y a de la
coopération.
Les théoriciens du jeu ont essayé de s'attaquer à
l'inefficacité évidente du résultat de la
Dilemme du Prisonnier. Par exemple, le jeu est
fondamentalement changé en jouant plus d'une fois. Dans un tel jeu répété, des
modèles de coopération peuvent être établis comme comportement rationnel quand
la peur des joueurs de la punition à l'avenir l'emporte sur leur gain de
défection aujourd'hui
L'équilibre de Nash
L'équilibre de Nash
est un type de solution – proposé par John Forbes Nash en
1950 – couramment utilisé en théorie des jeux,
dont la définition même souligne le caractère autoréalisateur. Un équilibre de
Nash est, en effet, une combinaison de décisions individuelles, appelées
« stratégies », où chacun anticipe correctement les choix des
autres ; il y a autoréalisation, puisque l'issue réalisée est le fruit de
décisions prises en pensant qu'elle va se réaliser. En fait, la grande
– et seule – question que se pose un joueur au moment de faire son
choix est, en théorie des jeux : que va faire l'autre ? Ses croyances
concernant le comportement des autres ont donc un rôle essentiel au moment de
la décision. À la diversité des croyances peut ainsi correspondre une
multiplicité d'équilibres
Que prédit la théorie
concernant les choix des joueurs ? Rien de bien précis, puisque tout
dépend de ce que chacun croit que l'autre va faire. En fait, de nombreuses
issues d'un jeu peuvent résulter du choix d'individus
« raisonnables » : il n'y a donc pas de raison particulière pour
privilégier les équilibres. On peut même s'interroger sur l'utilisation du mot
« équilibre » pour désigner les solutions de Nash, les règles des
jeux excluant tout processus (elles supposent un choix unique et simultané de
la part des joueurs).
Exemple:
En
éliminant les stratégies dominées (mêmes faiblement dominées) pour chacun des
joueurs, nous tombons sur (6 , 4) qui est comme nous le voyons un équilibre de
Nash (car c'est celle où aucun joueur n'a intérêt à changer de stratégie).
J1 / J2
|
S1
|
S2
|
S3
|
S1
|
5 , 2
|
4 , 4
|
6 , 4
|
S2
|
3 , 1
|
2 , 0
|
5 , 2
|
Tableau: 13 - Matrice avec équilibre de Nash
Le jeu suivant par contre, ne comporte pas d'équilibre de Nash.
Effectivement, quelque soit le couple de stratégies envisagé, l'un des joueurs
obtient toujours plus en modifiant son choix.
J1 / J2
|
S1
|
S2
|
S1
|
1 , 0
|
0 , 1
|
S2
|
0 , 1
|
1 , 0
|
Tableau: 14 - Matrice sans équilibre de Nash
Toutefois,
pour le moment il apparaît pour le moins prématuré de prescrire aux joueurs le
choix d'un équilibre; certes s'il est choisi, la situation a une certaine
stabilité, mais il reste trois difficultés :
1. Nous
ne sommes pas assurées de l'existence d'un couple de tactiques en équilibre
(conjonction des tactiques prudentes)
2. Même
en cas d'existence, nous ne sommes pas assurés de l'unicité d'un couple de
tactiques en équilibre
3. Même
en cas d'existence et d'unicité, nous pouvons prescrire un autre choix
0 Comments:
Enregistrer un commentaire