Equilibrio di Nash

Da Wikipedia, l'enciclopedia libera.
Vai alla navigazione Vai alla ricerca

In teoria dei giochi si definisce equilibrio di Nash un profilo di strategie (una per ciascun giocatore) rispetto al quale nessun giocatore ha interesse ad essere l'unico a cambiare. Prende il nome dal matematico statunitense John Nash.

«Un gioco può essere descritto in termini di strategie che i giocatori devono seguire nelle loro mosse: l'equilibrio c'è quando nessuno riesce a migliorare in maniera unilaterale il proprio comportamento. Per cambiare occorre agire insieme.[1]»

Nascita del teorema di Nash[modifica | modifica wikitesto]

La prima formulazione di questo teorema, relativo alla nozione di equilibrio più famosa della teoria dei giochi per quel che riguarda i "giochi non cooperativi", appare in un brevissimo articolo apparso nel 1950 dove John Nash, allora dottorando a Princeton, spiega la sua idea di fondere intimamente due concetti apparentemente assai lontani[2]: quella di un punto fisso in una trasformazione di coordinate, e quella della strategia più razionale che un giocatore può adottare, quando compete con un avversario anch'esso razionale, estendendo la teoria dei giochi ad un numero arbitrario di partecipanti, o agenti. Nash dimostra che, sotto certe condizioni, esiste sempre una situazione di equilibrio, che si ottiene quando ciascun individuo che partecipa a un dato gioco sceglie la sua mossa strategica in modo da massimizzare il suo payoff, sotto la congettura che il comportamento dei rivali non varierà a motivo della sua scelta (vuol dire che anche conoscendo la mossa dell'avversario, il giocatore non farebbe una mossa diversa da quella che ha deciso).

Il risultato di Nash può essere visto come una estensione rilevante rispetto al caso dei "giochi a somma zero" studiati in precedenza da John von Neumann. L'idea di equilibrio rappresenta anche una variazione concettuale significativa rispetto all'approccio di von Neumann, che faceva ricorso all'idea di minimax.

L'equilibrio di Nash[modifica | modifica wikitesto]

Vediamo ora più nel dettaglio cosa si intende esattamente per equilibrio di Nash. A tal fine, può essere utile chiarire alcuni semplici aspetti matematici della teoria dei giochi e definire alcuni concetti basilari.

Un gioco è caratterizzato da:

  • Un insieme di giocatori, o agenti, in numero di N, che indicheremo con i=1,...,N;
  • Per ogni agente, un vettore

di strategie che il giocatore i-esimo ha a disposizione, cioè l'insieme delle azioni che esso può compiere; per brevità indicheremo nel seguito con la strategia scelta dal giocatore i;

  • Per ogni agente, una funzione

che associa al giocatore i il guadagno (detto anche pay-off) derivante da ogni combinazione di strategie (il guadagno di un giocatore in generale dipende infatti non solo dalla sua strategia ma anche dalle strategie scelte dagli avversari).

Un equilibrio di Nash per un dato gioco è una combinazione di strategie (che indicheremo con l'apice e)

tale che

per ogni i e per ogni strategia scelta dal giocatore i-esimo.

Il significato di quest'ultima disuguaglianza è molto semplice: se un gioco ammette almeno un equilibrio di Nash, ogni agente ha a disposizione almeno una strategia dalla quale non ha alcun interesse ad allontanarsi se tutti gli altri giocatori hanno giocato la propria strategia . Infatti, come si può desumere direttamente dalla disuguaglianza, se il giocatore i gioca una qualunque strategia a sua disposizione diversa da , mentre tutti gli altri hanno giocato la propria strategia , può solo peggiorare il proprio guadagno o, al più, lasciarlo invariato. Se ne deduce quindi che se i giocatori raggiungono un equilibrio di Nash, nessuno può più migliorare il proprio risultato modificando solo la propria strategia, ed è quindi vincolato alle scelte degli altri. Poiché questo vale per tutti i giocatori, è evidente che se esiste un equilibrio di Nash ed è unico, esso rappresenta la soluzione del gioco, in quanto nessuno dei giocatori ha interesse a cambiare strategia.

Il contributo più importante dato da John Nash alla teoria dei giochi è la dimostrazione matematica dell'esistenza di questo equilibrio. In particolare egli ha dimostrato che ogni gioco finito ha almeno un equilibrio di Nash, eventualmente in strategie miste. Per gioco finito si intende un gioco con un numero qualunque ma finito di giocatori e di strategie, e per strategia mista per un dato giocatore si intende una distribuzione di probabilità sulle strategie a disposizione del suddetto giocatore.

Teorema[modifica | modifica wikitesto]

Sia un gioco non cooperativo ad giocatori. Si supponga che valgano le seguenti:

  • sono sottoinsiemi convessi, compatti e non vuoti di , per ogni ;
  • sono funzioni continue, per ogni ;
  • , tale che , dove indica la stringa di lunghezza in cui è stata eliminata la componente -esima, sia quasi concava, per ogni . In altre parole, la funzione utilità, ristretta ad una strategia, una volta fissate le altre, sia quasi concava.

Allora il gioco ammette almeno un equilibrio di Nash.

Dimostrazione[modifica | modifica wikitesto]

Innanzitutto, consideriamo la funzione miglior risposta (best replay) del giocatore -esimo , definita come . Si noti che . Data la funzione miglior risposta del gioco , definita come , si ha che è un equilibrio di Nash se e solo se è un punto fisso della funzione miglior risposta del gioco, cioè .

Quindi, se verifichiamo che la funzione miglior risposta del gioco, , soddisfa le ipotesi del teorema di Kakutani, avremo la tesi.

  • Banalmente si ha che è non vuoto, convesso e compatto, in quanto prodotto cartesiano di sottoinsiemi non vuoti, convessi e compatti di .
  • Essendo compatto ed continua, per ogni , allora esiste almeno un massimo in , ed inoltre, .
  • è compatto, per ogni . Infatti, essendo sottoinsiemi chiusi di un compatto, sono compatti. Consideriamo una successione , in , convergente ad , allora . Per definizione, si ha che
    Dal fatto che le funzioni utilità sono continue e la successione converge ad , allora
    Dunque, per il teorema della permanenza del segno, segue che
    Questo significa che .
  • è convesso, per ogni . Infatti, consideriamo l'insieme
    Dal fatto che le funzioni utilità sono quasi concave, ovvero il loro sottografico intersecato con iperpiani genera insiemi convessi, segue che l'insieme è convesso, . Osserviamo che , . Essendo è convesso, , allora la loro intersezione è ancora un insieme convesso, quindi è convesso.
  • La funzione miglior risposta del giocatore -esimo ha grafico chiuso. Consideriamo le successioni , in , convergenti rispettivamente ad , se, inoltre, , allora , ovvero la funzione miglior risposta del giocatore -esimo ha grafico chiuso. Si supponga per assurdo che . Allora esisterà un certo tale che . Sia . Equivalentemente si ha che
    Dal fatto che le successioni sono convergenti e le funzioni utilità sono continue, ed inoltre, , segue che
    Per , si ha che . Assurdo.

Equilibrio di Nash e ottimo di Pareto[modifica | modifica wikitesto]

Per concludere, è opportuno fare una breve riflessione sul significato profondo del concetto di equilibrio di Nash. Si è visto infatti come esso rappresenti una situazione nella quale nessun agente razionale ha interesse a cambiare strategia e come sia il frutto della scelta, da parte di tutti i giocatori, della propria strategia dominante: l'equilibrio di Nash rappresenta quindi la situazione nella quale il gruppo si viene a trovare se ogni componente del gruppo fa ciò che è meglio per sé, cioè mira a massimizzare il proprio profitto a prescindere dalle scelte degli avversari. Tuttavia, non è detto che l'equilibrio di Nash sia la soluzione migliore per tutti. Infatti, se è vero che in un equilibrio di Nash il singolo giocatore non può aumentare il proprio guadagno modificando solo la propria strategia, non è affatto detto che un gruppo di giocatori, o, al limite, tutti, non possano aumentare il proprio guadagno allontanandosi congiuntamente dall'equilibrio. È noto infatti che l'equilibrio di Nash può non essere un ottimo di Pareto (o ottimo paretiano), e quindi possano esistere altre combinazioni di strategie che conducono a migliorare il guadagno di alcuni senza ridurre il guadagno di nessuno, o addirittura, come accade nel caso del dilemma del prigioniero, ad aumentare il guadagno di tutti. Analogamente, il risultato migliore per tutti può non essere un equilibrio. Supponiamo quindi che in un gioco esista un equilibrio di Nash ed esista anche una combinazione di strategie ottimale, che indicheremo con l'apice o, tale che

per ogni i, ma che questa tale combinazione non sia un equilibrio, come accade nel dilemma del prigioniero, o, in altre parole, che non sia una strategia dominante. In tal caso, ogni singolo agente avrà a disposizione almeno una strategia diversa da che gli permette di migliorare ulteriormente il proprio profitto modificando la sua sola strategia, vale a dire che esiste per ogni agente una tale che

.

Conseguentemente, per l'assioma di razionalità, sarà portato a preferire una strategia diversa da . Inoltre, l'incremento di guadagno rispetto all'equilibrio di Nash derivante dalla scelta della strategia , dipende, come sempre, dal fatto che tutti abbiano scelto tale strategia, poiché in generale il guadagno di i dipende dalle scelte di tutti i giocatori; non essendo una strategia dominante, è possibile che se anche uno solo degli agenti sceglie di non giocare , gli altri subiscano una riduzione del proprio guadagno rispetto a quello che avrebbero ottenuto giocando una strategia ottimale. In conclusione, ogni giocatore troverà comunque preferibile non rischiare e giocare la propria strategia dominante, e la soluzione del gioco resterà comunque l'equilibrio di Nash, anche se esso non garantisce il massimo guadagno possibile.

Non si deve tuttavia pensare che non sia possibile raggiungere una situazione nella quale tutti ottengono il miglior risultato possibile se esso non è un equilibrio (in alcuni casi coincide con e quindi il problema non si pone): ciò è possibile ma a condizione che si instauri una cooperazione tra i giocatori, vale a dire che tutti agiscano non col fine di ottenere il miglior risultato per sé, ma di ottenere il miglior risultato per il gruppo, e quindi, indirettamente, ottenendo un risultato migliore anche per sé (anche questo concetto è ben esemplificato nel dilemma del prigioniero). Poiché tuttavia spesso la razionalità collettiva contrasta con quella individuale, è nella maggior parte dei casi necessario un accordo vincolante tra i giocatori (e quindi una istituzione che vigili su tale accordo) ed una sanzione nei confronti di chi non lo rispetta, riducendo quindi il profitto del singolo se esso si allontana dalla combinazione di strategie che garantisce a tutti il miglior risultato, affinché nessuno trovi preferibile defezionare.

Esempio: il "dilemma del prigioniero"[modifica | modifica wikitesto]

Lo stesso argomento in dettaglio: Dilemma del prigioniero.

Il dilemma del prigioniero fornisce un valido spunto per confrontare i due concetti di equilibrio di Nash e ottimo di Pareto, e per comprenderne l'applicazione in economia. Riprendendo quanto illustrato nella definizione matematica dell'equilibrio di Nash, vediamo la loro applicazione al caso del dilemma del prigioniero. Le possibili scelte per due prigionieri in celle diverse non comunicanti sono parlare (accusando l'altro) o non parlare.

  • Se entrambi non parlano avranno una pena leggera (1 anno);
  • Se entrambi parlano, accusandosi a vicenda, avranno una pena pesante (6 anni);
  • Se fanno scelte diverse, quello che parla avrà la libertà (0 anni) e l'altro avrà una pena leggermente più pesante (7 anni) che non se avessero confessato entrambi.

Se entrambi conoscono queste regole e non prendono accordi, la scelta che corrisponde all'equilibrio di Nash è di parlare, per entrambi. Da questo esempio si vede che la teoria nei casi reali non è sempre la soluzione migliore (o talvolta non è sufficientemente realistica).

Entrambi i giocatori hanno a disposizione le stesse strategie (due) e gli stessi pay-off (2x2) che sono (indicheremo per brevità confessa con c e non confessa con n e gli anni di carcere col segno meno poiché rappresentano perdite e quindi guadagni negativi):

  • Strategie:
  • Pay-off:

Si deduce immediatamente che, per entrambi, la strategia dominante è confessa, infatti

e

quindi qualunque sia la scelta dell'avversario, scegliere confessa garantisce sempre un guadagno maggiore rispetto a scegliere non confessa. È immediato riconoscere come la combinazione di strategie dominanti confessa-confessa soddisfi la disuguaglianza che definisce l'equilibrio di Nash, infatti per entrambi i giocatori

(per il secondo giocatore la disuguaglianza è soddisfatta invertendo l'ordine delle strategie). In sostanza, posto che il secondo giocatore confessi, il primo deve scegliere anch'esso confessa, e non può aumentare il proprio guadagno cambiando solo la sua strategia: il suo pay-off nel caso non confessa-confessa è minore di quello che otterrebbe giocando l'equilibrio. confessa-confessa è inoltre l'unico equilibrio del gioco, infatti nessun'altra combinazione di strategie soddisfa la disuguaglianza.

La soluzione del gioco è quindi che entrambi confessino, ottenendo 6 anni di carcere ciascuno.

L'aspetto tuttavia più interessante del dilemma del prigioniero è il seguente: tutte le combinazioni di strategie, ad eccezione dell'equilibrio di Nash, sono ottimi paretiani. Infatti, presa una qualunque di queste combinazioni, non è possibile trovarne un'altra che comporti per almeno uno dei due giocatori una riduzione degli anni di carcere senza che aumentino quelli dell'altro. Questo concetto non è invece applicabile all'equilibrio confessa-confessa: la combinazione non confessa-non confessa porta ad una riduzione degli anni di carcere per entrambi i giocatori (un anno ciascuno invece di 6) e poiché

per ogni i, (c, c) non è una soluzione Pareto-ottimale.

L'ottimo paretiano è un concetto di grande importanza in economia: un Ottimo di Pareto si definisce come una situazione nella quale, indipendentemente dalla specifica allocazione delle risorse, non sia possibile trovare un'altra che porti ad un incremento della ricchezza di alcuni senza sottrarre ricchezza ad altri. La ragione dell'importanza dell'ottimo di Pareto è intuitiva: se esiste una soluzione che comporta un incremento del guadagno di qualcuno senza che nessuno subisca delle perdite, vuol dire che esistono delle risorse che non sono state allocate o che sono state allocate male; meglio quindi cambiare allocazione. Nel caso dell'ottimo paretiano, infatti, l'ulteriore arricchimento di qualcuno passa necessariamente per l'impoverimento di qualcun altro. Il dilemma del prigioniero mette in luce un concetto cardine dell'economia: l'ottimo di Pareto è razionale dal punto di vista collettivo, ma non lo è affatto dal punto di vista individuale; in sostanza, se gli N agenti di un gioco (e quindi, per estensione, di un mercato) agiscono secondo la razionalità individuale, cioè col solo fine di massimizzare il proprio profitto personale, non è detto che essi raggiungano un ottimo di Pareto. In alcuni casi lo raggiungono ed in altri no; in quest'ultimo caso le loro azioni comportano una dispersione o cattiva allocazione di risorse.

Il confronto tra equilibrio di Nash e ottimo paretiano fa dubitare della generalità di quanto sostenuto da Adam Smith. Egli infatti riteneva che se ogni componente di un gruppo persegue il proprio interesse personale e vi sono condizioni di concorrenza perfetta, l'equilibrio che ne esce è uno nel quale ogni azione individuale accresce la ricchezza complessiva del gruppo. Un ottimo di Pareto, insomma. Oggi invece sappiamo che se ogni componente del gruppo fa ciò che è meglio per sé, il risultato cui si giunge è, in generale, un equilibrio di Nash ma non necessariamente un ottimo di Pareto: è quindi possibile che, se ogni agente fa solo il proprio interesse personale, si giunga ad un'allocazione inefficiente delle risorse. Nel caso del dilemma del prigioniero, ciò è evidente: il valore minimo possibile di anni di carcere è 0 per il singolo e 2 per il gruppo, ma se entrambi scelgono la propria strategia dominante, ne ottengono 6 a testa.

L'equilibrio di duopolio di Cournot e l'economia[modifica | modifica wikitesto]

Tale nozione di equilibrio costituisce una generalizzazione dell'equilibrio di duopolio che Antoine Augustin Cournot, matematico ed economista, descrisse già nel 1838.

Note[modifica | modifica wikitesto]

  1. ^ Piergiorgio Odifreddi, John Nash genio e follia, su espresso.repubblica.it, la Repubblica. Espresso. Cultura., 11 marzo 2008.
  2. ^ Si noti che questa connessione era comunque già presente qui: John von Neumann: Über ein ökonomisches Gleichungssystem und eine Verallgemeinerung der Brouwerschen Fixpunktsatzes, Ergebnisse eines Math. Kolloquiums (curatore: Karl Menger), 8, 73-83, 1937. Traduzione inglese: A model of general economic equilibrium, Review of Economic Studies, 13, 1-9, 1945-1946.

Bibliografia[modifica | modifica wikitesto]

  • Nash, John F. Jr. [1950]: Equilibrium Points in n-Person Games, Proc. Nat. Acad. Sci. U.S.A., 36, 48-49.
  • Nash, John F. Jr. [1951]: Non-Cooperative Games, Ann. of Math., 54, 286-295.

Voci correlate[modifica | modifica wikitesto]

Collegamenti esterni[modifica | modifica wikitesto]

  • Nash, Berge, Kakutani dimostrazione del teorema di esistenza dell'equilibrio di Nash e preliminari (file pdf, 18 pagg.)
Controllo di autoritàGND (DE4171190-7
  Portale Matematica: accedi alle voci di Wikipedia che trattano di matematica