Teoria dei Giochi e Matematica delle Scelte: perché i concorrenti cambiano le regole dell’ottimizzazione
Finora abbiamo utilizzato la matematica per ottimizzare processi, campagne di marketing, supply chain e modelli decisionali come se l’azienda operasse in un ambiente statico.
Ma cosa accade quando le nostre decisioni influenzano quelle dei concorrenti e, contemporaneamente, vengono influenzate dalle loro?
In questo caso non basta più trovare il massimo di una funzione o minimizzare un costo. Entriamo nel campo della Teoria dei Giochi, una disciplina matematica che studia le decisioni strategiche in presenza di più attori razionali.
Qui il profitto non dipende soltanto dall’efficienza interna dell’azienda, ma anche dalla capacità di anticipare il comportamento degli altri.
In questo articolo analizzeremo due modelli fondamentali:
- il Duopolio di Cournot, che descrive la competizione tra imprese che scelgono quantità produttive;
- il Dilemma del Prigioniero, che spiega perché le guerre di prezzo spesso conducono a risultati peggiori per tutti.
L’obiettivo non è soltanto comprendere la teoria, ma capire come questi modelli siano oggi alla base di sistemi di dynamic pricing, aste pubblicitarie, algoritmi di bidding e agenti AI che competono tra loro.
Che cos’è un Equilibrio di Nash?
Prima di iniziare, introduciamo il concetto centrale della teoria dei giochi.
Definizione
Un insieme di strategie costituisce un Equilibrio di Nash se nessun giocatore può migliorare il proprio risultato modificando unilateralmente la propria decisione, assumendo che tutti gli altri mantengano inalterate le proprie scelte.
In altre parole:
ciascun giocatore sta già adottando la migliore risposta possibile alle strategie degli altri.
L’Equilibrio di Nash non rappresenta necessariamente il miglior risultato collettivo possibile.
Spesso è semplicemente una situazione stabile dalla quale nessuno ha convenienza ad allontanarsi individualmente.
Caso Studio 1 – Il Duopolio di Cournot
Lo scenario
Due aziende producono lo stesso bene tecnologico.
Le quantità prodotte sono:
- [math]q_1[/math] = quantità prodotta dall’Azienda 1
- [math]q_2[/math] = quantità prodotta dall’Azienda 2
L’offerta totale sul mercato è:
[math]Q = q_1 + q_2[/math]
Il prezzo dipende dalla quantità complessivamente immessa sul mercato:
[math]P = 100 – Q[/math]
Entrambe le imprese hanno costo marginale costante pari a 10 euro per unità.
L’obiettivo è determinare l’Equilibrio di Nash.
La funzione di profitto
Per l’Azienda 1 il profitto è:
[math]\Pi_1 = \text{Ricavi} – \text{Costi}[/math]
ovvero:
[math]\Pi_1 = P \cdot q_1 – 10 q_1[/math]
Sostituendo la funzione di domanda:
[math]\Pi_1 = (100 – q_1 – q_2) q_1 – 10 q_1[/math]
Sviluppando:
[math]\Pi_1 = 90 q_1 – q_1^2 – q_1 q_2[/math]
Ricerca del massimo
Per massimizzare il profitto calcoliamo la derivata prima rispetto a [math]q_1[/math]:
[math]\frac{\partial \Pi_1}{\partial q_1} = 90 – 2 q_1 – q_2[/math]
Ponendola uguale a zero:
[math]90 – 2 q_1 – q_2 = 0[/math]
Otteniamo la curva di reazione dell’Azienda 1:
[math]q_1 = 45 – 0{,}5 q_2[/math]
Questa funzione indica la produzione ottimale di A1 per ogni possibile scelta di A2.
Verifica della condizione di massimo
La derivata seconda vale:
[math]\frac{\partial^2 \Pi_1}{\partial q_1^2} = -2[/math]
Poiché è negativa, la funzione di profitto è concava.
Pertanto il punto critico individuato rappresenta effettivamente un massimo.
Questo passaggio è importante perché garantisce che non stiamo trovando un minimo o un punto di flesso.
La curva di reazione dell’Azienda 2
Per simmetria:
[math]q_2 = 45 – 0{,}5 q_1[/math]
L’Equilibrio di Nash si trova all’intersezione delle due curve.
Sostituendo:
[math]q_1 = 45 – 0{,}5(45 – 0{,}5 q_1)[/math]
[math]q_1 = 45 – 22{,}5 + 0{,}25 q_1[/math]
[math]0{,}75 q_1 = 22{,}5[/math]
[math]q_1 = 30[/math]
Di conseguenza:
[math]q_2 = 30[/math]
L’Equilibrio di Nash
In equilibrio:
[math](q_1, q_2) = (30, 30)[/math]
La quantità totale è:
[math]Q = 60[/math]
Il prezzo di mercato diventa:
[math]P = 100 – 60 = 40[/math]
Il profitto di ciascuna impresa è:
[math]\Pi = (40 – 10) \cdot 30 = 900[/math]
Nessuna delle due aziende può migliorare il proprio profitto modificando unilateralmente la produzione.
Siamo quindi in un Equilibrio di Nash.
Implementazione in Python: calcolare e visualizzare l’Equilibrio di Nash
Dopo aver derivato matematicamente le curve di reazione delle due imprese, possiamo utilizzare Python per trovare numericamente l’Equilibrio di Nash e rappresentarlo graficamente.
Le due best response sono:
[math]q_1 = 45 – 0.5 q_2[/math]
[math]q_2 = 45 – 0.5 q_1[/math]
Possiamo interpretarle come un sistema lineare e risolverlo mediante algebra matriciale.
import numpy as np
import matplotlib.pyplot as plt
# ==========================
# 1. Calcolo dell'equilibrio
# ==========================
# Sistema:
# q1 + 0.5 q2 = 45
# 0.5 q1 + q2 = 45
A = np.array([
[1, 0.5],
[0.5, 1]
])
b = np.array([45, 45])
q1_nash, q2_nash = np.linalg.solve(A, b)
print("Equilibrio di Nash")
print(f"q1 = {q1_nash:.2f}")
print(f"q2 = {q2_nash:.2f}")
# ==========================
# 2. Curve di reazione
# ==========================
q1 = np.linspace(0, 50, 500)
# Best response Azienda 2
q2_br2 = 45 - 0.5 * q1
# Best response Azienda 1
q2_br1 = 90 - 2 * q1
# ==========================
# 3. Grafico
# ==========================
plt.figure(figsize=(9, 7))
plt.plot(
q1,
q2_br1,
linewidth=2,
label="Best Response Azienda 1"
)
plt.plot(
q1,
q2_br2,
linewidth=2,
label="Best Response Azienda 2"
)
plt.scatter(
q1_nash,
q2_nash,
s=120,
zorder=5,
label=f"Equilibrio di Nash ({q1_nash:.0f}, {q2_nash:.0f})"
)
plt.axvline(q1_nash, linestyle="--", alpha=0.6)
plt.axhline(q2_nash, linestyle="--", alpha=0.6)
plt.title("Duopolio di Cournot: Curve di Reazione ed Equilibrio di Nash")
plt.xlabel("Quantità Azienda 1 ($q_1$)")
plt.ylabel("Quantità Azienda 2 ($q_2$)")
plt.xlim(0, 50)
plt.ylim(0, 50)
plt.grid(True, linestyle=":")
plt.legend()
plt.tight_layout()
plt.show()
Interpretazione dei risultati
L’output numerico restituisce:
Equilibrio di Nash
q1 = 30.00
q2 = 30.00
Ciò significa che entrambe le imprese massimizzano il proprio profitto producendo 30 unità.

Nel grafico, il punto di intersezione delle due curve di reazione rappresenta una situazione stabile: nessuna delle due aziende ha convenienza a modificare unilateralmente la propria produzione.
Dal punto di vista economico, questo punto costituisce l’Equilibrio di Nash del modello di Cournot. Dal punto di vista matematico, è semplicemente la soluzione del sistema formato dalle due funzioni di reazione.
Reality Check: e se formassero un monopolio?
Supponiamo che le due imprese cooperino perfettamente e massimizzino il profitto complessivo.
La quantità totale [math]Q[/math] diventa l’unica variabile decisionale.
Il profitto totale è:
[math]\Pi = (P – 10) Q[/math]
Sostituendo la domanda:
[math]\Pi = (100 – Q – 10) Q[/math]
[math]\Pi = (90 – Q) Q[/math]
[math]\Pi = 90 Q – Q^2[/math]
Calcoliamo la derivata:
[math]\frac{d\Pi}{dQ} = 90 – 2Q[/math]
Ponendo uguale a zero:
[math]90 – 2Q = 0[/math]
[math]Q = 45[/math]
Il monopolista produrrebbe quindi 45 unità.
Il prezzo diventerebbe:
[math]P = 55[/math]
Il profitto totale sarebbe:
[math]\Pi = (55 – 10) \cdot 45 = 2025[/math]
Molto superiore ai 1800 euro complessivi ottenuti nel duopolio.
Questo esempio mostra una delle lezioni fondamentali della teoria dei giochi:
un Equilibrio di Nash non coincide necessariamente con il massimo profitto collettivo.
Caso Studio 2 – Il Dilemma del Prigioniero e le Guerre di Prezzo
Lo scenario
Due e-commerce vendono lo stesso videocorso.
Ciascuno può scegliere tra:
- mantenere il prezzo standard;
- applicare uno sconto aggressivo del 50%.
La matrice dei payoff è la seguente.
| B mantiene | B sconta | |
|---|---|---|
| A mantiene | (50,50) | (10,80) |
| A sconta | (80,10) | (25,25) |
I valori rappresentano profitti espressi in migliaia di euro.
Analisi della strategia dominante
Consideriamo il punto di vista dell’E-commerce A.
Se B mantiene il prezzo:
- mantenere → 50
- scontare → 80
Conviene scontare.
Se B sconta:
- mantenere → 10
- scontare → 25
Conviene ancora scontare.
La strategia “scontare” produce sempre un payoff maggiore.
In teoria dei giochi si dice che:
scontare domina strettamente mantenere il prezzo.
Poiché il ragionamento vale anche per B, entrambi sceglieranno di scontare.
L’Equilibrio di Nash
Il risultato finale è:
(25,25)
Nessuno dei due può migliorare unilateralmente il proprio risultato.
Questo è quindi un Equilibrio di Nash.
Tuttavia esiste un problema.
Entrambi avrebbero preferito il risultato:
(50,50)
La razionalità individuale conduce a un esito peggiore per tutti.
Questo è il cuore del Dilemma del Prigioniero.
L’evoluzione nei mercati reali: i giochi ripetuti
Fortunatamente, nel business i mercati non si esauriscono in un’unica transazione isolata. La reiterazione continua del gioco introduce dinamiche che permettono di superare la trappola del Dilemma del Prigioniero:
-
Tit-for-Tat (Colpo su Colpo): L’algoritmo inizia cooperando (prezzo standard) e, nei turni successivi, copia fedelmente l’azione precedente del rivale. È una strategia resiliente, che punisce la defezione ma perdona immediatamente se il concorrente torna a cooperare.
-
Grim Trigger (Innesco Spietato): Si coopera fino alla prima defezione del rivale. Da quel momento in poi, l’algoritmo applica la punizione massima (prezzo minimo) per l’eternità, distruggendo i margini di entrambi. Funziona come un fortissimo deterrente.
-
Folk Theorem: Questo principio matematico dimostra che, se gli attori hanno un orizzonte temporale sufficientemente lungo e non scontano eccessivamente il valore dei profitti futuri, la cooperazione può emergere come un Equilibrio di Nash stabile nei giochi ripetuti.
Questi modelli sono oggi utilizzati per studiare:
- piattaforme digitali;
- sistemi multi-agent;
- mercati finanziari;
- algoritmi di pricing.
Applicazione pratica: algoritmi di pricing e AI
Molti e-commerce utilizzano sistemi automatici di repricing.
Una regola apparentemente innocua come:
“imposta il prezzo a 0,01 € meno del concorrente”
implementa di fatto una strategia aggressiva di defezione continua.
Se due algoritmi adottano la stessa logica, si genera una spirale competitiva che può distruggere i margini nel giro di poche ore.
La teoria dei giochi permette invece di progettare sistemi più sofisticati, capaci di:
- valutare il comportamento storico dei concorrenti;
- evitare guerre di prezzo inutili;
- massimizzare il profitto nel lungo periodo.
Dove viene utilizzata oggi la Teoria dei Giochi?
Le applicazioni moderne sono molto più numerose di quanto si possa immaginare.
Tra le più importanti troviamo:
- aste Google Ads;
- bidding automatico nelle campagne PPC;
- dynamic pricing;
- mercati energetici;
- negoziazione algoritmica;
- cybersecurity;
- supply chain management;
- sistemi AI multi-agent;
- reinforcement learning multi-agente.
In tutti questi contesti il problema fondamentale è sempre lo stesso:
prendere decisioni ottimali sapendo che anche gli altri stanno cercando di fare la stessa cosa.
Il valore di questo esercizio risiede nella demistificazione di un concetto spesso abusato nel marketing: l’ottimizzazione isolata. Tradizionalmente, i marketer usano la matematica per l’A/B testing o il calcolo del Customer Lifetime Value supponendo che il contesto esterno sia statico. Questo modello introduce l’interdipendenza strategica, costringendo a pensare in ottica di sistemi complessi.
Risvolti applicativi nel Digital Marketing moderno:
La trappola dei Repricer Algoritmici automatizzati:
Oggi molti e-commerce utilizzano script di dynamic pricing su Amazon o Google Shopping. Questi algoritmi, se impostati su regole puramente egoistiche a breve termine (es. “imposta il prezzo a -0.01€ rispetto al concorrente”), sono la traduzione letterale nel codice del Dilemma del Prigioniero. Senza vincoli di teoria dei giochi, due algoritmi concorrenti entreranno in un loop infinito di defezione reciproca, distruggendo il margine del prodotto in poche ore. Comprendere l’Equilibrio di Nash permette di programmare algoritmi di pricing più evoluti (ad esempio basati su strategie Tit-for-Tat in giochi ripetuti).
Sostituti Strategici e Dynamic Supply:
Nel modello di Cournot, le quantità sono “sostituti strategici”. Nel digital marketing, questo si applica direttamente all’allocazione del budget di visibilità (es. Share of Voice nelle campagne Pay-Per-Click). Se il tuo concorrente satura le aste pubblicitarie su una determinata nicchia (alta [math]q_2[/math]), la tua risposta ottimale non è necessariamente fare Overbidding (che farebbe crollare i margini alzando il CPC), ma potrebbe essere contrarre la tua presenza su quel canale specifico per investire in nicchie ad alta marginalità e minor affollamento.
Il valore economico della fiducia (e del Brand):
Il paradosso del cartello economico: Sebbene i cartelli espliciti siano illegali, nel marketing esiste la cooperazione implicita guidata dal valore del brand. Gli e-commerce strutturati non competono sul prezzo ma sul posizionamento; l’esercizio dimostra matematicamente che l’azienda che si focalizza solo sulla conversione immediata tramite sconto distrugge il valore del mercato, mentre la stabilità dei prezzi genera un surplus che può essere reinvestito in customer experience e branding.
Come riconoscere un gioco strategico: la checklist operativa
-
Osservare le interdipendenze invisibili: Un gioco strategico nasce quando il tuo payoff non dipende solo dalle tue azioni, ma da quelle dell’ecosistema circostante. Se modificare la tua scelta di ottimizzazione altera automaticamente la risposta dei concorrenti (e viceversa), sei già dentro un gioco.
-
Mappare la temporalità (scelte simultanee o sequenziali): Il tempo è un indizio potente. Il modello di Cournot è simultaneo, il repricing algoritmico è quasi-simultaneo, mentre il bidding nelle campagne PPC è sequenziale ma rapidissimo. Se l’ordine in cui si muovono gli attori modifica strutturalmente l’esito del mercato, stai osservando un’interazione strategica.
-
Cercare i payoff non lineari: Nei giochi strategici, piccoli scostamenti generano effetti a cascata sproporzionati. Nel Dilemma del Prigioniero, il semplice passaggio dalla strategia “mantieni” a “sconta” non scala linearmente i profitti, ma ribalta l’intera matrice dei risultati. Se la relazione causa-effetto rompe la linearità, c’è una logica strategica in atto.
-
Riconoscere sostituti o complementi strategici: Nel modello di Cournot, i volumi di produzione sono sostituti strategici: se uno aumenta, l’altro ottimizza contraendosi. Nelle dinamiche di marketing digitale, questo è il comportamento tipico dei budget PPC per keyword iper-competitive. Se la tua best response scala in funzione dell’intensità altrui, sei in pieno territorio di gioco.
-
Individuare gli incentivi alla defezione: È il segnale (e il rischio) più evidente. Se adottare una strategia che danneggia l’equilibrio complessivo del sistema rappresenta comunque la migliore risposta razionale per il singolo individuo (come lo sconto aggressivo per acquisire quote di mercato), sei all’interno di un gioco. Accade quando “fare la cosa giusta per il sistema” smette di essere matematicamente ottimale per il singolo.
-
Verificare la presenza di equilibri stabili: Esiste un punto, nello spazio delle decisioni, in cui nessun decisore o sistema automatizzato ha convenienza a deviare unilateralmente? Se la risposta è sì (come il punto (30,30) in Cournot), hai individuato un Equilibrio di Nash. E dove c’è un Nash, le regole dell’ottimizzazione classica sono già state superate.
-
Analizzare la memoria e la ripetizione: Il comportamento passato influenza quello futuro? Nel business reale, quasi tutto è un “gioco ripetuto”: supply chain, aste algoritmiche, strategie di prezzo. Se strategie come il Tit-for-Tat o il Grim Trigger sono applicabili perché il sistema ha “memoria” delle azioni precedenti, la strategia di lungo periodo finisce per dominare l’ottimo a breve termine.
Conclusioni
La teoria dei giochi rappresenta il passaggio dalla matematica dell’ottimizzazione alla matematica dell’interazione strategica.
Il Duopolio di Cournot mostra come imprese razionali possano convergere verso un equilibrio stabile ma non necessariamente efficiente.
Il Dilemma del Prigioniero dimostra invece che la ricerca del massimo vantaggio individuale può produrre risultati collettivamente peggiori.
In un mondo sempre più popolato da algoritmi, agenti AI e sistemi automatizzati di decisione, comprendere questi meccanismi non è più soltanto una curiosità accademica.
È una competenza essenziale per chiunque voglia capire come si formano prezzi, strategie competitive e vantaggi sostenibili nei mercati digitali moderni.
Articoli di approfondimento
👉 La teoria delle decisioni: modelli e logiche per scegliere in condizioni di incertezza
👉 Teoria dei giochi: giochi in forma strategica con esempi pratici
👉 Oltre il prezzo fisso: introduzione al dynamic pricing
👉 Elasticità al prezzo: come calcolarla e ottimizzare la strategia di pricing
👉 Simulare il pricing competitivo: modello step-by-step per ottimizzazione
👉 Sconto massimo sostenibile: gamification e redditività e-commerce





