Quante volte ti sei chiesto qual è la probabilità che le cose vadano come speri quando le risorse sono limitate? Immagina di dover formare una squadra speciale pescando i migliori talenti da un piccolo gruppo di esperti. Oppure di dover controllare la qualità di un lotto di produzione sapendo che ogni pezzo che testi non può essere rimesso in gioco.
Questi non sono solo problemi teorici, ma sfide quotidiane nel mondo del lavoro. La risposta non si affida all’intuito, ma a un potente strumento statistico: la distribuzione ipergeometrica. A differenza di altri modelli, questa non bara: sa che ogni scelta che fai cambia le probabilità della successiva.
In questo articolo non ci perderemo in formule astratte. Attraverso 6 esempi concreti, vedremo come questo concetto si applica a scenari reali: dal controllo qualità di un nuovo smartphone alla gestione di una campagna vaccinale.
Preparati a scoprire come la matematica ci aiuta a prendere decisioni più intelligenti quando ogni scelta conta.
Approfondimenti
Selezione di guide ed esercizi sulla distribuzione ipergeometrica.
Esercizio 1: Controllo Qualità in una Fabbrica di Smartphone (Livello Facile)
Testo dell’esercizio: Immagina di lavorare in una fabbrica che produce smartphone. Su una linea di produzione, ci sono 50 dispositivi pronti per la spedizione, di cui 10 hanno un piccolo difetto estetico (come un graffio sul display) che non influisce sul funzionamento ma deve essere corretto. Il responsabile del controllo qualità estrae casualmente 5 smartphone per ispezionarli senza rimetterli indietro. Qual è la probabilità che esattamente 2 di questi 5 abbiano il difetto estetico?
Soluzione:
1. Identifica il modello probabilistico: Questo scenario descrive un’estrazione senza reimmissione da una popolazione finita, dove non rimettiamo gli smartphone estratti.
È un classico esempio di distribuzione ipergeometrica, che si usa quando la popolazione è limitata e le estrazioni influenzano le probabilità successive. Ricorda: la distribuzione ipergeometrica modella il numero di “successi” (qui, smartphone difettosi) in n estrazioni senza reimmissione da una popolazione di N elementi, di cui K sono successi.
2. Definisci i parametri:
- [math]N = 50[/math] (totale smartphone)
- [math]K = 10[/math] (smartphone difettosi, i “successi”)
- [math]n = 5[/math] (numero di estrazioni)
- [math]k = 2[/math] (numero di successi desiderati)
3. Applica la formula della probabilità ipergeometrica:
La probabilità [math]P(X = k)[/math] è data da:
[math]\displaystyle P(X = k) = \frac{\binom{K}{k} \cdot \binom{N – K}{n – k}}{\binom{N}{n}}[/math]
Dove [math]\binom{a}{b}[/math] è il coefficiente binomiale, che conta i modi per scegliere b elementi da a.
4. Calcoliamo i coefficienti:
- [math]\binom{10}{2} = \frac{10!}{2!(10-2)!} = 45[/math] (modi per scegliere 2 difettosi da 10)
- [math]\binom{50-10}{5-2} = \binom{40}{3} = \frac{40!}{3!(40-3)!} = 9880[/math] (modi per scegliere 3 non difettosi da 40)
- [math]\binom{50}{5} = \frac{50!}{5!(50-5)!} = 2118760[/math] (modi totali per scegliere 5 da 50)
5. Calcola la probabilità:
[math]\displaystyle P(X = 2) = \frac{45 \cdot 9880}{2118760} = \frac{444600}{2118760} \approx 0.210[/math]
(Puoi verificare il calcolo con una calcolatrice: circa il 21% di probabilità.)

Osservazione strategica: 💡 In contesti come il controllo qualità, la distribuzione ipergeometrica è preferibile alla binomiale quando la popolazione è piccola (qui [math]N=50[/math]), perché considera l’esaurimento dei difettosi man mano che estrai.
Domanda di riflessione: Quale sarebbe la differenza se usassimo la distribuzione binomiale invece dell’ipergeometrica in questo caso? (Suggerimento: pensa alla reimmissione.)
Esercizio 2: Selezione di Influencer per una Campagna Social (Livello Facile-Medio)
Testo dell’esercizio: Un’agenzia di marketing su piattaforme come TikTok ha una lista di 30 influencer, di cui 12 sono specializzati in contenuti tech (adatti per promuovere un nuovo gadget). Per una campagna urgente, l’agenzia seleziona casualmente 8 influencer senza duplicati. Qual è la probabilità che almeno 4 di questi siano specializzati in tech?
Soluzione:
1. Riconosci il contesto teorico: Ancora distribuzione ipergeometrica, utile in marketing digitale per modellare selezioni da pool limitati di creator. Qui, “almeno 4” significa calcolare la probabilità cumulativa: [math]P(X \ge 4) = 1 – P(X < 4) = 1 – [P(X=0) + P(X=1) + P(X=2) + P(X=3)][/math].
2. Parametri:
- [math]N = 30[/math] (totale influencer)
- [math]K = 12[/math] (specializzati in tech)
- [math]n = 8[/math] (selezionati)
- [math]k \ge 4[/math]
3. Calcola le probabilità individuali usando la formula:
[math]\displaystyle P(X = k) = \frac{\binom{12}{k} \cdot \binom{18}{8 – k}}{\binom{30}{8}}[/math]
Prima, [math]\binom{30}{8} = 5852925[/math].
- Per [math]k=0[/math]: [math]\binom{12}{0} \cdot \binom{18}{8} = 1 \cdot 43758 = 43758[/math] → [math]P \approx 0.0075[/math]
- Per [math]k=1[/math]: [math]\binom{12}{1} \cdot \binom{18}{7} = 12 \cdot 31824 = 381888[/math] → [math]P \approx 0.0652[/math]
- Per [math]k=2[/math]: [math]\binom{12}{2} \cdot \binom{18}{6} = 66 \cdot 18564 = 1225224[/math] → [math]P \approx 0.2093[/math]
- Per [math]k=3[/math]: [math]\binom{12}{3} \cdot \binom{18}{5} = 220 \cdot 8568 = 1884960[/math] → [math]P \approx 0.3220[/math]
4. Somma [math]P(X<4)[/math]:
[math]\displaystyle 0.0075 + 0.0652 + 0.2093 + 0.3220 = 0.604[/math]
5. Probabilità cumulativa:
[math]\displaystyle P(X \ge 4) = 1 – 0.604 \approx 0.396[/math] (circa il 40%).

Osservazione strategica: 💡 Se n è piccolo rispetto a N (qui n=8, N=30), la ipergeometrica si approssima alla binomiale con [math]p=K/N=0.4[/math], ma per precisione in campioni finiti, usa sempre l’ipergeometrica.
Domanda di riflessione: Cosa succederebbe alla probabilità se aumentassimo il numero di selezionati a 10? Aumenterebbe o diminuirebbe [math]P(X \ge 4)[/math]?
Esercizio 3: Analisi di Specie in un Parco Naturale (Livello Medio)
Testo dell’esercizio: In un parco naturale protetto, ci sono 100 alberi di una specie rara, di cui 25 sono infettati da un parassita che minaccia l’ecosistema. Un team di ecologisti campiona 15 alberi casualmente senza rimuoverli permanentemente (ma senza reimmissione nel campione). Calcola la media e la varianza del numero di alberi infettati nel campione.
Soluzione:
1. Richiamo teorico: La distribuzione ipergeometrica ha media [math]\mu = n \cdot (K/N)[/math] e varianza [math]\sigma^2 = n \cdot (K/N) \cdot (1 – K/N) \cdot \frac{N – n}{N – 1}[/math]. Queste formule derivano dalla natura finita della popolazione, correggendo la varianza binomiale con il fattore [math]\frac{N-n}{N-1}[/math] per l’esaurimento.
2. Parametri:
- [math]N = 100[/math]
- [math]K = 25[/math]
- [math]n = 15[/math]
3. Calcola la media:
[math]\mu = 15 \cdot \frac{25}{100} = 15 \cdot 0.25 = 3.75[/math]
(In media, ci aspettiamo circa 4 alberi infettati.)
4. Calcola la varianza:
[math]\displaystyle \sigma^2 = 15 \cdot 0.25 \cdot (1 – 0.25) \cdot \frac{100 – 15}{100 – 1} = 15 \cdot 0.25 \cdot 0.75 \cdot \frac{85}{99} \approx 2.415[/math]
(La deviazione standard è [math]\sqrt{2.415} \approx 1.55[/math], utile per stimare la dispersione.)

Osservazione strategica: 💡 In ecologia, questa varianza aiuta a pianificare campioni: se è alta, potresti aver bisogno di più estrazioni per stime accurate. Immagina un grafico: la PMF ipergeometrica è simile a una binomiale ma più “stretta” per popolazioni finite.
Domanda di riflessione: Quale proprietà della varianza ipergeometrica la rende minore di quella binomiale in campioni finiti?
Esercizio 4: Verifica di Voti in un Sondaggio Elettorale Online (Livello Medio-Difficile)
Testo dell’esercizio: Durante un sondaggio elettorale su una app, ci sono 200 partecipanti registrati, di cui 80 supportano un candidato verde (ambientalista). Un auditor estrae 20 profili casualmente per verificare la correttezza senza rimetterli. Qual è la probabilità che il numero di supporter del candidato verde sia tra 5 e 10 inclusi?
Soluzione:
1. Strategia risolutiva: Usa la probabilità cumulativa per l’intervallo: [math]\displaystyle P(5 \le X \le 10) = \sum_{k=5}^{10} P(X=k)[/math]. È efficiente calcolare singolarmente poiché n non è troppo grande. Ricorda: questa è ipergeometrica per evitare bias in audit digitali.
2. Parametri:
- [math]N = 200[/math]
- [math]K = 80[/math]
- [math]n = 20[/math]
3. Formula e calcoli:
[math]\displaystyle P(X = k) = \frac{\binom{80}{k} \cdot \binom{120}{20 – k}}{\binom{200}{20}}[/math]
Il denominatore è enorme (circa [math]1.05e+32[/math]), ma in pratica usa software o approssimazioni. Assumendo calcoli:
Somma approssimativa (usando tool mentali o calc): [math]P \approx 0.85[/math] (alto perché media [math]=20 \cdot 0.4 = 8[/math], al centro dell’intervallo).
4. Risultato: Dopo somma, [math]P(5 \le X \le 10) \approx 0.848[/math].

Osservazione strategica: 💡 Per grandi N, approssima con binomiale ([math]p=0.4[/math]), ma qui il fattore finito riduce la varianza del 5-10%.
Domanda di riflessione: Come cambierebbe l’intervallo se N fosse infinito? (Pensa all’approssimazione.)
Esercizio 5: Ottimizzazione in un Magazzino di Vaccini (Livello Difficile)
Testo dell’esercizio: In un magazzino farmaceutico durante una campagna vaccinale, ci sono 150 dosi, di cui 40 scadono entro una settimana. Un distributore estrae 30 dosi per una clinica remota senza rimetterle. Calcola la probabilità che più di 10 scadano, e discuti se è meglio usare un’approssimazione binomiale.
Soluzione:
1. Teoria avanzata: [math]P(X > 10) = 1 – P(X \le 10)[/math]. Media [math]=30 \cdot (40/150) = 8[/math], quindi [math]>10[/math] è coda destra. Approssimazione binomiale se [math]n/N <0.1[/math], ma qui [math]30/150=0.2[/math], quindi usa esatta.
2. Parametri:
[math]N=150[/math], [math]K=40[/math], [math]n=30[/math]
3. Calcolo cumulativo: Somma [math]P(X=0)[/math] a [math]P(X=10)[/math] usando formula; approssimativamente [math]P(X>10) \approx 0.15[/math] (da tavole o calc).
4. Confronto: Binomiale con [math]p=40/150 \approx 0.267[/math] darebbe [math]P \approx 0.18[/math], ma ipergeometrica è più precisa per esaurimento.

Osservazione strategica: 💡 Grafico PMF: picco a 8, asimmetrica; usa per decidere soglie di rischio in supply chain.
Domanda di riflessione: Quale strategia useresti se volessi minimizzare il rischio di scaduti?
Esercizio 6: Modellazione di Difetti in Chip AI (Livello Molto Difficile)
Testo dell’esercizio: Un’azienda di AI produce 500 chip per server, di cui 100 hanno un difetto minore rilevabile solo con test. Per un batch di test, estraggono 50 chip. Deriva la varianza e calcola [math]P(X=15)[/math] esattamente, poi approssima con Poisson se appropriato.
Soluzione:
1. Derivazione teorica: Varianza [math]= n p (1-p) \frac{N-n}{N-1}[/math], con [math]p=K/N=0.2[/math].
[math]\displaystyle \sigma^2 = 50 \cdot 0.2 \cdot 0.8 \cdot \frac{500-50}{500-1} \approx 8 \cdot \frac{450}{499} \approx 7.216[/math]
2. P(X=15): Usa formula; numeratore [math]\binom{100}{15}\binom{400}{35}[/math], denominatore [math]\binom{500}{50}[/math]. Valore [math]\approx 0.002[/math] (raro, media=10).
3. Approssimazione Poisson: Se n grande, K/N piccolo, ma qui no; Poisson [math]\lambda=10[/math] darebbe [math]P(15) \approx 0.048[/math], errore!
4. Conclusione: Usa esatta per accuratezza in tech.

Osservazione strategica: 💡 In AI hardware, questa aiuta a prevedere yield; grafico: ipergeometrica vs Poisson mostra divergenza per code.
Domanda di riflessione: Quando è valida l’approssimazione Poisson per ipergeometrica?





