Esercizi Svolti sulla Distribuzione Beta: Guida Completa con Teoria e Applicazioni

Notiamo che stai usando un AdBlocker.

Gli annunci pubblicitari ci aiutano a mantenere questo sito gratuito e accessibile a tutti. Ti saremmo davvero grati se volessi disattivare AdBlocker per il nostro sito: niente pubblicità invasive, promesso! Grazie per il tuo supporto ❤️Our team work realy hard to produce quality content on this website and we noticed you have ad-blocking enabled.

Guida alla Distribuzione Beta Esercizi Pratici

Poche distribuzioni sono tanto versatili e intuitive quanto la distribuzione Beta.

Immaginatela come la “distribuzione delle probabilità”. Se una variabile casuale può assumere un valore compreso esclusivamente tra 0 e 1 – come la percentuale di successo di una campagna marketing, la frazione di componenti difettosi in un lotto, o il punteggio di un’opinione – la distribuzione Beta è quasi sempre lo strumento giusto per descriverla.

La sua flessibilità è il suo vero punto di forza: a seconda dei suoi due parametri, $α$ e $β$ , può assumere un’incredibile varietà di forme. Può essere a forma di U, a campana, strettamente crescente, decrescente o persino uniforme, adattandosi così a quasi ogni tipo di credenza a priori o fenomeno che si voglia modellare su una scala proporzionale.

Ma la sua eleganza non si ferma qui. La Beta gioca un ruolo da protagonista nella statistica Bayesiana, dove ci permette di aggiornare in modo incredibilmente pulito le nostre credenze su una probabilità alla luce di nuove prove. Questa proprietà, nota come “coniugazione”, la rende uno strumento fondamentale nell’arsenale di ogni data scientist e ricercatore.

Come si passa, però, dalla formula teorica all’applicazione pratica?

Come si calcola la probabilità che un tasso di conversione superi una certa soglia?

O come si aggiorna la stima di questo tasso dopo aver raccolto nuovi dati?

Questo articolo è stato pensato proprio per colmare questo divario. Attraverso 6 esercizi originali, risolti e spiegati passo dopo passo, vi guideremo in un percorso a difficoltà crescente. Partiremo dalle basi – il calcolo di una semplice probabilità – per arrivare a concetti più avanzati come le trasformazioni di variabili, l’inferenza Bayesiana e le simulazioni numeriche.

🔗Comprendere la Distribuzione Beta Attraverso 5 Esempi Concreti

Esercizio 1 (Base) – Calcolo di probabilità

Testo:

Sia [math]X \sim \text{Beta}(2,3)[/math].

Calcola [math]P(X \le 0.6)[/math].

Teoria introduttiva:

La distribuzione Beta è definita su [math][0,1][/math] con PDF:

[math]\displaystyle f(x;\alpha,\beta) = \frac{x^{\alpha-1}(1-x)^{\beta-1}}{B(\alpha,\beta)}[/math]

dove [math]B(\alpha,\beta) = \frac{\Gamma(\alpha)\Gamma(\beta)}{\Gamma(\alpha+\beta)}[/math].

Per [math]\alpha,\beta[/math] interi, [math]B(\alpha,\beta) = \frac{(\alpha-1)!(\beta-1)!}{(\alpha+\beta-1)!}[/math].

È comunemente usata per modellare fenomeni le cui quantità sono proporzioni o percentuali, come il tasso di successo di una campagna pubblicitaria o la frazione di voti per un candidato.

Soluzione:

Calcola [math]B(2,3)[/math]:

[math]\displaystyle B(2,3) = \frac{(2-1)!(3-1)!}{(2+3-1)!} = \frac{1! \cdot 2!}{4!} = \frac{1 \cdot 2}{24} = \frac{2}{24} = \frac{1}{12}[/math].

La CDF è l’integrale della PDF:

[math]\displaystyle P(X \le 0.6) = \int_{0}^{0.6} \frac{x^1(1-x)^2}{1/12} \,dx = 12 \int_{0}^{0.6} x(1-2x+x^2) \,dx[/math].

Espandi e integra:

[math]\displaystyle 12 \int_{0}^{0.6} (x-2x^2+x^3) \,dx = 12 \left[\frac{x^2}{2} – \frac{2x^3}{3} + \frac{x^4}{4}\right]_{0}^{0.6}[/math].

Sostituisci [math]x=0.6[/math]:

[math]\displaystyle = 12 \left(\frac{0.6^2}{2} – \frac{2 \cdot 0.6^3}{3} + \frac{0.6^4}{4}\right)[/math]

[math]\displaystyle = 12 (0.18 – 0.144 + 0.0324)[/math]

[math]\displaystyle = 12 \times 0.0684[/math]

[math]\displaystyle = 0.8208[/math].

Risposta:

[math]P(X \le 0.6) \approx 0.8208[/math].

Applicazione Pratica:

Questo è il calcolo più fondamentale. Immagina che X rappresenti la frazione di componenti difettosi prodotti in un giorno, modellata come Beta(2,3). L’esercizio calcola la probabilità che questa frazione non superi il 60% (P(X ≤ 0.6)). È un calcolo essenziale nel controllo qualità.

Esercizio 2 (Media e Varianza)

Testo:

Sia [math]X \sim \text{Beta}(5,2)[/math]. Trova media e varianza. Verifica che [math]E[X] \in (0,1)[/math].

Teoria:

Media: [math]E[X] = \frac{\alpha}{\alpha+\beta}[/math].

Varianza: [math]\text{Var}(X) = \frac{\alpha\beta}{(\alpha+\beta)^2(\alpha+\beta+1)}[/math].

Soluzione:

Media:

[math]\displaystyle E[X] = \frac{5}{5+2} = \frac{5}{7} \approx 0.714[/math].

Varianza:

[math]\displaystyle \text{Var}(X) = \frac{5 \times 2}{(5+2)^2(5+2+1)} = \frac{10}{7^2 \times 8} = \frac{10}{49 \times 8} = \frac{10}{392} \approx 0.0255[/math].

Risposta:

[math]E[X]=\frac{5}{7}[/math], [math]\text{Var}(X) \approx 0.0255[/math].

Applicazione Pratica:

Se X è la percentuale di gradimento di un nuovo prodotto, la media (E[X] = 5/7 ≈ 71.4%) rappresenta il gradimento “atteso” o medio. La varianza misura l’incertezza o la dispersione delle opinioni attorno a questo valore medio. Una bassa varianza indicherebbe un consenso più forte.

Forse potrebbe interessarti anche: BCI: Applicazioni Cliniche, Sfide Etiche e Quadro Normativo della Nuova Frontiera Cervello-Computer

Questo esercizio dimostra come i parametri α e β non siano solo numeri astratti, ma controllino direttamente le proprietà descrittive più importanti della distribuzione: la sua tendenza centrale e la sua variabilità.

Esercizio 3 (Trasformazione lineare)

Testo:

Sia [math]X \sim \text{Beta}(3,4)[/math]. Definisci [math]Y=2X+5[/math]. Trova [math]E[Y][/math] e [math]\text{Var}(Y)[/math].

Teoria:

Per [math]Y=aX+b[/math]:

[math]E[Y]=aE[X]+b[/math],

[math]\text{Var}(Y)=a^2\text{Var}(X)[/math].

Soluzione:

Calcola [math]E[X][/math] e [math]\text{Var}(X)[/math]:

[math]\displaystyle E[X] = \frac{3}{3+4} = \frac{3}{7}[/math].

[math]\displaystyle \text{Var}(X) = \frac{3 \times 4}{(3+4)^2(3+4+1)} = \frac{12}{7^2 \times 8} = \frac{12}{49 \times 8} = \frac{12}{392} = \frac{3}{98}[/math].

Applica la trasformazione:

[math]\displaystyle E[Y] = 2E[X]+5 = 2 \times \frac{3}{7} + 5 = \frac{6}{7} + 5 = \frac{6+35}{7} = \frac{41}{7} \approx 5.857[/math].

[math]\displaystyle \text{Var}(Y) = 2^2\text{Var}(X) = 4 \times \frac{3}{98} = \frac{12}{98} = \frac{6}{49} \approx 0.1224[/math].

Risposta:

[math]E[Y] \approx 5.857[/math], [math]\text{Var}(Y) \approx 0.1224[/math].

Applicazione Pratica:

Questo scenario è molto comune. Supponiamo che X sia il tasso di conversione di un e-commerce (una proporzione tra 0 e 1). Il profitto Y potrebbe dipendere da questo tasso in modo lineare: Y = 2X + 5 (es. 2 milioni di euro di profitto variabile più 5 milioni di costi fissi recuperati). L’esercizio calcola il profitto atteso e la sua varianza.

Peculiarità:

Fa vedere come le proprietà di una variabile casuale (come la Beta) si propagano a funzioni di essa, un concetto chiave nel modeling statistico e finanziario.

Esercizio 4 (Bayesiano) – Prior e Posterior

Testo:

Un parametro [math]p[/math] ha prior [math]\text{Beta}(2,2)[/math]. Osserviamo 3 successi in 5 trial. Trova la posterior.

Teoria:

Se [math]p \sim \text{Beta}(\alpha,\beta)[/math] e osserviamo [math]k[/math] successi in [math]n[/math] trial, la posterior è [math]\text{Beta}(\alpha+k, \beta+n-k)[/math].

Soluzione:

Prior: [math]\text{Beta}(2,2)[/math].

Dati: [math]k=3[/math] successi in [math]n=5[/math] trial, quindi [math]n-k=2[/math] insuccessi.

Posterior:

[math]\text{Beta}(2+3, 2+(5-3)) = \text{Beta}(5, 2+2) = \text{Beta}(5,4)[/math].

Risposta:

La posterior è [math]\text{Beta}(5,4)[/math].

Applicazione Pratica:

Questo è il cuore pulsante della statistica Bayesiana. Un ricercatore ha una credenza iniziale (prior Beta(2,2)) sulla probabile efficacia p di un farmaco. Dopo un esperimento con 3 successi su 5 pazienti, aggiorna la sua credenza. La distribuzione posterior Beta(5,4) è la sua nuova, più informata, conoscenza sull’efficacia del farmaco.

Peculiarità dell’esercizio:

Illustra la bellezza della coniugazione. La famiglia Beta è il “coniugato” della verosimiglianza Binomiale, il che significa che se parti da una Beta (prior), dopo aver visto dati Binomiali, ottieni ancora una Beta (posterior), rendendo l’aggiornamento matematicamente pulito e diretto.

Approfondimento sulla Coniugazione Beta-Binomiale

1. Il Contesto: Il Teorema di Bayes

Ricordiamo la regola di Bayes, che è il motore di tutta l’inferenza Bayesiana:

[math]\displaystyle P(\text{ipotesi} \mid \text{dati}) = \frac{P(\text{dati} \mid \text{ipotesi}) \cdot P(\text{ipotesi})}{P(\text{dati})}[/math]

Nel nostro caso specifico, l'”ipotesi” è il valore di un parametro di probabilità sconosciuto, che chiamiamo [math]p[/math] (ad esempio, la probabilità che una moneta dia testa). I “dati” sono il risultato di un esperimento (ad esempio, osservare [math]k[/math] teste in [math]n[/math] lanci).

Le componenti diventano:

Prior [math](P(\text{ipotesi}))[/math]: La nostra credenza iniziale su [math]p[/math], prima di vedere i dati.
Verosimiglianza (Likelihood) [math](P(\text{dati} \mid \text{ipotesi}))[/math]: La probabilità di osservare i nostri dati, dato un certo valore di [math]p[/math].
Posterior [math](P(\text{ipotesi} \mid \text{dati}))[/math]: La nostra credenza su [math]p[/math> aggiornata dopo aver visto i dati.

Il denominatore, [math]P(\text{dati})[/math], è una costante di normalizzazione. Spesso, per semplificare, si lavora con la proporzionalità:

[math]\text{Posterior} \propto \text{Verosimiglianza} \times \text{Prior}[/math]

2. La “Magia” della Coniugazione: L’accoppiata Perfetta

Una coppia coniugata è una coppia di distribuzioni (Prior, Verosimiglianza) tale per cui la distribuzione Posterior risultante appartiene alla stessa famiglia del Prior.

Vediamo perché Beta e Binomiale sono una coppia coniugata.

a) Scegliamo il Prior (La nostra credenza iniziale)

Vogliamo modellare la nostra incertezza su un parametro [math]p[/math] che vive nell’intervallo [math][0,1][/math]. La distribuzione Beta è la scelta naturale, poiché è definita proprio su questo intervallo.

Forse potrebbe interessarti anche: Teorema di Bayes: Guida Pratica con 6 Esercizi Svolti su Medicina, Finanza e AI

La sua funzione di densità (ignorando la costante di normalizzazione [math]B(\alpha,\beta)[/math]) ha la forma:

[math]\displaystyle P(p; \alpha, \beta) \propto p^{\alpha-1}(1-p)^{\beta-1}[/math]

I parametri [math]\alpha[/math] e [math]\beta[/math] modellano la nostra credenza. Possiamo interpretarli come “pseudo-conteggi” di successi e insuccessi che abbiamo in mente prima ancora di iniziare l’esperimento.

[math]\text{Beta}(1, 1)[/math]: Prior non informativo (tutti i valori di [math]p[/math] sono ugualmente probabili).
[math]\text{Beta}(10, 10)[/math]: Crediamo fortemente che [math]p[/math] sia vicino a [math]0.5[/math].
[math]\text{Beta}(5, 2)[/math] (come nell’Esercizio 2): Crediamo che [math]p[/math] sia probabilmente superiore a [math]0.5[/math].

b) Osserviamo i Dati (La Verosimiglianza)

Conduciamo un esperimento che può avere due esiti (successo/insuccesso). Questo è descritto dalla distribuzione Binomiale. Se osserviamo [math]k[/math] successi in [math]n[/math] tentativi, la funzione di verosimiglianza per un dato [math]p[/math] è:

[math]\displaystyle P(\text{dati} \mid p) \propto p^k (1-p)^{n-k}[/math]

c) Calcoliamo il Posterior (La nostra credenza aggiornata)

Ora combiniamo Prior e Verosimiglianza usando la regola di Bayes:

[math]\displaystyle \begin{aligned} \text{Posterior}(p \mid \text{dati}) &\propto \text{Verosimiglianza Binomiale} \times \text{Prior Beta} \\ &\propto p^k (1-p)^{n-k} \times p^{\alpha-1}(1-p)^{\beta-1} \end{aligned}[/math]

Usando le proprietà delle potenze, raggruppiamo i termini:

[math]\displaystyle \begin{aligned} \text{Posterior}(p \mid \text{dati}) &\propto p^{(\alpha-1)+k} \cdot (1-p)^{(\beta-1)+(n-k)} \\ &\propto p^{(\alpha+k)-1} \cdot (1-p)^{(\beta+n-k)-1} \end{aligned}[/math]

L’intuizione chiave è qui: la forma matematica finale è identica a quella di una distribuzione Beta! È la forma [math]p^{\text{nuovo_param_1}-1}(1-p)^{\text{nuovo_param_2}-1}[/math].

Abbiamo dimostrato che il nostro Posterior è una distribuzione Beta con nuovi parametri:

Nuovo [math]\alpha’ = \alpha+k[/math] (prior successi + dati successi)
Nuovo [math]\beta’ = \beta+(n-k)[/math] (prior insuccessi + dati insuccessi)

Quindi, il nostro Posterior è [math]\text{Beta}(\alpha+k, \beta+n-k)[/math].

3. Perché è “Bello” e “Pulito”?

Efficienza Computazionale: Non abbiamo bisogno di fare complessi calcoli numerici (come l’integrazione Monte Carlo) per trovare la forma del Posterior. L’aggiornamento si riduce a due semplici addizioni. Questo era un vantaggio enorme prima della disponibilità di grande potenza di calcolo, ma rimane un grande vantaggio per la velocità ancora oggi.
Interpretabilità Diretta: Il risultato è incredibilmente intuitivo. La nostra nuova credenza (il Posterior) è semplicemente la nostra vecchia credenza (gli “pseudo-conteggi” [math]\alpha[/math] e [math]\beta[/math] del Prior) aggiornata con le evidenze che abbiamo raccolto (i conteggi reali [math]k[/math] e [math]n-k[/math] dai dati). L’inferenza diventa un semplice processo di “aggiungere informazione”.
Eleganza Matematica: La struttura algebrica della Beta e della Binomiale sono “compatibili”. La forma funzionale [math]p^a(1-p)^b[/math] è chiusa rispetto alla moltiplicazione. Questa coerenza rende il modello matematicamente elegante e facile da manipolare e comprendere.

Cosa succede senza coniugazione?

Immaginiamo di scegliere un prior non coniugato, ad esempio una distribuzione Triangolare per [math]p[/math]. Quando la moltiplichiamo per la verosimiglianza Binomiale, il Posterior risultante sarebbe una funzione complicata, non riconducibile a nessuna distribuzione nota. Per calcolare la sua media, la sua varianza o qualsiasi probabilità, saremmo costretti a usare metodi di approssimazione numerica (come le catene di Markov Monte Carlo – MCMC), che sono molto più lenti e complessi da implementare.

La coniugazione, quindi, è una “scorciatoia” analitica che ci permette di ottenere un risultato esatto e interpretabile in modo quasi istantaneo. L’esercizio 4 ne è l’esempio perfetto: l’aggiornamento da [math]\text{Beta}(2,2)[/math] a [math]\text{Beta}(5,4)[/math] dopo aver visto 3 successi e 2 insuccessi è immediato e non richiede altro che sommare i successi e gli insuccessi.

Esercizio 5 (Simulazione) – Metodo inverso

Testo:

Genera un valore da [math]\text{Beta}(2,1)[/math] usando il metodo inverso, sapendo che [math]u=0.4[/math] è un valore da [math]U(0,1)[/math].

Teoria:

La PDF di [math]\text{Beta}(2,1)[/math] è [math]f(x) = \frac{x^{2-1}(1-x)^{1-1}}{B(2,1)} = \frac{x^1 \cdot 1}{1/2} = 2x[/math].

La CDF di [math]\text{Beta}(2,1)[/math] è [math]F(x) = \int_0^x 2t \, dt = [t^2]_0^x = x^2[/math].

Il metodo inverso risolve [math]u=F(x)[/math].

Forse potrebbe interessarti anche: Distribuzione di Poisson: 6 Esercizi Svolti (con Python) per il Business

Soluzione:

CDF: [math]F(x)=x^2[/math].

Risolvi [math]0.4=x^2[/math]:

[math]x = \sqrt{0.4} \approx 0.632[/math].

Risposta:

Il valore generato è [math]\approx 0.632[/math].

Applicazione Pratica:

Fondamentale per le simulazioni Monte Carlo. Se vuoi simulare migliaia di scenari di mercato in cui un parametro p segue una distribuzione Beta, questo è uno dei metodi per generare valori realistici. Ad esempio, per testare la robustezza di una strategia di investimento a diverse performance di mercato

Esercizio 6 (Avanzato) – Distribuzione congiunta

Testo:

Siano [math]X \sim \text{Beta}(2,3)[/math] e [math]Y \sim \text{Beta}(3,2)[/math] indipendenti. Trova [math]P(XY \le 0.5)[/math].

Teoria:

La PDF congiunta di due variabili indipendenti è il prodotto delle PDF marginali. L’integrale richiesto non ha forma chiusa, quindi usiamo approssimazione numerica.

Soluzione:

PDF congiunta:

[math]\displaystyle f_{X,Y}(x,y) = f_X(x) \cdot f_Y(y) = \frac{x^{2-1}(1-x)^{3-1}}{B(2,3)} \cdot \frac{y^{3-1}(1-y)^{2-1}}{B(3,2)}[/math]

[math]\displaystyle = \frac{x(1-x)^2}{1/12} \cdot \frac{y^2(1-y)}{1/12}[/math]

[math]\displaystyle = 12x(1-x)^2 \cdot 12y^2(1-y)[/math]

[math]\displaystyle = 144x(1-x)^2y^2(1-y)[/math].

Calcola [math]P(XY \le 0.5)[/math] con integrale doppio:

[math]\displaystyle P(XY \le 0.5) = \iint_{xy \le 0.5, \, 0 \le x,y \le 1} f_{X,Y}(x,y) \,dy\,dx[/math].

L’area di integrazione è [math]0 \le x \le 1[/math] e [math]0 \le y \le \min(1, 0.5/x)[/math].

Suddividi l’integrale per gestire il [math]\min[/math] nella limitazione superiore di [math]y[/math]:

Se [math]x \le 0.5[/math], allora [math]0.5/x \ge 1[/math], quindi [math]\min(1, 0.5/x) = 1[/math].

Se [math]x > 0.5[/math], allora [math]0.5/x < 1[/math], quindi [math]\min(1, 0.5/x) = 0.5/x[/math].

Quindi, l’integrale diventa:

[math]\displaystyle \int_{0}^{0.5} \int_{0}^{1} 144x(1-x)^2y^2(1-y) \,dy\,dx + \int_{0.5}^{1} \int_{0}^{0.5/x} 144x(1-x)^2y^2(1-y) \,dy\,dx[/math].

Poiché questo integrale doppio non può essere risolto analiticamente in forma semplice, ricorriamo a metodi di integrazione numerica, uno strumento computazionale standard in statistica per problemi complessi.

Risolviamo numericamente con Python:

from scipy import integrate

f = lambda y, x: 144 * x * (1-x)**2 * y**2 * (1-y)

# Integral for x from 0 to 0.5, y from 0 to 1
prob1 = integrate.nquad(f, [[0, 0.5], [0, 1]])[0]

# Integral for x from 0.5 to 1, y from 0 to 0.5/x
prob2 = integrate.nquad(f, [[0.5, 1], [0, lambda x: 0.5/x]])[0]

prob = prob1 + prob2
# print(prob)

Eseguendo il codice Python, si ottiene:

[math]\displaystyle \text{prob} \approx 0.783[/math].

Risposta approssimata:

[math]P(XY \le 0.5) \approx 0.78[/math].

Applicazione Pratica:

Analisi del rischio di un sistema complesso. Siano X e Y le probabilità di fallimento (indipendenti) di due componenti critici di un satellite. L’esercizio calcola la probabilità che il prodotto delle loro probabilità di fallimento (XY) rimanga sotto una soglia di rischio accettabile.

Peculiarità dell’esercizio:

Spinge il lettore oltre i limiti dei problemi “da manuale”. Mostra che nel mondo reale molte domande interessanti non hanno una soluzione analitica pulita e richiedono l’uso di computer e metodi numerici per essere risolte. È un ponte perfetto verso la statistica computazionale.