Stima Intervallare Spiegata Semplice: Calcolo e Interpretazione (Z, t e Chi-Quadro)

Cerca:

Generic selectors
Exact matches only
Search in title
Search in content
Post Type Selectors
come calcolare intervallo di confidenza

Immagina di dover descrivere un amico che non hai mai visto a qualcuno. Ti limiti a dire “è alto 175 cm”?

Probabilmente no. È una stima troppo precisa per essere quasi certamente sbagliata.

È molto più utile dire “è alto tra i 170 e i 180 cm”. Dando un intervallo, hai sacrificato un po’ di precisione per guadagnare molta affidabilità.

La statistica inferenziale funziona allo stesso modo. Quando analizziamo un piccolo campione (30 studenti, 100 bulloni), non possiamo illuderci di trovare esattamente il valore medio di tutta la popolazione. La “stima puntuale” (es. “media = 7,2 ore di sonno”) è quasi sicuramente sbagliata.

È qui che entra in gioco la stima intervallare. Invece di un numero solo, definiamo un “recinto” (un intervallo, appunto) e un livello di fiducia (es. 95%) che quel recinto contenga il valore vero. Non è una scommessa, ma una misura onesta della nostra incertezza. In questa guida vediamo come costruire questi intervalli, quando usare la misteriosa ‘t di Student’ e quali errori evitare per non sbagliare all’esame.

Altro esempio:

Immagina di voler misurare qualcosa (es. l’altezza media degli studenti della tua classe), ma non puoi chiedere a tutti. Prendi un campione piccolo (es. 30 persone) e da lì stimi il valore vero per tutta la popolazione.

La stima puntuale dice: “Penso che la media sia 170 cm”. Ma è precisa al 100%? No!

La stima intervallare invece dice:

“Sono abbastanza sicuro (es. al 95%) che la media vera sia tra 168 e 172 cm.”

Questo è l’intervallo di confidenza.

Pubblicità

1. Livello di Confidenza (es. 95%)

Significa:

  • Se ripeto l’esperimento 100 volte con campioni diversi, in 95 casi su 100 l’intervallo conterrà il valore vero.

❌ Non significa: “C’è il 95% di probabilità che il valore vero sia nell’intervallo” (è un errore comune!).

L’intervallo o contiene il valore vero o non lo contiene. Il 95% è la fiducia nel metodo, non nella singola stima.


2. Intervallo di Confidenza per la Media (σ nota o ignota)

Caso 1: Varianza della popolazione nota (σ) – Usa la Z

Formula:

[math]\displaystyle \begin{aligned}
\text{IC}_{95\%} = \bar{x} \pm 1{,}96 \cdot \frac{\sigma}{\sqrt{n}}
\end{aligned}[/math]

Dove:

  • [math]\bar{x}[/math] = media del campione
  • [math]\sigma[/math] = deviazione standard della popolazione (nota!)
  • [math]n[/math] = dimensione del campione
  • [math]1{,}96[/math] viene dalla tabella Z per 95%

Esempio pratico (Bulloni):

Una fabbrica produce bulloni. Sappiamo che la lunghezza ha [math]\sigma = 0{,}5 \text{ cm}[/math] (dalla storia). Prendiamo [math]n = 100[/math] bulloni → media [math]\bar{x} = 10{,}2 \text{ cm}[/math].

[math]\displaystyle \begin{aligned}
\text{IC}_{95\%} &= 10{,}2 \pm 1{,}96 \cdot \frac{0{,}5}{\sqrt{100}} \\
&= 10{,}2 \pm 1{,}96 \cdot 0{,}05 = 10{,}2 \pm 0{,}098 \\
&\Rightarrow [10{,}102;\ 10{,}298]\ \text{cm}
\end{aligned}[/math]

Interpretazione: Siamo confidenti al 95% che la lunghezza media vera dei bulloni è tra 10,1 e 10,3 cm.

Caso 2: Varianza ignota → Usa la t di Student

Formula:

[math]\displaystyle \begin{aligned}
\text{IC} = \bar{x} \pm t^* \cdot \frac{s}{\sqrt{n}}
\end{aligned}[/math]

Dove:

  • [math]s[/math] = deviazione standard del campione
  • [math]t^*[/math] = valore dalla tabella t (dipende da [math]n-1[/math] e livello di confidenza)

Esempio pratico (Sonno):

Vuoi stimare il tempo medio di sonno degli studenti del tuo liceo. Campione: [math]n = 25[/math] studenti → [math]\bar{x} = 7{,}2 \text{ ore}[/math], [math]s = 1{,}1 \text{ ore}[/math].

Per 95% e 24 g.dl. → [math]t^* \approx 2{,}06[/math]

[math]\displaystyle \begin{aligned}
\text{IC} &= 7{,}2 \pm 2{,}06 \cdot \frac{1{,}1}{\sqrt{25}} \\
&= 7{,}2 \pm 2{,}06 \cdot 0{,}22 = 7{,}2 \pm 0{,}453 \\
&\Rightarrow [6{,}75;\ 7{,}65]\ \text{ore}
\end{aligned}[/math]

Forse potrebbe interessarti anche:  P-value: Cos'è, Come si Calcola e Quando si Usa nei Test Statistici

Siamo confidenti al 95% che gli studenti dormono in media tra 6,75 e 7,65 ore.


3. Intervallo di Confidenza per la Varianza (solo per dati normali)

Usiamo il chi-quadrato ([math]\chi^2[/math]).

Formula:

[math]\displaystyle \begin{aligned}
\left( \frac{(n-1)s^2}{\chi^2_{\text{alto}}};\ \frac{(n-1)s^2}{\chi^2_{\text{basso}}} \right)
\end{aligned}[/math]

Dove:

  • [math]\chi^2_{\text{alto}}[/math] = valore tabella per [math](1 – \alpha/2)[/math]
  • [math]\chi^2_{\text{basso}}[/math] = valore per [math]\alpha/2[/math]
  • g.dl. = [math]n-1[/math]

Esempio pratico (Mele):

Misuri la variabilità del peso di mele in un frutteto. [math]n = 16[/math] mele → [math]s^2 = 25 \text{ g}^2[/math] (varianza campionaria). Per 95%, g.dl. = 15:

[math]\chi^2_{0{,}975} \approx 27{,}5[/math], [math]\chi^2_{0{,}025} \approx 6{,}3[/math]

[math]\displaystyle \begin{aligned}
\text{IC} &= \left( \frac{15 \cdot 25}{27{,}5};\ \frac{15 \cdot 25}{6{,}3} \right) \\
&= (13{,}6;\ 59{,}5)
\end{aligned}[/math]

La varianza vera del peso è, con 95% di confidenza, tra 13,6 e 59,5 g².


Riassunto Tabella

Cosa stimi? Condizione Formula chiave Esempio
Media σ nota [math]\bar{x} \pm z \cdot \frac{\sigma}{\sqrt{n}}[/math] Bulloni
Media σ ignota [math]\bar{x} \pm t \cdot \frac{s}{\sqrt{n}}[/math] Sonno
Varianza Dati normali [math]\left( \frac{(n-1)s^2}{\chi^2_U}; \frac{(n-1)s^2}{\chi^2_L} \right)[/math] Mele

Consigli per Studenti

  • Più grande è [math]n[/math] → intervallo più stretto (più preciso!)
  • Livello di confidenza più alto (99% vs 95%) → intervallo più largo
  • Non dire mai: “il 95% di probabilità che sia dentro” → è il metodo che è affidabile al 95%

Domanda tipo d’esame:

Da un campione di 36 persone, [math]\bar{x}=82[/math], [math]s=15[/math]. Stima la media populazionale al 95%. ([math]t_{35;0{,}025} \approx 2{,}03[/math])

[math]\displaystyle \begin{aligned}
\text{IC} &= 82 \pm 2{,}03 \cdot \frac{15}{\sqrt{36}} \\
&= 82 \pm 2{,}03 \cdot 2{,}5 = 82 \pm 5{,}075 \quad \\
&\Rightarrow [76{,}9; 87{,}1]
\end{aligned}[/math]

Esempi Corretti e Controesempi: Errori da Evitare nella Stima Intervallare 

Pubblicità

La stima intervallare è uno strumento potente, ma è facile commettere errori nell’interpretazione e nel calcolo. Qui di seguito trovi una riepilogo degli esempi corretti e i principali controesempi (errori da evitare).

✅ ESEMPI CORRETTI (Fai così!)

ESEMPIO 1: Media con σ nota (Z)

Situazione:

  • Una macchina riempie bottiglie di succo.
  • Sappiamo che la deviazione standard della popolazione è [math]\sigma = 5 \text{ ml}[/math] (da anni di dati).
  • Campione: [math]n = 100[/math] bottiglie, media campionaria [math]\bar{x} = 503 \text{ ml}[/math].

Calcolo IC 95%:

[math]\displaystyle \begin{aligned}
IC &= 503 \pm 1{,}96 \cdot \frac{5}{\sqrt{100}} = 503 \pm 0{,}98 \\
&\Rightarrow [502{,}02; 503{,}98]\ \text{ml}
\end{aligned}[/math]

Interpretazione corretta:

“Con il 95% di confidenza, la quantità media vera di succo è tra 502 e 504 ml.”

ESEMPIO 2: Media con σ ignota (t-Student)

Situazione:

  • Vuoi sapere quanto tempo impiegano i tuoi compagni a fare i compiti.
  • Campione: [math]n = 20[/math] studenti, [math]\bar{x} = 2{,}1 \text{ ore}[/math], [math]s = 0{,}8 \text{ ore}[/math].

Calcolo IC 95% (g.dl. = 19 → [math]t^* \approx 2{,}09[/math]):

[math]\displaystyle \begin{aligned}
IC &= 2{,}1 \pm 2{,}09 \cdot \frac{0{,}8}{\sqrt{20}} = 2{,}1 \pm 0{,}374 \\
&\Rightarrow [1{,}73; 2{,}47]\ \text{ore}
\end{aligned}[/math]

Interpretazione corretta:

“Siamo confidenti al 95% che il tempo medio vero è tra 1,7 e 2,5 ore.”

ESEMPIO 3: Varianza ([math]\chi^2[/math])

Situazione:

  • Misuri il peso di 10 pomodori da un campo → [math]s^2 = 36 \text{ g}^2[/math].
  • Vuoi stimare la varianza vera del peso.

Calcolo IC 95% (g.dl. = 9):

Tabella [math]\chi^2[/math]:

  • [math]\chi^2_{0{,}975} = 19{,}02[/math]
  • [math]\chi^2_{0{,}025} = 2{,}70[/math]

[math]\displaystyle \begin{aligned}
IC &= \left( \frac{9 \cdot 36}{19{,}02};\ \frac{9 \cdot 36}{2{,}70} \right) \\
&= (17{,}0;\ 120{,}0)
\end{aligned}[/math]

Forse potrebbe interessarti anche:  Statistica Inferenziale: 8 Esercizi Progressivi (Z-Test, T-Test, P-value e Potenza) per Decidere con i Dati

Interpretazione corretta:

“La varianza vera del peso è, con 95% di confidenza, tra 17 e 120 g².”

❌ CONTROESEMPI (ERRORI DA EVITARE!)

CONTROESEMPIO 1: Usare Z invece di t quando σ è ignota

Errore: Hai [math]n = 25[/math], [math]\bar{x} = 70[/math], [math]s = 12[/math]. Ma non conosci [math]\sigma[/math].

Tu fai:

[math]\displaystyle \begin{aligned}
IC = 70 \pm 1{,}96 \cdot \frac{12}{\sqrt{25}} \quad \text{(SBAGLIATO!)}
\end{aligned}[/math]

Perché è sbagliato? → Devi usare la t di Student, non Z! Con g.dl. = 24 → [math]t^* \approx 2{,}06[/math] (non 1,96).

Correzione:

[math]\displaystyle \begin{aligned}
IC &= 70 \pm 2{,}06 \cdot \frac{12}{\sqrt{25}} = 70 \pm 4{,}94 \\
&\Rightarrow [65{,}06; 74{,}94]
\end{aligned}[/math]

Errore: intervallo troppo stretto → sottostima l’incertezza.

CONTROESEMPIO 2: Dire “c’è il 95% di probabilità che μ sia nell’intervallo”

Frase sbagliata:

“C’è il 95% di probabilità che la media vera sia tra 65 e 75.”

Perché è sbagliato? → Una volta calcolato l’intervallo, [math]\mu[/math] o c’è o non c’è. Il 95% è la fiducia nel metodo, non una probabilità sul valore vero.

Frase corretta:

“Siamo confidenti al 95% che l’intervallo [65; 75] contenga la media vera.”

CONTROESEMPIO 3: Usare la formula della varianza senza normalità

Errore: Hai dati molto asimmetrici (es. tempi di attesa in coda: molti piccoli, pochi lunghissimi). Calcoli comunque l’IC per la varianza con [math]\chi^2[/math].

Perché è sbagliato? → La distribuzione [math]\chi^2[/math] vale solo se i dati sono normali!

Soluzione:

  • Trasforma i dati (es. logaritmo)
  • O usa metodi non parametrici (es. bootstrap)

CONTROESEMPIO 4: Dimenticare [math]\sqrt{n}[/math] nella formula

Errore comune:

[math]\displaystyle \begin{aligned}
IC = \bar{x} \pm z \cdot s \quad \text{(dimentica di dividere per } \sqrt{n})
\end{aligned}[/math]

Esempio sbagliato: [math]n = 36[/math], [math]\bar{x} = 100[/math], [math]s = 15[/math]. → “100 [math]\pm 1{,}96 \times 15 = [70{,}7; 129{,}3][/math]” → intervallo enorme!

Correzione:

[math]\displaystyle \begin{aligned}
\frac{s}{\sqrt{n}} &= \frac{15}{6} = 2{,}5 \\
&\Rightarrow IC = 100 \pm 1{,}96 \cdot 2{,}5 = [95{,}1; 104{,}9]
\end{aligned}[/math]

Errore: intervallo troppo largo → perdi precisione.

Riepilogo: Cosa fare e Cosa NON fare

✅ FAI COSÌ ❌ NON FARE COSÌ
Usa Z solo se σ è nota Usa Z se hai solo [math]s[/math] (dev. std. campione)
Usa t se σ ignota Dimentica i gradi di libertà
Usa [math]\chi^2[/math] solo con dati normali Applica [math]\chi^2[/math] a dati molto asimmetrici
Scrivi: “confidenza al 95%” Scrivi: “probabilità che [math]\mu[/math] sia dentro”
Dividi sempre per [math]\sqrt{n}[/math] Moltiplica per [math]s[/math] senza [math]\sqrt{n}[/math]

ESERCIZIO per te (prova a casa!)

Dati: [math]n = 16[/math], [math]\bar{x} = 25[/math], [math]s = 6[/math]

Domanda: IC 90% per la media (σ ignota)

Passi di soluzione:

  • g.dl. = 15
  • [math]t^*[/math] per 90% ([math]\alpha/2 = 0{,}05[/math]) → tabella → [math]t^* \approx 1{,}75[/math]
  • Errore standard = [math]6 / \sqrt{16} = 1{,}5[/math]
  • [math]IC = 25 \pm 1{,}75 \times 1{,}5 = 25 \pm 2{,}625 \quad \Rightarrow [22{,}375; 27{,}625][/math]

Risposta corretta:

“Con il 90% di confidenza, la media vera è tra 22,4 e 27,6.”

📘 Statistica Inferenziale step-by-step

Distribuzione Normale – la base teorica

➤ Capire la forma a campana, media, deviazione standard e applicazioni pratiche

Intervallo di confidenza (teoria)

➤ Formula, significato del livello di confidenza, varianza nota

Intervalli di confidenza nelle vendite (applicazione reale)

➤ Esempi concreti su dati aziendali e interpretazione dei risultati

Guida completa + 8 esercizi svolti

➤ Passaggi guidati, formula generale, Z-test e risoluzioni commentate

6 esercizi di statistica inferenziale

➤ Media, proporzioni, intervalli di confidenza e test con soluzione dettagliata

Distribuzione della proporzione campionaria + esercizi

➤ Formula, applicazioni e differenze rispetto ai dati quantitativi

Forse potrebbe interessarti anche:  5 Esercizi di Pandas in Python Spiegati Passo Passo: Guida Pratica da Base ad Esperto per Data Analysis

Test t di Welch – scegliere il test giusto

➤ Confronto tra due medie con varianze diverse + esempi in Python

Test parametrici fuori controllo (episodio avanzato)

➤ Quando i presupposti dei test vengono violati e come intervenire

💡 L’Interesse Nascosto degli Esercizi: Cosa Stai Davvero Imparando

Gli esempi di stima intervallare (bulloni, sonno, mele) non sono casuali. Essi rappresentano i tre problemi di inferenza statistica più comuni e fondamentali che un analista incontra negli scenari del mondo reale.

L’Esercizio dei Bulloni (Media, σ nota)

Peculiarità: Lo scenario del Controllo Qualità (QC).

Contesto Applicativo: Immagina di lavorare nell’ingegneria o nella produzione industriale. La tua macchina è progettata per essere stabile. Hai anni di dati e sai che la variabilità della produzione (σ) è un dato storico affidabile (es. 0,5 cm). Il tuo problema non è la variabilità, ma la precisione. Vuoi sapere se la macchina si è “spostata” e ora produce bulloni in media troppo lunghi o troppo corti (cioè se [math]\mu[/math] è cambiata).

Perché è interessante: È l’unico caso in cui si utilizza la distribuzione Z (Normale Standard). È raro nella ricerca sociale (dove [math]\sigma[/math] non è mai nota), ma è un approccio standard e robusto nell’ingegneria e nel controllo dei processi.

 

L’Esercizio del Sonno (Media, σ ignota)

Peculiarità: Lo scenario più comune della ricerca.

Contesto Applicativo: Sei un ricercatore in medicina, psicologia o marketing. Stai conducendo un’analisi sull’efficacia di un farmaco, sul tempo di sonno o sulla soddisfazione dei clienti. Non hai nessuna idea di quale sia la vera [math]\sigma[/math] (variabilità) della popolazione. Devi stimare tutto dal tuo campione: sia la media ([math]\bar{x}[/math]) sia la deviazione standard (s).

Perché è interessante: Utilizzare la ‘t di Student’ è l’approccio corretto e più onesto. La ‘t’ (che ha “code più pesanti” della Z) produce intervalli leggermente più larghi per tenere conto dell’incertezza aggiuntiva che abbiamo, derivante dal fatto che stiamo stimando sia la media che la variabilità. Questo esercizio ti insegna ad essere più cauto e statisticamente corretto quando non conosci la variabilità totale.


L’Esercizio delle Mele (Stima della Varianza, χ2)

Peculiarità: Ci si concentra sulla variabilità, non sulla media.

Contesto Applicativo:

  • Agricoltura: Un cliente vuole mele che pesino circa 150 gr. Non gli importa se la media è 150 gr se poi riceve mele da 50 gr e mele da 250 gr. Vuole consistenza.
  • Finanza: Un investitore valuta la volatilità (varianza) di un titolo. Un’alta varianza implica un alto rischio.
  • Farmaceutica: La pillola deve contenere 10 mg di principio attivo. Se la media è 10 mg ma la varianza è alta, alcune pillole saranno sovradosate (tossiche) e altre sottodosate (inefficaci).

Perché è interessante: Questo esercizio sposta la tua attenzione dal “centro” dei dati (la media) alla loro “dispersione” (la varianza). Ti insegna che, in molti processi, la consistenza è più importante della media.

Pubblicità