Guida Pratica al T-test di Welch: Esercizi e Soluzioni Passo Passo

Cerca:

Generic selectors
Exact matches only
Search in title
Search in content
Post Type Selectors
quando usare t-test welch

6 Esercizi Pratici sul t-test di Welch

Ecco 6 esercizi sul t-test di Welch a difficoltà crescente, ciascuno con soluzione e spiegazione dettagliata, arricchita con nozioni teoriche. Questi scenari illustrano l’applicazione del test in contesti pratici.

👉Test t di Welch: Quando Usarlo, Formula, Esempi Pratici

Esercizio 1 (Base)

Problema:

Due gruppi di studenti hanno sostenuto un esame con i seguenti risultati:

  • Gruppo A: [math]n_1=10[/math], [math]\bar{x}_1=75[/math], [math]s_1=8[/math]
  • Gruppo B: [math]n_2=12[/math], [math]\bar{x}_2=70[/math], [math]s_2=6[/math]

Verifica se la differenza tra le medie è significativa ([math]\alpha=0.05[/math]) assumendo varianze disuguali.

Soluzione:

Ipotesi:

[math]H_0: \mu_1 = \mu_2[/math] (Le medie dei due gruppi sono uguali)

[math]H_1: \mu_1 \neq \mu_2[/math] (Le medie dei due gruppi sono diverse – test bilaterale)

Calcolo dei gradi di libertà (Welch-Satterthwaite):

[math]\begin{align*} df&=\frac{(\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2})^2}{\frac{(s_1^2/n_1)^2}{n_1-1}+\frac{(s_2^2/n_2)^2}{n_2-1}}\\ &=\frac{(\frac{8^2}{10}+\frac{6^2}{12})^2}{\frac{(8^2/10)^2}{10-1}+\frac{(6^2/12)^2}{12-1}}\\ &=\frac{(\frac{64}{10}+\frac{36}{12})^2}{\frac{(6.4)^2}{9}+\frac{(3)^2}{11}}\\ &\approx\frac{(6.4+3)^2}{4.551+0.818}\approx\frac{9.4^2}{5.369}\approx\frac{88.36}{5.369}\approx 16.45 \end{align*}[/math]

Si arrotonda per difetto al numero intero più vicino: [math]df \approx 16[/math].

Statistica t:

[math]\begin{align*} t&=\frac{\bar{x}_1-\bar{x}_2}{\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}}\\ &=\frac{75-70}{\sqrt{\frac{8^2}{10}+\frac{6^2}{12}}}\\ &=\frac{5}{\sqrt{\frac{64}{10}+\frac{36}{12}}}\\ &=\frac{5}{\sqrt{6.4+3}}=\frac{5}{\sqrt{9.4}}\approx\frac{5}{3.066}\approx 1.63 \end{align*}[/math]

Decisione:

Per un test bilaterale con [math]\alpha=0.05[/math] e [math]df=16[/math], il valore critico di t è [math]t_{0.025,16}\approx 2.120[/math].

Poiché [math]|1.63| < 2.120[/math], la statistica test non cade nella regione critica. Non rifiutiamo [math]H_0[/math].

Conclusione: Sulla base di questi dati, non c’è evidenza statisticamente significativa a un livello di [math]\alpha=0.05[/math] per affermare che le medie dei punteggi d’esame dei due gruppi siano diverse.

Pubblicità

Esercizio 2 (Base)

Problema:

Un ricercatore confronta il tempo di reazione (in millisecondi) tra due gruppi:

  • Gruppo X: [math]n_1=15[/math], [math]\bar{x}_1=200[/math] ms, [math]s_1=25[/math] ms
  • Gruppo Y: [math]n_2=20[/math], [math]\bar{x}_2=185[/math] ms, [math]s_2=30[/math] ms

Testa l’ipotesi di differenza con [math]\alpha=0.05[/math] assumendo varianze disuguali.

Soluzione:

Ipotesi:

[math]H_0: \mu_X = \mu_Y[/math] (Le medie dei tempi di reazione sono uguali)

[math]H_1: \mu_X \neq \mu_Y[/math] (Le medie dei tempi di reazione sono diverse – test bilaterale)

Gradi di libertà:

[math]\begin{align*} df&=\frac{(\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2})^2}{\frac{(s_1^2/n_1)^2}{n_1-1}+\frac{(s_2^2/n_2)^2}{n_2-1}}\\ &=\frac{(\frac{25^2}{15}+\frac{30^2}{20})^2}{\frac{(25^2/15)^2}{15-1}+\frac{(30^2/20)^2}{20-1}}\\ &=\frac{(\frac{625}{15}+\frac{900}{20})^2}{\frac{(41.666…)^2}{14}+\frac{(45)^2}{19}}\\ &\approx\frac{(41.67+45)^2}{124.01+106.58}\approx\frac{86.67^2}{230.59}\approx\frac{7511.7}{230.59}\approx 32.57 \end{align*}[/math]

Si arrotonda per difetto: [math]df \approx 32[/math] (Nota: arrotondando a 33 o 32, il risultato della decisione di solito non cambia per valori di t vicini al critico, ma 32 è l’arrotondamento standard per difetto).

Statistica t:

[math]\begin{align*} t&=\frac{\bar{x}_1-\bar{x}_2}{\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}}\\ &=\frac{200-185}{\sqrt{\frac{25^2}{15}+\frac{30^2}{20}}}\\ &=\frac{15}{\sqrt{\frac{625}{15}+\frac{900}{20}}}\\ &=\frac{15}{\sqrt{41.67+45}}=\frac{15}{\sqrt{86.67}}\approx\frac{15}{9.31}\approx 1.61 \end{align*}[/math]

Decisione:

Per un test bilaterale con [math]\alpha=0.05[/math] e [math]df=32[/math], il valore critico di t è [math]t_{0.025,32}\approx 2.037[/math].

Poiché [math]|1.61| < 2.037[/math], non rifiutiamo [math]H_0[/math].

Conclusione: A un livello di significatività del 5%, non c’è evidenza sufficiente per concludere che ci sia una differenza significativa nei tempi di reazione medi tra i due gruppi.

Forse potrebbe interessarti anche:  Perché la Varianza si Calcola con n-1? La Correzione di Bessel Spiegata Semplice

Esercizio 3 (Intermedio)

Problema:

Due macchine producono viti con le seguenti lunghezze medie e deviazioni standard campionarie (in mm):

  • Macchina A: [math]n_1=8[/math], [math]\bar{x}_1=50.2[/math] mm, [math]s_1=1.8[/math] mm
  • Macchina B: [math]n_2=10[/math], [math]\bar{x}_2=48.9[/math] mm, [math]s_2=2.3[/math] mm

Testa se le medie delle lunghezze prodotte dalle due macchine sono diverse ([math]\alpha=0.05[/math]), assumendo varianze disuguali.

Soluzione:

Ipotesi:

[math]H_0: \mu_A = \mu_B[/math]

[math]H_1: \mu_A \neq \mu_B[/math]

Gradi di libertà:

[math]\begin{align*} df&=\frac{(\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2})^2}{\frac{(s_1^2/n_1)^2}{n_1-1}+\frac{(s_2^2/n_2)^2}{n_2-1}}\\ &=\frac{(\frac{1.8^2}{8}+\frac{2.3^2}{10})^2}{\frac{(1.8^2/8)^2}{8-1}+\frac{(2.3^2/10)^2}{10-1}}\\ &=\frac{(\frac{3.24}{8}+\frac{5.29}{10})^2}{\frac{(0.405)^2}{7}+\frac{(0.529)^2}{9}}\\ &\approx\frac{(0.405+0.529)^2}{0.0234+0.0311}\approx\frac{0.934^2}{0.0545}\approx\frac{0.872}{0.0545}\approx 16.00 \end{align*}[/math]

Si arrotonda per difetto: [math]df \approx 16[/math].

Statistica t:

[math]\begin{align*} t&=\frac{\bar{x}_1-\bar{x}_2}{\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}}\\ &=\frac{50.2-48.9}{\sqrt{\frac{1.8^2}{8}+\frac{2.3^2}{10}}}\\ &=\frac{1.3}{\sqrt{\frac{3.24}{8}+\frac{5.29}{10}}}\\ &=\frac{1.3}{\sqrt{0.405+0.529}}=\frac{1.3}{\sqrt{0.934}}\approx\frac{1.3}{0.966}\approx 1.346 \end{align*}[/math]

Decisione:

Per un test bilaterale con [math]\alpha=0.05[/math] e [math]df=16[/math], il valore critico di t è [math]t_{0.025,16}=2.120[/math].

Poiché [math]|1.346| < 2.120[/math], non rifiutiamo [math]H_0[/math].

Conclusione: I dati campionari non forniscono sufficiente evidenza, a un livello di [math]\alpha=0.05[/math], per concludere che le lunghezze medie delle viti prodotte dalle due macchine siano significativamente diverse.

Esercizio 4 (Intermedio)

Problema:

Confronta i punteggi medi ottenuti da due gruppi in un test standardizzato:

  • Gruppo 1: [math]n_1=25[/math], [math]\bar{x}_1=85[/math], [math]s_1=12[/math]
  • Gruppo 2: [math]n_2=30[/math], [math]\bar{x}_2=78[/math], [math]s_2=15[/math]

Esegui il test di Welch per verificare se le medie sono diverse usando [math]\alpha=0.01[/math].

Soluzione:

Ipotesi:

[math]H_0: \mu_1 = \mu_2[/math]

[math]H_1: \mu_1 \neq \mu_2[/math]

Gradi di libertà:

[math]\begin{align*} df&=\frac{(\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2})^2}{\frac{(s_1^2/n_1)^2}{n_1-1}+\frac{(s_2^2/n_2)^2}{n_2-1}}\\ &=\frac{(\frac{12^2}{25}+\frac{15^2}{30})^2}{\frac{(12^2/25)^2}{25-1}+\frac{(15^2/30)^2}{30-1}}\\ &=\frac{(\frac{144}{25}+\frac{225}{30})^2}{\frac{(5.76)^2}{24}+\frac{(7.5)^2}{29}}\\ &\approx\frac{(5.76+7.5)^2}{1.3824+1.9396}\approx\frac{13.26^2}{3.322}\approx\frac{175.8276}{3.322}\approx 52.93 \end{align*}[/math]

Si arrotonda per difetto: [math]df \approx 52[/math] (vicino all’approssimazione [math]df \approx 50[/math] data nell’input originale).

Statistica t:

[math]\begin{align*} t&=\frac{\bar{x}_1-\bar{x}_2}{\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}}\\ &=\frac{85-78}{\sqrt{\frac{12^2}{25}+\frac{15^2}{30}}}\\ &=\frac{7}{\sqrt{\frac{144}{25}+\frac{225}{30}}}\\ &=\frac{7}{\sqrt{5.76+7.5}}=\frac{7}{\sqrt{13.26}}\approx\frac{7}{3.641}\approx 1.922 \end{align*}[/math]

Decisione:

Per un test bilaterale con [math]\alpha=0.01[/math] (quindi [math]\alpha/2=0.005[/math]) e [math]df=52[/math], il valore critico di t è [math]t_{0.005,52}\approx 2.675[/math].

Poiché [math]|1.922| < 2.675[/math], non rifiutiamo [math]H_0[/math].

Conclusione: A un livello di significatività dell’1%, non c’è evidenza statistica sufficiente per concludere che le medie dei punteggi dei due gruppi siano significativamente diverse.

Esercizio 5 (Avanzato)

Problema:

Uno studio clinico confronta l’efficacia (misurata su una scala) di due farmaci per abbassare la pressione sanguigna. I risultati sono:

  • Farmaco A: [math]n_1=18[/math], [math]\bar{x}_1=120[/math] (riduzione media), [math]s_1=20[/math]
  • Farmaco B: [math]n_2=22[/math], [math]\bar{x}_2=110[/math] (riduzione media), [math]s_2=25[/math]

Testa se il Farmaco A è significativamente superiore al Farmaco B (cioè, se la riduzione media con A è maggiore di quella con B) usando [math]\alpha=0.05[/math]. Assumi varianze disuguali.

Soluzione:

Ipotesi unidirezionali:

[math]H_0: \mu_A \leq \mu_B[/math] (Il Farmaco A non è superiore o è meno efficace del Farmaco B)

Forse potrebbe interessarti anche:  Test di Wilcoxon Signed-Rank: Guida Statistica con Esempi in Python e R

[math]H_1: \mu_A > \mu_B[/math] (Il Farmaco A è significativamente superiore al Farmaco B – test unilaterale destro)

Gradi di libertà:

[math]\begin{align*} df&=\frac{(\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2})^2}{\frac{(s_1^2/n_1)^2}{n_1-1}+\frac{(s_2^2/n_2)^2}{n_2-1}}\\ &=\frac{(\frac{20^2}{18}+\frac{25^2}{22})^2}{\frac{(20^2/18)^2}{18-1}+\frac{(25^2/22)^2}{22-1}}\\ &=\frac{(\frac{400}{18}+\frac{625}{22})^2}{\frac{(22.22)^2}{17}+\frac{(28.41)^2}{21}}\\ &\approx\frac{(22.22+28.41)^2}{29.04+38.29}\approx\frac{50.63^2}{67.33}\approx\frac{2563.4}{67.33}\approx 38.07 \end{align*}[/math]

Si arrotonda per difetto: [math]df \approx 38[/math] (vicino all’approssimazione [math]df \approx 35[/math] data nell’input originale).

Statistica t:

[math]\begin{align*} t&=\frac{\bar{x}_1-\bar{x}_2}{\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}}\\ &=\frac{120-110}{\sqrt{\frac{20^2}{18}+\frac{25^2}{22}}}\\ &=\frac{10}{\sqrt{\frac{400}{18}+\frac{625}{22}}}\\ &=\frac{10}{\sqrt{22.22+28.41}}=\frac{10}{\sqrt{50.63}}\approx\frac{10}{7.115}\approx 1.405 \end{align*}[/math]

Decisione:

Per un test unilaterale destro con [math]\alpha=0.05[/math] e [math]df=38[/math], il valore critico di t è [math]t_{0.05,38}\approx 1.686[/math].

Poiché [math]1.405 < 1.686[/math], la statistica test non cade nella regione critica. Non rifiutiamo [math]H_0[/math].

Conclusione: A un livello di significatività del 5%, non c’è sufficiente evidenza statistica dai dati campionari per concludere che il Farmaco A produca una riduzione della pressione sanguigna significativamente maggiore rispetto al Farmaco B.

👉Test t di Welch: Guida Completa con Esercizi Risolti per Studenti e Professionisti

Esercizio 6 (Avanzato)

Problema:

Analisi delle performance (in termini di accuratezza percentuale) di due algoritmi di machine learning su due dataset distinti:

  • Algoritmo X: [math]n_1=50[/math] (dataset 1), [math]\bar{x}_1=88\%[/math], [math]s_1=5\%[/math]
  • Algoritmo Y: [math]n_2=60[/math] (dataset 2), [math]\bar{x}_2=85\%[/math], [math]s_2=6\%[/math]

Verifica se l’Algoritmo X ha una performance significativamente migliore dell’Algoritmo Y ([math]\alpha=0.01[/math]). Assumi varianze disuguali.

Soluzione:

Ipotesi unidirezionali:

[math]H_0: \mu_X \leq \mu_Y[/math] (L’Algoritmo X non è migliore o è meno performante dell’Algoritmo Y)

[math]H_1: \mu_X > \mu_Y[/math] (L’Algoritmo X è significativamente migliore dell’Algoritmo Y – test unilaterale destro)

Gradi di libertà:

Le dimensioni dei campioni sono relativamente grandi, il che rende l’approssimazione dei gradi di libertà più stabile.

[math]\begin{align*} df&=\frac{(\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2})^2}{\frac{(s_1^2/n_1)^2}{n_1-1}+\frac{(s_2^2/n_2)^2}{n_2-1}}\\ &=\frac{(\frac{0.05^2}{50}+\frac{0.06^2}{60})^2}{\frac{(0.05^2/50)^2}{50-1}+\frac{(0.06^2/60)^2}{60-1}}\\ &=\frac{(\frac{0.0025}{50}+\frac{0.0036}{60})^2}{\frac{(0.00005)^2}{49}+\frac{(0.00006)^2}{59}}\\ &\approx\frac{(0.00005+0.00006)^2}{5.102 \times 10^{-11}+6.102 \times 10^{-11}}\approx\frac{(0.00011)^2}{1.1204 \times 10^{-10}}\\ &\approx\frac{1.21 \times 10^{-8}}{1.1204 \times 10^{-10}}\approx 107.99 \end{align*}[/math]

Si arrotonda per difetto: [math]df \approx 107[/math] (vicino all’approssimazione [math]df \approx 100[/math] data nell’input originale).

Statistica t:

Convertiamo le percentuali in decimali per il calcolo ([math]5\%=0.05[/math], etc.):

[math]\begin{align*} t&=\frac{\bar{x}_1-\bar{x}_2}{\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}}\\ &=\frac{0.88-0.85}{\sqrt{\frac{0.05^2}{50}+\frac{0.06^2}{60}}}\\ &=\frac{0.03}{\sqrt{\frac{0.0025}{50}+\frac{0.0036}{60}}}\\ &=\frac{0.03}{\sqrt{0.00005+0.00006}}=\frac{0.03}{\sqrt{0.00011}}\approx\frac{0.03}{0.01049}\approx 2.860 \end{align*}[/math]

Decisione:

Per un test unilaterale destro con [math]\alpha=0.01[/math] e [math]df=107[/math], il valore critico di t è [math]t_{0.01,107}\approx 2.366[/math].

Poiché [math]2.860 > 2.366[/math], la statistica test cade nella regione critica. Rifiutiamo [math]H_0[/math].

Conclusione: A un livello di significatività dell’1%, c’è sufficiente evidenza statistica per concludere che l’Algoritmo X ha una performance media significativamente migliore dell’Algoritmo Y.

Teoria chiave: t-test di Welch

Il t-test di Welch (anche noto come Welch-Satterthwaite test) è una versione modificata del t-test standard per due campioni indipendenti.

Quando usarlo:
È il test preferito per confrontare le medie di due gruppi indipendenti quando non si può assumere che le varianze delle popolazioni siano uguali (condizione di omoschedasticità). È anche robusto quando le dimensioni dei campioni sono diverse.

Forse potrebbe interessarti anche:  Test d'Ipotesi sulla Media con Varianza Nota: Esercizio Risolto e Spiegazione Dettagliata

Vantaggi:
Non richiede l’assunzione di omoschedasticità, a differenza del t-test standard che può portare a risultati inaffidabili se questa assunzione è violata e le dimensioni campionarie sono disuguali.

Formula della statistica t:

[math]t = \frac{\bar{x}_1 – \bar{x}_2}{\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}}[/math]

Questa formula è la stessa del t-test standard, ma l’interpretazione (i gradi di libertà) cambia.

Formula dei gradi di libertà:
L’approssimazione di Welch-Satterthwaite fornisce i gradi di libertà “effettivi”, che non sono necessariamente un numero intero (e che vengono poi arrotondati per difetto):

[math]\begin{align*} df&=\frac{(\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2})^2}{\frac{(s_1^2/n_1)^2}{n_1-1}+\frac{(s_2^2/n_2)^2}{n_2-1}} \end{align*}[/math]

Interpretazione:
Dopo aver calcolato la statistica t e i gradi di libertà, si confronta il valore assoluto della statistica t ottenuta con il valore critico dalla distribuzione t di Student con i gradi di libertà calcolati, o si calcola il p-value. Se il p-value è inferiore al livello di significatività [math]\alpha[/math] o il valore assoluto di t è maggiore del valore critico, si rifiuta l’ipotesi nulla [math]H_0[/math], concludendo che esiste una differenza statisticamente significativa tra le medie dei due gruppi.

Pubblicità