Statistica multivariata: esercizi svolti sulla retta di regressione

Generic selectors
Exact matches only
Search in title
Search in content
Post Type Selectors

Statistica multivariata

Esercizio 1

Si considerino i seguenti dati campionari, raccolti per stimare il tempo che impiega un computer a processare dati: x é il numero di “dati” e y il tempo, in secondi, impiegato dal computer per processarli.

Esercizi svolti di statistica multivariata

a. Si tracci uno scatterplot dei dati.
b. Si calcoli il coefficiente di correlazione tra le variabili.
c. Si scriva l’ equazione della retta di regressione e la si disegni sullo scatterplot
d. Si calcoli il tempo previsto per processare 200, 300, 400, 500 dati.

Soluzione

a.

Nella seguente figura sono rappresentati lo scatterplot e la retta di regressione.

Forse potrebbe interessarti anche:  Statistica Descrittiva: Lo scatterplot e il Bubblechart

Esercizi svolti di statistica multivariata lo scatterplot e la retta di regressione

b.

Per determinare il coefficiente di correlazione, calcoliamo prima le seguenti quantità:

Forse potrebbe interessarti anche:  La correlazione tra variabili: il coefficiente di correlazione

Calcolo del coefficiente di correlazione

calcolo del coefficiente di correlazione

II coefficiente di correlazione σxy vale quindi 0.94298.

c.

Per determinare i coefficienti della retta di regressione y= ax + b usiamo le formule che puoi trovare qui:

Forse potrebbe interessarti anche:  La retta di regressione lineare

ed i calcoli del punto precedente per trovare:

Esercizi svolti di statistica multivariata la retta di regressione

d.

Inserendo i valori nella retta di regressione si ottiene:

 

Esercizio 2

La direzione di una catena di fast-food ha effettuato una rilevazione dei costi in migliaia di euro (Y) in relazione alle presenze giornaliere in migliaia di unità (X), i risultati sono riportati in tabella

Disegnare il grafico di dispersione
Determinare la retta di regressione
Disegnare la retta di regressione

Soluzione

Costruiamo la seguente tabella che ci permetterà di conoscere i dati che interessano:

Calcoliamo le medie x e y

L’equazione della retta di regressione è  y = b1x + b0

Dove il valore di b0 si calcola  come il rapporto tra la covarianza e la varianza.

Dunque:

Rappresentiamo ora il grafico di dispersione e la retta di regressione.
Disponiamo un opportuno diagramma cartesiano, con x che va da 0 al valore massimo 4; y va da 0 al valore massimo 17.

Esercizi svolti di statistica multivariata llo scatterplot

Per rappresentare la retta di regressione individuiamo almeno due punti della retta; assegniamo dei valori alla x e ricaviamo i corrispondenti valori di y. Assegniamo a x dei valori che sono tra quelli che abbiamo già rappresentato, cioè tra 0 e 4.

I punti da rappresentare hanno coordinate A(1,5), B(4,17)

Esercizio 3

I seguenti dati di deformazione laterale (ey) e longitudinale (ex) sono stati ottenuti sottoponendo a sforzo delle sbarre fabbricate con una
lega sperimentale:

a. Disegnare uno scatterplot delle precedent! osservazioni, disponendo εx e εy rispettivamente, sull’asse x e y
b. Calcolare il coefficiente di correlazione delle variabili εx e εy.
c. In base ai punti a. e b., è ragionevole supporre che sussista una relazione lineare tra le variabili εx e εy

d. Usare il metodo dei minimi quadrati per determinare la retta di regressione, e disegnarne il grafico sullo scatterplot delle due variabili.
e. Usare la retta di regressione trovata per predire la deformazione laterale corrispondente a una deformazione longitudinale pari a εx = 0.35, oppure a εx = 0.8. Quale delle due previsioni ritenete più affidabile? Perché?

Soluzione

a.

Nella seguente figura sono rappresentati lo scatterplot e la retta di regressione.

b.

Come nell’esercizio precedente calcoliamo le quantità:

II coefficiente di correlazione ρxy vale quindi 0.98599.

c.

Poiché ρxy molto vicino a l è ragionevole che sussista una relazione tra le variabili εx e εy

d.

Per determinare i coefficienti della retta di regressione y = ax + b procediamo come nell’esercizio precedente:

e.

per εx = 0.35 si ha

εy = -0.01 + 0.37 • 0.35 = 0.1195

mentre per εx = 0.8 si ha

εy = —0.01 + 0.37 • 0.8 = 0.286.

La previsione più affidabile è quella relativa al valore εx = 0.35 poiché è più vicino ai valori di εx già osservati.