| ANALISI DELLA VARIANZA a piu’ criteri di classificazione
 
 11.2. confronto tra Analisi della varianza a due criteri e test t DI STUDENT per 2 campioni dipendenti 
 
 Quando si confrontano le medie di due soli trattamenti applicati agli stessi soggetti, quindi con valori riportati in una tabella con 2 trattamenti ed n blocchi, l'analisi della varianza a due criteri di classificazione fornisce i medesimi risultati del test t di Student per 2 campioni dipendenti, in riferimento al fattore principale. Un esempio permette di confrontare in modo didatticamente semplice e quindi di comprendere sia le due metodologie sia i risultati relativi. 
 Durante una giornata lavorativa (Giorno I), in una stazione di rilevamento sono state misurate le quantità di inquinamento dell'aria in 4 ore differenti; durante il successivo giorno festivo (Giorno II), sono state ripetute le misure alle stesse ore. La tabella riporta i valori rilevati nei due giorni alla stessa ora: 
 
 
 
 Esiste una differenza significativa nel tasso medio d’inquinamento tra i due giorni? 
 Risposta. Con i dati del quesito, è possibile utilizzare il test t di Student per 2 campioni dipendenti per verificare l’ipotesi nulla H0: d = 0 contro l’ipotesi alternativa bilaterale H1: d ¹ 0 
 Il metodo del test t di Student per 2 campioni dipendenti richiede che dapprima si calcoli la colonna delle differenze 
 
 
 
 sulle quali applicare le operazioni richieste dalla formula t(n-1) =
 
 Per una corretta comprensione del metodo, è importante evidenziare le due conseguenze determinate dall’uso delle differenze al posto dei valori rilevati: - i dati utilizzati nei calcoli sono resi indipendenti da quelli originari; - la varianza delle differenze, che possono essere viste come somma delle variazioni casuali delle coppie di dati quando l’ipotesi nulla è vera, è uguale alla somma delle varianze delle due serie di dati originali. 
 Dopo aver calcolato la media delle differenze 
 si stima la devianza 
 e da essa la varianza delle differenze 
 e la loro deviazione standard 
 Il valore di t con 3 gdl 
 risulta uguale a 13,28. 
 Dalle tavole del t di Student per una distribuzione a due code con 3 gdl si ricava - per a = 0.01, t = 5,841 - per a = 0.005, t = 7,453 - per a = 0.001, t = 12,941 Di conseguenza, si rifiuta l’ipotesi nulla con probabilità P< 0.001. 
 Con l'analisi della varianza a due criteri di classificazione, le ipotesi considerano - sia il confronto tra le medie dei due giorni con ipotesi nulla H0: mI = mII e ipotesi alternativa bilaterale H1: mI ¹ mII 
 - sia quello tra le medie delle 4 rilevazioni orarie con ipotesi nulla H0 : m6 = m10 = m14 = m18 e ipotesi alternativa H1: non tutte le 4 m dei blocchi sono tra loro uguali. 
 Dalle due serie di dati appaiati si calcolano i totali e le medie, sia quelle parziali che quella generale 
 
 
 
 La devianza totale con 7 gdl, calcolata come somma degli scarti al quadrato di ogni valore rispetto alla media totale, 
 risulta uguale a 3362. 
 La devianza tra giorni ha 1 gdl ed è 
 uguale a 1352. 
 La devianza tra ore ha 3 gdl e risulta 
 uguale a 1987. 
 La devianza d'errore con 3 gdl [7 - (1+3)] ed ottenuta per differenza 
 risulta uguale a 23. 
 Devianze e gdl possono essere riportati in tabella 
 
 
 
 Da essi sono stimate le 3 varianze necessarie ai due test F. 1) Per la differenza tra giorni si calcola un test F 
 con gdl 1 e 3, che risulta uguale a 176,36. Si può rifiutare l’ipotesi nulla alla stessa probabilità P < 0.001. 
 2) Per verificare la differenza tra ore si calcola un altro test F 
 con gdl 3 e 3, che risulta uguale a 86,40. Anche in questo caso si rifiuta l’ipotesi nulla, con probabilità P < 0.01 (valore critico uguale a 29,46). 
 Il confronto effettuato serve soprattutto per dimostrare che con 2 campioni test t e test F non solo permettono la stessa inferenza, ma forniscono anche risultati identici. Il valore di F che permette il confronto tra le medie dei due giorni fornisce una probabilità identica a quella del test t che verifica l’uguaglianza delle due medie giornaliere; ovviamente, coincidono anche i gdl che per il test F sono 1 e 3 e per il test t sono 3. Infatti, sulla base della relazione 
 si è ottenuto 
 
 Corrispondono anche i valori critici per la stessa probabilità. Infatti, come dimostrazione elementare e come caso di tutti i valori tabulati, - per t e per la prima colonna dei valori tabulati per F, è semplice verificare che per la probabilità a = 0.01 e gdl = 3 i cui valori critici sono rispettivamente - 5,841 per il test t - 34,12 per il test F  esiste la stessa
relazione           
 
 
 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Manuale di Statistica per la Ricerca e la Professione © Lamberto Soliani - Dipartimento di Scienze Ambientali, Università di Parma (apr 05 ed) ebook version by SixSigmaIn Team - © 2007 |