Services and Training for Six Sigma, Design of Experiments and Industrial Statistics

METODI NON PARAMETRICI PER DUE CAMPIONI DIPENDENTI

8.1. Test per 2 campioni dipendenti o per dati appaiati

Per confrontare l’effetto di due trattamenti in esperimenti di laboratorio o valutare se esiste una differenza significativa tra due situazioni in natura, è possibile usare i test statistici per due campioni. Essi possono essere dipendenti o indipendenti. Le loro caratteristiche distintive sono già state presentate ampiamente nel capitolo relativo al test t di Student.

In rapida sintesi, due gruppi di dati possono essere formati in due modi diversi:

1) utilizzando gli stessi individui o coppie di individui scelti come simili, misurati in due differenti situazioni, per cui ogni dato ha il relativo controllo;

2) con valori ricavati da individui di due gruppi diversi, per cui il confronto può essere solo complessivo.

La condizione sperimentale migliore per ottenere la potenza massima dal test è quella di utilizzare gli stessi soggetti, quindi due campioni dipendenti: si riduce la variabilità e le differenze tra i due gruppi sono imputabili più facilmente al fattore in esame.

Nell’altra condizione assume un peso rilevante il fatto che individui differenti sottoposti allo stesso stimolo spesso forniscono risposte molto variabili, che si somma all’effetto di uno stimolo differente. La varianza associata diventa grande e la differenza tra le due medie con probabilità maggiore non risulta significativa.

Nessun appaiamento ha variabilità d’errore minore di quello ottenuto per identità dell’oggetto.

Come già visto nel test t di Student, per quanto riguarda la metodologia dell’analisi statistica, con due campioni dipendenti si calcolano la differenze tra ogni coppia di dati e per l’inferenza si utilizza la serie di queste differenze.

Ma, a differenza di quanto considerato nel capitolo sul test t di Student, nella ricerca biologica, medica, farmacologica, ambientale ed ecologica, queste differenze non sempre possono essere valutate con una scala d’intervalli o di rapporti: in varie condizioni è possibile stimare solo il segno o la direzione della differenza. E’ tipico di analisi in realtà complesse poter indicare solo se la situazione è migliorata o peggiorata, senza poterne fornire una dimensione numerica.

In altri casi, l’informazione può raggiungere il livello di rango, affermando se la differenza è giudicata trascurabile, di livello medio o importante. In altre ancora, la scala è di intervalli o di rapporti, ma la distribuzione dei dati non rispetta le condizioni di validità richieste dalla statistica parametrica. Pertanto, si ricorre a test non parametrici.

Per inferenze sulla tendenza centrale di due campioni dipendenti, i test non parametrici più diffusi sono quattro:

- il test di McNemar,

- il test dei segni,

- il test T di Wilcoxon,

- il test di casualizzazione, detto anche test di permutazione.

Inoltre, per il test dei segni e il test T di Wilcoxon è possibile stimare

- l’intervallo di confidenza della tendenza centrale, che in questi casi riguarda la mediana (confidence interval for the population median)

con le stesse modalità illustrate nel capitolo precedente, dedicato ai test per un campione.

Il test di McNemar può essere utilizzato quando le variabili sono espresse in una scala nominale binaria. I dati raccolti sono conteggi di risposte positive o negative, espresse in due tempi diversi (prima e dopo). Sono riportati in una tabella 2x2, graficamente analoga a quella del c², ma da essa concettualmente differente.

Il test dei segni per due campioni dipendenti come metodologia è totalmente simile a quello per un campione (presentato nel capitolo precedente), poiché utilizza la serie delle differenze. Si ricorre al test dei segni quando per ogni coppia di dati, riferiti allo stesso individuo o caso, è possibile valutare solo il segno della differenza, cioè stabilire se la situazione è migliorata o peggiorata.

Il test T di Wilcoxon permette di verificare la stessa ipotesi del test dei segni, ma con una potenza maggiore. Si ricorre ad esso, quando si utilizza una misura con una informazione maggiore della precedente; cioè quando per ogni differenza è possibile determinare il rango.

Si ricorre al test di casualizzazione quando le risposte sono misurate in modo ancor più preciso, con una scala d'intervalli o di rapporti.

I tre ultimi metodi (segni, Wilcoxon, casualizzazione) sono del tutto analoghi a quelli già illustrati per un campione. Come nel test t di Student, si utilizza la colonna delle differenze (per stimare d) e l’ipotesi è fondata sulla sua significatività rispetto ad un valore atteso (d₀), che spesso è zero.

H₀: d = d₀