TEST NON PARAMETRICI

PER PIU' CAMPIONI

 

 

15.9.   ESTENSIONE DEL TEST DI McNEMAR O TEST DI BOWKER

 

 

Quando, con due campioni dipendenti le risposte non sono binarie ma hanno tre o più modalità, si costruisce una tabella quadrata N x N per analizzare la simmetria ai lati della diagonale. E’ il test proposto da  A. H. Bowker nel 1948 (con l’articolo A test for simmetry in contingency tables pubblicato su J. Amer. Statist. Assoc., 43, pp. 572-4) per verificare, come permette il test di Mc Nemar con risposte binarie, l’ipotesi che nel confronto tra due situazioni sia avvenuto un cambiamento significativo nella frequenza delle varie modalità. Tra i testi di statistica non parametrica a maggior diffusione, questo metodo è presentato da P. Sprent nel volume Applied nonparametric statistical methods, (second Edition, Chapman & Hall, London, 1993, pp. 239-240).

 

Nella ricerca ambientale, si ricorre al test di Bowker nel caso in cui si confrontano le risposte multiple (non binarie) delle stesse persone prima e dopo uno stimolo o i differenti effetti di due sostanze tossiche, somministrate allo stesso gruppo di cavie. E’ un approccio diverso dal Q di Cochran, poiché in questo caso le risposte sono date non una volta sola ma due volte (prima e dopo l’evento) e esse sono di tipo ordinale, non binario.

 

Si supponga che un’amministrazione comunale abbia deciso la chiusura del centro storico al traffico automobilistico.

Prima della delibera è stato fatto un sondaggio nominativo su un campione di individui residenti nella zona storica, deducendo da una serie di risposte se erano favorevoli, incerti o contrari.

Dopo due mesi di applicazione del divieto, il test è stato ripetuto sugli stessi individui.

 

La sottostante tabella 3 x 3 riporta il numero di individui per ognuna delle 9 combinazioni di risposte.


 

 

 

DOPO

 

 

Favorevoli

Incerti

Contrari

 

PRIMA

Favorevoli

85

16

35

Incerti

28

34

25

Contrari

54

39

74

 

 

La diagonale fornisce il numero di coloro che hanno mantenuto lo stesso parere, mentre le altre caselle riportano il numero di coloro che lo hanno cambiato in una direzione oppure nell’altra. Si vuole sapere se esistono differenze statisticamente significative tra prima e dopo.

Una indicazione preliminare, solo descrittiva, può essere fornita dai totali marginali

 

 

 

DOPO

 

 

 

Favorevoli

Incerti

Contrari

TOTALI

 

PRIMA

Favorevoli

85

16  (a)

35  (b)

136

Incerti

28  (a)

34

25  (c)

87

Contrari

54  (b)

39  (c)

74

167

 

TOTALI

167

89

134

390

 

 

 dai quali risulta che i favorevoli sono aumentati da 136 (prima) a 167  (dopo) e quelli incerti sono aumentati da 87 (prima ) a 89 (dopo) mentre i contrari sono diminuiti da 167 (prima) a 134 (dopo).

Ma, trattandosi di due campioni dipendenti, come per il test di Mc Nemar la risposta per l’inferenza è fornita da quelli che hanno cambiato parere (in grassetto nella tabella).

Il test presentato da Bowker confronta le frequenze distribuite che sono in modo simmetrico rispetto alla diagonale: se HO è vera, dovrebbero essere approssimativamente uguali.

 

I concetti ed il metodo sono semplici e possono essere descritti in 4 passaggi logici.

 

1 - Se non è intervenuto nessun mutamento sistematico nelle opinioni espresse dagli intervistati (H0 vera),

a)       coloro che prima erano Incerti e dopo sono diventati Favorevoli (28) dovrebbero essere equivalenti a quelli che prima erano Favorevoli e dopo Incerti (16);

b)       coloro che prima erano Contrari e dopo Favorevoli (54) dovrebbero essere equivalenti a quelli che prima erano Favorevoli e dopo sono Contrari (35);

c)         coloro che prima erano Contrari e dopo Incerti (39) dovrebbero essere equivalenti a quelli che prima erano Incerti e dopo Contrari (25).

 

In modo più formale, l’ipotesi nulla è

H0: pij = pji

 contro l’ipotesi alternativa

H1: pij ¹ pji

 con esclusione dei valori della diagonale.

 

2 – Il confronto è effettuato mediante un c2 che considera la differenza tra la frequenza assoluta di una casella non collocata sulla diagonale e quella ad essa simmetrica,

 con una formula

 =

 dove

-          la sommatoria è estesa a tutti gli i da 1 a n-1 ma solo con  j > i,

 

Con i dati dell’esempio, si ottiene

 

 un valore uguale a 10,85

 

3 –  Sotto l’ipotesi nulla di simmetria dei dati, la distribuzione asintotica (teoricamente, per un numero n di dati tendente all’infinito; in pratica per n sufficientemente grande) è un chi quadrato con gdl

gdl =

Con i dati dell’esempio, i gdl

gdl = = 3

 

 sono 3, corrispondenti alle 3 somme fatte o 3 coppie di valori a confronto (indicate con a, b, c, nella tabella), derivanti dalla combinazione

 

4 -  Poiché il valore del chi quadrato con 3 gdl

-          alla probabilità a = 0.05 è uguale a 7,815,

-          alla probabilità a = 0.01 è uguale a 11,345,

 si rifiuta l’ipotesi nulla, con una probabilità P inferiore a a = 0.05.

 

ESEMPIO. Per valutare l’impatto di una discarica sulla popolazione residente in un comune, prendendo un campione nominativo è stato fatta un’indagine sulla percezione di odori sgradevoli, fornendo 4 livelli di risposta: mai, di rado, spesso, sempre.

Dopo un anno, l’indagine è stata ripetuta sugli stessi individui con i seguenti risultati complessivi:

 

 

 

DOPO

 

 

Mai

Di rado

Spesso

Sempre

 

PRIMA

Mai

25

86

97

25

Di rado

65

78

54

33

Spesso

58

47

68

28

Sempre

12

39

17

14

 

Si può sostenere che l’intervento ha modificato la situazione in modo statisticamente significativo?

 

Risposta.  Indicando la posizione dei dati (esclusa la diagonale) con Xij come nella tabella

 

 

 

DOPO

 

 

Mai

Di rado

Spesso

Sempre

 

PRIMA

Mai

25

86   X1,2

97   X1,3

25   X1,4

Di rado

65   X2,1

78

54   X2,3

33   X2,4

Spesso

58   X3,1

47   X3,2

68

28   X3,4

Sempre

12   X4,1

39   X4,2

17   X4,3

14

 

Il metodo si fonda su quattro passaggi logici:

 

1- per verificare l’ipotesi nulla

H0: pij = pji

 contro l’ipotesi alternativa

H1: pij ¹ pji

 per tutti gli i da 1 a n-1 con  j > i,

 il confronto è tra i valori a destra della diagonale con quelli a sinistra, che occupano la posizione simmetrica (esempio X1,2 contro X2,1   e   X2,4 contro X4,2… );

 

2 - con la formula

 =

 

 in cui la sommatoria è estesa a tutti gli i da 1 a n-1 con  j > i

 si calcola un valore del chi quadrato

 

 

= = 2,92 + 9,81 + 4,57 + 0,49 + 0,50 + 2,69 = 20,98

 

 che risulta uguale a 20,98.

 

3 – Con il rapporto

gdl =

 applicato alla matrice 4 x 4

gdl =

 

 si stimano 6 gdl, che corrispondono al numero di coppie di dati a confronto, cioè la combinazione

 

 

 

4 – Infine, poiché il valore critico del chi quadrato con 6 gdl

-          alla probabilità a = 0.05 è uguale a 12,592 e

-          alla probabilità  a = 0.01 è uguale a 16,815

 si rifiuta l’ipotesi nulla, con una probabilità P inferiore a 0.01.

 

 

 

Manuale di Statistica per la Ricerca e la Professione  © Lamberto Soliani   - Dipartimento di Scienze Ambientali, Università di Parma  (apr 05 ed)  ebook version by SixSigmaIn Team  - © 2007