METODI NON PARAMETRICI PER DUE CAMPIONI INDIPENDENTI

9.8. Il test U di Mann-Whitney o dell'ordine robusto dei ranghi

Il test U di Mann-Whitney o test dell'ordine robusto dei ranghi deriva dalla proposta di H. B. Mann e D. R. Whitney di generalizzare il metodo di Wilcoxon (vedi il loro articolo On a test of whether one of two random variables is stochastically larger than the other, pubblicato su Annals of Mathematical Statistics, Vol. 18, pp. 50-60).

Il test non richiede alcuna ipotesi sulla simmetria dei due campioni. Può essere applicato quando essi hanno dimensioni diverse (come d’altronde il test di Wilcoxon nella versione presentata nel paragrafo precedente) e serve sempre per verificare la significatività della differenza tra le mediane.

Le ipotesi possono essere

- bilaterali

contro

- unilaterali in una direzione

contro

oppure nell’altra direzione

contro

dove sono rispettivamente la mediana del gruppo 1 e la mediana del gruppo 2.

A motivo della sua più estesa applicabilità, è preferibile al test di Wilcoxon-Mann-Whitney. Molti programmi informatici e testi di statistica applicata recenti riportano solo questo test e non riportano più il precedente, sebbene esso mantenga ancora una relativa diffusione internazionale e la sua conoscenza sia utile per capire articoli dei decenni scorsi.

La procedura del test U di Mann-Whitney è fondata sulle precedenze, che rappresentano l’altra metodologia più diffusa nei test non parametrici, alternativa ai ranghi.

Come già illustrato da Mann e Whitney nella loro prima presentazione (e come sarà in seguito dimostrato), è facile passare dal risultato di questo test a quello del test di Wilcoxon (come sarà spiegato nel paragrafo successivo).

Per illustrare questa metodologia è didatticamente utile avvalersi ancora dell’esempio utilizzato in precedenza:

A	B
92	156
114	123
82	198
164	83
167	242
110	176
135	185
---	217

Nel primo passaggio, la sequenza delle operazioni è simile:

1 - Combinare i dati dei due gruppi in un insieme unico, disponendo i valori o punteggi in ordine crescente, secondo il valore algebrico. Per ogni dato, conservare l'informazione relativa al gruppo di appartenenza.

82	83	92	110	114	123	135	156	164	167	176	185	198	217	242
A	B	A	A	A	B	A	B	A	A	B	B	B	B	B

Nel secondo iniziano le differenze

2 - Contare il numero di precedenze: quante volte ogni dato di un gruppo è preceduto da dati dell'altro gruppo.

Per esempio,

- il valore 82, che appartiene al gruppo A non è preceduto da alcun valore di B; di conseguenza il suo numero di precedenze è 0;

- i valori 92, 110 e 114 del gruppo A sono tutti tre preceduti da un valore di B (83); di conseguenza ognuno di questi tre valori come numero di precedenze ha 1.

Come indicatore, chiamato U, è stato scelto il numero minore di precedenze.

Con i dati dell’esempio, è corretto contare quante volte ogni dato di A è preceduto da dati di B. La somma di queste precedenze

82	83	92	110	114	123	135	156	164	167	176	185	198	217	242
A	B	A	A	A	B	A	B	A	A	B	B	B	B	B
0	---	1	1	1	---	2	---	3	3	---	---	---	---	---

è il valore di U

che risulta uguale a 11.

Si sarebbe anche potuto calcolare quante volte ogni valore del gruppo B è preceduto da valori di A

82	83	92	110	114	123	135	156	164	167	176	185	198	217	242
A	B	A	A	A	B	A	B	A	A	B	B	B	B	B
---	1	---	---	---	4	---	5	---	---	7	7	7	7	7

ottenendo un valore

uguale a 45, maggiore del precedente.

Il valore corretto dell’indice U è quello minore,

mentre quello maggiore deve essere indicato con U’.

3 - Quando le differenze tra U e U’ sono ridotte, non sempre è facile trovare subito il valore corretto. A questo scopo, è utile ricordare che U e U' sono legati dalla relazione

dove:

n₁ è il numero di dati del gruppo minore,

n₂ è il numero di dati del gruppo maggiore.

Con i dati dell'esempio, dove

n₁ = 7, n₂ = 8, U = 11, U’ = 45

si ottiene

Di conseguenza, è possibile calcolare un primo valore di U e, mediante la relazione, stimare l’altro.

Il valore da utilizzare, il vero U, è il valore minore tra i due.

Attraverso la relazione

può essere verificato facilmente, per escludere eventuali errori di calcolo.

4 - Nel caso in cui sia vera l'ipotesi H₁, quindi un campione abbia una mediana nettamente minore dell’altro, il valore di U tenderà a 0, poiché i dati del gruppo in esame, che deve fornire il totale minore, precederanno tutti i dati dell'altro gruppo e quindi ognuno di essi avrà 0 precedenze.

Nel caso in cui sia vera l'ipotesi H₀ di uguaglianza od identità delle due tendenze centrali, i dati dei due gruppi saranno casualmente mescolati: U tenderà ad un valore medio (), dipendente dal numero di osservazioni presenti n₁ e n₂ , secondo la relazione

m_U =

5 - Per valutare la significatività del valore di U si seguono metodi diversi, in funzione delle dimensioni dei due campioni.

Nel caso di piccoli campioni (n₁ e n₂ < 15), la tavola dei valori critici fornisce il valore di U significativo. Nella tabella sono riportati i valori critici alla probabilità a uguale a 0.05

- per test a due code nella parte superiore di ogni casella,

- per test a una coda nella parte inferiore.

E’ significativo qualunque valore di U calcolato che sia uguale o inferiore a quello riportato nella tabella.

Per n₁ = 7 e n₂ = 8 in un test ad una coda, il valore di U riportato nella tabella alla probabilità a = 0.05 è 13. Con i dati dell’esempio, il valore U calcolato (11) risulta inferiore a quello tabulato (13). Pertanto alla probabilità 0.05 si rifiuta l’ipotesi nulla e si accetta l’ipotesi alternativa: la mediana del primo gruppo è significativamente minore di quella del secondo gruppo.

Tavola dei valori critici di U del test Mann-Whitney

per 2 campioni indipendenti alla probabilità a £ 0.05

Valore critico per test a due code (2) nella parte superiore e per test a una coda (1) nella parte inferiore di ogni casella. U calcolato è significativo quando è uguale o minore del valore tabulato.

= campione con il numero minore di osservazioni.

= campione con il numero maggiore di osservazioni.

n₁	n₂	2	3	4	5	6	7	8	9	10	11	12	13	14	15
2	2	-	-	-	-	-	-	0	0	0	0	1	1	1	1
	1	-	-	-	0	0	0	1	1	1	1	2	2	3	3
3	2		-	-	0	1	1	2	2	3	3	4	4	5	5
	1		0	0	1	2	2	3	4	4	5	5	6	7	7
4	2			0	1	2	3	4	4	5	6	7	8	9	10
	1			1	2	3	4	5	6	7	8	9	10	11	12
5	2				2	3	5	6	7	8	9	11	12	13	14
	1				4	5	6	8	9	11	12	13	15	16	18
6	2					5	6	8	10	11	13	14	16	17	19
	1					7	8	10	12	14	16	17	19	21	23
7	2						8	10	12	14	16	18	20	22	24
	1						11	13	15	17	19	21	24	26	28
8	2							13	15	17	19	22	24	26	29
	1							15	18	20	23	26	28	31	33
9	2								17	20	23	26	28	31	34
	1								21	24	27	30	33	36	39
10	2									23	26	29	33	36	39
	1									27	31	34	37	41	44
11	2										30	33	37	40	44
	1										34	38	42	46	50
12	2											37	41	45	49
	1											42	47	51	55
13	2												45	50	54
	1												51	56	61
14	2													55	59
	1													61	66
15	2														64
	1														72

Tabella dei valori critici del test U di Mann-Whitney

(campioni di dimensioni diverse)

I valori della matrice triangolare superiore si riferiscono alla probabilità a = 0.05.

I valori della matrice triangolare inferiore si riferiscono alla probabilità a = 0.01.

Test a 1 coda


	5	6	7	8	9	10	11	12	13	14	15	16	17	18	19	20

5		5	6	8	9	11	12	13	15	16	18	19	20	22	23	25
6	2		8	10	12	14	16	17	19	21	23	25	26	28	30	32
7	3	4		13	15	17	19	21	24	26	28	30	33	35	37	39
8	4	6	7		18	20	23	26	28	31	33	36	39	41	44	47
9	5	7	9	11		24	27	30	33	36	39	42	45	48	51	54
10	6	8	11	13	16		31	34	37	41	44	48	51	55	58	62
11	7	9	12	15	18	22		38	42	46	50	54	57	61	65	69
12	8	11	14	17	21	24	28		47	51	55	60	64	68	72	77
13	9	12	16	20	23	27	31	35		56	61	65	70	75	80	84
14	10	13	17	22	26	30	34	38	43		66	71	77	82	87	92
15	11	15	19	24	28	33	37	42	47	51		77	83	88	94	100
16	12	16	21	26	31	36	41	46	51	56	61		89	95	101	107
17	13	18	23	28	33	38	44	49	55	60	66	71		102	109	115
18	14	19	24	30	36	41	47	53	59	65	70	76	82		116	123
19	15	20	26	32	38	44	50	56	63	69	75	82	88	94		130
20	16	22	28	34	40	47	53	60	67	73	80	87	93	100	107

Valori delle diagonali (campioni di uguali dimensioni).

₌	5	6	7	8	9	10	11	12	13	14	15	16	17	18	19	20
a = 0.05	4	7	11	15	21	27	34	42	51	61	72	83	96	109	123	138
a = 0.01	1	3	6	9	14	19	25	31	39	47	56	66	77	88	101	114

Tabella dei valori critici del test U di Mann-Whitney

(campioni di dimensioni diverse)

I valori della matrice triangolare superiore si riferiscono alla probabilità a = 0.05.

I valori della matrice triangolare inferiore si riferiscono alla probabilità a = 0.01.

Test a 2 code


	5	6	7	8	9	10	11	12	13	14	15	16	17	18	19	20

5		3	5	6	7	8	9	11	12	13	14	15	17	18	19	20
6	1		6	8	10	11	13	14	16	17	19	21	22	24	25	27
7	1	3		10	12	14	16	18	20	22	24	26	28	30	32	34
8	2	4	6		15	17	19	22	24	26	29	31	34	36	38	41
9	3	5	7	9		20	23	26	28	31	34	37	39	42	45	48
10	4	6	9	11	13		26	29	33	36	39	42	45	48	52	55
11	5	7	10	13	16	18		33	37	40	44	47	51	55	58	62
12	6	9	12	15	18	21	24		41	45	49	53	57	61	65	69
13	7	10	13	17	20	24	27	31		50	54	59	63	67	72	76
14	7	11	15	18	22	26	30	34	38		59	64	69	74	78	83
15	8	12	16	20	24	29	33	37	42	46		70	75	80	85	90
16	9	13	18	22	27	31	36	41	45	50	55		81	86	92	98
17	10	15	19	24	29	34	39	44	49	54	60	65		93	99	105
18	11	16	21	26	31	37	42	47	53	58	64	70	75		106	112
19	12	17	22	28	33	39	45	51	57	63	69	74	81	87		119
20	13	18	24	30	36	42	48	54	60	67	73	79	86	92	99

Valori delle diagonali (campioni di uguali dimensioni).

N_{1 =} n₂	5	6	7	8	9	10	11	12	13	14	15	16	17	18	19	20
a = 0.05	2	5	8	13	17	23	30	37	45	55	64	75	87	99	113	127
a = 0.01	0	2	4	7	11	16	21	27	34	42	51	60	70	81	93	105

Ai fini dell’inferenza il confronto è tra le mediane, anche se non è necessario calcolarle.

Quando sono presenti valori identici (ties), si deve assegnare il rango medio e stimare il numero di precedenze come media dei diversi ranghi possibili.

Nel caso di piccoli campioni non dovrebbero essere presenti valori identici, come richiesto dalla condizione che la scala sia continua. Valori identici (ties) non alterano la media, ma abbassano il valore della varianza, che non viene considerata quando si deve ricorrere alla tabella dei valori critici per piccoli campioni.

Un numero molto limitato di valori ex-aequo incide in modo trascurabile sulla stima della significatività; pertanto nella prassi viene abitualmente accettato il valore che non considera la correzione, che invece può essere utile nel caso di grandi campioni.

Nel caso di grandi campioni (n₁ o n₂ > 15), se è vera l'ipotesi nulla H₀ la distribuzione di campionamento di U è bene approssimato dalla distribuzione normale, con media 0 e varianza unitaria:

Z =

dove U è lo stimatore osservato,

- è il suo valore atteso nell'ipotesi H₀

m_U =

- e la deviazione standard è

Con i dati dell'esempio, U è risultato uguale a 11,

mentre

è uguale a 28

e la deviazione standard

è uguale a 8,64.

La significatività della differenza tra le mediane dei due gruppi indipendenti può essere stimata mediante il valore di Z

che risulta uguale a -1,967.

Nella distribuzione normale a Z = 1,967 in una coda della distribuzione corrisponde una probabilità leggermente inferiore a 0.0250.

Si rifiuta l'ipotesi nulla e si accetta l'ipotesi alternativa di una minore presenza di solventi aromatici dispersi nell'aria della città, durante i giorni festivi.

Il valore di Z risulta sempre negativo e non assume un significato preciso, in quanto U è sempre inferiore alla media attesa m_U.

Il test U ipotizza che la scala utilizzata sia continua ; quindi che le osservazione ex-aequo non esistano o abbiano una presenza molto limitata.

In caso di ties, ad ogni gruppo di punteggi uguali sarà assegnata la media del gruppo. La presenza di valori identici non altera la media ma modifica la varianza.

Nel caso di grandi campioni ed il ricorso alla distribuzione normale, la deviazione standard diventa

dove:

N è eguale a

è dato da:

con ex-aequo dello stesso rango.

La correzione riduce il valore della deviazione standard ed aumenta proporzionalmente il valore di Z. Se non si introduce la correzione, il valore di Z risulta minore e quindi è più difficile raggiungere la significatività; si dice anche che, senza correzione, il test risulta più conservativo. Di norma anche molti valori simili determinano una correzione ridotta: una sola serie molto lunga di valori identici ha effetti maggiori di molti valori ripetuti solo due o tre volte.

ESEMPIO. Per verificare se un’area montana (M) ha avuto una quantità di piogge significativamente superiore a quella di un’area collinare ( C ) limitrofa si confrontano due serie mensili (in millimetri):

AREA M	AREA C
78	43
130	58
93	69
110	96
---	72
---	85

La quantità mediana di pioggia caduta nell’area montana è significativamente superiore a quella dell’area collinare?

Risposta.

E’ un test ad una coda, con le seguenti ipotesi sulle mediane

H₀: Me_M £ Me_C H₁: Me_M > Me_C

Per applicare il test, effettuare i seguenti passaggi operativi:

1 - Ordinare i valori, conservando l’informazione del gruppo d’appartenenza.

43	58	69	72	78	85	93	96	110	130
C	C	C	C	M	C	M	C	M	M

2 - Riportare le precedenze e sommarle, determinando U

43	58	69	72	78	85	93	96	110	130
C	C	C	C	M	C	M	C	M	M
0	0	0	0	---	1	---	2	---	---

che risulta uguale a 3.

Per n₁ = 4 e n₂ = 6, il valore critico riportato nella tabella per un test unilaterale alla probabilità a = 0.05 risulta uguale a 3. Il valore calcolato è uguale a quello riportato nella tabella: il test risulta significativo e si rifiuta l’ipotesi nulla.