METODI NON PARAMETRICI PER DUE CAMPIONI INDIPENDENTI

 

 

 

9.8.   Il test U di Mann-Whitney o dell'ordine robusto dei ranghi

 

 

Il test U di Mann-Whitney o test dell'ordine robusto dei ranghi deriva dalla proposta di H. B. Mann e D. R. Whitney di generalizzare il metodo di Wilcoxon (vedi il loro articolo On a test of whether one of two random variables is stochastically larger than the other, pubblicato su Annals of Mathematical Statistics, Vol. 18, pp. 50-60).

Il test non richiede alcuna ipotesi sulla simmetria dei due campioni. Può essere applicato quando essi hanno dimensioni diverse (come d’altronde il test di Wilcoxon nella versione presentata nel paragrafo precedente) e serve sempre per verificare la significatività della differenza tra le mediane.

 

Le ipotesi possono essere

-          bilaterali

 

     contro    

 

-          unilaterali in una direzione

     contro    

  oppure  nell’altra direzione

     contro    

 dove  sono rispettivamente la mediana del gruppo 1 e la mediana del gruppo 2.

 

A motivo della sua più estesa applicabilità, è preferibile al test di Wilcoxon-Mann-Whitney. Molti programmi informatici e testi di statistica applicata recenti riportano solo questo test e non riportano più il precedente, sebbene esso mantenga ancora una relativa diffusione internazionale e la sua conoscenza sia utile per capire articoli dei decenni scorsi.

La procedura del test U di Mann-Whitney è fondata sulle precedenze, che rappresentano l’altra metodologia più diffusa nei test non parametrici, alternativa ai ranghi.

Come già illustrato da Mann e Whitney nella loro prima presentazione (e come sarà in seguito dimostrato), è facile passare dal risultato di questo test a quello del test di Wilcoxon (come sarà spiegato nel paragrafo successivo).

Per illustrare questa metodologia è didatticamente utile avvalersi ancora dell’esempio utilizzato in precedenza:


 

 

A

B

92

156

114

123

82

198

164

83

167

242

110

176

135

185

---

217

 

 

Nel primo passaggio, la sequenza delle operazioni è simile:

 

1 - Combinare i dati dei due gruppi in un insieme unico, disponendo i valori o punteggi in ordine crescente, secondo il valore algebrico. Per ogni dato, conservare l'informazione relativa al gruppo di appartenenza.

 

82

83

92

110

114

123

135

156

164

167

176

185

198

217

242

A

B

A

A

A

B

A

B

A

A

B

B

B

B

B

 

 

Nel secondo iniziano le differenze

2 - Contare il numero di precedenze: quante volte ogni dato di un gruppo è preceduto da dati dell'altro gruppo.

Per esempio,

-          il valore 82, che appartiene al gruppo A non è preceduto da alcun valore di B; di conseguenza il suo numero di precedenze è 0;

-          i valori 92, 110 e 114 del gruppo A sono tutti tre preceduti da un valore di B (83); di conseguenza ognuno di questi tre valori come numero di precedenze ha 1.

Come indicatore, chiamato U, è stato scelto il numero minore di precedenze.

 

Con i dati dell’esempio, è corretto contare quante volte ogni dato di A è preceduto da dati di B. La somma di queste precedenze


 

82

83

92

110

114

123

135

156

164

167

176

185

198

217

242

A

B

A

A

A

B

A

B

A

A

B

B

B

B

B

0

---

1

1

1

---

2

---

3

3

---

---

---

---

---

 

 è il valore di U

 che risulta uguale a 11.

 

Si sarebbe anche potuto calcolare quante volte ogni valore del gruppo B è preceduto da valori di A

 

82

83

92

110

114

123

135

156

164

167

176

185

198

217

242

A

B

A

A

A

B

A

B

A

A

B

B

B

B

B

---

1

---

---

---

4

---

5

---

---

7

7

7

7

7

 

 ottenendo un valore

 uguale a 45, maggiore del precedente.

Il valore corretto dell’indice U è quello minore,

 mentre quello maggiore deve essere indicato con U’.

 

3 - Quando le differenze tra U e U’ sono ridotte, non sempre è facile trovare subito il valore corretto. A questo scopo, è utile ricordare che U e U' sono legati dalla relazione

 

dove:

         n1 è il numero di dati del gruppo minore,

         n2 è il numero di dati del gruppo maggiore.

 

Con i dati dell'esempio, dove

  n1 = 7,   n2 = 8,   U = 11,   U’ = 45

 si ottiene

Di conseguenza, è possibile calcolare un primo valore di U e, mediante la relazione, stimare l’altro.

 

Il valore da utilizzare, il vero U, è il valore minore tra i due.

Attraverso la relazione

 

 può essere verificato facilmente, per escludere eventuali errori di calcolo.

 

4 - Nel caso in cui sia vera l'ipotesi H1, quindi un campione abbia una mediana nettamente minore dell’altro, il valore di U tenderà a 0, poiché i dati del gruppo in esame, che deve fornire il totale minore, precederanno tutti i dati dell'altro gruppo e quindi ognuno di essi avrà 0 precedenze.

Nel caso in cui sia vera l'ipotesi H0 di uguaglianza od identità delle due tendenze centrali, i dati dei due gruppi saranno casualmente mescolati: U tenderà ad un valore medio (), dipendente dal numero di osservazioni presenti n1 e n2 , secondo la relazione

 

mU =

 

5 - Per valutare la significatività del valore di U si seguono metodi diversi, in funzione delle dimensioni dei due campioni.

 

Nel caso di piccoli campioni (n1 e n2 < 15), la tavola dei valori critici fornisce il valore di U significativo. Nella tabella sono riportati i valori critici alla probabilità a uguale a 0.05

-           per test a due code nella parte superiore di ogni casella,

-           per test a una coda nella parte inferiore.

E’ significativo qualunque valore di U calcolato che sia uguale o inferiore a quello riportato nella tabella.

 

Per n1 = 7  e  n2 = 8 in un test ad una coda, il valore di U riportato nella tabella alla probabilità a = 0.05 è 13. Con i dati dell’esempio, il valore U calcolato (11) risulta inferiore a quello tabulato (13). Pertanto alla probabilità 0.05 si rifiuta l’ipotesi nulla e si accetta l’ipotesi alternativa: la mediana del primo gruppo è significativamente minore di quella del secondo gruppo.

 


 

Tavola dei valori critici di U del test Mann-Whitney

per 2 campioni indipendenti alla probabilità a £ 0.05

 

Valore critico per test a due code (2) nella parte superiore e per test a una coda (1) nella parte inferiore di ogni casella. U calcolato è significativo quando è uguale o minore del valore tabulato.

 = campione con il numero minore di osservazioni.

 = campione con il numero maggiore di osservazioni.

 

n1

n2

2

3

4

5

6

7

8

9

10

11

12

13

14

15

2

2

-

-

-

-

-

-

0

0

0

0

1

1

1

1

 

1

-

-

-

0

0

0

1

1

1

1

2

2

3

3

3

2

 

-

-

0

1

1

2

2

3

3

4

4

5

5

 

1

 

0

0

1

2

2

3

4

4

5

5

6

7

7

4

2

 

 

0

1

2

3

4

4

5

6

7

8

9

10

 

1

 

 

1

2

3

4

5

6

7

8

9

10

11

12

5

2

 

 

 

2

3

5

6

7

8

9

11

12

13

14

 

1

 

 

 

4

5

6

8

9

11

12

13

15

16

18

6

2

 

 

 

 

5

6

8

10

11

13

14

16

17

19

 

1

 

 

 

 

7

8

10

12

14

16

17

19

21

23

7

2

 

 

 

 

 

8

10

12

14

16

18

20

22

24

 

1

 

 

 

 

 

11

13

15

17

19

21

24

26

28

8

2

 

 

 

 

 

 

13

15

17

19

22

24

26

29

 

1

 

 

 

 

 

 

15

18

20

23

26

28

31

33

9

2

 

 

 

 

 

 

 

17

20

23

26

28

31

34

 

1

 

 

 

 

 

 

 

21

24

27

30

33

36

39

10

2

 

 

 

 

 

 

 

 

23

26

29

33

36

39

 

1

 

 

 

 

 

 

 

 

27

31

34

37

41

44

11

2

 

 

 

 

 

 

 

 

 

30

33

37

40

44

 

1

 

 

 

 

 

 

 

 

 

34

38

42

46

50

12

2

 

 

 

 

 

 

 

 

 

 

37

41

45

49

 

1

 

 

 

 

 

 

 

 

 

 

42

47

51

55

13

2

 

 

 

 

 

 

 

 

 

 

 

45

50

54

 

1

 

 

 

 

 

 

 

 

 

 

 

51

56

61

14

2

 

 

 

 

 

 

 

 

 

 

 

 

55

59

 

1

 

 

 

 

 

 

 

 

 

 

 

 

61

66

15

2

 

 

 

 

 

 

 

 

 

 

 

 

 

64

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

72

 

Tabella dei valori critici del test U di Mann-Whitney

(campioni di dimensioni diverse)

 

I valori della matrice triangolare superiore si riferiscono alla probabilità a = 0.05.

I valori della matrice triangolare inferiore si riferiscono alla probabilità a = 0.01.

 

Test a 1 coda

 

 

 

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

 

5

 

5

6

8

9

11

12

13

15

16

18

19

20

22

23

25

6

2

 

8

10

12

14

16

17

19

21

23

25

26

28

30

32

7

3

4

 

13

15

17

19

21

24

26

28

30

33

35

37

39

8

4

6

7

 

18

20

23

26

28

31

33

36

39

41

44

47

9

5

7

9

11

 

24

27

30

33

36

39

42

45

48

51

54

10

6

8

11

13

16

 

31

34

37

41

44

48

51

55

58

62

11

7

9

12

15

18

22

 

38

42

46

50

54

57

61

65

69

12

8

11

14

17

21

24

28

 

47

51

55

60

64

68

72

77

13

9

12

16

20

23

27

31

35

 

56

61

65

70

75

80

84

14

10

13

17

22

26

30

34

38

43

 

66

71

77

82

87

92

15

11

15

19

24

28

33

37

42

47

51

 

77

83

88

94

100

16

12

16

21

26

31

36

41

46

51

56

61

 

89

95

101

107

17

13

18

23

28

33

38

44

49

55

60

66

71

 

102

109

115

18

14

19

24

30

36

41

47

53

59

65

70

76

82

 

116

123

19

15

20

26

32

38

44

50

56

63

69

75

82

88

94

 

130

20

16

22

28

34

40

47

53

60

67

73

80

87

93

100

107

 

 

 

Valori delle diagonali (campioni di uguali dimensioni).

 

 =

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

a = 0.05

4

7

11

15

21

27

34

42

51

61

72

83

96

109

123

138

a = 0.01

1

3

6

9

14

19

25

31

39

47

56

66

77

88

101

114

 

 


 

Tabella dei valori critici del test U di Mann-Whitney

(campioni di dimensioni diverse)

 

I valori della matrice triangolare superiore si riferiscono alla probabilità a = 0.05.

I valori della matrice triangolare inferiore si riferiscono alla probabilità a = 0.01.

 

Test a 2 code

 

 

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

 

5

 

3

5

6

7

8

9

11

12

13

14

15

17

18

19

20

6

1

 

6

8

10

11

13

14

16

17

19

21

22

24

25

27

7

1

3

 

10

12

14

16

18

20

22

24

26

28

30

32

34

8

2

4

6

 

15

17

19

22

24

26

29

31

34

36

38

41

9

3

5

7

9

 

20

23

26

28

31

34

37

39

42

45

48

10

4

6

9

11

13

 

26

29

33

36

39

42

45

48

52

55

11

5

7

10

13

16

18

 

33

37

40

44

47

51

55

58

62

12

6

9

12

15

18

21

24

 

41

45

49

53

57

61

65

69

13

7

10

13

17

20

24

27

31

 

50

54

59

63

67

72

76

14

7

11

15

18

22

26

30

34

38

 

59

64

69

74

78

83

15

8

12

16

20

24

29

33

37

42

46

 

70

75

80

85

90

16

9

13

18

22

27

31

36

41

45

50

55

 

81

86

92

98

17

10

15

19

24

29

34

39

44

49

54

60

65

 

93

99

105

18

11

16

21

26

31

37

42

47

53

58

64

70

75

 

106

112

19

12

17

22

28

33

39

45

51

57

63

69

74

81

87

 

119

20

13

18

24

30

36

42

48

54

60

67

73

79

86

92

99

 

 

 

Valori delle diagonali (campioni di uguali dimensioni).

 

N1 = n2

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

a = 0.05

2

5

8

13

17

23

30

37

45

55

64

75

87

99

113

127

a = 0.01

0

2

4

7

11

16

21

27

34

42

51

60

70

81

93

105

 


 

Ai fini dell’inferenza il confronto è tra le mediane, anche se non è necessario calcolarle.

 

Quando sono presenti valori identici (ties), si deve assegnare il rango medio e stimare il numero di  precedenze come media dei diversi ranghi possibili.

Nel caso di piccoli campioni non dovrebbero essere presenti valori identici, come richiesto dalla condizione che la scala sia continua. Valori identici (ties) non alterano la media, ma abbassano il valore della varianza, che non viene considerata quando si deve ricorrere alla tabella dei valori critici per piccoli campioni.

Un numero molto limitato di valori ex-aequo incide in modo trascurabile sulla stima della significatività; pertanto nella prassi viene abitualmente accettato il valore che non considera la correzione, che invece può essere utile nel caso di grandi campioni.

 

 

Nel caso di grandi campioni (n1 o n2 > 15), se è vera l'ipotesi nulla H0 la distribuzione di campionamento di U è bene approssimato dalla distribuzione normale, con media 0 e varianza unitaria:

Z =

dove U è lo stimatore osservato,

-           è il suo valore atteso nell'ipotesi H0

mU =

-          e la deviazione standard  è

 

Con i dati dell'esempio, U è risultato uguale a 11,

 mentre

 è uguale a 28

 e la deviazione standard

è uguale a 8,64.

La significatività della differenza tra le mediane dei due gruppi indipendenti può essere stimata mediante il valore di Z

che risulta uguale a -1,967.

Nella distribuzione normale a Z = 1,967 in una coda della distribuzione corrisponde una probabilità leggermente inferiore a 0.0250.

Si rifiuta l'ipotesi nulla e si accetta l'ipotesi alternativa di una minore presenza di solventi aromatici dispersi nell'aria della città, durante i giorni festivi.

Il valore di Z risulta sempre negativo e non assume un significato preciso, in quanto U è sempre inferiore alla media attesa mU.

 

Il test U ipotizza che la scala utilizzata sia continua ; quindi che le osservazione ex-aequo non esistano o abbiano una presenza molto limitata.

In caso di ties, ad ogni gruppo di punteggi uguali sarà assegnata la media del gruppo. La presenza di valori identici non altera la media ma modifica la varianza.

Nel caso di grandi campioni ed il ricorso alla distribuzione normale, la deviazione standard   diventa

 dove:

         N è eguale a

          è dato da:

con    ex-aequo dello stesso rango.

 

La correzione riduce il valore della deviazione standard ed aumenta proporzionalmente il valore di Z. Se non si introduce la correzione, il valore di Z risulta minore e quindi è più difficile raggiungere la significatività; si dice anche che, senza correzione, il test risulta più conservativo. Di norma anche molti valori simili determinano una correzione ridotta: una sola serie molto lunga di valori identici ha effetti maggiori di molti valori ripetuti solo due o tre volte.

 

 

ESEMPIO. Per verificare se un’area montana (M) ha avuto una quantità di piogge significativamente superiore a quella di un’area collinare  ( C ) limitrofa si confrontano due serie mensili (in millimetri):

 

AREA

M

AREA

C

78

43

130

58

93

69

110

96

---

72

---

85

 

La quantità mediana di pioggia caduta nell’area montana è significativamente superiore a quella dell’area collinare?

 

Risposta.

E’ un test ad una coda, con le seguenti ipotesi sulle mediane

H0: MeM £ MeC        H1: MeM > MeC

 

Per applicare il test, effettuare i seguenti passaggi operativi:

 

1 - Ordinare i valori, conservando l’informazione del gruppo d’appartenenza.

 

43

58

69

72

78

85

93

96

110

130

C

C

C

C

M

C

M

C

M

M

 

 

2 - Riportare le precedenze e sommarle, determinando U

 

43

58

69

72

78

85

93

96

110

130

C

C

C

C

M

C

M

C

M

M

0

0

0

0

---

1

---

2

---

---

 

 

 che risulta uguale a 3.

Per n1 = 4  e  n2 = 6, il valore critico riportato nella tabella per un test unilaterale alla probabilità a = 0.05 risulta uguale a 3. Il valore calcolato è uguale a quello riportato nella tabella: il test risulta significativo e si rifiuta l’ipotesi nulla.

 

 

 

Manuale di Statistica per la Ricerca e la Professione  © Lamberto Soliani   - Dipartimento di Scienze Ambientali, Università di Parma  (apr 05 ed)  ebook version by SixSigmaIn Team  - © 2007