Services and Training for Six Sigma, Design of Experiments and Industrial Statistics

METODI NON PARAMETRICI PER UN CAMPIONE

7.19. PRESENTAZIONE DEI RISULTATI DI PROGRAMMI INFORMATICI E CONFRONTI TRA TEST

In questo capitolo, la stessa serie di dati è stata analizzata con modalità differenti. La scelta del test più adeguato dipende dalle caratteristiche della distribuzione e dall’informazione effettivamente contenuta nelle misure raccolte. Quindi, per questo ultimo aspetto essenziale, la scelta del test deriva più dalle conoscenze del ricercatore che dalle proprietà statistiche dei dati.

Nell’approccio statistico più recente, permesso dalla diffusione dell’informatica, è frequente il ricorso a più test applicati agli stessi dati. Mediante il confronto tra i risultati, è possibile pervenire a una comprensione più approfondita del problema e degli effetti indotti sia dalle caratteristiche della distribuzione (intensità della asimmetria, dimensioni della varianza), sia da quelle dei dati (tipo di scala).

ESEMPIO (ripreso dal paragrafo 6)

Per valutare l’effetto inibente delle basse temperature, sono stati misurati i tassi di crescita di 10 campioni, composti da un numero iniziale di individui molto variabile. La tabella sottostante riporta il tasso di crescita (, espresso in percentuale) di ogni campione:

Campione	a	b	c	d	e	f	g	h	i	l
	22	28	30	15	48	37	50	24	29	36

Il loro tasso di crescita medio è significativamente minore del 45%?

Risposta. Si vuole verificare l’ipotesi

H₀: m ³ m₀ contro H₁: m < m₀

quando si applica un test parametrico o il test di casualizzazione

e l’equivalente

H₀: me ³ me₀ contro H₁: me < me₀

se si applica il test dei segni o il test T di Wilcoxon o il test dei segni.

I simboli m₀ e me₀ indicano la quantità (45) di confronto.

Utilizzando le differenze, l’ipotesi nulla e quella alternativa possono essere espresse con

H₀: d ³ 0 contro H₁: d < 0

Per mettere a confronto i risultati ottenuti dalle varie metodologie proposte per questo problema, agli stessi dati sono stati applicati:

1) il test t di Student sui dati originari ed è stato calcolato l’intervallo di confidenza della media delle differenze;

2) il test t di Student sui dati trasformati in arcseno ed è stato calcolato l’intervallo di confidenza della media delle differenze, sempre trasformate nello stesso modo;

3) il test T di Wilcoxon sulle misure raccolte (la trasformazione in arcseno è ininfluente, poiché il test utilizza i ranghi) ed è stato calcolato l’intervallo di confidenza sui dati originali;

4) il test T di Wilcoxon sulle differenze (che ovviamente fornisce la stessa probabilità del T sui dati originali, vedi punto 3) ed è stato calcolato l’intervallo di confidenza delle differenze (per un confronto con il punto 1);

5) l’intervallo di confidenza con il t di Student dei dati originali, per un confronto con il punto 3;

1) Test t di Student e intervallo di confidenza sui dati originali

Nella prima striscia sono riportati

- il nome della variabile (X),

- il numero di dati (10), la media del campione (31,9),

- la deviazione standard (11,06998) per valutare la dispersione dei dati,

- l’errore standard della media (3,50063).

Nella seconda striscia,

- il nome della variabile (X),

- il valore del t ottenuto (-3,742),

- il numero di gradi di libertà (9),

- la probabilità per un test bilaterale (P = 0.005), dal quale si ricava la probabilità per un test unilaterale (P < 0.0025),

- la differenza tra la media del campione e quella riportata nell’ipotesi nulla (-13,1),

- con il suo intervallo di confidenza alla probabilità a = 0.05 che varia tra –21,019 e –5,181.

2) Test t di Student e intervallo di confidenza sui dati trasformati in arcseno

Per valutare l’effetto della trasformazione è utile confrontare

- il valore del test t (-3,8) che ovviamente ha gli stessi gradi di libertà e

- il valore della probabilità (P = 0.004) per un test bilaterale.

Seppure di poco, il test risulta più significativo del precedente. Se ne deve dedurre che la trasformazione ha determinato una migliore normalizzazione dei dati. La trasformazione in arcseno delle percentuali risulta adeguata alle caratteristiche della distribuzione, seppure con effetti che in questo caso sono limitatissimi.

3) Test T di Wilcoxon

- Wilcoxon signed rank test

- data: x

- p-value = 0.009766

- alternative hypothesis: true mu is not equal to 45

- 95 percent confidence interval: 24.0 - 39.5

- sample estimates: (pseudo)median = 31.5

Con il test T di Wilcoxon è calcolata una probabilità bilaterale (p = 0.009766) più alta di quelle dei due test t di Student; in particolare di quello stimato dopo trasformazione dei dati in arcseno. Se ne deve dedurre che, con questi dati campionari, il test t dei riquadri 1 e 2 è più potente e quindi la distribuzione dei dati è approssimativamente normale anche senza trasformazione.

Anche in queste condizioni si dovrebbe preferire il test T di Wilcoxon, se i tassi utilizzati sono stati calcolati su campioni di dimensioni estremamente variabili e quindi la misura raccolta in realtà è una scala di rango. E’ una informazione importante, quando si utilizzano rapporti o percentuali; pertanto il ricercatore dovrebbe sempre riportarla nella descrizione dell’esperimento e delle modalità di raccolta dei dati.

La misura della tendenza centrale (pseudo-mediana) dei valori raccolti è 31,5. Il suo intervallo di confidenza con il test T alla probabilità del 95% ha come limiti 24,0 e 39,5.

4) Intervallo di confidenza della differenza con il test T di Wilcoxon

Wilcoxon signed rank test

- data: d

- p-value = 0.009766

- alternative hypothesis: true mu is not equal to 0

- 95 percent confidence interval: -21.0 -5.5

- sample estimates:(pseudo)median: -13.5

Invece di chiedersi se la tendenza mediana della distribuzione è inferiore a 45, è possibile chiedersi se la mediana delle differenze da 45 è inferiore a 0.

Ovviamente la probabilità stimata è identica (P = 0.009766) e si rifiuta l’ipotesi nulla.

Nelle ultime due righe, la misura della tendenza centrale (pseudo-mediana) delle differenze è -13,5. Il suo intervallo di confidenza alla probabilità del 95% ha come limiti – 21,0 e -5,5.

Nel precedente punto 1, con la distribuzione t di Student,

- la differenza media del campione è -13,1

- e il suo intervallo di confidenza alla probabilità a = 0.05 varia tra –21,019 e –5,181.

Sono differenze minime rispetto ai valori ottenuti con il t di Student. E’ un risultato che depone a favore del test T di Wilcoxon, per la precisione con la quale esso permette di stimare l’intervallo di confidenza rispetto al test parametrico, senza richiedere la condizione di normalità della distribuzione. L’intervallo non è simmetrico rispetto al valore di tendenza centrale, come è effettivamente la distribuzione originaria dei dati.

5) Intervallo di confidenza dei valori con il t di Student.

Con la distribuzione t di Student è possibile stimare anche l’intervallo di confidenza dei valori osservati. La media dei valori è 31,9 e il suo intervallo di confidenza alla probabilità del 95% è tra 23,981 e 39,819.

Questo risultato può essere confrontato con quanto riportato nel riquadro 3. I due risultati sono molto simili, come già evidenziato per la differenza.

Per un confronto ancora più ampio tra i risultati dei vari test applicati agli stessi dati, è possibile

6) utilizzare il test dei segni e calcolare l’intervallo di confidenza con tale metodo,

7) calcolare la probabilità con il test di casualizzazione.

Questi due ultimi non sono riportati in programmi informatici a grande diffusione.

E’ necessario un calcolo manuale, che ha il vantaggio di essere rapido. In particolare è veloce la stima della probabilità e dell’intervallo di confidenza con l’uso della binomiale, se si ricorre a tabelle di probabilità cumulate.