PROPORZIONI E PERCENTUALI, RISCHI, ODDS E TASSI

5.8. LA POTENZA A POSTERIORI E A PRIORI DI UN TEST SULLA PROPORZIONE PER UN CAMPIONE, CON L’USO DELLA NORMALE.

- p non è troppo vicino a 0 oppure a 1 e

- il numero n di osservazioni è abbastanza grande,

- anche la potenza (1-b) di un test sulla proporzione di un campione può essere ottenuta con la distribuzione normale Z.

Per calcolarla, non esiste una formula unica, ma tre formule che tra loro differiscono, in rapporto alla direzionalità dell’ipotesi alternativa H₁:

- se è bilaterale (1) o unilaterale,

- nel caso in cui sia unilaterale, se destra (2) oppure sinistra (3).

Indicando con

- p la proporzione trovata sperimentalmente e con q = 1- p

- p₀ la proporzione attesa o teorica di confronto,

la formula diventa:

1) nel caso di un test bilaterale la potenza è ottenuta con

1-b =

2) nel caso di un test unilaterale, con ipotesi nulla

H₀: p £ p₀ contro H₁: p > p₀

è ottenuta con

1-b =

3) per l’ipotesi nulla

H₀: p ³ p₀ contro H₁: p < p₀

è ottenuta con

1-b =

ESEMPIO 1 (CALCOLO DELLA POTENZA IN UN TEST BILATERALE). In una ricerca antecedente entro un’area ad alto inquinamento, il 50% dei campioni d’acqua superava i limiti di legge. A distanza di tempo, si intende effettuare una nuova verifica, programmando 50 prelievi.

Quale è la probabilità 1-b di trovare che una differenza di 0,10 nella proporzione di laghi inquinati risulti significativa alla probabilità a = 0.05?

Risposta. E’ un test bilaterale, in cui l’ipotesi nulla è

H₀: p = p₀ = 0.5

con ipotesi alternativa bilaterale

H₁: p ¹ p₀

Con la formula

1-b =

dove

- per a = 0.05 si ha = 1,96 = 0,1 0,5

- e sono uguale rispettivamente a 0,4 e 0,6 (o viceversa) mentre = 50

si ottiene

1-b =

Questa somma deve essere effettuata attraverso le probabilità P corrispondenti.

In una distribuzione normale

- a un valore di Z = 0,56 in una coda della distribuzione corrisponde una probabilità P = 0.288

- a un valore di Z = 3,44 in una coda della distribuzione corrisponde una probabilità P = 0.0003

Di conseguenza, la potenza del test

1-b = 0.2880 + 0.0003 = 0.2883

è 1 - b = 0.2883.

Vi sarà solamente una probabilità del 29% che il campione raccolto risulti significativo con i parametri indicati. Simmetricamente, vi sarà una probabilità del 71% di commettere un errore b, vale a dire di non trovare una differenza che in realtà esiste.

ESEMPIO 2 (CALCOLO DELLA POTENZA IN UN TEST UNILATERALE). In un’area ad alto inquinamento, il 50% dei prelievi superava i limiti di legge. Dopo un’azione di risanamento, si intende effettuare una nuova verifica, programmando 50 prelievi.

Quale è la probabilità 1-b che una proporzione p = 0,40 di laghi inquinati risulti significativa alla probabilità a = 0.05?

Risposta. Nella domanda si ha p₀ = 0,50 e la proporzione campionaria p = 0,40

E’ un test unilaterale, in cui l’ipotesi nulla è

H₀: p ³ p₀ = 0.5

e l’ipotesi alternativa unilaterale è

H₁: p < p₀

Con la formula

1-b =

dove

- per a = 0.05 si ha = 1,645 = 0,5 = 0,4 = 50

si ottiene

1-b =

un valore di Z = -0,2359.

In una coda della distribuzione a Z = 0,24 corrisponde una probabilità P = 0.405.

La potenza di questo test unilaterale è 1-b = 0.405.

Con un test unilaterale, pure mantenendo costanti tutti gli altri parametri utilizzati nell’esempio precedente, vi sarà una probabilità del 40,5% che il campione raccolto risulti significativo. Simmetricamente, vi sarà una probabilità del 59,5% di commettere un errore b, vale a dire di non trovare una differenza che in realtà esiste.

Per un test unilaterale nell’altra direzione, cioè per rendere significativo un aumento di 0,10

si sarebbe utilizzata la formula

1-b =

ottenendo

1-b =

un valore di Z = 0,2359 identico al valore precedente, ma con segno opposto.

Con le formule presentate è possibile anche stimare n o potenza a priori, cioè

- le dimensioni minime n del campione

- affinché la differenza tra una proporzione attesa p₀ e una proporzione osservata p risulti significativa,

- alla probabilità a e con il rischio b prefissati.

Dovendo considerare, come riportato nell’ultima riga, contemporaneamente due parametri, quali

- la probabilità a o errore di I Tipo,

- la probabilità b, detto anche rischio b o errore di II Tipo,

un metodo per calcolare n consiste nell’uso delle formule prima presentate per la potenza, ma procedendo per tentativi, in modo iterativo.

Con una presentazione più dettagliata del metodo,

- dopo aver scelto i valori di p, p₀ e Z_a

- si fissa un valore di n e se ne calcola la potenza (1-b),

- utilizzando una delle tre ultime formule presentate, in rapporto all’ipotesi da verificare.

Se la potenza risulta inferiore a quella prefissata, si aumenta n; se la potenza risulta maggiore, si può abbassare n.

Il metodo risulta più facilmente comprensibile in tutti i suoi passaggi logici e operativi, con lo svolgimento completo e dettagliato di un esempio.

ESEMPIO 3 (STIMA DI n CON I DATI DELL’ESEMPIO 2). In un’area ad alto inquinamento, il 50% dei prelievi superava i limiti di legge. Dopo un’azione di risanamento, si intende effettuare una nuova verifica. E’ stato dimostrato che, con n = 50, la probabilità 1-b che un abbassamento di 0,10 nella proporzione di laghi inquinati risulti significativa alla probabilità a = 0.05 è uguale a 0,405.

Quanti dati occorre raccogliere, affinché la potenza sia almeno uguale o superiore a 0,80?

Risposta. Si intende applicare un test unilaterale, in cui l’ipotesi nulla è

H₀: p = p₀ = 0.5

e l’ipotesi alternativa unilaterale è

H₁: p < p₀

La stima della potenza 1-b del test, con

- per a = 0.05 unilaterale = 1,645

- = 0,5 e = 0,4

- scelto intuitivamente a priori uguale a 120 (serve solo l’esperienza per indicare come primo numero un valore vicino a quello che risulterà dai calcoli),

attraverso

1-b =

permette di pervenire

1-b =

a un valore di Z = 0,5582.

E’ in risultato con Z positivo. Arrotondato a 0,56 nella coda destra della distribuzione corrisponde a una probabilità P = 0,288.

Poiché 0,4 (frequenza campionaria) è minore di 0,5 (frequenza dell’ipotesi nulla) e quindi nella distribuzione normale si trova alla sua sinistra, la potenza del test è stimata dalla probabilità complessiva che si trova a sinistra del valore Z calcolato (+0,56).

Ne deriva che la potenza 1-b di questo test è dato dalla somma della probabilità 0,50 (la parte negativa) + 0,212 (la parte positiva della probabilità, inferiore a Z = 0,56) risultando uguale a 0,712.

Più rapidamente,

1 - b = 1 - 0,288 = 0,712

Il valore alla potenza richiesta (0,80) era superiore. Di conseguenza, i 120 dati ipotizzati sono insufficienti e serve un numero minimo n superiore. Si deve indicare un numero maggiore, come 160, che deve essere verificato mediante una seconda stima della potenza.

Con n = 160

1-b =

si ottiene un valore di Z = 0,903.

Arrotondato a 0,90 (in difetto), nella coda destra della distribuzione ad esso corrisponde una probabilità uguale a 0,184. Di conseguenza, la potenza 1 - b di questo test è 1 – 0,184 = 0,816.

La potenza stimata è leggermente superiore a quella richiesta e quindi può essere accettata: si devono raccogliere n = 160 dati. E’ possibile un campione leggermente minore, forse di 5 dati; ma, per affermarlo con maggiore sicurezza, occorrerebbe una terza stima con n = 155.