Services and Training for Six Sigma, Design of Experiments and Industrial Statistics

CAP III - ANALISI DELLE FREQUENZE

3.8. TABELLE DI CONTINGENZA 2 X 2 IN PICCOLI CAMPIONI: IL METODO ESATTO DI FISHER

Il c² è valido solo per grandi campioni. Se il numero di frequenze attese è piccolo, nel caso di tabelle 2 x 2 si deve ricorrere al metodo esatto di Fisher, derivato dalla distribuzione ipergeometrica. E’ lo stesso principio per cui, nel caso di una sola proporzione e un campione piccolo, si ricorre alla distribuzione binomiale.

Per passare da indicazioni di principio a raccomandazioni pratiche, per la scelta appropriata del test è consigliato utilizzare il metodo esatto di Fisher in sostituzione del chi quadrato quando

- il campione ha un numero totale di osservazioni inferiore a circa 30,

- e/o almeno una frequenza attesa è inferiore a 5.

Sono criteri identici alle raccomandazioni precedenti, che consigliavano di evitare l’uso del c² quando il valore di n×p oppure quello di n×(1-p) sono inferiori a 5.

Il metodo delle probabilità esatte di Fisher, dal nome del suo proponente in un articolo del 1935 (Fisher R. A. The logic of scientific inference, sulla rivista inglese Journal of the Royal Statistical Society, vol. 98, pp. 39-54), è di estrema utilità sotto l’aspetto didattico, perché spiega con chiarezza la logica dell’inferenza statistica.

L’uso di questo metodo richiede l’impiego dei fattoriali; di conseguenza, è di semplice e rapida applicazione solo quando il numero di osservazioni è molto piccolo. Il metodo potrebbe essere applicato anche nel caso di campioni di dimensioni medie; ma con un numero più alto di dati, diviene possibile stimare la probabilità solamente con l’uso di calcolatori.

Il metodo permette di stimare la specifica probabilità (Pi) di ottenere una tabella 2 x 2 uguale a quella osservata.

Usando la medesima simbologia dei precedenti paragrafi 4 e 6, riportata nella tabella seguente

	Risposta X	Risposta x	Totale
Campione Y	a	b	= a + b
Campione y	c	d	= c + d
Totale	= a + c	= a + d	N = a+b+c+d

con la distribuzione ipergeometrica la probabilità P_i è calcolata con la formula

In modo più rapido, lo stesso risultato è ottenuta con

Con questa formula abbreviata, (abbrevia i tempi richiesti dal calcolo manuale) la probabilità (Pi) di trovare quel particolare insieme dei dati osservati è determinata dal rapporto tra il prodotto dei fattoriali dei quattro totali marginali ed il prodotto dei fattoriali delle quattro frequenze osservate moltiplicato il numero totale di osservazioni.

Il metodo di Fisher si fonda sul concetto che, tenendo fissi i totali, i numeri riportati nelle 4 caselle possano assumere per caso qualsiasi valore. Sulla base di questo presupposto, si può calcolare la probabilità di ottenere ognuna delle risposte possibili.

Per stabilire se esiste una differenza significativa tra le due distribuzioni osservate dei campioni Y e y, non è sufficiente calcolare la probabilità della distribuzione osservata. Come con la precedente distribuzione binomiale, nel caso di metodi esatti si deve stimare la probabilità totale di osservare una combinazione di dati così estrema oppure più estrema.

A questo fine, si riduce di 1 il numero di osservazioni nella casella con il numero minore, modificando i valori delle altre caselle per mantenere uguali i totali marginali; successivamente, si calcola la probabilità di ottenere ognuna di queste risposte. E’ necessario elencare tutte le possibili combinazioni delle osservazioni più estreme e quindi calcolare le probabilità esatte associate ad ognuna di queste possibili combinazione dei dati.

Per poter decidere tra le due ipotesi, la probabilità che occorre stimare è data dalla somma della probabilità della distribuzione osservata e di quelle delle risposte più estreme nella stessa direzione.

La probabilità così stimata corrisponde ad un test ad una coda; per un test a due code, si deve moltiplicare per due questa probabilità.

In modo più dettagliato, i passaggi per calcolare la probabilità che permette di rifiutare l’ipotesi nulla sono:

1 - calcolare la probabilità associata ai dati osservati;

2 - individuare la casella con il numero minore; se è zero, è sufficiente questa probabilità, perché la risposta osservata è quella più estrema;

3 - se è diverso da zero, ridurre il valore di 1, modificando le frequenze nelle altre tre caselle, in modo che i totali marginali (e quindi quello totale) restino immutati;

4 - calcolare la probabilità associata alla nuova tabella;

5 - ripetere le operazioni 3 e 4, finché il valore minore diventa zero;

6 - per un test ad una coda, sommare tutte queste probabilità;

7 - per un test a due code, moltiplicare per 2 il risultato della precedente operazione 6;

8 - se la probabilità totale calcolata è inferiore al valore di probabilità prefissato come limite critico (di solito 0,05), si rifiuta l’ipotesi nulla H₀ ed implicitamente si accetta l’ipotesi alternativa H₁, che può essere sia bilaterale che unilaterale.

ESEMPIO. Su un numero ridotto di cavie, si sono sperimentati due pesticidi per verificare se quello di nuova produzione (B) ha effetti più letali di quello usato in precedenza (A).

Il risultato dell’esperimento è riportato nella tabella sottostante:

DATI OSSERVATI	Cavie
DATI OSSERVATI	Sopravvissute	Morte	Totale
Pesticida A	7	1	8
Pesticida B	3	6	9
Totale	10	7	17

Il pesticida B, di nuova produzione, è più efficace del precedente pesticida A?

Risposta. Si tratta di un test ad una coda.

La probabilità di avere per caso la risposta osservata nell’esperimento è

Ma la risposta osservata non è quella più estrema, nell’ipotesi che B sia più letale di A. E’ semplice osservare che è possibile un’altra risposta più estrema: quella in cui con il pesticida A sopravvivano tutti 8 gli animali e di conseguenza, per mantenere fissi i totali come richiede il metodo proposto da Fisher, con il pesticida B sopravvivano non 3 ma solo 2 animali sui 9 del campione.

Le frequenze previste in una tabella 2 x 2 che evidenzi una differenza maggiore tra gli effetti del pesticida A rispetto a quelli del pesticida B sono riportate nella tabella seguente:

RISPOSTA PIU’ ESTREMA	Cavie
RISPOSTA PIU’ ESTREMA	Sopravvissute	Morte	Totale
Pesticida A	8	0	8
Pesticida B	2	7	9
Totale	10	7	17

La probabilità di avere per caso questa possibile risposta, mantenendo fissi i totali, è data da

e risulta uguale a 0.00185.

La probabilità totale di ottenere la risposta osservata oppure una di quelle più estreme (in questo caso solo una è più estrema) nella stessa direzione è data dalla somma dei due valori già calcolati:

P = 0.03455 + 0.00185 = 0.0364

La probabilità complessiva 0.0364 (o 3,64%), stimata nella condizione che sia vera l’ipotesi nulla (i valori della risposta sono determinati dal caso, poiché non esiste una differenza reale nella letalità dei due pesticidi) è bassa, inferiore al 5%. Di conseguenza, si rifiuta l’ipotesi nulla e si accetta l’ipotesi alternativa: il nuovo pesticida B è più letale del pesticida A.

Se la domanda fosse stata se esiste differenza tra l’effetto dei due pesticidi, si dovevano ipotizzare come possibili anche le risposte in cui il numero di morti fosse più alto con il pesticida A, collocate quindi nell’altra coda della distribuzione. Ma spesso, come avviene con i dati di questo esercizio, le risposte non sono simmetriche. Per questo motivo, nei test a due code la probabilità complessiva è ottenuta moltiplicando per 2 quella precedentemente calcolata ad una coda:

P = 0.0364 x 2 = 0.0728

La probabilità 0.0728 (o 7,28%) sarebbe stata superiore al 5%; di conseguenza, non si sarebbe rifiutata l’ipotesi nulla.

Anche in questo caso, si dimostra come il test ad una coda sia più potente del test a due code: è maggiore la probabilità di rifiutare l’ipotesi nulla, quando essa è falsa.

Un modo semplice, ma più lungo, per capire esattamente il funzionamento del test di Fisher è quello di verificare tutte le possibili risposte, tenendo costanti i totali marginali. Individuata la frequenza osservata minore, occorre sostituire ad essa il valore 0 e simmetricamente le altre 3; successivamente si deve aumentare progressivamente quel valore di 1 unità, fino a quando compare 0 in un’altra casella. A quel punto non sono più possibili altre risposte.

Con i dati dell’esempio, è possibile osservare che le risposte differenti che si sarebbero potute ottenere sono le 8 seguenti

(1)		(2)		(3)		(4)
8	0	7	1	6	2	5	3
2	7	3	6	4	5	5	4

(5)		(6)		(7)		(8)
4	4	3	5	2	6	1	7
6	3	7	2	8	1	9	0

e che non esistono altri possibili risultati, che diano gli stessi totali di riga e di colonna.

Con la formula del metodo esatto di Fisher, è possibile calcolare le probabilità di ottenere ognuna di queste risposte teoricamente possibili; ovviamente, se non sono stati commessi errori od approssimazioni eccessive, il loro totale darà 1 se espresso in valore unitario, oppure 100 se espresso in percentuale.

Dalla prima all’ottava possibile risposta si passa da un estremo di una maggiore letalità del pesticida B (con B si hanno 7 morti su 9, mentre con A sono sopravvissuti tutti 8), all’altro estremo di un effetto maggiore del pesticida A (con A ne muoiono 7 su 8, mentre con B sopravvivono tutti 9).

Per poter stabilire se esiste una differenza significativa tra i due pesticidi, occorre sommare alla probabilità calcolata per la risposta 2 (che coincide con quella sperimentale) la probabilità di ottenere le risposte più estreme nella stessa direzione (nell’esempio è una sola, la risposta 1). Se la loro somma supera il 5%, non è possibile rifiutare l’ipotesi nulla. Essa sarà rifiutata quando la somma delle probabilità di ottenere la risposta in oggetto o quelle più estreme non supera il valore prefissato.

Le probabilità complessive calcolate con il metodo esatto di Fisher possono essere estese in una sola direzione, per test ad una coda; ma possono essere estese ad ambedue le direzioni, per test a due code.

In questo ultimo caso, se il campione fosse di grandi dimensioni la probabilità complessiva coinciderebbe con quanto è possibile calcolare con il test , che è un test a due code.

Considerare fissi i totali marginali appare ad alcuni autori una scelta impropria ed arbitraria. Sono state proposte modifiche al metodo di Fisher, come quella di di K. D. Tocher del 1950 (vedi l’articolo Extension of the Neyman-Pearson theory of tests to discontinuous variates, pubblicato da Biometrika Vol. 37, pp. 130-144). Queste modifiche, citate in alcuni testi specialistici, in questo manuale sono tralasciate, perché nella ricerca applicata quasi sempre il metodo di Fisher è usato come proposto originariamente dall’autore, che ne raccomandò l’applicazione a tutti i dati dicotomici.