Services and Training for Six Sigma, Design of Experiments and Industrial Statistics

IL DISEGNO SPERIMENTALE:

CAMPIONAMENTO, PROGRAMMAZIONE DELL’ESPERIMENTO E POTENZA

23.7. IL DISEGNO SPERIMENTALE TOTALMENTE RANDOMIZZATO: VANTAGGI, LIMITI E POTENZA.

Nella programmazione di un esperimento a più fattori, per il quale si è stabilito che i dati saranno analizzati statisticamente con l’ANOVA a effetti fissi, si pone spesso il problema di avere una indicazione preliminare, scientificamente accettabile, del numero di dati che serviranno in ogni trattamento, per ottenere un test significativo nelle condizioni ipotizzate. E’ necessario che tale numero sia fissato prima di dare inizio alle prove, poiché

- le replicazioni devono essere effettuate contemporaneamente

- e il loro numero è indipendente dai risultati dell’esperimento.

Soprattutto per calcoli manuali che sarebbero lunghi e complessi, il metodo abbreviato più diffuso è quello proposto da E. S. Pearson (figlio di Karl Pearson) e H. O. Hartley nel 1951 nell’articolo già ampiamente presentato nei capitoli dedicati all’analisi della varianza. Anche se ora i calcoli vengono effettuati con programmi informatici, è ugualmente molto importante comprenderne la logica e sapere quali sono i parametri fondamentali che determinano queste stime, dette della potenza a priori () e della potenza a posteriori (1-b).

Gli esempi discussi in questo capitolo seguono le indicazioni fornite da Nicola Montanaro, nel capitolo Lezione 9: il disegno sperimentale del testo pubblicato nel 1977 Biometria, Principi e Metodi, per studenti e ricercatori biologi (Piccin Editore, Padova, XVI + 552 p.), al quale si rimanda per ulteriori approfondimenti.

L’uso delle famiglie di curve per calcolare la potenza (1-b) del test F proposte da Pearson e Hartley, per ricordare i concetti fondamentali, richiede la conoscenza di quattro parametri:

1 - a = il livello di significatività prescelto per il test che sarà applicato,

2 - = numero di gradi di libertà del numeratore; quindi del numero dei gruppi dei trattamenti poiché esiste la relazione

3 - = numero di gradi di libertà del denominatore, nel rapporto tra le due varianze per il test F; quindi del numero totale di dati dei trattamenti per la relazione

4 - = valore che dipende sia dal disegno prescelto, sia congiuntamente da d e da s; nella stima di f per la programmazione sperimentale esiste la rilevante complicazione che prima dell’esperimento i parametri d e s sono sconosciuti.

Inoltre l’indice varia il funzione del disegno sperimentale prescelto.

Il disegno completamente randomizzato è l’esperimento più semplice. Ma è conveniente solo quando il materiale utilizzato è altamente omogeneo. Ad esempio, in un esperimento di laboratorio per valutare l’effetto di farmaci somministrati a (uguale a ) cavie, per ottenere la maggior potenza del test si richiede che esse siano tutte dello stesso ceppo (quindi che abbiano gli stessi genitori), abbiano la stessa età (quindi siano della stessa nidiata), lo stesso peso, il medesimo sesso e in generale siano identiche per tutti quei fattori che si ritiene influenzino il valore che verrà misurato. Solamente in queste condizioni è credibile che

- le differenze tra le medie siano imputabili solamente ai differenti effetti dei farmaci,

- alla fine dell’esperimento la varianza d’errore sarà minima.

I vantaggi più evidenti di questo disegno sperimentale sono

- la facilità dell’esecuzione,

- la semplicità dell’analisi statistica,

- una varianza d’errore con il numero massimo di gradi di libertà,

- il fatto che gruppi non bilanciati, fenomeno frequente quando l’osservazione si prolunga nel tempo, non rendono l’analisi statistica più complessa.

Gli svantaggi principali sono che

- molto difficilmente in natura, ma spesso anche in laboratorio, si dispone di un materiale così omogeneo;

- è ugualmente interessante valutare se, per la variabile analizzata, esistono differenze significative anche entro altri fattori, quali il ceppo, l’età, il peso, il sesso e in generale tra i livelli di tutte le variabili ritenute influenti, anche se ovvie.

Per presentare con un esempio, applicato al disegno completamente randomizzato, i concetti e le formule per calcolare

- sia la potenza (1-b)

- sia la dimensione () di campioni bilanciati,

si supponga di avere a disposizione 20 cavie per valutare l’effetto di = 5 farmaci.

Di conseguenza, per ognuno dei gruppi si possono si hanno = 4 cavie.

Il valore del parametro è dato da

In essa, oltre ai simboli già spiegati,

- s = deviazione standard della popolazione

- d_j = m_j - m. Per ognuno dei trattamenti, d_j è lo scostamento della jesima media vera di trattamento (m_j) dalla media vera della popolazione (m).

Nel calcolo di , la difficoltà maggiore consiste nell’assegnare un valore ai parametri s e d che, soprattutto nel momento di programmazione dell’esperimento, sono sconosciuti.

Il parametro è caratteristico di ogni variabile nelle situazione sperimentale prefissata; esso deve essere ricavato da esperienze precedenti, dalla letteratura oppure da un esperimento pilota.

Il valore del parametro è prefissato dallo sperimentatore, sulla base di una significatività biologica, ambientale o medica, cioè di una rilevanza non trascurabile per i suoi effetti. Inoltre, per il calcolo di f senza una conoscenza precisa di d e di , è vantaggioso che d sia espresso in termini di , cioè di deviazioni standard.

Le modalità per effettuare tale operazione sono diverse. Limitiamo la presentazione ai due metodi più semplici e utili

1) Un primo metodo è assumere che l’ipotesi nulla H₀ sia falsa, in quanto tutte le medie a confronto sono uguali eccetto una sola la media ,

- che differisce dalle altre di una quantità

Ne deriva che, rispetto alla media generale , le medie

- differiscono tutte di una quantità

- mentre la media differisce di una quantità .

Si può quindi ricavare la relazione

e da essa

per giungere alla relazione .

In conclusione si ha

Nella formula per la stima del parametro f,

per la relazione

si può eliminare la variabile d e utilizzare

la formula semplificata

e infine semplificare anche ottenendo

In conclusione non serve più conoscere più né d né s, ma avere solamente una stima del rapporto c.

2) Il secondo metodo porta a una formula ancora più semplice. Assumendo, sempre con H₀ falsa, che esista una differenza tra tutte le medie e la differenza massima tra la media vera minore e la media vera maggiore sia uguale a , si ricava

La formula semplificata diventa

e infine, semplificando anche ,

Anche in questo caso, è sufficiente una stima approssimata del rapporto tra media e varianza, come fornita anche dal coefficiente di variazione o da altri metodi, discussi nei paragrafi precedenti.

ESEMPIO 1 (CALCOLO DELLA POTENZA). Calcolare la potenza di un’analisi della varianza a un criterio con = 5 e = 4, per una probabilità prefissata = 0.05 e = 1,8.

Risposta. Da

si ricava = 1,14

Dalle dimensioni dell’esperimento che sono state indicate, cioè un’analisi della varianza a un criterio con = 5 e = 4 e quindi = 20, occorre poi ricavare che i gradi di libertà della devianza tra trattamenti sono 4 e quelli della devianza d’errore sono 15. Pertanto i parametri da utilizzare nei grafici delle curve di potenza di Pearson e Hartley (riportate anche alla fine del capitolo) sono

= 4; = 15; = 0.05; = 1,14

Nella curva di potenza con = 4 (verificare nella 4 figura, in alto a sinistra),

- per = 0.05 (nel gruppo di curve a sinistra),

- il valore = 1,14 (riportato nella numerazione superiore sull’asse delle ascisse e che varia da 1 a 3)

- incontra la curva per = 15 in un punto che, trasferito orizzontalmente sulla potenza, fornisce approssimativamente il valore = 0,32.

Tale risposta significa che con l’esperimento programmato esiste una probabilità piccola, solo del 32%, che il test risulti significativo.

ESEMPIO 2 (CALCOLO DEL NUMERO DI REPLICHE ). Dopo questa prima risposta che ha stimato una probabilità b del 68% (100 - 32) che il test che si sta programmando non risulterà significativo, pur esistendo una differenza reale tra le medie dei 5 gruppi, è presumibile che il ricercatore voglia elevare la potenza del test, aumentando il numero di repliche () di ognuno dei campioni.

Quanti dati è necessario avere per ogni campione, se si vuole un test con una potenza = 0,90?

Risposta. Con i parametri

= 4; = 1,8; = 0.05; = 0,90

occorre procedere per tentativi, in quanto è calcolabile solo conoscendo , che si vuole appunto stimare.

Sulla base dell’esperienza, per aumentare la potenza si deve assumere un valore di sensibilmente maggiore di prima, ad esempio approssimativamente = 50 al posto di = 15.

Poiché i gruppi sono = 5, in questa condizione il numero totale di dati è = 55, quindi = 11 e il valore

risulta uguale a 1,89.

Dalla lettura dello stesso grafico (= 4)

- per = 0.05 (nel gruppo di curve a sinistra),

- il valore = 1,89 (riportato nella numerazione superiore sull’asse delle ascisse e che varia da 1 a 3)

- nel punto in cui incontra la retta di potenza = 0,90 taglia la curva = 30 che rappresenta una stima nettamente minore di quella ipotizzata (= 50).

Si deve quindi fare un secondo tentativo, in questo caso abbassando il numero di dati per gruppo.

Potrebbe essere = 10 con un numero totale di dati = 50;

con questi parametri

il valore risulta uguale a 1,80.

Dalla lettura dello stesso grafico (= 4)

- per = 0.05 (nel gruppo di curve a sinistra),

- il valore = 1,80 nel punto in cui incontra la retta di potenza = 0,90 in modo approssimato incontra la curva = 50 che rappresenta una stima vicina a quella ipotizzata.

Per un esperimento che abbia la potenza ( = 0,90) richiesta, servono = 10 dati per ognuno dei = 5 gruppi. Sono metodo grafici, in cui le distanze tra curve con alti, sono minime. Ne deriva una forte approssimazione.