Services and Training for Six Sigma, Design of Experiments and Industrial Statistics

INFERENZA SU UNA O DUE MEDIE CON IL TEST t DI STUDENT

6.12. IL BILANCIAMENTO DI 2 CAMPIONI INDIPENDENTI: VANTAGGI E COSTI

Determinato il numero totale di osservazioni che servono per condurre, con la potenza o la precisione prestabilite, un esperimento con 2 campioni indipendenti, il problema successivo che spesso si pone è il loro bilanciamento. Si tratta di sapere se, per utilizzare al meglio i dati, sia più conveniente formare due gruppi uguali, bilanciati, oppure due gruppi con un numero differente di dati.

Per esempio, avendo stimato che per un confronto tra un trattamento e il controllo servono complessivamente 40 dati, è più utile fare 2 campioni con

- 20 osservazioni per ogni gruppo oppure

- utilizzarne 30 per il trattamento e solo 10 come controllo?

Vari ricercatori ritengono più importante il risultato del trattamento, l’effetto della sostanza analizzata rispetto a quello del controllo. Pensano che sia più vantaggioso costruire campioni non bilanciati, per avere più misure per il trattamento e meno per il controllo. Credono che, nell’economia complessiva dell’esperimento, convenga misurare con precisione maggiore l’effetto del trattamento, ignoto, che non quello del controllo, spesso già noto.

In realtà il test t di Student per 2 campioni indipendenti è fondato sullo scarto tra le due medie campionarie e la varianza pooled è stimata a partire dalle due devianze; quindi i due gruppi hanno la stessa importanza per il risultato finale.

La formula del t per 2 campioni indipendenti

fornisce gli elementi per rispondere al quesito sulla convenienza del bilanciamento.

Si può osservare che

l'errore standard della differenza (es_d)

es_d =

a parità di varianza pooled

- raggiunge il valore minimo quando i due campioni (n₁ = n₂) sono bilanciati.

Allontanandosi dal bilanciamento, l’errore standard diventa maggiore e quindi

- il valore di t, a parità di tutte le altre condizioni, diventa minore e con ciò meno significativo.

Allontanarsi da una distribuzione bilanciata dei dati, mettere più dati in un gruppo togliendoli all’altro, comporta sempre una perdita d’informazione dell’esperimento.

E’ semplice calcolare che, se si dispone in totale di 40 dati,

- con 20 dati per gruppo si moltiplica la varianza pooled per 0,1 (1/20 + 1/20),

- con 30 dati in un gruppo e 10 nell’altro si moltiplica la varianza pooled per 0,133 (1/30 + 1/10).

Nel secondo caso, con un errore standard maggiore, il valore di t è inferiore e quindi la differenza tra le due medie più difficilmente risulterà significativa.

Un test per due campioni indipendenti raggiunge

- il massimo di potenza e robustezza quando i due gruppi sono bilanciati.

E’ quindi la scelta più conveniente, in particolare quando il numero di dati a disposizione è piccolo.

Ma non sempre è possibile o conveniente formare due campioni con lo stesso numero di dati. A volte i costi morali od economici del gruppo sottoposto a trattamento e del controllo non sono uguali.

Supponiamo di avere un gruppo di ammalati di tumore e di dover sperimentare un farmaco che potrebbe portare alla guarigione:

- ad un primo gruppo di ammalati viene somministrato il farmaco,

- al gruppo di controllo, sempre composto da ammalati nelle stesse condizioni del primo, occorre somministrare il placebo, una sostanza apparentemente uguale al farmaco ma senza il principio attivo che, presumibilmente, aumenta la probabilità di guarigione.

Considerazioni etiche vietano l'assegnazione casuale dei pazienti a trattamenti differenziati in esperimenti clinici, quando a priori si abbiano forti ragioni per credere che uno dei due trattamenti sia indubbiamente migliore dell'altro. E' quindi moralmente doveroso ridurre il più possibile il gruppo al quale somministrare il placebo, aumentando di conseguenza il gruppo sottoposto a trattamento, per non ridurre la potenza e la robustezza del test.

Ma di quanto aumentare il secondo gruppo, se una distribuzione non bilanciata, a parità del numero totale di dati, comporta sempre una perdita complessiva d’informazione del test, rispetto alla distribuzione uniforme?

Con il rapporto

dove

- è il numero di osservazioni stimato come necessario in ognuno dei due campioni,

- è il numero di osservazioni assegnate al primo gruppo,

- è il numero di osservazioni che devono essere assegnate secondo gruppo,

è possibile stimare quante osservazioni (n₂) deve avere il secondo gruppo al diminuire delle osservazioni (n₁) del primo, una volta che sia stata stimata la loro dimensione minima (), per mantenere costante la potenza del test.

ESEMPIO 1. Si supponga che, per sperimentare un farmaco antitumorale, sia stato calcolato che servono due gruppi di persone, composti ognuno da almeno 15 individui ( = 15).

Per l’alto costo morale insito nella somministrazione del placebo ad ammalati, si vuole ridurre il numero di persone di questo gruppo. Mettendo nel gruppo trattato con placebo 10 individui (n₁ = 10), quanti dovranno essere gli individui trattati con il farmaco (n₂)?

Risposta.

Applicando la formula

con

- = 15 e = 10,

il valore di

= 30

risulta uguale a 30 individui.

Si osservi che le dimensioni complessive dell’esperimento aumentano: in totale si richiedono non più 30 (15 + 15) persone ma 40 (10 + 30).

Il vantaggio consiste solo nella diminuzione del gruppo che ha costi morali alti.

Ma è applicabile solo quando, come spesso succede, il numero di persone ammalate che vogliono farsi curare è più alto del numero minimo stimato come necessario per l’esperimento. Nessuno obietta al fatto che il numero di persone che vengono seguite nel decorso della malattia, alla quali distribuire gratuitamente il farmaco e da visitare periodicamente, sia alto. L’unico problema può essere rappresentato dai costi dell’operazione, per l’aumento del numero totale di ammalati da seguire nella cura.

Il numero di persone al quale somministrare il placebo può diminuire ulteriormente.

Ad esempio,

abbassandolo a 8 persone (n₁ = 8),

= 120

il numero di persone ai quali somministrare il farmaco sale a 120 (n₂ = 120).

Tuttavia, come si può dimostrare con facilità, non è conveniente scendere oltre una certa soglia. Ad esempio, con 7 persone nel primo gruppo (n₁ = 7)

n₂ = = = ?

n₂ diverrebbe negativo.

E’ una situazione da evitare, anche utilizzando un secondo campione molto più grande di quello stimato in precedenza: differenze importanti nelle dimensioni dei due campioni determinano alterazioni profonde, non stimate, della robustezza e della potenza del test, con conseguenze rilevanti

- sia sulla probabilità a

- sia della probabilità b.

Anche nella ricerca ambientale sovente si pongono problemi etici. Quando occorre condurre esperimenti su animali per valutare effetti di sostanze tossiche, qualcuno deve essere sacrificato.

Soprattutto occorre attenzione ai problemi economici, al costo dell’esperimento, per ottenere il risultato massimo dal finanziamento assegnato. Le dimensioni minime dell’esperimento rappresentano una prima risposta, in quanto permettono di evitare analisi con campioni troppo piccoli (quindi inutili ai fini del risultato) oppure con campioni molto più grandi di quanto necessario (quindi con spreco dell’investimento in risorse, persone e tempo).

Una seconda serie di problemi deriva dal fatto che, in varie situazioni, anche i costi economici sono molto diversi tra le osservazioni del trattamento e quelle del controllo. Le cavie sottoposte all’effetto di una sostanza tossica hanno probabilità maggiori di morire o comunque di non essere più utilizzabili per un secondo esperimento, rispetto al controllo. Confrontando livelli d’inquinamento di due laghi, uno potrebbe distare maggiormente dalla sede del ricercatore e quindi richiedere spese maggiori per il campionamento; analisi di laboratorio condotte con metodologie diverse che richiedano tempi differenti quasi sempre hanno costi diversi; il farmaco e il principio attivo costano più del placebo.

La risposta ottimale a questa serie di problemi è leggermente più complessa della scelta qualitativa legata ai problemi etici; ma è possibile

- determinare il rapporto numerico ottimale tra i due gruppi, per ridurre i costi complessivi dell’esperimento.

Ad esempio, se ogni prova sperimentale con il trattamento costa 10.000 lire e una con il controllo 2.000 lire, nell'esperimento bilanciato di 15 osservazioni per gruppo

il costo complessivo sarebbe

15 x 10.000 + 15 x 2.000 = 180.000

di 180.000 lire .

L’esperimento con 10 osservazioni nel controllo e 30 nel trattamento (che ha la stessa potenza)

avrebbe un costo di

10 x 10.000 + 30 x 2.000 = 160.000

di 160.000 lire.

Infine l’esperimento con 8 osservazioni per il trattamento e 120 per il controllo vedrebbe aumentare i costi a

8 x 10.000 + 120 x 2.000 = 320.000

320.000 lire.

Ovviamente, con rapporti diversi tra i costi delle due rilevazioni la risposta sarebbe stata differente.

Per trovare la soluzione ottimale, evitando metodi più complessi, la procedura può essere semplice:

- dopo aver calcolato le dimensioni minime necessarie , per ognuno dei due gruppi,

- si stimano le coppie di osservazioni (n₁ e n₂) che hanno la stessa potenza di quella bilanciata,

- senza superare il valore soglia, rappresentato da una differenza 2n₁ - negativa.

Delle possibili pianificazioni accettabili, si stimano i costi, scegliendo quella più conveniente, ricordando che, dal punto di vista statistico,

- è sempre preferibile utilizzare campioni con dimensioni non troppo differenti.