analisi FATTORIALE E  disegni complessi

CON FATTORI INCROCIATI

 

 

 

12.9.   QUADRATI LATINI CON REPLICHE

 

 

Nella presentazione del disegno sperimentale a quadrati latini è stato ripetutamente evidenziato il suo limite operativo, imposto dall’esigenza che i tre fattori a confronto abbiano lo stesso numero di livelli. Di conseguenza, si è indotti ad effettuare esperimenti di piccole dimensioni, con la forte controindicazione che il numero di df dell’errore è molto piccolo: in un esperimento 3 x 3, i test F relativi alla significatività di ognuno dei tre fattori hanno df 2 e 2.

Spesso è utile applicare forme di repliche, che aumentino i df dell’errore: con df 2 e 2 alla probabilità a = 0.05 il valore critico è uguale a 18,51 e alla probabilità a = 0.01 è uguale a 99,00; già con df 2 e 4 i due valori critici si abbassano rispettivamente a 6,94 e 18,00 rendendo significative differenze che sono circa 1/3 e 1/5 delle prime.

Le modalità con cui si possono avere repliche di quadrati latini, soprattutto in esperimenti di laboratorio, sono numerose. A volte è possibile ripetere l’esperimento utilizzando le stesse cavie, altre volte ricorrendo a cavie appartenenti alla medesima nidiata, sempre distribuite nelle caselle in modo casuale. Negli esperimenti in natura, è possibile ripetere l’esperimento in altra località, con una diversa distribuzione casuale dei fattori.

 

In un esperimento con 2 differenti quadrati 3 x 3, estratti a caso dai 12 possibili determinati dalla diversa distribuzione del terzo fattore nelle 9 caselle, si ottengono 18 osservazioni. L’analisi separata dei 2 quadrati, ognuno con 9 osservazioni, facilmente porterebbe a conclusioni non significative per entrambi gli esperimenti.

 

L’analisi combinata consente

-          una stima della devianza d’errore e della significatività dei due fattori di disturbo con 4 df anziché 2;

-          l’effetto del fattore ritenuto più importante è saggiato sul numero totale di osservazioni ottenute con i due esperimenti;

-          infine è possibile l’analisi dell’interazione tra il fattore principale  e le repliche, al fine di saggiare eventuali risultati diversi ottenuti con i due quadrati.

-          Se questa ultima interazione risulta significativa, è corretto analizzare separatamente i fattori nei due quadrati, con l’impostazione già presentata nei paragrafi precedenti; se non risulta significativa, è conveniente la loro analisi combinata.

 

In un disegno sperimentale con q repliche di un quadrato latino di dimensioni n è possibile calcolare le devianze sottoriportate, con i relativi df.

 

 

DEVIANZE

DF

TOTALE

q (n2 - 1)

Tra quadrati

q - 1

Fattore X entro quadrati

q (n - 1)

Fattore Y entro quadrati

q (n - 1)

Trattamenti entro quadrati

q (n - 1)

Trattamenti

n - 1

Interazione trattamenti x quadrati

(q - 1) (n - 1 )

Errore

q (n - 1) (n - 2)

 

 

La devianza tra trattamenti entro quadrati ed i suoi df possono essere scomposti in due parti:

- la devianza tra trattamenti con df n-1, con la quale si saggiano le differenze complessive tra le modalità dei trattamenti, senza considerare le differenze tra i due quadrati latini, ma valutando i dati come risultato di un unico esperimento;

- la devianza d’interazione trattamenti x quadrati con df (q-1) (n-1), con la quale si verifica se il fattore in esame, quello ritenuto più importante dei tre sotto controllo, determina risultati significativamente diversi nei due quadrati.

 

 

ESEMPIO.  Si intende saggiare la quantità di produzione unitaria di tre varietà dello stesso cereale (Z), considerando anche gli effetti di tre concimi (X) e di tre tipi di aratura (Y).

Per avere un numero di dati sufficientemente alto e per considerare anche l’effetto della località, sono stati impostati due esperimenti a quadrati latini: uno in pianura e l’altro in montagna, con i risultati che sono stati riportati nelle due tabelle.


 

 

PIANURA

 

 

 

MONTAGNA

 

X1

X2

X3

 

 

 

X1

X2

X3

Y1

B  18

A  12

C  17

 

 

Y1

C  23

A  16

B  22

Y2

A 14

C  21

B  20

 

 

Y2

A  18

B  24

C  27

Y3

C  18

B  16

A  12

 

 

Y3

B  20

C  20

A  15

 

 

Calcolare le devianze dei tre fattori e la devianza d’interazione delle varietà del cereale per località.

 

Risposta. Separatamente per i due quadrati latini riportati di seguito

 

 

PIANURA

 

 

X1

X2

X3

Totale

Y1

B  18

A  12

C  17

47

Y2

A 14

C  21

B  20

55

Y3

C  18

B  16

A  12

46

Totale

50

49

49

148

 

 

 

MONTAGNA

 

 

X1

X2

X3

Totale

Y1

C  23

A  16

B  22

61

Y2

A  18

B  24

C  27

69

Y3

B  20

C  20

A  15

55

Totale

61

60

64

185

 

e congiuntamente per le sementi si calcolano i totali


 

 

SEMENTI

 

 

A

B

C

Totale

Pianura

38

54

56

148

Montagna

49

66

70

185

Totale

87

120

126

333

 

Con le solite modalità già illustrate per i quadrati latini, si possono ottenere le devianze e i df sia per l’esperimento in pianura che per quello in montagna.

 

 

PIANURA

MONTAGNA

 

DEVIANZA

DF

DEVIANZA

DF

Tra dosi di X

0,22

2

2,89

2

Tra dosi di Y

16,22

2

32,89

2

Tra sementi

64,89

2

82,89

2

Errore

132,67

2

1,55

2

Totale

214,00

8

120,22

8

 

 

Mediante l’analisi congiunta dei due quadrati latini è possibile calcolare:

 

- la devianza totale, che è uguale alla somma degli scarti al quadrato di ognuno dei 18 valori dalla media generale, e può essere ottenuta come

/n

(con n = 18 nel caso dell’esempio);

 il valore calcolato è 410,28 con 17 df;

 

- la devianza tra quadrati (o tra località)

 = 2433,78 + 3802,78 - 6160,5 = 76,06

 che risulta uguale a 76,06 con 1 df;

 

- la devianza tra sostanza X  entro località, o entro quadrati,

 che ovviamente coincide con la somma delle due devianze del fattore X calcolate entro ogni quadrato

0,22 + 2,89  =  3,11

e risulta uguale a 3,11 con 4 df (2 + 2);

 

- la devianza tra sostanza Y entro località

 

che coincide con la somma delle due devianze calcolate separatamente

16,22 + 32,89  = 49,11

e risulta uguale a 49,11 con 4 df;

 

- la devianza tra sementi entro località

che coincide con la somma delle due devianze relative

64,89 + 82,89  = 147,78

e risulta uguale a 147,78 con 4 df.

 

Questa ultima devianza calcolata entro quadrati, in particolare quando si considerano le sementi come il fattore più importante e gli altre due fattori come fonti di perturbazione da controllare, può essere suddivisa in due devianze:

 

- la devianza tra sementi

  =  1261,5 + 2400 + 2646 - 6160,5  = 147

che risulta uguale a 147 ed ha 2 df;

 

- la devianza d’interazione sementi x località

che è ottenuta per differenza

dev. tra sementi entro località  -  dev. tra sementi  =  dev. d’interazione sementi x località

147,78 - 147  = 0,78

e che, con i dati dell’esempio, risulta uguale a 0,78 ed ha 2 df.

 

Questa scomposizione potrebbe essere fatta contemporaneamente per tutti e tre i fattori.

Infine si calcola la devianza d’errore, che può essere facilmente ottenuta come somma delle due devianze d’errore calcolate in ogni quadrato:

con i dati dell’esempio

132,67 + 1,55  = 134,22

risulta uguale a 134,22 ed ha 4 df.

E’ sempre utile presentare tutte le devianze in una tabella

 

FATTORI  E  INTERAZIONI

DEVIANZA

DF

VARIANZA

Totale

410,28

17

---

Tra località

76,06

1

76,06

Fattore X entro località

3,11

4

0,78

Fattore Y entro località

49,11

4

12,28

Sementi entro località

147,78

4

36,94

Sementi

147

2

73,5

Interazione sementi x località

0,78

2

0,39

Residuo

134,22

4

33,55

 

 

che riassume i risultati di tutti i calcoli effettuati ed eventualmente la significatività di ogni test F.

 

 

 

Manuale di Statistica per la Ricerca e la Professione  © Lamberto Soliani   - Dipartimento di Scienze Ambientali, Università di Parma  (apr 05 ed)  ebook version by SixSigmaIn Team  - © 2007