Services and Training for Six Sigma, Design of Experiments and Industrial Statistics

trasformazionI dei dati;

test per normalita’ e PER OUTLIER

13.3 ALTRI EFFETTI DELLE TRASFORMAZIONI

Quando si analizza un fenomeno biologico o ambientale, sovente le modalità per misurarlo sono numerose. E’ sempre importante che la misura prescelta

- abbia la caratteristica di descrivere meglio delle altre il fattore analizzato e come tale sia facilmente interpretabile,

- determini una distribuzione dei dati sperimentali, che sia in accordo le caratteristiche richieste dalla corretta applicazione del test prescelto.

Ad esempio per valutare la resistenza veloce di atleti su un percorso di 4 Km, come misura della loro capacità atletica è possibile utilizzare

- il tempo impiegato complessivamente (esempio, 12 minuti da un atleta),

- il tempo impiegato per unità di distanza (3 minuti per Km),

- la distanza percorsa per ogni minuto (4 Km / 12 minuti = 0,333 Km/minuto), che è il suo reciproco,

- la distanza teorica percorsa in un’ora alla stessa velocità (20 km/ora).

Come più volte accennato, la trasformazione di una serie di dati è giustificata dagli effetti che essa determina sulla forma della distribuzione.

Entro il campo di variazione di una serie osservazioni sperimentali, l’effetto di una trasformazione non è costante. Alcune hanno un effetto più forte sui valori minori, altre su quelli maggiori. Dipende dall’azione congiunta del tipo di trasformazione e della dimensione dei valori.

Nel capitolo scritto da John D. Emerson e intitolato Introduction to Transformation nel testo del 1991 di David Caster Hoaglin, Frederick Mosteller e John W. Tukey dal titolo Fundamentals of Exploratory Analysis of Variance (A Wiley-Interscience Publication, John Wiley $ Sons, Inc. New York, XVII + 430 p.), le trasformazione sono classificate

- sulla base degli effetti che esse hanno sulla forma della distribuzione.

Quando i dati hanno asimmetria sinistra o negativa, come nella figura sottostante

per ottenere una distribuzione normale è necessario distanziare maggiormente i valori alti. Si deve quindi usare una trasformazione che è definita accelerating, oppure curved up o cupped come sono,

ad esempio

- oppure quando (come nel grafico),

- oppure quando .

Quando la distribuzione dei dati ha asimmetria destra o positiva, come nella figura successiva

per ottenere una distribuzione normale è necessario distanziare maggiormente i valori bassi. Si deve quindi usare una trasformazione decelerating, oppure curved down o capped come sono quasi tutte, da quelle logaritmica, alla radice quadrata e alla reciproca che inoltre inverte il rango dei valori.

Alcune trasformazioni hanno entrambi gli effetti, ovviamente in aree diverse della distribuzione dei dati

Ad esempio, la trasformazione in

- è accelerating quando

- è decelerating quando .

mentre la trasformazione in ha il comportamento opposto

Questa proprietà di modificare i rapporti e le distanze tra i dati dipende dal fatto che la intensità con la quale le trasformazioni agiscono sui singoli valori cambia in funzione della dimensione, come evidenzia la figura precedente.

In essa sono illustrati gli effetti di una trasformazione in radice quadrata. Ad esempio l’azione tra i valori di X (Y nella figura) è molto più forte per i valori compresi tra 0 e 1, rispetto a quelli compresi tra 4 e 5. E’ il concetto di strenght di una trasformazione, che non deve essere confuso con quello di accelerating (in questo caso tra 0 e 1) e quello di decelerating (oltre 1), illustrati in precedenza.

Tutte quelle presentate sono trasformazioni monotoniche: non modificano l’ordine dei valori.

Al massimo, come in quella reciproca, l’invertono. Questo concetto assume importanza nella statistica non parametrica: i test fondati sui ranghi non modificano il loro risultato, con qualsiasi trasformazione monotonica.

Le trasformazioni sono anche classificate in famiglie. Nel grafico successivo sono riportati alcuni membri di una famiglia di trasformazioni di potenza.

Il grafico, che comprende alcune trasformazioni non descritte nel paragrafo precedente, evidenzia con chiarezza sufficiente i loro effetti. Per ulteriori approfondimenti di questi aspetti, si rinvia al testo citato dal quale sono state riprese le figure di questo paragrafo.