Misure di tendenza centrale per dati raggruppati

Le misure di tendenza centrale dei dati raggruppati vengono utilizzate nelle statistiche per descrivere determinati comportamenti di un gruppo di dati forniti, come ad esempio il valore a cui sono vicini, qual è la media dei dati raccolti, tra gli altri.

Quando viene prelevata una grande quantità di dati, è utile raggrupparli per avere un ordine migliore e quindi essere in grado di calcolare determinate misure di tendenza centrale.

Tra le misure di tendenza centrale più utilizzate sono la media aritmetica, la mediana e la modalità. Questi numeri indicano alcune qualità dei dati raccolti in un determinato esperimento.

Per utilizzare queste misure è necessario prima sapere come raggruppare un insieme di dati.

Dati raggruppati

Per raggruppare i dati prima è necessario calcolare l'intervallo di dati, che viene ottenuto sottraendo il valore più alto meno il valore più basso dei dati.

Quindi scegliere un numero "k", che è il numero di classi in cui si desidera raggruppare i dati.

Procediamo a suddividere l'intervallo tra «k» per ottenere l'ampiezza delle classi da raggruppare. Questo numero è C = R / k.

Finalmente viene avviato il raggruppamento, per il quale viene scelto un numero inferiore rispetto al valore più basso dei dati ottenuti.

Questo numero sarà il limite inferiore della prima classe. A questo viene aggiunto C. Il valore ottenuto sarà il limite superiore della prima classe.

Quindi, C viene aggiunto a questo valore e viene ottenuto il limite superiore della seconda classe. In questo modo procediamo fino ad ottenere il limite superiore dell'ultima classe.

Dopo aver raggruppato i dati, è possibile calcolare la media, la mediana e la modalità.

Per illustrare come vengono calcolate la media aritmetica, la mediana e la modalità, procederemo con un esempio.

esempio

Pertanto, quando si raggruppano i dati si otterrà una tabella come la seguente:

Le 3 principali misure di tendenza centrale

Ora procederemo a calcolare la media aritmetica, la mediana e la modalità. L'esempio precedente verrà utilizzato per illustrare questa procedura.

1- Media aritmetica

La media aritmetica consiste nel moltiplicare ogni frequenza per la media dell'intervallo. Quindi vengono aggiunti tutti questi risultati e infine viene diviso tra i dati totali.

Usando l'esempio precedente otterremmo che la media aritmetica sia uguale a:

(4 * 2 + 4 * 4 + 6 * 6 + 4 * 8) / 18 = (8 + 16 + 36 + 32) / 18 = 5, 11111

Ciò indica che il valore medio dei dati nella tabella è 5.11111.

2- Medio

Per calcolare la mediana di un set di dati, prima tutti i dati vengono ordinati dal meno al più grande. Si possono presentare due casi:

- Se il numero di dati è dispari, la mediana è il dato giusto al centro.

- Se il numero di dati è pari, la mediana è la media dei due dati che rimangono al centro.

Quando si tratta di dati raggruppati, il calcolo della mediana viene effettuato nel modo seguente:

- N / 2 è calcolato, dove N è il totale dei dati.

- Viene cercato il primo intervallo in cui la frequenza accumulata (la somma delle frequenze) è maggiore di N / 2 e viene selezionato il limite inferiore di questo intervallo, chiamato Li.

La mediana è data dalla seguente formula:

Me = Li + (Ls-Li) * (N / 2 - Frequenza accumulata prima di Li) / Frequenza di [Li, Ls)

Ls è il limite superiore dell'intervallo sopra menzionato.

Se viene utilizzata la tabella di dati sopra, abbiamo N / 2 = 18/2 = 9. Le frequenze accumulate sono 4, 8, 14 e 18 (una per ogni riga della tabella).

Pertanto, è necessario selezionare il terzo intervallo, poiché la frequenza accumulata è maggiore di N / 2 = 9.

Quindi Li = 5 e Ls = 7. Applicando la formula sopra descritta, devi:

Me = 5 + (7-5) * (9-8) / 6 = 5 + 2 * 1/6 = 5 + 1/3 = 16/3 ≈ 5.3333.

3- Moda

La moda è il valore che ha la maggior frequenza tra tutti i dati raggruppati; cioè, è il valore che viene ripetuto più volte nel set di dati iniziale.

Quando si dispone di una grande quantità di dati, la seguente formula viene utilizzata per calcolare la modalità dei dati raggruppati:

Mo = Li + (Ls-Li) * (Frequenza Li - Frequenza di L (i-1)) / ((Frequenza Li-Frequenza di L (i-1)) + (Frequenza Li-Frequenza di L ( i + 1)))

L'intervallo [Li, Ls) è l'intervallo in cui viene trovata la frequenza più alta. Per l'esempio fatto in questo articolo abbiamo che la moda è data da:

Mo = 5 + (7-5) * (6-4) / ((6-4) + (6-4)) = 5 + 2 * 2/4 = 5 + 1 = 6.

Un'altra formula che viene utilizzata per ottenere un valore approssimativo alla moda è la seguente:

Mo = Li + (Ls-Li) * (frequenza L (i + 1)) / (frequenza L (i-1) + frequenza L (i + 1)).

Con questa formula, i conti sono i seguenti:

Mo = 5 + (7-5) * 4 / (4 + 4) = 5 + 2 * 4/8 = 5 + 1 = 6.