Quando un set di dati presenta alcuni casi estremi.
Esempio: abbiamo un set di dati di 1000 in cui la maggior parte dei valori si aggira intorno al 1000-mark. Diciamo che la media e la mediana sono entrambi 1000. Ora aggiungiamo un "milionario". Il valore medio salirà drammaticamente a quasi 2000, mentre la mediana non cambierà davvero, perché sarà il valore del caso 501 invece del mezzo tra il caso 500 e il caso 501 (casi disposti in ordine di valore)
La media è la misura del centro più utilizzata, ma ci sono momenti in cui si consiglia di utilizzare la mediana per la visualizzazione e l'analisi dei dati. Quando potrebbe essere opportuno utilizzare la mediana anziché la media?
Quando ci sono alcuni valori estremi nel tuo set di dati. Esempio: hai un set di dati di 1000 casi con valori non troppo distanti. La loro media è 100, come è la loro mediana. Ora sostituisci un solo caso con un caso che ha valore 100000 (solo per essere estremo). Il valore medio salirà drammaticamente (fino a quasi 200), mentre la mediana non sarà influenzata. Calcolo: 1000 casi, media = 100, somma di valori = 100000 Perdere uno 100, aggiungere 100000, somma di valori = 199900, media = 199,9 Mediana (= caso 500 + 501) / 2 rimane uguale.
La mediana è definita una misura resistente, mentre la media è una misura non resistente. Qual è una misura resistente?
Resistente in questo caso significa che può resistere a valori estremi. Esempio: immagina un gruppo di 101 persone con una media (= media) di $ 1000 in banca. Succede anche che l'intermediario (dopo aver selezionato il saldo bancario) abbia anche $ 1000 in banca. Questa mediana significa che 50 (%) hanno meno e 50 ne hanno di più. Ora uno di loro vince un premio della lotteria di $ 100000 e decide di metterlo in banca. Il valore medio salirà immediatamente da $ 1000 a quasi $ 2000, poiché viene calcolato dividendo l'importo totale per 101. La mediana ("metà della riga") non sar
Diciamo che la mediana è una misura resistente, mentre la media non è una misura resistente. Qual è una misura resistente?
Una misura resistente è quella che non è influenzata da valori anomali.Per esempio se abbiamo una lista ordinata di numeri: 1, 3, 4, 5, 6, 8, 50 La media è: 11 La mediana è 5 La media in questo caso è maggiore della maggior parte dei numeri nella lista perché è influenzato così fortemente da 50, in questo caso un outlier forte. La mediana resterebbe 5 anche se l'ultimo numero nell'elenco ordinato era molto più grande, in quanto fornisce semplicemente il numero centrale in un elenco ordinato di numeri.