La statistica descrittiva è la disciplina di descrivere quantitativamente le caratteristiche principali di una raccolta di informazioni o la descrizione quantitativa stessa.
Le statistiche descrittive sono molto importanti perché se presentassimo semplicemente i nostri dati grezzi sarebbe difficile rendere visibile ciò che i dati stavano mostrando, specialmente se ce n'era un sacco. Le statistiche descrittive ci consentono quindi di presentare i dati in un modo più significativo, che consente un'interpretazione più semplice dei dati.
Ad esempio, se avessimo i risultati di 100 parti di corsi per studenti, potremmo essere interessati alle prestazioni generali di quegli studenti. Saremmo anche interessati alla distribuzione o alla diffusione dei marchi. Le statistiche descrittive ci permettono di farlo. Come descrivere correttamente i dati tramite statistiche e grafici è un argomento importante e discusso in altre guide di Laerd Statistics. In genere, esistono due tipi generali di statistiche che vengono utilizzati per descrivere i dati:
Misure di tendenza centrale: questi sono modi per descrivere la posizione centrale di una distribuzione di frequenza per un gruppo di dati. In questo caso, la distribuzione di frequenza è semplicemente la distribuzione e il modello dei punteggi ottenuti dai 100 studenti dal più basso al più alto.
Misure di diffusione: questi sono modi per riassumere un gruppo di dati descrivendo quanto sono distribuiti i punteggi. Ad esempio, il punteggio medio dei nostri 100 studenti può essere 65 su 100. Tuttavia, non tutti gli studenti avranno segnato 65 punti. Piuttosto, i loro punteggi saranno distribuiti. Alcuni saranno più bassi e altri più alti. Le misure di diffusione ci aiutano a riassumere la diffusione di questi punteggi.
Quando usiamo statistiche descrittive è utile riassumere il nostro gruppo di dati usando una combinazione di descrizioni tabulate (cioè tabelle), descrizione grafica (cioè grafici e grafici) e commenti statistici (cioè una discussione dei risultati).
La somma delle cifre di un numero a due cifre è 14. La differenza tra la cifra delle decine e la cifra delle unità è 2. Se x è la cifra delle decine e y è la cifra, quale sistema di equazioni rappresenta la parola problema?
X + y = 14 xy = 2 e (possibilmente) "Number" = 10x + y Se xey sono due cifre e ci viene detto che la loro somma è 14: x + y = 14 Se la differenza tra la cifra delle decine x e la unità cifra y è 2: xy = 2 Se x è la cifra delle decine di un "Numero" e y è la sua cifra di unità: "Numero" = 10x + y
Perché le misure di tendenza centrale sono essenziali per le statistiche descrittive?
Perché nel descrivere un insieme di dati, il nostro interesse principale è solitamente il valore centrale della distribuzione. Nelle statistiche descrittive, stiamo spiegando le caratteristiche di un insieme di dati in mano - non stiamo tracciando conclusioni sulla popolazione più ampia da cui provengono i dati (si tratta di statistiche inferenziali). Nel fare ciò, la nostra domanda principale è di solito "dove si trova il centro della distribuzione". Per rispondere a questa domanda, usiamo normalmente la media, la mediana o la modalità, a seconda del tipo di dati. Queste tre misure
Come posso calcolare le seguenti statistiche sull'aspettativa di durata della vita del motore? (le statistiche, apprezzerebbero davvero l'aiuto con questo)
"a)" 4 "b) 0.150158" "c) 0.133705" "Si noti che una probabilità non può essere negativa, quindi suppongo che" "dobbiamo supporre che x vada da 0 a 10." "Prima di tutto abbiamo bisogno di determinare c in modo che la somma di tutte le probabilità" "sia 1:" int_0 ^ 10 cx ^ 2 (10 - x) "" dx = c int_0 ^ 10 x ^ 2 (10 - x) " "dx = 10 c int_0 ^ 10 x ^ 2 dx - c int_0 ^ 10 x ^ 3 dx = 10 c [x ^ 3/3] _0 ^ 10 - c [x ^ 4/4] _0 ^ 10 = 10000 c / 3 - 10000 c / 4 = 10000 c (1/3 - 1/4) = 10000 c (4 - 3) / 12 = 10000 c / 12 = 1 => c =