Qual è il teorema del limite centrale?

Qual è il teorema del limite centrale?
Anonim

Risposta:

Il teorema del limite centrale rende rigorosa l'idea intuitiva secondo cui le stime della media (stimata da alcuni campioni) di alcune misurazioni associate ad alcune popolazioni migliorano all'aumentare della dimensione del campione.

Spiegazione:

Immagina una foresta contenente 100 alberi.

Ora immagina che (piuttosto irrealisticamente) che, misurato in metri, un quarto di loro abbia un'altezza di 2, un quarto di loro ha un'altezza di 3, un quarto di loro ha un'altezza di 4, e un quarto di loro ha un altezza di 5.

Immagina di misurare l'altezza di ogni albero nella foresta e di utilizzare le informazioni per costruire un istogramma con dimensioni del cestino opportunamente scelte (ad esempio da 1,5 a 2,5, da 2,5 a 3,5, da 3,5 a 4,5 e da 5,5 a 6,5; mi rendo conto che non ho specificato il cestino a cui appartengono i confini ma non importa qui).

È possibile utilizzare l'istogramma per stimare la distribuzione di probabilità degli alberi. Chiaramente, non sarebbe normale.In effetti, fornire i punti finali sono stati scelti in modo appropriato, sarebbe uno uniforme perché ci sarebbe un numero uguale di alberi corrispondenti ad una delle altezze specificate in ogni cestino.

Ora immagina di andare nella foresta e misurare l'altezza di soli due alberi; calcola l'altezza media di questi due alberi e prendine nota. Ripeti l'operazione più volte, in modo da avere una raccolta dei valori medi per i campioni della dimensione 2. Se dovessi tracciare un istogramma delle stime della media, non sarebbe più uniforme. Invece, è probabile che ci sarebbero più misure (stime della media basate su campioni di dimensione 2) vicino all'altezza media complessiva di tutti gli alberi nella foresta (in questo caso particolare,

#(2 + 3 + 4 + 5)/4 = 3.5# metri).

Come ci sarebbe di più stime della media vicino al vera popolazione media (che è noto in questo esempio irrealistico), che lontano dalla media, la forma di questo nuovo istogramma sarebbe più vicina a una distribuzione normale (con un picco vicino alla media).

Ora immagina di andare nella foresta e ripetere l'esercizio, tranne per il fatto che misurerai l'altezza di 3 alberi, calcolando la media in ogni caso e prendendo nota di ciò. L'istogramma che costruiresti avrebbe ancora più stime della media vicino alla media vera, con meno diffusione (la possibilità di selezionare tre alberi in un campione qualsiasi in modo che tutti vengano da entrambi i gruppi finali - o la stessa alto o molto corto --- è inferiore alla selezione di tre alberi con una selezione di altezze). La forma dell'istogramma che comprende una stima della dimensione media (ciascuna media basata su tre misurazioni) sarebbe più vicina a quella di una distribuzione normale e la corrispondente deviazione standard (delle stime della media, non della popolazione madre) sarebbe più piccoli.

Ripeti questo per 4, 5, 6, ecc., Alberi per media, e l'istogramma che costruisci sembrerebbe sempre più simile a una distribuzione normale (con dimensioni del campione progressivamente più grandi), con la media del distribuzione di il stime della media essere più vicino alla vera media e la deviazione standard delle stime della media che diventa sempre più stretta e stretta.

Se ripeti l'esercizio per il caso (degenerato) in cui tutti gli alberi sono misurati (in diverse occasioni, prendendo nota della media in ogni caso), allora l'istogramma avrà una stima della media solo in uno dei bidoni (quello corrispondente alla media vera), senza alcuna variazione in modo che la deviazione standard di (la distribuzione di probabilità stimata da) che "istogramma" sia zero.

Così, il teorema del limite centrale rileva che la media della certa stima della media di qualche popolazione si avvicina asintoticamente la vera media e la deviazione standard della stima della media (piuttosto che la deviazione standard della distribuzione della popolazione genitore) diventa progressivamente più piccolo per campioni di dimensioni maggiori.