A szórás mérlegelésekor meglepetés lehet, hogy valójában két megfontolható. Van egy populációs szórás és van egy minta szórás. Megkülönböztetjük a kettőt, és kiemeljük a különbségeket.
Minőségi különbségek
Bár mindkét standard eltérés méri a variabilitást, vannak különbségek a populáció és az a között a minta szórása. Az első a különbségtétel között van statisztikák és paraméterek. A populáció szórása egy paraméter, amely egy fix érték, amelyet a populáció minden egyes egyénéből kiszámítanak.
A minta szórása egy statisztika. Ez azt jelenti, hogy a népességnek csak néhány egyedéből számítják ki. Mivel a minta szórása a mintától függ, nagyobb variabilitása van. Így a minta szórása nagyobb, mint a populációé.
Mennyiségi különbség
Látni fogjuk, hogy ez a kétféle eltérés hogyan számszerűen különbözik egymástól. Ehhez figyelembe vesszük a képleteket mind a minta szórására, mind a populáció szórására.
A két szórás kiszámításához használt képletek majdnem megegyeznek:
- Számítsa ki az átlagot.
- Vonja le az átlagot az egyes értékekből, hogy eltérést kapjon az átlagtól.
- Négyzetbe helyezze az eltéréseket.
- Összeadja ezeket a négyzetes eltéréseket.
Most ezeknek a szórásoknak a kiszámítása eltér:
- Ha a népesség szórását számoljuk, akkor osztjuk el N, az adatértékek száma.
- Ha a minta szórását számoljuk, akkor osztjuk el n -1, egy kevesebb, mint az adatértékek száma.
Az utolsó lépés, a két vizsgált esetben mindkét esetben az, hogy a hányados négyzetgyökét vesszük az előző lépésből.
Minél nagyobb a n minél közelebb lesz a populáció és a minta szórása.
Példa számításra
A két számítás összehasonlításához ugyanazt az adatkészletet fogjuk kezdeni:
1, 2, 4, 5, 8
Ezután elvégezzük az összes lépést, amelyek mindkét számításban közösek. Ezt követően a számítások eltérnek egymástól, és megkülönböztetjük a populációt és a mintavételi szórást.
Az átlag (1 + 2 + 4 + 5 + 8) / 5 = 20/5 = 4.
Az eltéréseket az átlag kivonásával számolják az egyes értékekből:
- 1 - 4 = -3
- 2 - 4 = -2
- 4 - 4 = 0
- 5 - 4 = 1
- 8 - 4 = 4.
A négyzet eltérései a következők:
- (-3)2 = 9
- (-2)2 = 4
- 02 = 0
- 12 = 1
- 42 = 16
Most hozzáadjuk ezeket a négyzetes eltéréseket és látjuk, hogy azok összege 9 + 4 + 0 + 1 + 16 = 30.
Első számításunk során az adatokat úgy kezeljük, mintha az a teljes populáció lenne. Az adatpontok számával osztjuk, ami öt. Ez azt jelenti, hogy a lakosság variancia értéke 30/5 = 6. A népesség szórása a négyzetgyök 6. Ez körülbelül 2.4495.
Második számításunkban az adatainkat úgy kezeljük, mintha mintavétel lenne, nem pedig a teljes populációt. Egy kevesebbel osztjuk el, mint az adatpontok száma. Tehát ebben az esetben négyre osztjuk. Ez azt jelenti, hogy a minta szórása 30/4 = 7,5. A minta szórása a négyzetgyök 7,5. Ez körülbelül 2,7386.
Ebből a példából nagyon nyilvánvaló, hogy különbség van a populáció és a minta szórása között.