A népességi szórás megmutatja, hogyan kell elosztani az adatkészletet. Sajnos általában lehetetlen pontosan tudni, hogy mi ez a populációs paraméter. A tudáshiány kompenzálására a következtetési statisztikákból álló, az úgynevezett témát használjuk megbízhatósági intervallumok. Látni fogunk egy példát arra, hogyan lehet kiszámítani a konfidencia intervallumot a populáció varianciájához.
Bizalmi intervallum képlet
Az (1 - α) képlete a populációs variancia konfidencia intervalluma. Az egyenlőtlenségek következő sorozata adja:
[ (n - 1)s2] / B < σ2 < [ (n - 1)s2] / A.
Itt n a minta mérete, s2 a minta szórása. A szám A az a chi-négyzet eloszlás pontja, ahol n -1 szabadságfok, amelyen pontosan a görbe alatti terület α / 2-e van balra A. Hasonló módon a szám B ugyanazon a chi-négyzet eloszlás pontja, pontosan α / 2 értékével a görbe alatti terület jobb oldalától B.
előzmények
Egy 10 értékű adatkészlettel kezdjük. Ezt az adatértéket egy egyszerű véletlenszerű mintával nyertük:
97, 75, 124, 106, 120, 131, 94, 97,96, 102
Néhány feltáró adat elemzésre lenne szükség annak bizonyítására, hogy nincsenek túlmutatások. Azáltal, hogy szár és levél telek látjuk, hogy ezek az adatok valószínűleg olyan eloszlásból származnak, amely megközelítőleg normálisan eloszlik. Ez azt jelenti, hogy folytathatjuk a populációs variancia 95% -os konfidencia-intervallumának megállapítását.
Mintavariancia
Becsülnünk kell a populáció varianciáját a minta szórásával, amelyet jelölünk s2. Tehát ezt a statisztikát kiszámoljuk. Alapvetően átlagoljuk a a négyzet eltérések összege középre. Ahelyett, hogy ezt az összeget elosztnánk n osztjuk fel n - 1.
Megállapítottuk, hogy a minta átlaga 104,2. Ezzel számoljuk az átlagtól számított négyzet eltérését:
(97 – 104.2)2 + (75 – 104.3)2 +... + (96 – 104.2)2 + (102 – 104.2)2 = 2495.6
Ezt az összeget 10 - 1 = 9-el osztjuk, hogy 277-es szórásmintát kapjunk.
Chi-négyzet eloszlás
Most a chi-négyzet eloszlásunkhoz fordulunk. Mivel 10 adatértékünk van, 9-esünk van fokú szabadság. Mivel az eloszlás középértékének 95% -át akarjuk, mindkét farokhoz 2,5% -ra van szükség. Kínálunk egy négyzet alakú táblát vagy szoftvert, és látjuk, hogy a 2.7004 és a 19.023 táblázati értékek a disztribúció területének 95% -át fedik le. Ezek a számok A és B, ill.
Most már van mindent, amire szükségünk van, és készen állunk arra, hogy összeállítsuk a bizalmi intervallumunkat. A bal oldali végpont képlete: (n - 1)s2] / B. Ez azt jelenti, hogy a bal végpont:
(9 x 277) / 19,023 = 133
A helyes végpontot a cserével találja meg B val vel A:
(9x277) / 2,7004 = 923
Így 95% -kal biztosak vagyunk abban, hogy a népesség szórása 133 és 923 között van.
Népesség szórása
Természetesen, mivel a szórás a variancia négyzetgyöke, ez a módszer felhasználható a populáció standard eltérésének konfidenciaintervallumának megalkotására. Csak annyit kell tennünk, hogy a végpontok négyzetgyökereit vonjuk le. Az eredmény 95% -os megbízhatósági intervallum lenne a szórás.