A kutatók sokszor meg akarják tudni a széles körű kérdésekre adott válaszokat. Például:
- Mit néztek egy adott országban a televízióban tegnap este?
- Ki választók? szavazni kívánnak egy közelgő választáson?
- Hány madár visszatér a vándorlásból egy adott helyen?
- A munkaerő hány százaléka van munkanélküli?
Az ilyen típusú kérdések hatalmasak abban az értelemben, hogy egyének millióinak nyomon követése megköveteli tőlünk.
A statisztika egyszerűsíti ezeket a problémákat a mintavételnek nevezett módszer használatával. Statisztikai minta elvégzésével mérhetetlenül csökkenthetjük munkaterhelésünket. A milliárdok vagy milliók viselkedésének nyomon követése helyett csak a több ezer vagy száz ember viselkedését kell megvizsgálnunk. Mint látni fogjuk, ez az egyszerűsítés áron jár.
Népesség és népszámlálás
A statisztikai tanulmány populációja az, amiben megpróbálunk kideríteni valamit. Az összes vizsgált személyből áll. A lakosság valójában bármi lehet. A kaliforniai, karibi, számítógépeket, autókat vagy megyéket mind statisztikai kérdéstől függően populációnak lehet tekinteni. Bár a vizsgált populációk többsége nagy, nem feltétlenül kell.
A lakosság kutatásának egyik stratégiája a népszámlálás lefolytatása. A népszámlálás során a népesség minden egyes tagját megvizsgáljuk tanulmányunkban. Kiváló példa erre Amerikai népszámlálás. A népszámlálási iroda tízévente kérdőívet küld minden ország számára. Azokat, akik nem küldik vissza az űrlapot, a népszámláló dolgozók látogatják meg
A népszámlálás nehézségekkel teli. Idő és erőforrások szempontjából jellemzően drágák. Ezen túlmenően nehéz garantálni, hogy a lakosság minden tagját elérték. Más népességnél még nehezebb a népszámlálást elvégezni. Ha szeretnénk tanulmányozni a kóbor kutyák szokásait New York államban, akkor sok szerencsét felfelé fordítva összes ezeknek a tranziens kutyáknak.
minták
Mivel általában nem lehetséges vagy nem praktikus a népesség minden tagjának nyomon követése, a következő választható lehetőség a populáció mintavétele. A minta a populáció bármely részhalmaza, tehát mérete lehet kicsi vagy nagy. Olyan kicsi mintát akarunk, amely számítási teljesítményünkkel kezelhető, ugyanakkor elég nagy ahhoz, hogy statisztikailag szignifikáns eredményeket kapjunk.
Ha egy szavazó cég megpróbálja meghatározni a választók elégedettségét a Kongresszussal, és annak minta nagysága az egyik, akkor az eredmények értelmetlenek lesznek (de könnyen megszerezhetők). Másrészt az emberek millióinak kérése túl sok forrást fog felhasználni. Az egyensúly megteremtése érdekében az ilyen típusú közvélemény-kutatások mintavétele általában körülbelül 1000.
Véletlenszerű minták
De a megfelelő méretű minta nem elegendő a jó eredmények biztosításához. Olyan mintát akarunk, amely reprezentatív a lakosság számára. Tegyük fel, hogy meg akarjuk tudni, hogy hány könyvet olvas az átlagos amerikai évente. Felkérjük 2000 főiskolai hallgatót, hogy tartsa nyomon az év folyamán olvasott oldalt, majd egy év elteltével nézzen vissza velük. Megállapítottuk, hogy az elolvasott könyvek átlagos száma 12, majd arra következtetünk, hogy az átlagos amerikai évente 12 könyvet olvas.
A forgatókönyv problémája a minta. A főiskolai hallgatók többsége 18-25 év közötti, oktatóik pedig tankönyveket és regényeket olvasnak el. Ez az átlagos amerikai gyenge ábrázolása. Egy jó minta különböző életkorú, életmódbeli és ország különböző régióiból származó embereket tartalmazna. Egy ilyen minta megszerzéséhez véletlenszerűen kell összeállítanunk, hogy minden amerikai egyenlő eséllyel rendelkezzen a mintában.
A minták típusai
A statisztikai kísérletek arany szabványa a egyszerű véletlenszerű minta. Egy ilyen méretű mintában n egyének, a populáció minden tagja ugyanolyan valószínűséggel választja meg a mintát, és minden csoport n az egyének ugyanolyan valószínűséggel kerülnek kiválasztásra. A populáció mintavételének különféle módjai vannak. Néhány a leggyakoribb a következők:
- Véletlenszerű példa
- Egyszerű véletlenszerű minta
- Önkéntes válaszminta
- Kényelmi minta
- Rendszeres minta
- Klaszterminta
- Rétegzett minta
Néhány tanács
Ahogy a mondás mondja: „A jól kezdett fél kész.” Annak biztosítása érdekében, hogy statisztikai tanulmányaink és kísérleteink eredményesek legyenek, gondosan meg kell terveznünk és el kell kezdenünk őket. Könnyű előállítani a rossz statisztikai mintákat. Jó egyszerű véletlenszerű minták munkát igényel a megszerzéséhez. Ha adataink véletlenszerűen és körültekintően szerezhetők be, akkor a statisztikai technikák nem számítanak érdemi következtetésekre, függetlenül attól, hogy milyen kifinomult elemzést végezzünk.