A hipotézis tesztek vagy a szignifikancia tesztek egy p-értékként ismert szám kiszámítását foglalják magukban. Ez a szám nagyon fontos a teszt befejezéséhez. A P-értékek a teszt statisztikájához kapcsolódnak, és a nulla hipotézis alapján meghatározzák a bizonyítékot.
Null és alternatív hipotézisek
A statisztikai jelentőségű tesztek mindegyike a-vel kezdődik null és egy alternatív hipotézis. A nullhipotézis a hatástalanság megállapítása vagy az általánosan elfogadott helyzet állítása. Az alternatív hipotézist próbáljuk bizonyítani. A hipotézis-teszt munkafeltételezése szerint a nullhipotézis igaz.
Teszt statisztika
Feltételezzük, hogy teljesülnek a feltételek az adott teszthez, amelyen dolgozunk. A egyszerű véletlenszerű minta mintadatokat ad nekünk. Ezen adatok alapján kiszámolhatjuk a teszt statisztikáját. A teszt statisztikája nagyban különbözik attól függően, hogy milyen paramétereket érinti a hipotézis teszt. Néhány általános tesztstatisztika a következőket tartalmazza:
- Z - a népesség átlagát érintő hipotézis tesztek statisztikája, amikor tudjuk, hogy a populáció szórása.
- t - a népesség átlagát érintő hipotézis tesztek statisztikája, amikor nem tudjuk a populáció szórását.
- t - a két független populáció közti különbségre vonatkozó hipotézis tesztek statisztikája, amikor a két populáció egyikének szórását sem tudjuk megismerni.
- Z - a populáció arányára vonatkozó hipotézis tesztek statisztikája.
- Chi-négyzet - statisztika a kategorikus adatok várható és tényleges száma közötti különbségre vonatkozó hipotézis teszteknél.
A P-értékek kiszámítása
A tesztstatisztikák hasznosak, de hasznosabb lehet, ha ezekre a statisztikákra p-értéket rendelnek. A p-érték annak a valószínűsége, hogy ha a nulla hipotézis igaz, akkor legalább olyan szélsőséges statisztikát fogunk megfigyelni, mint amit megfigyeltünk. A p-érték kiszámításához a megfelelő szoftvert vagy statisztikai táblázatot használjuk, amely megfelel a teszt statisztikánknak.
Például a normál normál eloszlás kiszámításakor a Z teszt statisztika. Értékei Z a nagy abszolút értékekkel (például a 2,5-nél nagyobb értékekkel) nem nagyon gyakoriak, és kis p-értéket adnának. Értékei Z amelyek nullához közelebb vannak, gyakoribbak, és sokkal nagyobb p-értékeket adnának.
A P-érték értelmezése
Mint már megjegyeztük, a p-érték valószínűség. Ez azt jelenti, hogy 0 és 1 közötti valós szám. Míg a tesztstatisztika az egyik módja annak, hogy meghatározzuk, mennyire extrém a statisztika egy adott mintára, addig a p-értékek ezt is mérik.
Amikor megkapjuk az adott statisztikai mintát, akkor mindig fel kell tennünk a kérdést: „Ez a minta véletlenszerűen van-e? egyedül egy igaz nullhipotézissel, vagy ha a nullhipotézis hamis? ” Ha p-értékünk kicsi, akkor ez a kettő egyikét jelentheti dolgot:
- A nullhipotézis igaz, de nagyon szerencsések voltak a megfigyelt minta megszerzésében.
- A mintánknak az az oka, hogy a nullhipotézis hamis.
Általában véve: minél kisebb a p-érték, annál több bizonyíték van a nullhipotézisünk ellen.
Mennyire kicsi elég kicsi?
Milyen kicsi p-értékre van szükségünk ahhoz, hogy utasítsa el a nullhipotézist? A válasz erre: "Attól függ." Általános szabály, hogy a p-értéknek legfeljebb 0,05-nek kell lennie, de ebben az értékben nincs semmi univerzális.
Általában, mielőtt elvégznénk egy hipotézis tesztet, választanánk egy küszöbértéket. Ha van olyan p-érték, amely ezen küszöbértéknél kisebb vagy azzal egyenlő, akkor elutasítjuk a nullhipotézist. Ellenkező esetben elutasítjuk a nulla hipotézist. Ezt a küszöböt hipotézistesztünk szignifikancia szintjének hívják, és a görög alfa betűvel jelölik. Nincs az alfa értéke amely mindig meghatározza a statisztikai szignifikanciát.