Ebben a cikkben áttekintjük a szükséges lépéseket hipotézis teszt, vagy a szignifikancia tesztje a két populációarány különbségére. Ez lehetővé teszi, hogy összehasonlítsunk két ismeretlen arányt és következtethessünk, ha nem azonosak egymással, vagy ha az egyik nagyobb, mint a másik.
Hipotézis teszt áttekintése és háttér
Mielőtt megvizsgálnánk a hipotézisteszt specifikációit, megvizsgáljuk a hipotézisteszt kereteit. A szignifikancia vizsgálatánál megpróbáljuk kimutatni, hogy egy állítás a népesség értékére vonatkozik paraméter (vagy néha maga a lakosság jellege) valószínűleg igaz.
E nyilatkozatot bizonyítékokkal gyűjtjük a statisztikai minta. Ebből a mintából kiszámítunk egy statisztikát. Ennek a statisztikának az értékét használjuk az eredeti állítás igazságának meghatározására. Ez a folyamat bizonytalanságot tartalmaz, azonban ezt a bizonytalanságot mennyiségileg meg tudjuk határozni
A hipotézisvizsgálat teljes folyamatát az alábbi lista adja:
- Ellenőrizze, hogy teljesülnek-e a vizsgálatunkhoz szükséges feltételek.
- Világosan állapítsa meg a null és alternatív hipotézisek. Az alternatív hipotézis magában foglalhat egyoldalú vagy kétoldalas tesztet. Meg kell határoznunk a szignifikancia szintjét is, amelyet a görög alfa betű jelöl.
- Számítsa ki a teszt statisztikáját. Az általunk használt statisztika típusa az elvégzett teszttől függ. A számítás statisztikai mintánkon alapul.
- Számítsa ki a p-érték. A teszt statisztikája lefordítható p-értékre. A p-érték a véletlenszerűség valószínűsége, amely önmagában eredményezi a tesztstatisztikánk értékét azzal a feltételezéssel, hogy a nulla hipotézis igaz. Az általános szabály az, hogy minél kisebb a p-érték, annál több bizonyíték van a nullhipotézissel szemben.
- Végezzen egy következtetést. Végül az alfa értékét használjuk, amelyet már küszöbértékként választottak ki. A döntési szabály az, hogy ha a p-érték kisebb vagy egyenlő, mint az alfa, akkor elutasítjuk a nullhipotézist. Egyébként mi nem utasítják el a nulla hipotézis.
Most, hogy megláttuk a hipotézis-teszt keretét, meglátjuk a két populációarány különbségére vonatkozó hipotézisteszt részleteit.
A feltételek
A két populációarány különbségére vonatkozó hipotézisvizsgálat megköveteli a következő feltételek teljesülését:
- Van ketten egyszerű véletlenszerű minták nagy népességből. Itt a „nagy” azt jelenti, hogy a populáció legalább húszszor nagyobb, mint a minta. A minta méretét jelöli n1 és n2.
- A mintánkban szereplő egyéneket egymástól függetlenül választottuk meg. A lakosságnak is függetlennek kell lennie.
- Mindkét mintánkban legalább 10 siker és 10 kudarc található.
Amíg ezek a feltételek teljesülnek, folytathatjuk hipotézistesztünket.
A nulla és az alternatív hipotézis
Most meg kell vizsgálnunk a hipotéziseket a szignifikancia tesztünk során. A nullhipotézis a hatástalanság megállapítása. Ebben a hipotézis-vizsgálatban az a hipotézis, hogy nincsenek különbségek a két populációarány között. Ezt H-ként írhatjuk0: p1 = p2.
Az alternatív hipotézis a három lehetőség egyike, attól függően, hogy mit tesztelünk:
- Hegy: p1 nagyobb, mint p2. Ez egyoldalú vagy egyoldalas teszt.
- Hegy: p1 kevesebb mint p2. Ez egyoldalú teszt is.
- Hegy: p1 nem egyenlő: p2. Ez egy kétirányú vagy kétoldalas teszt.
Mint mindig, az óvatosság érdekében a kétoldalas alternatív hipotézist kell használnunk, ha a minta megszerzése előtt nincs szem előtt tartva egy irányt. Ennek oka az, hogy a nullhipotézist nehezebb kétoldalú teszttel elutasítani.
A három hipotézist át lehet írni úgy, hogy meghatározzuk, hogyan p1 - p2 a nulla értékhez kapcsolódik. Pontosabban fogalmazva, a nullhipotézis H lesz0:p1 - p2 = 0. A lehetséges alternatív hipotéziseket így írnák:
- Hegy: p1 - p2 > 0 egyenértékű a "p1 nagyobb, mint p2."
- Hegy: p1 - p2 <0 egyenértékű a "p1 kevesebb mint p2."
- Hegy: p1 - p2 ≠ 0 egyenértékű a "p1 nem egyenlő: p2."
Ez az egyenértékű megfogalmazás valójában egy kicsit megmutatja nekünk, mi történik a színfalak mögött. Amit a hipotézis teszt során teszünk, a két paraméter elforgatása p1 és p2 az egyetlen paraméterbe p1 - p2. Ezután teszteljük ezt az új paramétert a nulla értékkel szemben.
A teszt statisztika
A teszt statisztikájának képlete a fenti képen található. Az egyes kifejezések magyarázata a következő:
- Az első populáció mintájának mérete van n1. A minta sikereinek száma (amelyet a fenti képlet nem mutat közvetlenül): k1.
- A második populáció mintájának mérete van n2. A minta sikereinek száma: k2.
- A minta aránya p1-kalap = k1 / n1 és p2-hat = k2 / n2 .
- Ezután egyesítjük vagy összevonjuk mindkét minta sikereit és megkapjuk: p-kalap = (k1 + k2) / (n1 + n2).
Mint mindig, vigyázzon a műveletek sorrendjére a számítás során. A négyzetgyök megvétele előtt ki kell számolni a radikális alatti mindent.
A P-érték
A következő lépés a p-érték kiszámítása, amely megfelel a teszt statisztikánknak. A statisztikánkhoz egy normál normál eloszlást használunk, és megkeresjük az értékek táblázatát, vagy statisztikai szoftvert használunk.
A p-érték kiszámításának részletei az általunk használt alternatív hipotézistől függnek:
- Hegy: p1 - p2 > 0, kiszámoljuk a normál eloszlás nagyobb arányát, mint Z.
- Hegy: p1 - p2 <0, akkor kiszámoljuk a normál eloszlás arányát, amely kevesebb, mint Z.
- Hegy: p1 - p2 ≠ 0, kiszámoljuk a normál eloszlás arányát, amely nagyobb, mint |Z, abszolút értéke Z. Ezt követően, hogy figyelembe vegyük azt a tényt, hogy kétoldalú tesztünk van, megkétszerezzük az arányt.
Döntési szabály
Most döntenek arról, hogy elutasítják-e a nullhipotézist (és ezzel elfogadjuk az alternatívát), vagy pedig a nullhipotézist. Ezt a döntést úgy hozzuk meg, hogy p-értékünket összehasonlítjuk az alfa-jelentőség szintjével.
- Ha a p-érték kisebb vagy egyenlő, mint az alfa, akkor elutasítjuk a nullhipotézist. Ez azt jelenti, hogy statisztikailag szignifikáns eredményünk van, és elfogadni fogjuk az alternatív hipotézist.
- Ha a p-érték nagyobb, mint az alfa, akkor a nullhipotézist nem lehet elutasítani. Ez nem bizonyítja, hogy a nulla hipotézis igaz. Ehelyett azt jelenti, hogy nem kaptunk elegendő meggyőző bizonyítékot a nullhipotézis elutasításához.
Különleges megjegyzés
Az konfidencia intervallum a két populációs arány különbségére nem egyesíti a sikereket, míg a hipotézis teszt. Ennek oka az, hogy a nullhipotézisünk ezt feltételezi p1 - p2 = 0. A konfidencia intervallum ezt nem feltételezi. Egyes statisztikusok nem egyesítik a hipotézisteszt sikereit, ehelyett a fenti tesztstatisztika kissé módosított változatát használják.