Példa a megfelelőség tesztjére

Az az illesztés chi-négyzet jóságának tesztje hasznos összehasonlítani a elméleti modell a megfigyelt adatokhoz. Ez a teszt az általánosabb chi-square teszt típusa. Mint minden matematikai vagy statisztikai téma esetében, hasznos lehet egy példa kidolgozása annak megértése érdekében, hogy mi történik, egy példa segítségével az illeszkedés tesztjének négyzet alakú jóságát.

Vegyük figyelembe az M & Ms tejcsokoládé standard csomagját. Hat különböző szín létezik: piros, narancs, sárga, zöld, kék és barna. Tegyük fel, hogy kíváncsi vagyunk e színek eloszlására, és kérdezzük: vajon mind a hat szín azonos arányban fordul elő? Ez a fajta kérdés, amelyre megválaszolható az alkalmassági teszt.

Beállítás

Először megjegyezzük a beállítást és azt, hogy miért megfelelő az illeszkedés tesztje. A színváltozónk kategorikus. Ennek a változónak hat szintje van, amely a hat lehetséges színnek felel meg. Feltételezzük, hogy az általunk beszámolt M & Ms egy egyszerű véletlenszerű minta lesz az összes M & Ms populációjából.

instagram viewer

Null és alternatív hipotézisek

Az null és alternatív hipotézisek az alkalmassági tesztünk tükrözi azt a feltételezést, amelyet a népességgel kapcsolatban teszünk. Mivel azt vizsgáljuk, hogy a színek egyenlő arányban fordulnak elő, nulla hipotézisünk az lesz, hogy minden szín azonos arányban fordul elő. Formálisabban, ha p1 a piros cukorka népességaránya, p2 a narancssárga cukorka népességaránya és így tovább, akkor a nulla hipotézis az, hogy p1 = p2 =... = p6 = 1/6.

Alternatív hipotézis az, hogy a populáció arányainak legalább az egyik nem egyenlő 1/6-tal.

Tényleges és várható számok

A tényleges szám a cukorkák száma mind a hat színben. A várt szám arra utal, amit elvárhatnánk, ha a nulla hipotézis igaz lenne. Engedjük n legyen a mintánk mérete. A vörös cukorkák várható száma: p1 n vagy n/6. Valójában ebben a példában a hat szín mindegyikének várható száma édességet jelent n alkalommal pénvagy n/6.

Chi-négyzet statisztika a fittségről

Most kiszámoljuk a chi-négyzet statisztikát egy adott példához. Tegyük fel, hogy van egy egyszerű véletlenszerű mintánk, 600 M&M cukorka, a következő eloszlással:

  • A cukorkák közül 212 kék színű.
  • A cukorkák közül 147 narancssárga.
  • A cukorkák közül 103 zöld.
  • A cukorkák közül 50 piros.
  • 46 cukorka sárga.
  • A cukorkák közül 42 barna.

Ha a nulla hipotézis igaz, akkor ezeknek a színeknek a várható száma (1/6) x 600 = 100. Most ezt használjuk a khi-négyzet statisztika kiszámításához.

Az egyes színekből kiszámoljuk a statisztikához való hozzájárulást. Mindegyik formája van (tényleges - várható)2/Expected.:

  • A kéknek van (212 - 100)2/100 = 125.44
  • A narancshoz (147 - 100) van2/100 = 22.09
  • A zöld számára (103–100)2/100 = 0.09
  • A vörösnek van (50–100)2/100 = 25
  • Sárga esetében (46–100)2/100 = 29.16
  • Barna esetében (42 - 100)2/100 = 33.64

Ezután összesítjük ezeket a hozzájárulásokat és megállapítottuk, hogy a chi-négyzet statisztikánk 125,44 + 22,09 + 0,09 + 25 +29,16 + 33,64 = 235,42.

Szabadságfokok

Száma fokú szabadság az illeszkedés jóságának vizsgálata egyszerűen egy kevesebb, mint a változónk szintjeinek száma. Mivel hat szín volt, 6 - 1 = 5 szabadságfok van.

Chi-négyzet táblázat és P-érték

A kiszámított 235,42 chi-négyzet statisztika egy adott szabadság fokának megfelelő chi-négyzet eloszlás adott helyére vonatkozik. Most szükségünk van egy p-érték, hogy meghatározzák a legalább 235,42 szélsőséges tesztstatisztika megszerzésének valószínűségét, feltételezve, hogy a nullhipotézis igaz.

A Microsoft Excel használható a számításhoz. Megállapítottuk, hogy öt szabadságfokú tesztstatisztikánk p-értéke 7,29 x 10-49. Ez egy rendkívül kicsi p-érték.

Döntési szabály

A p-érték nagysága alapján döntjük el a nullhipotézis elutasításáról. Mivel nagyon apró p-értékünk van, elutasítjuk a nullhipotézist. Megállapítottuk, hogy az M & Ms nem oszlik meg egyenletesen a hat különböző szín között. Egy nyomon követési elemzés felhasználható az adott szín populációarányának konfidencia intervallumának meghatározására.