Adott a adatsor, feltehetjük a kérdést, hogy a sorozat véletlenszerű jelenségek útján történt-e, vagy ha az adatok nem véletlenszerűek. A véletlenszerűséget nehéz azonosítani, mivel nagyon nehéz egyszerűen megnézni az adatokat, és meghatározni, hogy csak véletlenszerűen állították-e elő. Az egyik olyan módszer, amelyet felhasználhatunk annak meghatározására, hogy egy sorozat valóban véletlenül történt-e, futási tesztnek nevezzük.
A futási teszt egy szignifikancia teszt vagy hipotézis teszt. A teszt eljárása azon adatok futtatásán vagy sorozatán alapul, amelyeknek van egy bizonyos tulajdonsága. A futásteszt működésének megértéséhez először meg kell vizsgálnunk a futás fogalmát.
Az adatsorok
Először egy futási példát vizsgálunk meg. Vegye figyelembe a véletlenszerű számjegyek következő sorozatát:
6 2 7 0 0 1 7 3 0 5 0 8 4 6 8 7 0 6 5 5
Ezen számok osztályozásának egyik módja az, hogy két kategóriába osztják őket, akár egyenletes (beleértve a 0, 2, 4, 6 és 8 számjegyeket), akár páratlan (beleértve az 1., 3., 5., 7. és 9. számjegyet). Megvizsgáljuk a véletlenszerű számjegyek sorrendjét, és a páros számokat E-vel, a páratlan számokat O-val jelöljük:
E E O E E O O E E E E E E O E E O O
A futások könnyebben láthatók, ha ezt újraírjuk úgy, hogy az összes O és az összes együtt legyen:
EE O EE OO E O EEEEE O EE OO
Megszámoljuk a páros vagy páratlan számú blokkok számát, és látjuk, hogy összesen tíz fut az adat. Négy futás hossza egy, öt kettő és egy hossza öt
Körülmények
Bármelyikkel szignifikancia teszt, fontos tudni, hogy milyen feltételek szükségesek a teszt elvégzéséhez. A futási teszthez az egyes adatértékeket a mintából két kategóriába sorolhatjuk. A teljes futtatás számát az egyes kategóriákba eső adatértékek számához viszonyítva számoljuk.
A teszt a kétoldalas teszt. Ennek oka az, hogy a túl kevés futtatás azt jelenti, hogy valószínűleg nincs elég variáció és a véletlenszerű folyamatokból származó futtatások száma. Túl sok futtatás eredményez eredményt, ha egy folyamat túl gyakran váltakozik a kategóriák között, hogy véletlenszerűen le lehessen írni.
Hipotézisek és P-értékek
Minden jelentőségű tesztnek van a null és egy alternatív hipotézis. A futási teszthez a nullhipotézis az, hogy a sorozat véletlenszerű sorozat. Alternatív hipotézis az, hogy a mintaadatok sorrendje nem véletlenszerű.
A statisztikai szoftver kiszámítja a p-érték amely megfelel egy adott vizsgálati statisztikának. Vannak táblák is, amelyek egy adott kritikus számot adnak meg a szignifikancia szintje az összes futtatás számára.
Futtatja a tesztpéldát
A következő példán keresztül vizsgáljuk meg, hogyan működik a futási teszt. Tegyük fel, hogy egy feladat elvégzéséhez a hallgatókat felkérik, hogy 16 érmét hajtsanak végre egy érmét, és jegyezze fel a felbukkanó fejek és farok sorrendjét. Ha befejezzük ezt az adatkészletet:
H T H H H T T H T T H T H T H H
Feltehetjük azt a kérdést, hogy a hallgató valóban elvégezte-e a házi feladatát, vagy becsapta és írta le egy véletlenszerűnek látszó H és T sorozatot? A futási teszt segíthet nekünk. A futási teszt feltételezései teljesülnek, mivel az adatokat két csoportba lehet sorolni, akár fejként, akár farokként. Folytatjuk a futások számának megszámlálásával. Átcsoportosítva a következőket látjuk:
H T HHH TT H TT H T H T HH
Adatunkhoz tíz futás van, hét farok kilenc feje.
A nullhipotézis az, hogy az adatok véletlenszerűek. Alternatíva az, hogy nem véletlenszerű. Ha az alfa szignifikanciaszintje 0,05, akkor a megfelelő táblázat megkeresésével láthatjuk, hogy elutasítjuk a nullhipotézist, ha a futtatás száma kevesebb, mint 4, vagy nagyobb, mint 16. Mivel adatainkban tíz futás van, mi nem utasítják el a nullhipotézis H0.
Normál közelítés
A futási teszt hasznos eszköz annak meghatározására, hogy egy sorozat valószínűleg véletlenszerű-e vagy sem. Nagy adathalmaz esetén néha lehetséges egy normál közelítés is. Ez a normál közelítés megköveteli, hogy felhasználjuk az egyes kategóriákban szereplő elemek számát, majd kiszámítsuk a megfelelő érték átlagát és szórását. normális eloszlás.