Példa a rendszerindításra a statisztikában

bootstrapping egy hatékony statisztikai technika. Különösen akkor hasznos, ha minta kicsi a mérete, amelyen dolgozunk. Szokásos körülmények között a 40-nél kisebb mintadarabok nem kezelhetők a következő feltételezéssel: normális eloszlás vagy a t eloszlás. A bootstrap technikák elég jól működnek a mintáknál, amelyek kevesebb mint 40 elemet tartalmaznak. Ennek oka az, hogy a rendszerindítás előtti mintavétel. Az ilyen technikák nem feltételeznek semmit a terjesztés adatainkból.

A rendszerindítás egyre népszerűbbé vált, mivel a számítástechnikai erőforrások könnyebben elérhetővé váltak. Ennek oka az, hogy ahhoz, hogy a rendszerindítás praktikus legyen, számítógépet kell használni. Látjuk, hogyan működik ez a bootstrapping következő példájában.

Kezdjük statisztikai minta egy olyan lakosságból, amelyről semmit sem tudunk. Célunk a minta átlaga körülbelül 90% -os megbízhatósági intervalluma lesz. Bár más statisztikai technikák meghatározására használták megbízhatósági intervallumok Feltételezzük, hogy tudjuk a populáció átlagát vagy szórását, a bootstrapping csak a mintát igényli.

instagram viewer

Példánkban feltételezzük, hogy a minta 1, 2, 4, 4, 10.

Most újból állunk a mintánk cseréjével, hogy létrehozzuk az úgynevezett bootstrap mintákat. Mindegyik bootstrap-minta öt méretű lesz, akárcsak az eredeti minta. Mivel véletlenszerűen választunk ki, majd kicseréljük az egyes értékeket, a rendszerindító minták különbözhetnek az eredeti mintától és egymástól.

Példákra, amelyekbe belemerülnénk a való világban, ezt százszor, vagy akár több ezer alkalommal is megismételjük. Az alábbiakban 20 példa látható a bootstrap mintákra:

Mivel a bootstrapping segítségével kiszámoljuk a népesség átlagának konfidencia-intervallumát, most kiszámoljuk az egyes bootstrap-mintánk átlagát. Ezek a növekvő sorrendben elrendezett eszközök: 2, 2,4, 2,6, 2,6, 2,8, 3, 3, 3,2, 3,4, 3,6, 3,8, 4, 4, 4,2, 4,6, 5,2, 6, 6, 6,6, 7,6.

Most a bootstrap-mintánkból szerezzük be a konfidencia intervallumot. Mivel 90% -os megbízhatósági intervallumot akarunk, az intervallumok végpontjaként a 95. és 5. százalékot használjuk. Ennek oka az, hogy a 100% - 90% = 10% -ot felosztjuk felére úgy, hogy az összes bootstrap-minta középértékének 90% -át megkapjuk.

instagram story viewer