A rendszerindítás egy statisztikai technika, amely a mintavétel tágabb fejezete alá tartozik. Ez a technika viszonylag egyszerű eljárást foglal magában, de olyan sokszor megismételhető, hogy erősen függ a számítógépes számításoktól. A rendszerindítás a konfidencia intervallumoktól eltérő módszert biztosít a populációs paraméter becslésére. A rendszerindítás nagyon úgy tűnik, mint a varázslat. Olvassa tovább, hogy megszerezze érdekes nevét.
A rendszerindítás magyarázata
Az egyik célja következtetési statisztikák a populáció egy paraméterének értékének meghatározása. Általában túl drága vagy akár lehetetlen is ezt közvetlenül mérni. Tehát használjuk statisztikai mintavétel. Mintát veszünk egy populációból, megmérjük a minta statisztikáját, majd ezt a statisztikát használjuk, hogy mondjunk valamit a megfelelő paraméter a lakosság száma.
Például egy csokoládégyárban garantálhatnánk, hogy az édességek különlegesek legyenek átlagos súly. Nem lehetséges mérlegelni az összes előállított cukorkát, ezért mintavételi technikákat használunk véletlenszerűen kiválasztott 100 cukorkatartóra. Kiszámoljuk ennek a 100 édességbárnak az átlagát, és azt mondjuk, hogy a népesség átlaga hibahatáron belül esik, mint a mi átlagunk.
Tegyük fel, hogy néhány hónappal később nagyobb pontossággal akarjuk megtudni - vagy kevesebbet a hibahatár - milyen volt az édesség bárányi átlagos súlya azon a napon, amikor a mintavételt elvégeztük a gyártósorból. Nem használhatjuk a mai édességet sem sok változó beléptek a képre (különböző tej-, cukor- és kakaóbab-tételek, különböző légköri körülmények, különböző vonalban dolgozók stb.). A 100 tömeg csak annyit jelent, hogy mióta kíváncsi vagyunk. Ha nem lenne időgépek aznap, akkor úgy tűnik, hogy a kezdeti hibahatár a legjobb, amire számíthatunk.
Szerencsére használhatjuk a a bootstrapping technika. Ebben a helyzetben véletlenszerűen minta cserével a 100 ismert súlyból. Ezután ezt bootstrap mintának nevezzük. Mivel megengedjük a cserét, ez a bootstrap-minta valószínűleg nem azonos az eredeti mintánkkal. Néhány adatpontot lemásolhatunk, másokat pedig a kezdeti 100 adatpontjai elhagyhatók a rendszerindítási mintában. Egy számítógép segítségével viszonylag rövid idő alatt több ezer rendszerindító minta készíthető.
Egy példa
Mint már említettük, a bootstrap technikák valódi használatához számítógépet kell használni. A következő numerikus példa segít bebizonyítani, hogy a folyamat működik. Ha a 2., 4., 5., 6., 6. mintával kezdjük, akkor a következők mindegyike lehetséges bootstrap-minta:
- 2 ,5, 5, 6, 6
- 4, 5, 6, 6, 6
- 2, 2, 4, 5, 5
- 2, 2, 2, 4, 6
- 2, 2, 2, 2, 2
- 4,6, 6, 6, 6
A technika története
A bootstrap technikák viszonylag újak a statisztikák területén. Az első felhasználást Bradley Efron 1979-es kiadványában tették közzé. Ahogy a számítási teljesítmény növekedett és olcsóbbá vált, a bootstrap technikák elterjedtebbé váltak.
Miért neve a rendszerindításnak?
A „bootstrapping” név a következő kifejezésből származik: „Hogy felemelje magát a bootstraps által.” Ez arra utal, ami bosszantó és lehetetlen. Próbálj meg annyira, amennyit csak tudsz, és nem emelheted fel magad a levegőbe, ha a csizmádon bőrdarabokkal húzol.
Van egy matematikai elmélet, amely igazolja a bootstrapping technikákat. A bootstrapping használata azonban úgy érzi, mintha lehetetlen lenne. Noha nem tűnik úgy, hogy javíthatná a népességstatisztika becslését azáltal, hogy ugyanazt a mintát újra és újra felhasználná, a rendszerindítás valójában ezt megteheti.