Mi az a robusztus statisztika?

Ban ben statisztikaA robusztus vagy robusztus kifejezés egy statisztikai modell, tesztek és eljárások erősségére utal, a statisztikai elemzés konkrét feltételeinek megfelelően, amelyeket a tanulmány elérni kíván. Mivel a tanulmány ezen feltételei teljesülnek, a modellek valódiságát matematikai bizonyítékok felhasználásával lehet igazolni.

Számos modell azon ideális helyzeteken alapul, amelyek nem léteznek valós adatokkal való munkavégzés során, és ennek eredményeként a modell helyes eredményeket adhat még akkor is, ha a feltételek nem teljesülnek pontosan.

A megbízható statisztika tehát minden olyan statisztika, amely jó teljesítményt nyújt, ha az adatok széles köréből származnak valószínűségi eloszlások, amelyeket az adott modell modellezési feltételezéseitől való eltérések vagy kis eltérések nagymértékben nem befolyásolnak adatbázisba. Más szavakkal: egy robusztus statisztika ellenálló az eredmények hibáival.

Az általánosan alkalmazott, robusztus statisztikai eljárás megfigyelésének egyik módja, hogy nem csak a t-eljárásokon kell keresnie, amelyek hipotézis teszteket használnak a legpontosabb statisztikai előrejelzések meghatározására.

instagram viewer

A T-eljárások betartása

A robusztusság példaként foglalkozunk t- eljárások, amelyek magukban foglalják a megbízhatósági intervallum egy ismeretlen populációs szórással rendelkező populáció középértéke, valamint a népesség átlagára vonatkozó hipotézis tesztek.

A... haszna t-Az eljárások feltételezik a következőket:

  • Az adatkészlet, amelyen dolgozunk, a egyszerű véletlenszerű minta a lakosság száma.
  • A populáció, amelyből mintát vettünk, általában megoszlik.

A valós élet példáinak gyakorlatában a statisztikusok ritkán rendelkeznek olyan populációval, amely normálisan eloszlik, tehát inkább a következő kérdés válik: „Mennyire robusztusak t-eljárásokat?”

Általánosságban az a tény, hogy egyszerű véletlenszerű mintánk van, sokkal fontosabb, mint az a körülmény, hogy egy normál eloszlású populációból vettünk mintát; Ennek oka az, hogy a központi határ tétel biztosítja a mintavételi eloszlást, megközelítőleg normál - minél nagyobb a mintánk, annál közelebb lesz a minta mintavételi eloszlása Normál.

Hogyan működnek a T-eljárások robusztus statisztikákként?

Tehát robusztus t-procedúrák a minta méretétől és a minta eloszlásától függnek. Ennek szempontjai a következők:

  • Ha a minták mérete nagy, vagyis 40 vagy annál több megfigyelés van, akkor t-Az eljárások még ferde eloszlásokkal is használhatók.
  • Ha a minta mérete 15 és 40 között van, akkor használhatjuk t-eljárások bármilyen alakú eloszlásra, kivéve, ha vannak eltérések vagy magas fokú ferde.
  • Ha a minta mérete kisebb, mint 15, akkor használhatjuk t- olyan adatokra vonatkozó eljárások, amelyeknek nincs kiugró értéke, egyetlen csúcsuk, és szinte szimmetrikusak.

A legtöbb esetben a robusztusságot a matematikai statisztikák műszaki munkájával állapították meg, és szerencsére a megfelelő működéshez nem feltétlenül kell elvégeznünk ezeket a fejlett matematikai számításokat használja őket; csak meg kell értenünk, hogy mi az átfogó iránymutatás az egyedi statisztikai módszerünk robusztusságra.

A T-eljárások megbízható statisztikákként működnek, mivel ezekre a modellekre jellemzően jó teljesítményt adnak, ha a minta méretét tényezővel veszik figyelembe az eljárás alkalmazásának alapjául.