A Quantiles megértése: Fogalommeghatározások és felhasználások

Összegző statisztikák, például a medián, első kvartilis és harmadik kvartilis a helyzet mérése. Ennek oka az, hogy ezek a számok jelzik, hogy hol helyezkedik el az adatmegosztás meghatározott hányada. Például a medián a vizsgált adatok középső pozíciója. Az adatok felének kevesebb értéke van, mint a medián. Hasonlóképpen, az adatok 25% -ának értékei kevesebbek, mint az első kvartilis, és 75% -ának az értékei kevesebbek, mint a harmadik kvartilisé.

Ez a koncepció általánosítható. Ennek egyik módja a mérlegelés százalékosztályok. A 90. percentilis azt a pontot jelöli, ahol az adatok 90% -ának az értéke kevesebb, mint ez a szám. Általánosabban: pA th százalék a szám n amelyekre paz adatok% - a kevesebb, mint n.

Folyamatos véletlen változók

Bár a medián, az első kvartilis és a harmadik kvartilis sorrend statisztikáját általában egy a külön adatkészlettel beállítva, ezek a statisztikák folyamatos véletlenszerűkre is definiálhatók változó. Mivel folyamatos disztribúcióval dolgozunk, az integrált használjuk. Az pA százalékos szám egy szám n oly módon, hogy:

instagram viewer

-₶nf ( x ) dx = p/100.

Itt f ( x ) egy valószínűségi sűrűségfüggvény. Így bármilyen százalékot beszerezhetünk, amelyet szeretnénk a folyamatos terjesztés.

kvantilisekre

További általánosítás, ha megjegyezzük, hogy megrendelési statisztikánk megoszlik az eloszlásban, amelyen dolgozunk. A medián az adatok halmaza felére oszlik, a folytonos eloszlás mediánja vagy 50. százaléka pedig az eloszlást felületre osztva felére osztja. Az első kvartilis, középső és a harmadik kvartilis adatainkat négy részre osztjuk, egyenként számítva mindegyikben. A fenti integrál segítségével megkaphatjuk a 25., az 50. és a 75. percentilt, és a folyamatos eloszlást négy egyenlő területre oszthatjuk.

Ezt az eljárást általánosíthatjuk. A kérdés, amelyen kezdhetjük, természetes számot kap n, hogyan lehet felosztani egy változó eloszlását? n azonos méretű darabok? Ez közvetlenül a kvantumok elméletére vonatkozik.

Az n Az adatkészlet kvantumait megközelítőleg úgy találjuk meg, hogy az adatokat sorrendbe soroljuk, majd ezt a rangsorot felosztjuk n - 1 egyenlő távolságban lévő pont az intervallumban.

Ha van valószínűségi sűrűségfüggvényünk egy folyamatos véletlen változóra, akkor a fenti integrált használjuk a kvantumok megtalálására. mert n kvantumokat akarunk:

  • Az első, aki 1 /n az eloszlás területétől balra.
  • A második, hogy 2 /n az eloszlás területétől balra.
  • Az rakkor kell r/n az eloszlás területétől balra.
  • Az utóbbin - 1)/n az eloszlás területétől balra.

Ezt láthatjuk bármely természetes számra n, az n a kvantumok megfelelnek a 100-nakr/nth százalékok, ahol r bármilyen természetes szám lehet 1-től n - 1.

Közös kagylók

Bizonyos típusú kvantumokat elég gyakran használnak, hogy specifikus nevek legyenek. Az alábbiakban felsoroljuk ezeket:

  • A 2 kvantilit mediánnak nevezzük
  • A 3 kvantált tercileknek nevezzük
  • A 4 kvantált kvartilnek nevezzük
  • Az 5 kvantált kvintileknek nevezzük
  • A 6 kvantált szextilnek nevezzük
  • A 7 kvantált septilesnek hívják
  • A 8 kvantált oktileknek nevezzük
  • A 10 kvantált decilnek nevezzük
  • A 12 kvantát duodecil-nek nevezzük
  • A 20 kvantált vigintileknek nevezzük
  • A 100 kvantált százalékoknak nevezzük
  • Az 1000 kvantált permill-eknek nevezzük

Természetesen a fenti listán kívül más kvantumok is léteznek. A használt konkrét kvantilis sokszor megegyezik a folyamatos mintából terjesztés.

A Quantiles használata

Az adatkészlet helyzetének meghatározása mellett a kvantumok más módon is hasznosak. Tegyük fel, hogy van egy egyszerű véletlenszerű mintánk egy populációból, és a populáció eloszlása ​​ismeretlen. Annak meghatározása érdekében, hogy egy modell, például a normál eloszlás vagy a Weibull-eloszlás - megfelelő-e a mintába vett populáció szempontjából, megnézhetjük az adatok és a modell kvantumait.

A mintánk adatainak kvantáit az adott kvantumokkal egyeztetve Valószínűségi eloszlás, az eredmény párosított adatok gyűjteménye. Ezeket az adatokat egy scatterplotban ábrázoljuk, amelyet kvantál-kvantitatív vagy q-q grafikonnak hívunk. Ha az eredményül kapott scatterplot nagyjából egyenes, akkor a modell jól illeszkedik adatainkhoz.

instagram story viewer