Összegző statisztikák, például a medián, első kvartilis és harmadik kvartilis a helyzet mérése. Ennek oka az, hogy ezek a számok jelzik, hogy hol helyezkedik el az adatmegosztás meghatározott hányada. Például a medián a vizsgált adatok középső pozíciója. Az adatok felének kevesebb értéke van, mint a medián. Hasonlóképpen, az adatok 25% -ának értékei kevesebbek, mint az első kvartilis, és 75% -ának az értékei kevesebbek, mint a harmadik kvartilisé.
Ez a koncepció általánosítható. Ennek egyik módja a mérlegelés százalékosztályok. A 90. percentilis azt a pontot jelöli, ahol az adatok 90% -ának az értéke kevesebb, mint ez a szám. Általánosabban: pA th százalék a szám n amelyekre paz adatok% - a kevesebb, mint n.
Folyamatos véletlen változók
Bár a medián, az első kvartilis és a harmadik kvartilis sorrend statisztikáját általában egy a külön adatkészlettel beállítva, ezek a statisztikák folyamatos véletlenszerűkre is definiálhatók változó. Mivel folyamatos disztribúcióval dolgozunk, az integrált használjuk. Az pA százalékos szám egy szám n oly módon, hogy:
∫-₶nf ( x ) dx = p/100.
Itt f ( x ) egy valószínűségi sűrűségfüggvény. Így bármilyen százalékot beszerezhetünk, amelyet szeretnénk a folyamatos terjesztés.
kvantilisekre
További általánosítás, ha megjegyezzük, hogy megrendelési statisztikánk megoszlik az eloszlásban, amelyen dolgozunk. A medián az adatok halmaza felére oszlik, a folytonos eloszlás mediánja vagy 50. százaléka pedig az eloszlást felületre osztva felére osztja. Az első kvartilis, középső és a harmadik kvartilis adatainkat négy részre osztjuk, egyenként számítva mindegyikben. A fenti integrál segítségével megkaphatjuk a 25., az 50. és a 75. percentilt, és a folyamatos eloszlást négy egyenlő területre oszthatjuk.
Ezt az eljárást általánosíthatjuk. A kérdés, amelyen kezdhetjük, természetes számot kap n, hogyan lehet felosztani egy változó eloszlását? n azonos méretű darabok? Ez közvetlenül a kvantumok elméletére vonatkozik.
Az n Az adatkészlet kvantumait megközelítőleg úgy találjuk meg, hogy az adatokat sorrendbe soroljuk, majd ezt a rangsorot felosztjuk n - 1 egyenlő távolságban lévő pont az intervallumban.
Ha van valószínűségi sűrűségfüggvényünk egy folyamatos véletlen változóra, akkor a fenti integrált használjuk a kvantumok megtalálására. mert n kvantumokat akarunk:
- Az első, aki 1 /n az eloszlás területétől balra.
- A második, hogy 2 /n az eloszlás területétől balra.
- Az rakkor kell r/n az eloszlás területétől balra.
- Az utóbbin - 1)/n az eloszlás területétől balra.
Ezt láthatjuk bármely természetes számra n, az n a kvantumok megfelelnek a 100-nakr/nth százalékok, ahol r bármilyen természetes szám lehet 1-től n - 1.
Közös kagylók
Bizonyos típusú kvantumokat elég gyakran használnak, hogy specifikus nevek legyenek. Az alábbiakban felsoroljuk ezeket:
- A 2 kvantilit mediánnak nevezzük
- A 3 kvantált tercileknek nevezzük
- A 4 kvantált kvartilnek nevezzük
- Az 5 kvantált kvintileknek nevezzük
- A 6 kvantált szextilnek nevezzük
- A 7 kvantált septilesnek hívják
- A 8 kvantált oktileknek nevezzük
- A 10 kvantált decilnek nevezzük
- A 12 kvantát duodecil-nek nevezzük
- A 20 kvantált vigintileknek nevezzük
- A 100 kvantált százalékoknak nevezzük
- Az 1000 kvantált permill-eknek nevezzük
Természetesen a fenti listán kívül más kvantumok is léteznek. A használt konkrét kvantilis sokszor megegyezik a folyamatos mintából terjesztés.
A Quantiles használata
Az adatkészlet helyzetének meghatározása mellett a kvantumok más módon is hasznosak. Tegyük fel, hogy van egy egyszerű véletlenszerű mintánk egy populációból, és a populáció eloszlása ismeretlen. Annak meghatározása érdekében, hogy egy modell, például a normál eloszlás vagy a Weibull-eloszlás - megfelelő-e a mintába vett populáció szempontjából, megnézhetjük az adatok és a modell kvantumait.
A mintánk adatainak kvantáit az adott kvantumokkal egyeztetve Valószínűségi eloszlás, az eredmény párosított adatok gyűjteménye. Ezeket az adatokat egy scatterplotban ábrázoljuk, amelyet kvantál-kvantitatív vagy q-q grafikonnak hívunk. Ha az eredményül kapott scatterplot nagyjából egyenes, akkor a modell jól illeszkedik adatainkhoz.