Mik az első és a harmadik kvartilis?

Az első és a harmadik kvartilis leíró statisztika, amely az adatkészlet helyzetének mérését jelenti. Hasonlóan arra, ahogyan a medián az adatkészlet középpontját jelöli, az első kvartilis a negyedév vagy 25% -ot jelöli. Az adatértékek kb. 25% -a kevesebb vagy egyenlő az első kvartilis értékével. A harmadik kvartilis hasonló, de az adatértékek felső 25% -ánál. Az alábbiakban részletesebben megvizsgáljuk ezeket az ötleteket.

A medián

A módszer mérésének többféle módja van központ adatkészlet. Az átlagnak, a mediánnak, a módnak és a középértéknek megvannak az előnyei és korlátai az adatok közepének kifejezésében. Az átlag megtalálásának ezen módjai közül a középső a leginkább ellenálló a túlmutatókkal szemben. Az adatok közepét jelöli abban az értelemben, hogy az adatok fele kevesebb, mint a medián.

Az első kvartilis

Nincs ok, hogy meg kell állnunk, hogy csak a közepet találjuk meg. Mi lenne, ha úgy döntünk, hogy folytatjuk ezt a folyamatot? Meg tudnánk számítani az adatok alsó felének mediánját. Az 50% fele 25%. Az adatok fele vagy egynegyede tehát ez alatt lenne. Mivel az eredeti halmaz negyedével kell foglalkoznunk, az adatok alsó felének ezt a mediánját első kvartilisnek nevezzük, és

instagram viewer
Q1.

A harmadik kvartilis

Nincs ok, miért néztük az adatok alsó felét. Ehelyett a felső felét nézhetjük volna meg, és ugyanazokat a lépéseket hajthattuk végre, mint a fentiek. Ennek a félnek a mediánja, amelyet mi jelölni fogunk Q3 az adatkészletet negyedre osztja. Ez a szám azonban az adatok első negyedét jelöli. Az adatok háromnegyede tehát a szám alatt van Q3. Ezért hívjuk Q3 a harmadik kvartilis.

Egy példa

Hogy ezt egyértelművé tegyük, nézzünk meg egy példát. Hasznos lehet először áttekinteni, hogyan lehet kiszámítani egyes adatok mediánját. Kezdje a következő adatkészlettel:

1, 2, 2, 3, 4, 6, 6, 7, 7, 7, 8, 11, 12, 15, 15, 15, 17, 17, 18, 20

Összesen húsz adatpont van a készletben. Kezdjük azzal, hogy megtaláljuk a mediánt. Mivel páros számú adatérték van, a medián a tizedik és tizenegyedik érték átlaga. Más szavakkal, a medián:

(7 + 8)/2 = 7.5.

Most nézzük meg az adatok alsó felét. Ennek a félnek a mediánja a következő ötödik és hatodik értéke között található:

1, 2, 2, 3, 4, 6, 6, 7, 7, 7

Így az első kvartilis egyenlőnek tekinthető Q1 = (4 + 6)/2 = 5

A harmadik kvartilis megtalálásához nézze meg az eredeti adatkészlet felső felét. Meg kell találnunk a következő mediánt:

8, 11, 12, 15, 15, 15, 17, 17, 18, 20

Itt a medián (15 + 15) / 2 = 15. Így a harmadik kvartilis Q3 = 15.

Intervartilis tartomány és öt szám összefoglalása

A kvartilek teljes képet nyújtanak az adatkészlet egészéről. Az első és a harmadik kvartilis információkat szolgáltat nekünk az adatok belső felépítéséről. Az adatok középső fele az első és a harmadik kvartilis közé esik, és a mediánra koncentrálódik. Az első és harmadik kvartilis közötti különbség, az úgynevezett interquartilis tartomány, megmutatja, hogy az adatok hogyan vannak elrendezve a mediánra vonatkozóan. Egy kicsi intervartilis tartomány jelzi azokat az adatokat, amelyek a medián köré vannak csoportosítva. A nagyobb interkvartilis tartomány azt mutatja, hogy az adatok szélesebb körben terjednek.

Az adatok részletesebb képet kaphat a legmagasabb érték, az úgynevezett maximális érték, és a legalacsonyabb érték, az úgynevezett minimális érték ismeretében. A minimális, az első kvartilis, a medián, a harmadik kvartilis és a maximum öt értékből álló sorozat, a öt szám összefoglaló. Az öt szám megjelenítésének hatékony módját a-nak hívják boxplot vagy box és whisker grafikon.