Az interkvartilis tartomány (IQR) az első kvartilis és a harmadik kvartilis közötti különbség. Ennek képlete:
IQR = Q3 - Q1
Az adathalmaz variabilitása sokféleképpen mérhető. Mind a hatótávolság és szórás mondd el nekünk, hogy milyen szétszórtak az adatok. Ezeknek a leíró statisztikáknak az a problémája, hogy meglehetősen érzékenyek a túlmutatókra. Egy olyan adatkészlet terjedésének mérése, amely jobban ellenáll a külsõ értékek jelenlétének, az interkvartilis tartomány.
Az interkvartilis tartomány meghatározása
Mint fentebb láttuk, az interkvartilis tartomány más statisztikák kiszámítására épül. Az interkvartilis tartomány meghatározása előtt meg kell ismernünk az első kvartilis és a harmadik kvartilis értékeit. (Természetesen az első és a harmadik kvartilis a medián értékétől függ).
Miután meghatároztuk az első és a harmadik kvartilis értékeit, az interkvartilis tartomány nagyon könnyen kiszámítható. Csak annyit kell tennünk, hogy kivonjuk az első kvartilit a harmadik kvartilisből. Ez magyarázza az interkvartilis tartomány kifejezés használatát ezen statisztika esetében.
Példa
Az interkvartilis tartomány kiszámításának példájához a következőket vesszük figyelembe: 2, 3, 3, 4, 5, 6, 6, 7, 8, 8, 8, 9. Az öt szám összefoglaló ehhez az adatkészlethez:
- Legalább 2
- Első kvartilis 3.5
- 6-os medián
- Harmadik negyedév
- Legfeljebb 9
Így látjuk, hogy az interkvartilis tartomány 8 - 3,5 = 4,5.
Az interkvartilis tartomány jelentése
Ez a tartomány megmérheti, hogy az adatkészlet teljes eloszlása milyen méretű. Az interkvartilis tartomány, amely megmutatja, hogy milyen messze vannak egymástól első és harmadik kvartilis a, azt jelzi, hogy az adatkészlet közepes 50% -a hogyan oszlik meg.
Ellenállás a túlmutatókkal szemben
Az adathalmaz terjedésének mérése helyett az interkvartilis tartomány alkalmazásának elsődleges előnye az, hogy az interkvartilis tartomány nem érzékeny a külsőségekre. Ehhez egy példát fogunk nézni.
A fenti adathalmazból az interkvartilis tartomány tartománya 3,5, a tartomány 9 - 2 = 7 és a szórás 2,34. Ha a legmagasabb 9 értéket kicseréljük egy extrém 100-ra, akkor a szórás 27,37 lesz, és a tartomány 98. Annak ellenére, hogy meglehetősen drasztikusan eltolódunk ezen értékek között, az első és a harmadik kvartilis változatlan marad, így az interkvartilis tartomány nem változik.
Az Interquartile tartomány használata
Amellett, hogy az adatkészlet terjedésének kevésbé érzékeny mértéke, az interkvartilis tartománynak még egy fontos felhasználási területe is van. Annak érdekében, hogy ellenáll a kiugró értékeknek, az interkvartilis tartomány hasznos annak meghatározásában, hogy mikor van egy érték külsõ.
Az interkvartilis tartomány tartomány ez az, ami tájékoztat arról, hogy van-e enyhe vagy erős kimenetelünk. A külsõ rész kereséséhez az elsõ kvartilis alatt vagy a harmadik kvartilis felett kell nézni. Az, hogy milyen messzire kell mennünk, az interkvartilis tartomány értékétől függ.