Az adatkészlet egyik jellemzője, amelyet fontos meghatározni, hogy tartalmaz-e esetlegesen kívül eső értékeket. A külsõ értékeket intuitív módon olyan értékeknek tekintik az adatkészletünkben, amelyek jelentõsen különböznek a többi adat többségétõl. Természetesen ez a túlmutatók megértése kétértelmű. Kihívásnak tekinthető, hogy az érték mennyiben térjen el a többi adattól? Vajon az egyik kutató úgy hívja, hogy egy külsõ esemény illeszkedik egy másik kutatóhoz? Annak érdekében, hogy bizonyos mértékű konzisztencia és mennyiségi mérés legyen a külső értékek meghatározására, belső és külső kerítéseket használunk.
Az adatkészlet belső és külső kerítésének megkereséséhez először szükség van néhány további elemre leíró statisztika. Kezdjük a kvartilek kiszámításával. Ez az interkvartilis tartományhoz vezet. Végül, miután ezeket a számításokat elvégztük, meg tudjuk határozni a belső és a külső kerítést.
kvartilisok
Az első és harmadik kvartilis részei a öt szám összefoglaló a mennyiségi adatok bármely halmazát. Az adatok közép- vagy középpontjának megkeresésével kezdjük, miután az összes értéket növekvő sorrendben soroltuk fel. A mediánnál kisebb értékek az adatok nagyjából felének felelnek meg. Megtaláljuk az adathalmaz ezen felének mediánját, és ez az első kvartilis.
Hasonló módon most az adatkészlet felső felét vesszük figyelembe. Ha megtaláljuk az adat ezen felének mediánját, akkor a harmadik kvartilis van. Ezek a kvartilek azért kapják a nevüket, hogy az adatsort négy azonos méretű részre vagy negyedre osztják. Tehát más szavakkal, az összes adatérték kb. 25% -a kevesebb, mint az első kvartilis. Hasonló módon az adatértékek kb. 75% -a kevesebb, mint a harmadik kvartilis.
Interquartilis tartomány
Ezután meg kell találnunk a interquartilis tartomány (IQR). Ez könnyebben kiszámítható, mint az első kvartilis q1 és a harmadik kvartilis q3. Csak annyit kell tennünk, hogy figyelembe vegyük a két kvartilis különbségét. Ez adja meg a képletet:
IQR = Q3 - Q1
Az IQR megmutatja nekünk, mennyire eloszlik adatkészletünk közepe.
Keresse meg a belső kerítéseket
Megtalálhatjuk a belső kerítéseket. Az IQR-vel kezdjük, és megszorozzuk ezt a számot 1,5-szel. Ezután kivonjuk ezt a számot az első kvartilisből. Ezt a számot hozzá is adjuk a harmadik kvartilishez. Ez a két szám képezi a belső kerítésünket.
Keresse meg a külső kerítéseket
A külső kerítések esetében az IQR-vel kezdjük, és megszorozzuk ezt a számot háromszor. Ezután kivonjuk ezt a számot az első kvartilisből és hozzáadjuk a harmadik kvartilishez. Ez a két szám a külső kerítésünk.
A külsőségek észlelése
A kimutatása kiugró Most már olyan egyszerűvé válik, hogy meghatározzuk, hogy az adatértékek miként vonatkoznak a belső és külső kerítésünkre. Ha az egyetlen adatérték szélsőségesebb, mint bármelyik külső kerítésünk, akkor ez egy külsõ, és néha erõs külsõnek is nevezik. Ha adatértékeink a megfelelő belső és külső kerítés között vannak, akkor ez az érték feltételezhetően túlságosan nagy vagy gyenge. Lásd: az alábbiakban bemutatjuk, hogyan működik ez.
Példa
Tegyük fel, hogy kiszámítottuk adataink első és harmadik kvartilisét, és ezeket az értékeket 50, illetve 60 értékre találtuk. Az interkvartilis tartomány IQR = 60-50 = 10. Ezután látjuk, hogy 1,5 x IQR = 15. Ez azt jelenti, hogy a belső kerítések 50 - 15 = 35 és 60 + 15 = 75. Ez 1,5 x IQR-rel kevesebb, mint az első kvartilis és több, mint a harmadik kvartilis.
Most kiszámoljuk a 3 x IQR-t, és látjuk, hogy ez 3 x 10 = 30. A külső kerítések 3 x IQR szélsőségesebbek, mint az első és a harmadik kvartilis. Ez azt jelenti, hogy a külső kerítések 50 - 30 = 20 és 60 + 30 = 90.
A 20-nál kisebb vagy 90-nél nagyobb adatértékeket túlmutatónak tekintjük. Bármely 29 és 35 közötti, illetve 75 és 90 közötti adatértéket feltételezhetõen túllépi.