A statisztikai adatkészletek tartománya

A statisztikákban és a matematikában a tartomány az adathalmaz maximális és minimális értékei közötti különbség, és az adatkészlet két fontos jellemzőjeként szolgál. Egy tartomány képlete a maximális érték, levonva a minimális értéket az adatkészletben, amely a statisztikusok számára jobb megértést kínál az adatkészlet változékonyságáról.

Az adatkészlet két fontos jellemzője magában foglalja az adat központját és az adat eloszlását, és a központ lehettöbbféle módon mérhető: ezek közül a legnépszerűbbek az átlag, középső, mód és közepes tartomány, de hasonló módon különféle módszerekkel lehet kiszámítani, hogy mekkora az adatkészlet eloszlása, és a terjedés legkönnyebb és legkeményebb mértékét a tartománynak nevezzük.

A tartomány kiszámítása nagyon egyszerű. Csak annyit kell tennünk, hogy megtaláljuk a különbséget a készlet legnagyobb adatértéke és a legkisebb adatértéke között. Összefoglalva, a következő képlettel rendelkezik: Range = Maximum Value - Minimum Value. Például a 4,6,10, 15, 18 adatkészlet maximum 18, minimum 4 és tartománya lehet 18-4 = 14.

instagram viewer

A tartomány nagyon durva az adatok terjedésének mérése, mivel rendkívül érzékeny a túlmutatókra, és ennek eredményeként vannak bizonyos -. - Az adatkészlet valódi tartományának a statisztikusok számára való felhasználhatóságának korlátozásai, mivel egyetlen adatérték jelentősen befolyásolhatja az - hatótávolság.

Vegyük például az 1., 2., 3., 4., 6., 7., 7., 8. adathalmazt. A maximális érték 8, a minimum 1 és a tartomány 7. Ezután vegye figyelembe ugyanazt az adatkészletet, csak a 100 értékkel együtt. A tartomány mostantól vált 100-1 = 99 ahol egyetlen extra adatpont hozzáadása nagyban befolyásolta a tartomány értékét. A szórás egy másik olyan mérték a szórás, amely kevésbé érzékeny a kiugró értékekre, de hátránya az, hogy a a szórás kiszámítása sokkal bonyolultabb.

A tartomány semmit nem mond nekünk az adatkészlet belső tulajdonságairól. Például az 1, 1, 2, 3, 4, 5, 5, 6, 7, 8, 8, 10 adatkészletet vesszük figyelembe, ahol az adatkészlet tartománya 10-1 = 9. Ha ezt összehasonlítjuk az 1, 1, 1, 2, 9, 9, 9, 10 adatkészlettel. Itt a tartomány ismét kilenc, de erre a második halmazra, és az első halmaztól eltérően az adatok a minimum és a maximum köré vannak csoportosítva. Más statisztikákat, mint például az első és a harmadik kvartilis, a belső struktúra egy részének felismerésére kell használni.

Ez a tartomány jó módszer arra, hogy nagyon egyszerű megértést kapjunk arról, hogy az adatok halmozottan hányszor vannak az adatkészletben, mivel ez könnyű számítsa, mivel csak alapvető számtani műveletet igényel, de van még néhány egyéb alkalmazás az adatkészlet tartományában statisztika.

A tartomány felhasználható a szórás egy másik mértékének, a szórásnak a becslésére is. Ahelyett, hogy átmennénk egy meglehetősen bonyolult képletet a szórás megállapításához, használhatnánk az úgynevezett tartományszabály. A tartomány alapvető fontosságú ebben a számításban.

A tartomány a box-plot, vagy doboz és pofaszakáll telek. A maximális és a minimális értéket egyaránt ábrázoljuk a grafikon pofájának végén, és a pofaszakáll és a doboz teljes hossza megegyezik a tartománygal.

instagram story viewer