A statisztikákban a terjedés vagy a szóródás mérése sokféle. Habár a hatótávolság és szórás a leggyakrabban használt, a diszperzió számszerűsítésére más módszerek is vannak. Megvizsgáljuk, hogyan lehet kiszámítani az adathalmaz abszolút eltérését.
Meghatározás
Az abszolút átlagos eltérés meghatározásával kezdjük, amelyet átlag abszolút eltérésnek is nevezünk. Az ebben a cikkben bemutatott képlet az átlagos abszolút eltérés formális meghatározása. Lehet, hogy értelmesebb lenne ezt a képletet olyan folyamatnak vagy lépések sorozatának tekinteni, amelyet felhasználhatunk a statisztikáinkhoz.
- Egynel kezdjük átlag, vagy a középpont mérése, egy adatkészlet, amelyet mi jelölni fogunk m.
- Ezután megtudjuk, hogy az egyes adatértékek mennyiben térnek el egymástól m. Ez azt jelenti, hogy figyelembe vesszük a különbséget az egyes adatértékek és a m.
- Ezután megtesszük a abszolút érték az előző lépéshez viszonyított különbségek mindegyike. Más szavakkal, a különbségek bármelyikére negatív jeleket hagyunk. Ennek oka az, hogy pozitív és negatív eltérések vannak a m. Ha nem találjuk ki a negatív jelek kiküszöbölésének módját, akkor az összes eltérés megszünteti egymást, ha összeadjuk őket.
- Most összeadjuk ezeket az abszolút értékeket.
- Végül ezt az összeget osztjuk fel n, amely az összes adatérték. Az eredmény az abszolút átlagos eltérés.
Variációk
A fenti eljárásnak számos változata van. Vegye figyelembe, hogy nem pontosan határoztuk meg, hogy mit m van. Ennek oka az, hogy különféle statisztikákat használhatunk m. Általában ez az adatkészletünk központja, így a központi tendencia bármely mérése felhasználható.
Az adatkészlet középpontjának leggyakoribb statisztikai mérése az átlag, középső és az üzemmód. Így ezek bármelyikét felhasználhatjuk m az abszolút átlagos eltérés kiszámításánál. Ez az oka annak, hogy a középérték abszolút eltérésére vagy a medián átlagos abszolút eltérésére utalnak. Több példát fogunk látni erre.
Példa: Átlagos abszolút eltérés a középértékről
Tegyük fel, hogy a következő adatkészlettel kezdjük:
1, 2, 2, 3, 5, 7, 7, 7, 7, 9.
Ezen adatkészlet átlaga 5. Az alábbi táblázat összefoglalja az átlag abszolút eltérésének kiszámításán dolgozó munkánkat.
Adatok értéke | Eltérés az átlagtól | Az eltérés abszolút értéke |
1 | 1 - 5 = -4 | |-4| = 4 |
2 | 2 - 5 = -3 | |-3| = 3 |
2 | 2 - 5 = -3 | |-3| = 3 |
3 | 3 - 5 = -2 | |-2| = 2 |
5 | 5 - 5 = 0 | |0| = 0 |
7 | 7 - 5 = 2 | |2| = 2 |
7 | 7 - 5 = 2 | |2| = 2 |
7 | 7 - 5 = 2 | |2| = 2 |
7 | 7 - 5 = 2 | |2| = 2 |
9 | 9 - 5 = 4 | |4| = 4 |
Abszolút eltérések összesen: | 24 |
Ezt az összeget most osztjuk 10-vel, mivel összesen tíz adatérték van. Az átlagos abszolút eltérés az átlaghoz képest 24/10 = 2,4.
Példa: Átlagos abszolút eltérés a középértékről
Most egy másik adatkészlettel kezdjük:
1, 1, 4, 5, 5, 5, 5, 7, 7, 10.
Csakúgy, mint az előző adatkészlet, ezen adatkészlet átlaga 5.
Adatok értéke | Eltérés az átlagtól | Az eltérés abszolút értéke |
1 | 1 - 5 = -4 | |-4| = 4 |
1 | 1 - 5 = -4 | |-4| = 4 |
4 | 4 - 5 = -1 | |-1| = 1 |
5 | 5 - 5 = 0 | |0| = 0 |
5 | 5 - 5 = 0 | |0| = 0 |
5 | 5 - 5 = 0 | |0| = 0 |
5 | 5 - 5 = 0 | |0| = 0 |
7 | 7 - 5 = 2 | |2| = 2 |
7 | 7 - 5 = 2 | |2| = 2 |
10 | 10 - 5 = 5 | |5| = 5 |
Abszolút eltérések összesen: | 18 |
Így az átlagos abszolút eltérés az átlaghoz képest 18/10 = 1,8. Ezt az eredményt összehasonlítjuk az első példával. Bár ezeknek a példáknak az átlaga azonos volt, az első példában szereplő adatok szélesebb körben eloszlanak. E két példa alapján láthatjuk, hogy az abszolút átlagos eltérés az első példától nagyobb, mint az átlagos abszolút eltérés a második példától. Minél nagyobb az átlagos abszolút eltérés, annál nagyobb az adatok eloszlása.
Példa: A medián abszolút eltérése
Kezdje ugyanazzal az adatkészlettel, mint az első példa:
1, 2, 2, 3, 5, 7, 7, 7, 7, 9.
Az adathalmaz mediánja 6. A következő táblázatban bemutatjuk a mediánhoz közeli abszolút eltérés kiszámításának részleteit.
Adatok értéke | Eltérés a mediántól | Az eltérés abszolút értéke |
1 | 1 - 6 = -5 | |-5| = 5 |
2 | 2 - 6 = -4 | |-4| = 4 |
2 | 2 - 6 = -4 | |-4| = 4 |
3 | 3 - 6 = -3 | |-3| = 3 |
5 | 5 - 6 = -1 | |-1| = 1 |
7 | 7 - 6 = 1 | |1| = 1 |
7 | 7 - 6 = 1 | |1| = 1 |
7 | 7 - 6 = 1 | |1| = 1 |
7 | 7 - 6 = 1 | |1| = 1 |
9 | 9 - 6 = 3 | |3| = 3 |
Abszolút eltérések összesen: | 24 |
Ismét elosztjuk a teljes értéket 10-gyel, és a medián körül átlagos átlagnál 24/10 = 2,4 értéket kapunk.
Példa: A medián abszolút eltérése
Kezdje ugyanazzal az adatkészlettel, mint korábban:
1, 2, 2, 3, 5, 7, 7, 7, 7, 9.
Ezúttal úgy találjuk, hogy ezen adatkészlet módja 7. A következő táblázatban bemutatjuk az üzemmódhoz tartozó abszolút átlagos eltérés kiszámításának részleteit.
Adat | Az üzemmódtól való eltérés | Az eltérés abszolút értéke |
1 | 1 - 7 = -6 | |-5| = 6 |
2 | 2 - 7 = -5 | |-5| = 5 |
2 | 2 - 7 = -5 | |-5| = 5 |
3 | 3 - 7 = -4 | |-4| = 4 |
5 | 5 - 7 = -2 | |-2| = 2 |
7 | 7 - 7 = 0 | |0| = 0 |
7 | 7 - 7 = 0 | |0| = 0 |
7 | 7 - 7 = 0 | |0| = 0 |
7 | 7 - 7 = 0 | |0| = 0 |
9 | 9 - 7 = 2 | |2| = 2 |
Abszolút eltérések összesen: | 22 |
Osztjuk el az abszolút eltérések összegét és látjuk, hogy az átlagos abszolút eltérés körülbelül 22/10 = 2,2.
Gyors tények
Az átlagos abszolút eltérésekre vonatkozóan néhány alapvető tulajdonság létezik
- Az átlagos abszolút eltérés a medián körül mindig kisebb, vagy egyenlő az átlagos abszolút eltéréssel.
- A szórás nagyobb, vagy annál nagyobb, mint az átlagos abszolút eltérés.
- Az átlagos abszolút eltérést néha a MAD rövidíti. Sajnos ez nem egyértelmű, mivel a MAD felváltva utalhat a medián abszolút eltérésre.
- A normál eloszlás átlagos abszolút eltérése körülbelül 0,8-szorosa a szórás nagyságának.
Általános felhasználások
Az abszolút átlagos eltérésnek van néhány alkalmazása. Az első alkalmazás az, hogy ezt a statisztikát fel lehet használni a szórás. Az átlagos abszolút eltérést az átlagnál sokkal könnyebb kiszámítani, mint a szórást. Nem szükséges, hogy az eltéréseket négyzet alakú legyen, és számításunk végén nem kell négyzetgyököt találnunk. Ezenkívül az átlagos abszolút eltérés intuitívebben kapcsolódik az adathalmaz elterjedéséhez, mint ami a szórás. Ezért először az átlag abszolút eltérést először a standard eltérés bevezetése előtt tanítják.
Néhányan odamentek, hogy azt állítják, hogy a szórást az átlagos abszolút eltéréssel kell felváltani. Bár a szórás fontos a tudományos és matematikai alkalmazásokban, nem olyan intuitív, mint az abszolút átlagos eltérés. Napi alkalmazások esetén az átlagos abszolút eltérés kézzelfoghatóbb módszer az adatok eloszlásának mérésére.