Az adathalmaz változékonyságának mérésekor két szorosan összekapcsolt statisztika áll ehhez kapcsolódóan: variancia és szórás, amelyek egyaránt jelzik az adatértékek eloszlását, és számításuk hasonló lépéseit tartalmazzák. A két statisztikai elemzés közötti legnagyobb különbség azonban az, hogy a szórás a variancia négyzetgyöke.
A statisztikai eloszlás e két megfigyelése közötti különbségek megértése érdekében először meg kell érteni, hogy mit jelentenek mindegyik: A variancia a halmaz összes adatpontját képviseli és az egyes átlagok négyzetbeli eltérésének átlagolásával számítják, míg a szórás az átlag körüli eloszlás mértékét jelenti, amikor a központi tendenciát a átlagos.
Ennek eredményeként a variancia kifejezhető az értékek átlagától számított négyzet eltérésével az átlagtól vagy [négyzet az átlag eltérése] osztva a megfigyelések számával és a szórással, a négyzetgyökével fejezhető ki variancia.
A variancia felépítése
A statisztikák közötti különbség teljes megértése érdekében meg kell értenünk a variancia kiszámítását. A minta variancia kiszámításának lépései a következők:
- Számítsa ki az adatok minta átlagát.
- Keresse meg a különbséget az átlag és az egyes adatértékek között.
- Jelölje meg ezeket a különbségeket.
- Összeadjuk a négyzetkülönbségeket.
- Ossza el ezt az összeget kevesebbel, mint az összes adatérték.
E lépések okai a következők:
- Az átlag adja a középpontot vagy átlagos az adatok.
- Az átlagtól való eltérések segítik az átlagtól való eltérések meghatározását. Az átlagtól távol eső adatértékek nagyobb eltérést eredményeznek, mint az átlaghoz közeli értékek.
- A különbségek négyzetben vannak megadva, mert ha a különbségeket négyzet nélkül adják hozzá, ez az összeg nulla.
- Az ezen négyzetes eltérések hozzáadása a teljes eltérés mérését adja meg.
- A mintának egynél kevesebb osztásával egyfajta átlagos eltérés származik. Ez tagadja azt a hatást, hogy sok adatpont hozzájárul a szórás méréséhez.
Mint már korábban kijelentettük, a szórást egyszerűen kiszámolják ennek az eredménynek a négyzetgyökéből, amely megadja az abszolút standard eltérést az összes adatértéktől függetlenül.
Variancia és szórás
Amikor figyelembe vesszük a varianciát, rájövünk, hogy ennek egyik legnagyobb hátránya van. Ha a variancia kiszámításának lépéseit követjük, akkor ez azt mutatja, hogy a varianciát négyzet egységekben mérjük, mivel számításunkban négyzetkülönbségeket adunk össze. Például, ha a mintánk adatait méterben mérik, akkor a varianciaegységeket négyzetméterben adják meg.
A szóródás mértékének egységesítése érdekében a variancia négyzetgyökét kell vennünk. Ez kiküszöböli a négyzetes egységek problémáját, és megmutatja nekünk a szórást, amelynek azonos egységei lesznek, mint az eredeti mintánk.
A matematikai statisztikákban sok olyan képlet van, amelyek szélesebb megjelenési formákat mutatnak, ha a szórás helyett a szórást adjuk meg.