A normál eloszlást általában haranggörbének hívják. Az ilyen típusú görbe az egész oldalon megjelenik statisztika és a való világban.
Például, miután teszteltem valamelyik osztályomat, egy dolog, amit szeretek csinálni, egy grafikon készítése az összes pontszámról. Általában 10 ponttartományt írok le, például 60–69, 70–79 és 80–89, majd az adott tartomány minden egyes tesztjére pontozási pontot adok. Szinte minden alkalommal, amikor ezt megteszem, ismerős alak alakul ki. Néhány diákok nagyon jól csinálnak, és néhányuk nagyon rosszul. Egy csomó pontszám végül az átlagérték köré csoportosul. A különböző tesztek eltérő átlagokat és standard eltéréseket eredményezhetnek, de a grafikon alakja szinte mindig azonos. Ezt az alakot általában haranggörbének hívják.
Miért nevezik haranggörbének? A haranggörbe egyszerűen azért kapja a nevét, mert alakja hasonlít a harang alakjára. Ezek a görbék a statisztikai tanulmányok során megjelennek, és fontosságukat nem lehet túl hangsúlyozni.
Mi a haranggörbe?
Technikai jellegűnek tekintve azokat a csengőhang-görbéket, amelyeket a statisztikákban leginkább érdekelünk, valójában normálisnak nevezzük valószínűségi eloszlások. A következőkben azt feltételezzük, hogy a csengőgörbék normális valószínűség-eloszlások. A „haranggörbe” név ellenére ezeket a görbéket nem határozza meg alakjuk. Ehelyett egy félelmetes megjelenés képlet a haranggörbék hivatalos meghatározása.
De valójában nem kell sokat aggódnunk a képlet miatt. Az egyetlen két szám, amelyben érdekel, az átlag és a szórás. Egy adott adatkészlet haranggörbéjének közepe a közepén helyezkedik el. Itt található a görbe legmagasabb pontja vagy a „harang teteje”. Az adatkészlet szórása határozza meg, hogy a harang-görbe hogyan oszlik meg. Minél nagyobb a szórás, annál szélesebb a görbe.
A haranggörbe fontos jellemzői
A haranggörbéknek számos olyan jellemzője van, amelyek fontosak és megkülönböztetik őket a statisztikák többi görbéjétől:
- A haranggörbének van egy módja, amely egybeesik az átlaggal és a mediánnal. Ez a görbe középpontja, ahol a legmagasabb.
- A haranggörbe szimmetrikus. Ha egy függőleges vonal mentén hajtják meg, akkor mindkét fél tökéletesen illeszkedik egymáshoz, mivel egymás tükörképei.
- Egy haranggörbe követi a 68-95-99.7 szabályt, amely kényelmes módszert kínál a becsült számítások elvégzésére:
- Az összes adat körülbelül 68% -a az átlag egy szórása alatt van.
- Az összes adat körülbelül 95% -a az átlag két szórása alatt van.
- Az adatok körülbelül 99,7% -a az átlag három szórása alatt van.
Egy példa
Ha tudjuk, hogy egy haranggörbe modellezi adatainkat, akkor a haranggörbe fenti tulajdonságait használhatjuk, hogy elég kicsit megmondjuk. Visszatérve a teszt példához, tegyük fel, hogy 100 hallgatónk volt egy statisztikai tesztet, amelynek átlagos pontszáma 70 és szórás 10.
A szórás 10. Vonjuk le és adjuk hozzá a 10-et az átlaghoz. Ez ad nekünk 60 és 80. A 68-95-99,7 szabály szerint a 100, vagy a 68 hallgató körülbelül 68% -a várhatóan 60 és 80 közötti pontszámot tesztel.
A szórás kétszerese 20. Ha kivonunk és hozzáadunk 20-at az átlaghoz, akkor 50 és 90 lesz. Arra számíthatnánk, hogy a 100, vagy a 95 hallgató kb. 95% -a szerez 50–90 pontot a teszten.
Egy hasonló számítás azt mondja nekünk, hogy gyakorlatilag mindenki 40 és 100 között szerepelt a teszten.
A haranggörbe felhasználásai
Számos alkalmazás létezik a haranggörbékhez. Fontosak a statisztikákban, mivel a valós adatok sokféle modelljét modellezik. Mint fentebb említettük, a teszteredmények egy helyen jelennek meg. Íme néhány más:
- Egy berendezés ismételt mérése
- A biológiai jellemzők mérése
- Közelítő esélyesemények, például érme többszöri elfordítása
- Egy iskolai körzetben egy adott évfolyamon tanuló diákok magassága
Mikor nem használja a csengőgörbét
Annak ellenére, hogy számtalan alkalmazásra kerül a haranggörbe, nem helyénvaló használni minden helyzetben. Néhány statisztikai adatkészlet, például a berendezés meghibásodása vagy a jövedelem eloszlása, eltérő alakú és nem szimmetrikus. Más esetekben lehet két vagy több mód, például amikor több hallgató nagyon jól teljesít, több pedig nagyon rosszul tesztel. Ezek az alkalmazások más görbéket igényelnek, amelyeket a csengőgörbétől eltérően határoznak meg. A kérdéses adatkészlet beszerzésének ismerete segít meghatározni, hogy haranggörbét kell-e használni az adatok ábrázolásához.