Hány kalóriát evett reggelire? Milyen messze volt otthon ma mindenki? Mekkora a hely, amelyet haza hívunk? Hány ember hívja haza? Ezen információk értelmezéséhez bizonyos eszközökre és gondolkodásmódokra van szükség. A statisztikáknak nevezett matematikai tudomány segíti számunkra az információs túlterhelés kezelését.
A statisztika numerikus információ, az úgynevezett adat tanulmányozása. A statisztikusok adatokat gyűjtnek, szerveznek és elemeznek. E folyamat minden részét szintén megvizsgáljuk. A statisztikai technikákat sok más tudásterületre alkalmazzák. Az alábbiakban bemutatjuk a statisztikák néhány fő témakörét.
Népesség és minták
A statisztikák egyik visszatérő témája az, hogy a csoport viszonylag kis részének tanulmányozása alapján valamit mondhatunk egy nagy csoportról. A csoport egészét népességnek nevezzük. A csoport azon része, amelyet tanulmányozunk, a minta.
Tegyük fel például, hogy szeretnénk megtudni az Egyesült Államokban élő emberek átlagos magasságát. Megpróbálhatnánk megmérni több mint 300 millió embert, de ez lehetetlen. Logisztikai rémálom lenne, ha a méréseket úgy hajtanák végre, hogy senkit nem hagytak ki, és senkit sem kétszer számoltak.
Az Egyesült Államokban mindenki mérésének lehetetlen jellege miatt ehelyett statisztikákat használhatunk. Ahelyett, hogy a lakosság mindenkiének magasságát találnánk, a: statisztikai minta néhány ezerből. Ha helyesen vettünk mintát a populációból, akkor a minta átlagos magassága nagyon közel lesz a populáció átlagos magasságához.
Adatok beszerzése
Jó következtetések levonásához jó adatokra van szükségünk, amelyekkel dolgozhatunk. Mindig ellenőrizni kell azt a módszert, amellyel mintavételt végezünk ezekből az adatokból. Az, hogy milyen mintát használunk, attól függ, hogy milyen kérdést teszünk fel a lakossággal kapcsolatban. A leggyakrabban használt minták:
- Egyszerű véletlenszerű
- rétegelt
- Fürtözött
Ugyanilyen fontos tudni, hogy a minta mérése hogyan történik. Visszatérve a fenti példához, hogyan szerezzük meg a mintánk magasságát?
- Engedjük-e az embereknek, hogy egy kérdőívben jelentsék a saját magasságukat?
- Az ország különböző kutatói különböző embereket mérnek és jelentik-e eredményeiket?
- Egy kutató ugyanazzal a mérőszalaggal méri a mintában szereplőket?
Az adatok beszerzésének ezen módjai mindegyikének megvannak a maga előnyei és hátrányai. Bárki, aki felhasználja a tanulmány adatait, szeretné tudni, hogyan szerezte meg azt.
Az adatok szervezése
Időnként sokféle adat van, és szó szerint eltévedhetünk az összes részletben. Nehéz látni az erdőt a fák számára. Ezért fontos, hogy adatainkat jól szervezzük. Gondos szervezés és grafikus kijelzők az adatok segítenek felismerni a mintákat és trendeket, még mielőtt ténylegesen elvégeznénk bármilyen számítást.
Mivel az adatok grafikus megjelenítésének módja számos tényezőtől függ. Általános grafikonok:
- Kördiagramok vagy kördiagramok
- Sáv vagy pareto grafikonok
- Scatterplots
- Idő grafikonok
- Szár és levél parcellák
- Doboz és pofaszakáll grafikonok
Ezen jól ismert grafikonokon kívül vannak olyanok is, amelyeket speciális helyzetekben használnak.
Leíró statisztika
Az adatok elemzésének egyik módszerét leíró statisztikának nevezzük. Itt a cél az adatainkat leíró mennyiségek kiszámítása. A számokat átlagnak nevezzük, középső és az üzemmódot mind jelzik a átlagos vagy az adat közepe. A tartományt és a szórást arra használják, hogy megmondják, hogy az adatok hogyan oszlanak meg. Bonyolultabb technikák, például korreláció és a regresszió leírja a párosított adatokat.
Inferenciális statisztikák
Amikor egy mintával kezdjük, majd megpróbálunk következtetni valamit a népességre, akkor használjuk következtetési statisztikák. A statisztikák ezen területével való együttműködésben a hipotézis tesztelése merül fel. Itt láthatjuk a statisztika tárgyának tudományos természetét, amikor egy hipotézist állítunk fel, majd használjuk statisztikai eszközök a mintánkkal annak valószínűségének meghatározására, hogy a hipotézist el kell utasítani, vagy nem. Ez a magyarázat valójában csak a statisztika e nagyon hasznos részének felületét karcolja.
A statisztikák alkalmazásai
Nem túlzás azt mondani, hogy a statisztikai eszközöket szinte minden tudományos kutatási területen használják. Íme néhány terület, amelyek nagymértékben támaszkodnak a statisztikákra:
- Pszichológia
- Közgazdaságtan
- Gyógyszer
- Hirdető
- Demográfia
A statisztika alapjai
Bár egyesek a statisztikákat a matematika egyik ágaként gondolják, jobb, ha azt a tudományágként gondolják, amely a matematikán alapul. Konkrétan, a statisztikákat a valószínűségnek nevezett matematika területéből építik fel. A valószínűség lehetőséget ad arra, hogy meghatározzuk az esemény valószínűségét. Ez azt is lehetővé teszi, hogy a véletlenszerűségről beszéljünk. Ez a statisztika kulcsa, mivel a tipikus mintát véletlenszerűen kell kiválasztani a populációból.
A valószínűséget először az 1700-as években vizsgálták olyan matematikusok, mint például Pascal és Fermat. Az 1700-as évek szintén a statisztikák kezdete. A statisztikák valószínűségi gyökerekből tovább növekedtek, és az 1800-as években valóban elindultak. Ma az elméleti hatókörét tovább bővítik az úgynevezett matematikai statisztika.