A statisztika területe két fő részre oszlik: leíró és következtetési. Ezen szegmensek mindegyike fontos, különféle technikákat kínálva, amelyek különböző célokat szolgálnak. Leíró statisztikák leírják, mi folyik az a népesség vagy adatkészlet. Az inferenciális statisztikák ezzel szemben lehetővé teszik a tudósok számára, hogy mintákat vegyenek egy mintacsoportból és általánosítsák őket egy nagyobb populációra. A statisztikák két típusának van néhány fontos különbsége.
Leíró statisztika
A leíró statisztika az a statisztikai típus, amely valószínűleg a legtöbb ember gondolataiba jut, amikor meghallja a „statisztika” szót. A statisztika ezen ágában a cél az, hogy leírjuk. Numerikus mértékeket használunk az adatkészlet jellemzőinek leírására. Számos elem tartozik a statisztika e részébe, például:
- Az átlagos, vagy az adatkészlet középpontjának mérése, amely az átlagból, a mediánból, a módból vagy a középértékből áll
- Az adathalmaz elterjedése, amelyet meg lehet mérni a hatótávolság vagy szórás
- Az adatok átfogó leírása, például a öt szám összefoglaló
- Mérések, mint például ferdeség és kurtosis
- A kapcsolatok feltárása és korreláció párosított adatok között
- A statisztikai eredmények bemutatása grafikus forma
Ezek az intézkedések fontosak és hasznosak, mivel lehetővé teszik a tudósok számára, hogy az adatok között mintákat látjanak, és így értelmezzék ezeket az adatokat. A leíró statisztikák csak a vizsgált populáció vagy adatkészlet leírására használhatók: Az eredményeket nem lehet általánosítani más csoportra vagy populációra.
A leíró statisztikák típusai
Kétféle leíró statisztika létezik, amelyeket a társadalomtudósok használnak:
A központi tendencia mérése rögzíti az adatok általános tendenciáit, és kiszámítja, és közép-, medián- és módban fejezi ki. Egy átlag megmondja a tudósoknak az összes adat matematikai átlagát, például az első házasságkor mért átlagos életkorot; a medián az adatmegosztás közepét képviseli, hasonlóan az életkorhoz, amely azon korosztály közepén helyezkedik el, amikor az emberek először házasodnak; és az üzemmód lehet a leggyakoribb életkor, amikor az emberek először házasodnak.
A terjedési intézkedések leírják az adatok elosztását és egymáshoz viszonyítását, ideértve:
- Az adattartományban lévő értékek teljes tartománya
- A frekvenciaeloszlás, amely meghatározza, hogy egy adott érték hányszor fordul elő egy adott értékben
- Négyzetek, alcsoportok, amelyek egy adatkészletben alakulnak ki, amikor az összes értéket négy egyenlő részre osztják a tartományban
- Átlagos abszolút eltérés, az átlag, hogy az egyes értékek mennyiben térnek el az átlagtól
- Variancia, amely azt szemlélteti, hogy az adatokban mekkora a terjedése
- Szabványbeli eltérés, amely az adatok átlaghoz viszonyított eloszlását szemlélteti
A terjedés mértékeit gyakran vizuálisan ábrázolják táblázatok, kördiagramok és oszlopdiagramok, valamint hisztogramok az adatok tendenciáinak megértése érdekében.
Inferenciális statisztikák
Az inferenciális statisztikákat összetett matematikai számítások segítségével állítják elő, amelyek lehetővé teszik a tudósok számára, hogy a belőlük vett minta vizsgálata alapján egy nagyobb népesség tendenciáit vonják le. A tudósok következtetési statisztikákat használnak a mintán belüli változók közötti kapcsolat megvizsgálására majd általánosításokat vagy előrejelzéseket készít arról, hogy ezek a változók hogyan viszonyulnak egy nagyobbhoz népesség.
Általában lehetetlen megvizsgálni a populáció egyes tagjait külön-külön. Tehát a tudósok a populáció reprezentatív részhalmazát választják, amelyet statisztikai mintának neveznek, és ezen elemzés alapján meg tudnak mondani valamit a populációból, ahonnan a minta származik. A következtetési statisztikák két fő felosztása van:
- A megbízhatósági intervallum a statisztikai minta mérésével a populáció ismeretlen paramétereinek értéktartományát adja meg. Ezt intervallumban fejezik ki, és azt a megbízhatósági fokot fejezik ki, hogy a paraméter az intervallumon belül van.
- Fontos vagy hipotézis tesztelése ahol a tudósok statisztikai minta elemzésével állítják a lakossággal kapcsolatos állításukat. A kialakítás szempontjából van némi bizonytalanság ebben a folyamatban. Ez a jelentőség szintjével fejezhető ki.
A technikák, amelyeket a társadalomtudósok használnak a változók közötti kapcsolatok vizsgálatára, és ezáltal következtetési statisztikák létrehozására, tartalmazzák a következőket lineáris regressziós elemzések, logisztikus regressziós elemzések, ANOVA, korrelációs elemzések, szerkezeti egyenlet modellezése, és a túlélési elemzés. A következtetõ statisztikák felhasználásával végzett kutatások során a tudósok jelentõs tesztet végeznek annak meghatározására, hogy tudják-e általánosítani eredményeiket nagyobb népességre. A szignifikancia általános vizsgálatai a következőket tartalmazzák: chi-négyzet és t-teszt. Ezek megmutatják a tudósoknak annak valószínűségét, hogy a minta elemzésének eredményei reprezentatívak a teljes populációra.
Leíró vs. Inferenciális statisztikák
Noha a leíró statisztika segítséget nyújt olyan dolgok megtanulásához, mint az adatok elterjedése és középpontja, a leíró statisztikákban semmi sem használható általánosítások készítésére. A leíró statisztikákban a méréseket, például az átlagot és a szórást pontos számként kell megadni.
Annak ellenére, hogy a következtetési statisztikák néhány hasonló számítást használnak - például az átlagot és a szórást -, az eltérő a hangsúly a következtetési statisztikák esetében. Az inferenciális statisztika egy mintával kezdődik, majd általánosítja a populációt. Ez a lakossággal kapcsolatos információ nem szerepel számként. Ehelyett a tudósok ezeket a paramétereket potenciális számok sorozataként fejezik ki, bizonyos fokú bizalom mellett.