Leíró vs. Inferenciális statisztikák

A statisztika területe két fő részre oszlik: leíró és következtetési. Ezen szegmensek mindegyike fontos, különféle technikákat kínálva, amelyek különböző célokat szolgálnak. Leíró statisztikák leírják, mi folyik az a népesség vagy adatkészlet. Az inferenciális statisztikák ezzel szemben lehetővé teszik a tudósok számára, hogy mintákat vegyenek egy mintacsoportból és általánosítsák őket egy nagyobb populációra. A statisztikák két típusának van néhány fontos különbsége.

Leíró statisztika

A leíró statisztika az a statisztikai típus, amely valószínűleg a legtöbb ember gondolataiba jut, amikor meghallja a „statisztika” szót. A statisztika ezen ágában a cél az, hogy leírjuk. Numerikus mértékeket használunk az adatkészlet jellemzőinek leírására. Számos elem tartozik a statisztika e részébe, például:

  • Az átlagos, vagy az adatkészlet középpontjának mérése, amely az átlagból, a mediánból, a módból vagy a középértékből áll
  • Az adathalmaz elterjedése, amelyet meg lehet mérni a hatótávolság vagy szórás
  • Az adatok átfogó leírása, például a öt szám összefoglaló
  • instagram viewer
  • Mérések, mint például ferdeség és kurtosis
  • A kapcsolatok feltárása és korreláció párosított adatok között
  • A statisztikai eredmények bemutatása grafikus forma

Ezek az intézkedések fontosak és hasznosak, mivel lehetővé teszik a tudósok számára, hogy az adatok között mintákat látjanak, és így értelmezzék ezeket az adatokat. A leíró statisztikák csak a vizsgált populáció vagy adatkészlet leírására használhatók: Az eredményeket nem lehet általánosítani más csoportra vagy populációra.

A leíró statisztikák típusai

Kétféle leíró statisztika létezik, amelyeket a társadalomtudósok használnak:

A központi tendencia mérése rögzíti az adatok általános tendenciáit, és kiszámítja, és közép-, medián- és módban fejezi ki. Egy átlag megmondja a tudósoknak az összes adat matematikai átlagát, például az első házasságkor mért átlagos életkorot; a medián az adatmegosztás közepét képviseli, hasonlóan az életkorhoz, amely azon korosztály közepén helyezkedik el, amikor az emberek először házasodnak; és az üzemmód lehet a leggyakoribb életkor, amikor az emberek először házasodnak.

A terjedési intézkedések leírják az adatok elosztását és egymáshoz viszonyítását, ideértve:

  • Az adattartományban lévő értékek teljes tartománya
  • A frekvenciaeloszlás, amely meghatározza, hogy egy adott érték hányszor fordul elő egy adott értékben
  • Négyzetek, alcsoportok, amelyek egy adatkészletben alakulnak ki, amikor az összes értéket négy egyenlő részre osztják a tartományban
  • Átlagos abszolút eltérés, az átlag, hogy az egyes értékek mennyiben térnek el az átlagtól
  • Variancia, amely azt szemlélteti, hogy az adatokban mekkora a terjedése
  • Szabványbeli eltérés, amely az adatok átlaghoz viszonyított eloszlását szemlélteti

A terjedés mértékeit gyakran vizuálisan ábrázolják táblázatok, kördiagramok és oszlopdiagramok, valamint hisztogramok az adatok tendenciáinak megértése érdekében.

Inferenciális statisztikák

Az inferenciális statisztikákat összetett matematikai számítások segítségével állítják elő, amelyek lehetővé teszik a tudósok számára, hogy a belőlük vett minta vizsgálata alapján egy nagyobb népesség tendenciáit vonják le. A tudósok következtetési statisztikákat használnak a mintán belüli változók közötti kapcsolat megvizsgálására majd általánosításokat vagy előrejelzéseket készít arról, hogy ezek a változók hogyan viszonyulnak egy nagyobbhoz népesség.

Általában lehetetlen megvizsgálni a populáció egyes tagjait külön-külön. Tehát a tudósok a populáció reprezentatív részhalmazát választják, amelyet statisztikai mintának neveznek, és ezen elemzés alapján meg tudnak mondani valamit a populációból, ahonnan a minta származik. A következtetési statisztikák két fő felosztása van:

  • A megbízhatósági intervallum a statisztikai minta mérésével a populáció ismeretlen paramétereinek értéktartományát adja meg. Ezt intervallumban fejezik ki, és azt a megbízhatósági fokot fejezik ki, hogy a paraméter az intervallumon belül van.
  • Fontos vagy hipotézis tesztelése ahol a tudósok statisztikai minta elemzésével állítják a lakossággal kapcsolatos állításukat. A kialakítás szempontjából van némi bizonytalanság ebben a folyamatban. Ez a jelentőség szintjével fejezhető ki.

A technikák, amelyeket a társadalomtudósok használnak a változók közötti kapcsolatok vizsgálatára, és ezáltal következtetési statisztikák létrehozására, tartalmazzák a következőket lineáris regressziós elemzések, logisztikus regressziós elemzések, ANOVA, korrelációs elemzések, szerkezeti egyenlet modellezése, és a túlélési elemzés. A következtetõ statisztikák felhasználásával végzett kutatások során a tudósok jelentõs tesztet végeznek annak meghatározására, hogy tudják-e általánosítani eredményeiket nagyobb népességre. A szignifikancia általános vizsgálatai a következőket tartalmazzák: chi-négyzet és t-teszt. Ezek megmutatják a tudósoknak annak valószínűségét, hogy a minta elemzésének eredményei reprezentatívak a teljes populációra.

Leíró vs. Inferenciális statisztikák

Noha a leíró statisztika segítséget nyújt olyan dolgok megtanulásához, mint az adatok elterjedése és középpontja, a leíró statisztikákban semmi sem használható általánosítások készítésére. A leíró statisztikákban a méréseket, például az átlagot és a szórást pontos számként kell megadni.

Annak ellenére, hogy a következtetési statisztikák néhány hasonló számítást használnak - például az átlagot és a szórást -, az eltérő a hangsúly a következtetési statisztikák esetében. Az inferenciális statisztika egy mintával kezdődik, majd általánosítja a populációt. Ez a lakossággal kapcsolatos információ nem szerepel számként. Ehelyett a tudósok ezeket a paramétereket potenciális számok sorozataként fejezik ki, bizonyos fokú bizalom mellett.