Mi a páros adat a statisztikákban?

A statisztikai párosított adatok, amelyeket gyakran rendezett pároknak hívnak, két olyan változóra utalnak a populáció egyedeinél, amelyeket összekapcsolnak egymás közötti összefüggés meghatározása céljából. Annak érdekében, hogy egy adatkészletet párosított adatnak lehessen tekinteni, mindkét adatértéket csatolni kell vagy össze kell kapcsolni egymással, és nem kell külön-külön figyelembe venni.

A párosított adatok elképzelése ellentétben áll egy szám szokásos társításával az egyes adatpontokhoz, mint a másikban mennyiségi adatok beállítja, hogy az egyes adatpontok két számmal vannak összekapcsolva, olyan grafikonot biztosítva, amely lehetővé teszi a statisztikusok számára, hogy megfigyeljék a populációk ezen változók közötti kapcsolatát.

A párosított adatok ezen módszerét akkor alkalmazzák, amikor egy tanulmány két változó összehasonlítását reméli a populáció egyedeinél, hogy valamilyen következtetést vonjon le a megfigyelt összefüggésről. Ezeknek az adatpontoknak a megfigyelésekor a párosítás sorrendje fontos, mivel az első szám egy dolog mérése, a második pedig valami teljesen más mértéke.

instagram viewer

Példa párosított adatokra

A páros adatok példájának megtekintéséhez tegyük fel, hogy egy tanár megszámolja az egyes hallgatók házi feladatát bekapcsolódik egy adott egységnél, majd ezt a számot párosítja az egyes hallgatók százalékos arányával az egységtesztben. A párok a következők:

  • A 10 feladatot elvégző személy 95% -ot tett a tesztjén. (10, 95%)
  • Az a személy, aki 5 feladatot teljesített, 80% -ot tett a tesztjén. (5, 80%)
  • Az a személy, aki 9 feladatot végzett, 85% -ot tett a tesztjén. (9, 85%)
  • Az a személy, aki 2 feladatot teljesített, 50% -ot tett a tesztjén. (2, 50%)
  • Az a személy, aki 5 feladatot teljesített, 60% -ot tett a tesztjén. (5, 60%)
  • Az a személy, aki 3 feladatot teljesített, 70% -ot tett a tesztjén. (3, 70%)

A párosított adatok mindegyikében láthatjuk, hogy a hozzárendelések száma mindig az rendezett pár, miközben a teszt során megszerzett százalék a második lesz, amint az első példában látható (10, 95%).

Noha ezeknek az adatoknak a statisztikai elemzése felhasználható lenne az átlagos darabszám kiszámítására is házi feladatok elvégzése vagy az átlagos teszt pontszám, más kérdések is felmerülhetnek az adat. Ebben az esetben a tanár meg akarja tudni, van-e kapcsolat a házi feladatok száma között bekapcsolódott és teljesítette a tesztet, és a tanárnak párosítani kellene az adatokat ahhoz, hogy erre válaszoljon kérdés.

Párosított adatok elemzése

Az statisztikai technikák nak,-nek korreláció és a regressziót használjuk a párosított adatok elemzésére, ahol a korrelációs együttható számszerűsíti, hogy az adatok egyenes vonal mentén helyezkednek el, és megméri a lineáris kapcsolat erősségét.

A regressziót viszont számos alkalmazásban használják, beleértve annak meghatározását, hogy melyik vonal felel meg legjobban az adatkészletünknek. Ez a sor ezután felhasználható becsléshez vagy előrejelzéshez y értékek értékei: x amelyek nem tartoztak az eredeti adatkészletünkbe.

Van egy speciális típusú grafikon, amely különösen jól alkalmazható párosított adatokra, scatterplot néven. Ebben grafikon típusa, az egyik koordinátatengely a párosított adatok egyik mennyiségét, míg a másik koordinátatengely a párosított adatok másik mennyiségét jelöli.

A fenti adatok scatterbotja szerint az x tengely jelzi a befordított feladatok számát, míg az y tengely az egység teszt pontszámait jelöli.

instagram story viewer