A statisztikák egyik célja az adatok értelmes elrendezése. A kétirányú táblák fontos módja egy adott típusú asztal megszervezésének párosított adatok. Mint a statisztikák bármely grafikonjának vagy táblájának összeállításakor, nagyon fontos ismerni a változókat, amelyekkel dolgozunk. Ha kvantitatív adatokkal rendelkezünk, akkor egy grafikon, például a hisztogram vagy szár és levél telek kell használni. Ha kategorikus adatok vannak, akkor oszlopdiagramon vagy kördiagram megfelelő.
Párosított adatokkal való munka során óvatosnak kell lennünk. A páros kvantitatív adatok számára scatterplot létezik, de milyen grafikon létezik a párosított adatokhoz kategorikus adat? Ha két kategóriás változónk van, akkor kétirányú táblát kell használnunk.
A kétirányú asztal leírása
Először emlékeztetünk arra, hogy a kategorikus adatok jellemzőkre vagy kategóriákra vonatkoznak. Ez nem mennyiségi, és nem rendelkezik számértékekkel.
A kétirányú táblázat magában foglalja a két kategorikus változó összes értékének vagy szintjének felsorolását. Az egyik változó összes értéke fel van tüntetve egy függőleges oszlopban. A másik változó értékeit vízszintes sorban soroljuk fel. Ha az első változó rendelkezik
m értékeket, és a második változónak van n értékeket, akkor összesen lesz mn tételek a táblázatban. Ezen bejegyzések mindegyike megfelel a két változó egy adott értékének.Mindegyik sor és az oszlop mentén a bejegyzések összesítve vannak. Ezek az összegek fontosak a marginális és feltételes eloszlások meghatározásakor. Ezek az összegek akkor is fontosak, ha chi-square függetlenségi tesztet végezzünk.
Példa egy kétirányú táblára
Például megvizsgáljuk azt a helyzetet, amelyben egy egyetemi statisztikai kurzus több szakaszát vizsgáljuk meg. Kétirányú táblát akarunk felállítani annak meghatározására, milyen különbségek vannak, ha vannak, a férfiak és a nők között a túra során. Ennek elérése érdekében számoljuk az egyes levélértékek számát, amelyet az egyes neműek tagjai megszereztek.
Megjegyezzük, hogy az első kategorikus változó a nem, és két lehetséges érték létezik a férfi és a nő tanulmányozásakor. A második kategorikus változó a betűs osztály, és öt érték van megadva, amelyeket A, B, C, D és F ad meg. Ez azt jelenti, hogy lesz egy kétirányú tábla 2 x 5 = 10 bejegyzéssel, plusz egy további sorral és egy további oszlopmal, amelyre szükség lesz a sor és az oszlop összesítésének táblázásához.
Vizsgálataink azt mutatják, hogy:
- 50 férfi A-t, 60 nő pedig A-t kapott.
- 60 férfi B-t, 80 nő pedig B-t kapott.
- 100 férfi C-t, 50 nő pedig C-t kapott.
- 40 férfi keresett D, 50 nő pedig D.
- 30 férfi F-et, 20 nő pedig F-t kapott.
Ezt az információt az alábbi kétirányú táblázatba írják be. Az egyes sorok összesen azt mutatják, hogy hány kategóriát szereztek. Az oszlop összesítése megmutatja a hímek és a nők számát.
A kétirányú táblák fontossága
A kétirányú táblák segítenek az adatok rendezésében, ha két kategorikus változónk van. Ez a táblázat felhasználható adataink két különféle csoportjának összehasonlításához. Például megvizsgálhatjuk a férfiak relatív teljesítményét a statisztikai kurzusban a nők teljesítményével szemben.
Következő lépések
A kétirányú táblázat összeállítása után a következő lépés az adatok statisztikai elemzése. Megkérdezhetjük, hogy a tanulmányban szereplő változók függetlenek-e egymástól, vagy sem. A kérdés megválaszolásához használhatunk egy chi-square tesztet a kétutas asztalon.
Kétirányú táblázat az osztályok és a nemek számára
Férfi | Női | Teljes | |
A | 50 | 60 | 110 |
B | 60 | 80 | 140 |
C | 100 | 50 | 150 |
D | 40 | 50 | 90 |
F | 30 | 20 | 50 |
Teljes | 280 | 260 | 540 |