Mi a Scatterplot gráf a statisztikákban?

A statisztikák egyik célja az adatok szervezése és megjelenítése. Sokszor az egyik módja ennek a grafikon, diagram vagy táblázat. Amikor dolgozik párosított adatok, egy hasznos gráftípus egy scatterplot. Az ilyen típusú grafikon lehetővé teszi számunkra, hogy könnyen és hatékonyan feltárjuk az adatainkat a síkban lévő pontok szóródásának vizsgálatával.

Párosított adatok

Érdemes kiemelni, hogy a scatterplot egy olyan típusú grafikon, amelyet párosított adatokhoz használnak. Ez egy olyan típusú adatkészlet, amelyben minden adatpontunkhoz két szám van társítva. Az ilyen párosítások általános példái a következők:

  • Mérés a kezelés előtt és után. Ez a hallgatói előzetes teszttel, majd később utáni teszttel járhat.
  • Egyező páros kísérleti terv. Itt az egyik egyed a kontrollcsoportban, a másik hasonló a kezelési csoportban.
  • Két mérés ugyanazon személytől. Például felvehetjük 100 ember súlyát és magasságát.

2D grafikonok

Az üres vászon, amelyet a scatterplot-ral kezdünk, a derékszögű koordinátarendszer. Ezt téglalap alakú koordinátarendszernek is hívják, mivel minden pont megtalálható egy adott téglalap rajzolásával. Egy téglalap alakú koordinátarendszert a következők segítségével állíthat be:

instagram viewer

  1. Vízszintes számsorral kezdve. Ezt hívják x-tengely.
  2. Adjon hozzá egy függőleges számot. Metszi a x-tengelyét oly módon, hogy mindkét vonal nullpontja metszi egymást. Ezt a második számsort hívják y-tengely.
  3. A pontot, ahol a számsorunk nullái keresztezik, az eredetnek nevezzük.

Most felrajzolhatjuk adatpontjainkat. Az első szám a párunkban a x-koordináta. A vízszintes távolság az y tengelytől, és ezáltal az eredeti is. Jobbra lépünk a x és az origótól balra a x.

Párunk második száma a y-koordináta. A függőleges távolság az x tengelytől. Az eredeti helytől kezdve a x-ax, lépjen felfelé a pozitív értékekhez y és lefelé negatív értékekre y.

A grafikonon lévő helyet ezután ponttal megjelöltük. Ezt az eljárást újra és újra megismételjük az adatkészletünk minden pontján. Az eredmény a pontok szétszóródása, amely a scatterplot nevét adja.

Magyarázat és válasz

Az egyik fontos utasítás, hogy fennmaradjon, vigyázzon, melyik változó melyik tengelyen van. Ha a párosított adatok egy magyarázat és válasz párosítás, akkor a magyarázó változó az x tengelyen van feltüntetve. Ha mindkét változó magyarázónak tekinthető, akkor választhatjuk, melyiket kell az x tengelyen ábrázolni, és melyiket a y-tengely.

A Scatterplot jellemzői

A scatterplotnak számos fontos jellemzője van. Ezeknek a tulajdonságoknak az azonosításával további információkat fedezhetünk fel adatkészletünkről. Ezek a szolgáltatások a következők:

  • A változók közötti általános tendencia. Balról jobbra olvasva mi a nagy kép? Felfelé mutató minta, lefelé vagy ciklikusan?
  • Bármelyik eltérés az általános trendből. Ezek a többi adatból való eltérések, vagy befolyásos pontok?
  • Bármely trend alakja. Ez lineáris, exponenciális, logaritmikus vagy valami más?
  • Bármely trend erőssége. Mennyire illeszkednek az adatok az általunk azonosított általános mintához?

Kapcsolódó témák

A lineáris tendenciát mutató szórtáblák a következő statisztikai technikákkal elemezhetők:lineáris regresszió és korreláció. A regresszió végrehajtható más típusú nemlineáris tendenciák esetén is.

instagram story viewer