Sok kérdést kell feltenni, amikor egy szétszórt tervet látunk. Az egyik leggyakoribb az, hogy vajon mennyire közelít egy egyenes egyenes az adatokhoz. Ennek megválaszolásához van egy leíró statisztika, amelyet korrelációs együtthatónak hívnak. Látjuk, hogyan kell kiszámítani ezt a statisztikát.
A korrelációs együttható
Az korrelációs együttható, jelölve r, megmutatja nekünk, hogy milyen szorosan vannak az a szórásgörbe esik egyenes vonal mentén. Minél közelebb van az abszolút érték nak,-nek r az egyik, annál jobb, ha az adatokat egy lineáris egyenlet írja le. Ha r = 1 vagy r = -1 akkor az adatkészlet tökéletesen igazodik. Adatkészletek: r nulla közelében mutat kicsit vagy egyáltalán nem mutat egyenes kapcsolatot.
A hosszú számítások miatt a legjobb kiszámítani r számológép vagy statisztikai szoftver használatával. Mindig azonban érdemes arra törekednünk, hogy tudjuk, mit csinál a számológép a számítás során. A következőkben a korrelációs együtthatót főként kézzel számolják, a rutin számtani lépésekhez használt számológéppel.
A számítás lépései r
Először felsoroljuk a korrelációs együttható kiszámításának lépéseit. Azok az adatok, amelyekkel dolgozunk, vannak párosított adatok, amelyek mindegyik párját (xén, yén).
- Néhány előzetes számítással kezdjük. Az ezekből a számításokból származó mennyiségeket felhasználjuk a következő számítási lépéseinkben: r:
- Számítsuk ki x̄, a átlagos az adatok összes első koordinátája xén.
- Számítsuk ki az ȳ értéket, az adatok összes második koordinátájának átlagát
- yén.
- Kiszámítja s x a minta szórás az adatok összes első koordinátája xén.
- Kiszámítja s y az adatok összes második koordinátájának mintavételezési szórása yén.
- Használja a képletet (zx)én = (xén - x) / s x és kiszámítja mindegyik standardizált értékét xén.
- Használja a képletet (zy)én = (yén – ȳ) / s y és kiszámítja mindegyik standardizált értékét yén.
- Szorozzuk meg a megfelelő szabványos értékeket: (zx)én(zy)én
- Adja hozzá az utolsó lépés termékeit.
- Osszuk el az összeget az előző lépésről n - 1, ahol n a párosított adatkészletben szereplő összes pontszám. Mindez eredménye a korrelációs együttható r.
Ez a folyamat nem nehéz, és minden lépés meglehetősen rutin, de ezen lépések összegyűjtése eléggé vonzó. A szórás kiszámítása önmagában elég unalmas. A korrelációs együttható kiszámítása azonban nem csak két szórást, hanem sok más műveletet is magában foglal.
Egy példa
Pontosan látni, hogy az r kapott, nézzünk meg egy példát. Fontos megjegyeznünk, hogy a gyakorlati alkalmazásokhoz kalkulátorunkat vagy statisztikai szoftvereinket szeretnénk használni a számításhoz r nekünk.
A páros adatok felsorolásával kezdjük: (1, 1), (2, 3), (4, 5), (5,7). Az átlag a x értékek esetén az 1, 2, 4 és 5 átlaga x̄ = 3. Azt is megkapjuk, hogy ȳ = 4. A
x értékek sx = 1,83 és sy = 2.58. Az alábbi táblázat összefoglalja a szükséges számításokat r. A jobb oldali oszlopban szereplő termékek összege 2.969848. Mivel összesen négy pont van, és 4 - 1 = 3, akkor a termékek összegét háromszor osztjuk. Ez korrelációs együtthatót ad nekünk r = 2.969848/3 = 0.989949.
Táblázat a korrelációs együttható kiszámításához
x | y | Zx | Zy | ZxZy |
---|---|---|---|---|
1 | 1 | -1.09544503 | -1.161894958 | 1.272792057 |
2 | 3 | -0.547722515 | -0.387298319 | 0.212132009 |
4 | 5 | 0.547722515 | 0.387298319 | 0.212132009 |
5 | 7 | 1.09544503 | 1.161894958 | 1.272792057 |