ANOVA (varianciaanalízis)

Sokszor, amikor egy csoportot vizsgálunk, valóban két populációt hasonlítunk össze. Attól függően, hogy paraméter Ennek a csoportnak, amelyben érdekelünk, és a feltételekkel, amelyekkel foglalkozunk, számos technika áll rendelkezésre. Statisztikai következtetés két populáció összehasonlítását érintő eljárások általában nem alkalmazhatók három vagy több populációra. Egyszerre több mint két populáció tanulmányozásához különféle típusú statisztikai eszközökre van szükségünk. A variancia elemzéseAz ANOVA egy statisztikai interferenciaből származó technika, amely lehetővé teszi számunkra, hogy több populációval foglalkozzunk.

Az eszközök összehasonlítása

Példaként tekintjük meg, hogy milyen problémák merülnek fel és miért van szükségünk az ANOVA-ra. Tegyük fel, hogy megpróbáljuk meghatározni, hogy a átlagos A zöld, piros, kék és narancssárga M&M cukorka súlya különbözik egymástól. Meg fogjuk adni ezen populációk átlagos tömegét, μ1, μ2, μ3 μ4 és rendre. Használhatjuk a megfelelőt hipotézis teszt többször, és teszt C (4,2), vagy hat különböző nullhipotézisek:

instagram viewer
  • H0: μ1 = μ2 annak ellenőrzése, hogy a piros cukorka népességének átlagos tömege eltér-e a kék cukorka népességének átlagos tömegétől.
  • H0: μ2 = μ3 annak ellenőrzése, hogy a kék cukorka népességének átlagos tömege eltér-e a zöld cukorka népességének átlagos tömegétől.
  • H0: μ3 = μ4 annak ellenőrzése, hogy a zöld cukorka népességének átlagos tömege eltér-e a narancssárga cukorka népességének átlagos tömegétől.
  • H0: μ4 = μ1 annak ellenőrzése, hogy a narancssárga cukorka népességének átlagos tömege eltér-e a vörös cukorka népességének átlagos tömegétől.
  • H0: μ1 = μ3 annak ellenőrzése, hogy a piros cukorka népességének átlagos tömege eltér-e a zöld cukorka népességének átlagos tömegétől.
  • H0: μ2 = μ4 annak ellenőrzése, hogy a kék cukorka népességének átlagos tömege eltér-e a narancssárga cukorka népességének átlagos tömegétől.

Sok probléma van az ilyen elemzéssel. Hat leszünk p-értékek. Annak ellenére, hogy mindegyiket 95% -on tesztelhetjük a bizalom szintje, az egész folyamatba vetett bizalmunk ennél kevesebb, mert a valószínűségek szorozódnak: .95 x .95 x .95 x .95 x .95 x .95 megközelítőleg 0,74, vagyis 74% -os konfidenciaszint. Így az I. típusú hiba valószínűsége megnőtt.

Alapvetőbb szinten nem hasonlíthatjuk össze ezt a négy paramétert, ha egyszerre kettőt hasonlítunk össze. A vörös és a kék M & Ms középértéke szignifikáns lehet, a vörös átlagos tömege viszonylag nagyobb, mint a kék átlagos tömege. Ha azonban figyelembe vesszük a négyféle cukorka átlagos tömegét, akkor lehet, hogy nincs szignifikáns különbség.

A variancia elemzése

AnOVA-t használunk olyan helyzetek kezelésére, amikor többszörös összehasonlítást kell végezni. Ez a teszt lehetővé teszi, hogy egyidejűleg több populáció paramétereit is megvizsgáljuk anélkül, hogy bele kellene foglalnunk néhány olyan problémába, amelyekkel szembenézünk hipotézis tesztek elvégzése két paraméterre egyszerre.

AnOVA elvégzéséhez a fenti M&M példával tesztelnénk a H nullhipotézist01 = μ2 = μ3= μ4. Ez azt állítja, hogy nincs különbség a vörös, kék és zöld M & Ms közép súlya között. Alternatív hipotézis az, hogy létezik némi különbség a vörös, kék, zöld és narancssárga M & Ms közép súlya között. Ez a hipotézis valóban több állítás kombinációja Hegy:

  • A piros cukorka populáció átlagos tömege nem egyenlő a kék cukorka populáció átlagos tömegével, VAGY
  • A kék cukorka népességének átlagos tömege nem egyenlő a zöld cukorka populáció átlagos tömegével, VAGY
  • A zöld cukorka népességének átlagos tömege nem egyezik meg a narancssárga cukorka népességének átlagos tömegével, VAGY
  • A zöld cukorka népességének átlagos tömege nem egyenlő a vörös cukorka populáció átlagos tömegével, VAGY
  • A kék cukorka népességének átlagos tömege nem egyezik meg a narancssárga cukorka populáció átlagos tömegével, VAGY
  • A kék cukorka népességének átlagos tömege nem egyezik meg a piros cukorka populációjának átlagos tömegével.

Ebben az esetben a p-érték megszerzéséhez a Valószínűségi eloszlás néven ismert F-eloszlás. Az ANOVA F tesztet magában foglaló számítások kézzel is elvégezhetők, de általában statisztikai szoftverrel kell kiszámítani.

Több összehasonlítás

Ami az ANOVA-t elválasztja a többi statisztikai technikától, az az, hogy több összehasonlításra használják. Ez a statisztikák egészében jellemző, mivel sokszor nem csak két csoportot akarunk összehasonlítani. Általában egy átfogó teszt arra utal, hogy valamilyen különbség van a vizsgált paraméterek között. Ezután ezt a tesztet más elemzéssel követjük el annak eldöntésére, hogy melyik paraméter különbözik egymástól.