Mi a ferde a statisztikákban?

Egyes adatterjesztések, például a haranggörbe vagy normális eloszlás, szimmetrikusak. Ez azt jelenti, hogy az eloszlás jobb és bal oldala tökéletes tükörképe. Az adatok eloszlása ​​nem minden esetben szimmetrikus. Azokat az adatkészleteket, amelyek nem szimmetrikusak, aszimmetrikusnak mondják. Az aszimmetrikus eloszlás mértékét úgy mutatják, hogy ferde.

Az átlag, a medián és a mód mind egyaránt a központ mérése adatkészlet. Az adatok ferde jellegét az határozhatja meg, hogy ezek a mennyiségek hogyan kapcsolódnak egymáshoz.

Jobbra fordult

A jobbra ferde adatoknak hosszú farokuk van, amelyek jobbra húzódnak. A jobbra ferde adatkészletről alternatív módon beszélhetünk, ha azt mondjuk, hogy pozitívan ferde. Ebben a helyzetben az átlag és a középső mindkettő nagyobb, mint az üzemmód. Általános szabály, hogy a jobbra ferde adatok esetén az átlag nagyobb lesz, mint a medián. Összefoglalva: a jobbra ferde adatkészlet esetében:

  • Mindig: nagyobb, mint az üzemmód
  • Mindig: a módhoz képest nagyobb medián
  • Az idő nagy részében: az átlag nagyobb, mint a medián
instagram viewer

Balra ferdén

A helyzet megfordul, amikor a balra ferde adatokkal foglalkozunk. A balra ferde adatok hosszú farokúak, amelyek balra húzódnak. A balra ferde adatkészletről alternatív módon beszélhetünk, ha negatívan ferde. Ebben a helyzetben az átlag és a medián egyaránt kevesebb, mint az üzemmód. Általános szabály, hogy a balra ferde adatok esetén az átlag kevesebb lesz, mint a medián. Összefoglalva: a balra ferde adatkészlet esetében:

  • Mindig: kevesebb, mint az üzemmód
  • Mindig: közepes, mint az üzemmód
  • Az idő nagy részében: kevesebb, mint a medián

Ferdesség mérése

Az egyik dolog, ha két adatsort nézzünk meg, és meghatározzuk, hogy az egyik szimmetrikus, míg a másik aszimmetrikus. Másik lehetőség az aszimmetrikus adatok két halmazát nézni, és azt mondani, hogy az egyik ferdebb, mint a másik. Nagyon szubjektív lehet meghatározni, hogy melyik az a ferde, ha egyszerűen megnézzük az eloszlás grafikonját. Ezért van mód arra, hogy numerikusan kiszámítsuk a ferdénséget.

A ferde mérés, amelyet Pearson első ferde koefficienseként hívnak, az, hogy kivonja az átlagot a módból, majd ezt a különbséget osztja a szórás az adatok. A különbség felosztásának oka az, hogy dimenzió nélküli mennyiségünk van. Ez magyarázza, hogy miért van a jobbra ferde adatok pozitív ferde. Ha az adatkészlet jobbra van ferdítve, az átlag nagyobb, mint az üzemmód, így az üzemmód kivonása az átlagból pozitív számot ad. Hasonló érv magyarázza, hogy a balra ferde adatok miért negatív ferde.

Pearson második ferde együtthatóját szintén használják az adatkészlet aszimmetriájának mérésére. Ehhez a mennyiséghez kivonjuk az üzemmódot a mediánból, megszorozzuk ezt a számot háromszor, majd osztjuk a szórással.

A ferde adatok felhasználása

A ferde adatok természetesen különböző helyzetekben merülnek fel. A jövedelmek jobbra vannak ferdítve, mivel csak néhány olyan személy, akik millió dollárt keresnek, nagymértékben befolyásolhatja az átlagot, és nincs negatív jövedelem. Hasonlóképpen, egy termék élettartamára vonatkozó adatok, például egy villanykörte márka, jobbra vannak ferdítve. Ebben az esetben a legkisebb az élettartam nulla, és a tartós izzók pozitív ferde képességeket adnak az adatokhoz.