Chebyshev egyenlőtlensége szerint legalább 1-1 /K2 a mintából származó adatoknak belül kell lenniük K standard eltérések az átlagtól (itt K bármilyen pozitív valós szám egynél nagyobb).
Bármely adatkészlet, amely általában eloszlik, vagy a haranggörbe, számos funkcióval rendelkezik. Az egyik az adatoknak az átlagtól való standard eltérések számához viszonyított eloszlásával foglalkozik. Normál eloszlásban tudjuk, hogy az adatok 68% -a egy standard eltérés az átlagtól, 95% két a standard eltérés az átlagtól, és kb. 99% -a az átlagostól számított három standard eltérésen belül van.
De ha az adatkészlet nem haranggörbe formájában van elosztva, akkor egy eltérés lehet egy szóráson belül. A Chebyshev egyenlőtlensége lehetőséget ad arra, hogy megtudjuk, az adatok mely hányada tartozik K a standard eltérés a Bármi adatkészlet.
Tények az egyenlőtlenségről
Azt is kijelenthetjük, hogy a fenti egyenlőtlenség helyébe az „a mintából származó adatok” kifejezés lép Valószínűségi eloszlás. Ennek oka az, hogy Chebyshev egyenlőtlensége a valószínűség következménye, amelyet később alkalmazni lehet a statisztikákra.
Fontos megjegyezni, hogy ez az egyenlőtlenség matematikailag bebizonyított eredmény. Nem olyan, mint a empirikus kapcsolat az átlag és a mód között, vagy a ökölszabály amely összeköti a tartományt és a szórást.
Az egyenlőtlenség illusztrációja
Az egyenlőtlenség szemléltetése céljából néhány értéket vizsgálunk meg K:
- mert K = 2 van 1 - 1 /K2 = 1 - 1/4 = 3/4 = 75%. Tehát Chebyshev egyenlőtlensége azt mondja, hogy az eloszlás adatértékeinek legalább 75% -ának az átlag két standard eltérésén belül kell lennie.
- mert K = 3 van 1 - 1 /K2 = 1 - 1/9 = 8/9 = 89%. Tehát Chebyshev egyenlőtlensége azt mondja, hogy az eloszlás adatértékeinek legalább 89% -ának az átlag három standard eltérésén belül kell lennie.
- mert K = 4 van 1 - 1 /K2 = 1 - 1/16 = 15/16 = 93.75%. Tehát Chebyshev egyenlőtlensége azt mondja, hogy az eloszlás adatértékeinek legalább 93,75% -ának az átlag két standard eltérésén belül kell lennie.
Példa
Tegyük fel, hogy mintavételt végeztünk a kutyák súlyából a helyi állattartóban, és azt találtuk, hogy a mintánk átlagosan 20 font, 3 font szórással. A Chebyshev egyenlőtlenség alkalmazásával tudjuk, hogy a mintánkba vett kutyák legalább 75% -ának súlya két standard eltérés az átlagtól. A szórás kétszerese 2 x 3 = 6 -ot eredményez. Kivonjuk és add hozzá ezt a 20 átlagából. Ez azt mondja nekünk, hogy a kutyák 75% -ának súlya 14 és 26 font között van.
Az egyenlőtlenség használata
Ha többet tudunk a disztribúcióról, amellyel dolgozunk, akkor általában garantálhatjuk, hogy több adat bizonyos számú standard eltéréssel eltér az átlagtól. Például, ha tudjuk, hogy normális eloszlásunk van, akkor az adatok 95% -a két standard eltérés az átlagtól. Chebyshev egyenlőtlensége azt mondja, hogy ebben a helyzetben ezt tudjuk legalább Az adatok 75% -a két standard eltérés az átlagtól. Mint ebben az esetben láthatjuk, ez sokkal több lehet, mint ez a 75%.
Az egyenlőtlenség értéke, hogy egy „rosszabb eset” forgatókönyvet ad nekünk, amelyben a mintaadatokról (vagy valószínűség-eloszlásról) csak az átlagot és szórás. Amikor az adatunkból nem tudunk semmit, a Chebyshev egyenlőtlensége további betekintést nyújt az adatkészlet eloszlásába.
Az egyenlőtlenség története
Az egyenlőtlenséget Pafnuty Chebyshev orosz matematikusról nevezték el, aki 1874-ben először bizonyíték nélkül kijelentette az egyenlőtlenséget. Tíz évvel később az egyenlőtlenséget Markov bizonyította Ph. értekezés. Az orosz ábécé angol nyelvű ábrázolásának eltérései miatt Chebyshev Tchebysheff-nek is nevezik.