Az a minta szórása egy leíró statisztika, amely a kvantitatív adatkészlet elterjedését méri. Ez a szám bármilyen nem negatív valós szám lehet. Mivel a nulla nemnegatív valós szám, érdemes megkérdezni: „Mikor lesz a minta szórása nulla?” Ez a nagyon különleges és rendkívül szokatlan esetben fordul elő, amikor minden adatértékünk pontosan megegyezik. Meg fogjuk vizsgálni az okokat.
A szórás leírása
Két fontos kérdés, amelyekre általában meg akarunk válaszolni egy adatkészlettel kapcsolatban:
- Mi az adatkészlet középpontja?
- Mennyire eloszlik az adatkészlet?
Különböző mérések léteznek, úgynevezett leíró statisztikák, amelyek válaszolnak ezekre a kérdésekre. Például az adat központja, más néven: átlagos, leírható átlag, medián vagy mód szerint. Más, kevésbé ismert statisztikák is felhasználhatók, mint például a midhinge vagy a trimean.
Adataink terjesztésére a következő tartományt használhatjuk: interquartilis tartomány vagy a szórás. A szórás párosul az átlaggal, hogy mennyiségileg meghatározzuk adataink terjedését. Ezt a számot felhasználhatjuk több adatkészlet összehasonlítására. Minél nagyobb a szórása, annál nagyobb a szórása.
Intuíció
Tehát nézzük meg ebből a leírásból, hogy mit jelentene nulla szórás. Ez azt jelzi, hogy adatkészletünkben egyáltalán nincs szóródás. Az összes adat adatot egyetlen értékre összevonják. Mivel az adatoknak csak egy értéke lenne, ez az érték jelenti a mintánk átlagát.
Ebben a helyzetben, amikor az összes adatérték azonos, akkor semmiféle változás nem történik. Intuitív szempontból van értelme, hogy egy ilyen adatkészlet szórása nulla legyen.
Matematikai igazolás
A minta szórását egy képlet határozza meg. A fentiekhez hasonló állításokat tehát ennek a képletnek a használatával kell igazolni. Egy adatkészlettel kezdjük, amely megfelel a fenti leírásnak: minden érték azonos, és vannak n értékek megegyeznek a x.
Kiszámoljuk ennek az adatkészletnek az átlagát és látjuk, hogy az van
x = (x + x +... + x)/n = nx/n = x.
Amikor kiszámoljuk az eltéréseket az átlagtól, látjuk, hogy ezek az eltérések nulla. Következésképpen a variancia és a szórás is egyenlő nullával.
Szükséges és elegendő
Látjuk, hogy ha az adatkészlet nem mutat variációt, akkor szórása nulla. Megkérdezhetjük, hogy a társalog ezen állítás pontja is igaz. Ha meg akarjuk nézni, hogy van-e, ismét a szórás képletét fogjuk használni. Ezúttal azonban a standard eltérést nullával állítjuk be. Az adatkészlettel kapcsolatban semmiféle feltételezést nem teszünk, de meglátjuk, hogy melyik beállítást kell megadni s = 0 azt jelenti
Tegyük fel, hogy az adatkészlet szórása nulla. Ez azt jelentené, hogy a minta szórása s2 szintén nulla. Az eredmény az egyenlet:
0 = (1/(n - 1)) ∑ (xén - x )2
Az egyenlet mindkét oldalát megszorozzuk n - 1 és nézzük meg, hogy a négyzetbeli eltérések összege nulla. Mivel valós számokkal dolgozunk, ennek előfordulásának egyetlen módja az, hogy a négyzet eltérései egyenlők legyenek nullával. Ez azt jelenti, hogy mindenki számára én, a kifejezés (xén - x )2 = 0.
Most a fenti egyenlet négyzetgyökét vesszük, és látjuk, hogy az átlagtól való minden eltérésnek nullának kell lennie. Mivel mindenki számára én,
xén - x = 0
Ez azt jelenti, hogy minden adat értéke megegyezik az átlaggal. Ez az eredmény, a fentiekkel együtt, azt mondhatja, hogy az adatkészlet mintavételezési szórása nulla akkor és csak akkor, ha az összes értéke azonos.