A minimum a legkisebb érték az adatkészletben. A maximum az adatkészlet legnagyobb értéke. Tudjon meg többet arról, hogy ez a statisztika miért nem lehet olyan triviális.
Háttér
A kvantitatív adatoknak sok tulajdonsága van. A statisztika egyik célja ezeknek a jellemzőknek a leírása érthető értékekkel és az adatok összefoglalásának biztosítása az adatkészlet minden értékének felsorolása nélkül. Ezen statisztikák egy része meglehetősen alapvető, és szinte triviálisnak tűnik. A maximum és a minimum jó példákat mutatnak a leíró statisztika típusára, amelyet könnyű marginalizálni. Annak ellenére, hogy ez a két szám rendkívül könnyen meghatározható, megjelennek a többi leíró statisztika kiszámításában. Mint láttuk, mindkét statisztika meghatározása nagyon intuitív.
A minimum
Először alaposabban megvizsgáljuk a minimumként ismert statisztikákat. Ez a szám az az adatérték, amely kisebb vagy egyenlő az adatkészletben szereplő összes többi értékkel. Ha minden adatot növekvő sorrendben rendeznénk, akkor a minimum lenne a listánk első száma. Noha a minimális érték megismételhető az adatkészletünkben, definíció szerint ez egy egyedi szám. Nem lehet két minimum, mert ezen értékek egyikének kevesebbnek kell lennie, mint a másiknak.
A maximum
Most a maximálisra fordulunk. Ez a szám az az adatérték, amely nagyobb vagy egyenlő az adatkészlet összes többi értékével. Ha minden adatot növekvő sorrendben rendeznénk, akkor a maximum lenne az utolsó felsorolt szám. A maximum egy adott adathalmaz egyedi száma. Ez a szám megismételhető, de az adatkészletnek csak egy maximuma van. Nem lehet két maximum, mert ezen értékek közül az egyik nagyobb lenne, mint a másik.
Példa
Az alábbiakban bemutatunk egy példát az adatkészletre:
23, 2, 4, 10, 19, 15, 21, 41, 3, 24, 1, 20, 19, 15, 22, 11, 4
Az értékeket növekvő sorrendben rendezzük, és látjuk, hogy az 1 a listában szereplők közül a legkisebb. Ez azt jelenti, hogy 1 az adatkészlet minimumja. Azt is látjuk, hogy a 41 nagyobb, mint a lista összes többi értéke. Ez azt jelenti, hogy a 41 az adathalmaz maximuma.
A maximális és a minimális felhasználása
Amellett, hogy megad egy nagyon alapvető információt az adatkészletről, a maximális és a minimális megjelenik a többi összefoglaló statisztika számításaiban is.
Mindkét két számot használjuk a hatótávolság, amely egyszerűen a maximális és a minimális különbség.
A maximális és a minimális megjelenik az első, a második és a harmadik kvartilis mellett a következőket tartalmazó értékek összetételében: öt szám összefoglaló adatkészlethez. A minimum a felsorolt első szám, mivel a legalacsonyabb, és a legmagasabb az utolsó felsorolt szám, mert a legmagasabb. Az öt számösszefoglalóval való kapcsolat miatt a maximális és a minimum egyaránt megjelenik egy doboz- és pofaszakáll-ábrán.
A maximális és a minimális korlátozások
A maximum és a minimum nagyon érzékenyek a túlmutatókra. Ez az egyszerű ok miatt: ha valamilyen érték hozzáadódik egy adatkészlethez, amely kevesebb, mint a minimum, akkor a minimum változik, és ez az új érték. Hasonlóképpen, ha bármely adat, amely meghaladja a maximumot, szerepel az adatkészletben, akkor a maximum megváltozik.
Tegyük fel például, hogy a 100 érték hozzáadódik a fent vizsgált adatkészlethez. Ez befolyásolja a maximumot, és 41-ről 100-ra változik.
Sokszor a maximális vagy a minimális túlmutat az adatkészletünkben. Annak meghatározására, hogy valóban vannak-e kiugró, használhatjuk a interkvartilis tartomány tartomány.