A bizalmi intervallumok a következtetési statisztikák kulcseleme. Használhatunk bizonyos valószínűségeket és információkat a Valószínűségi eloszlás egy populáció paraméterének becslése egy minta felhasználásával. Az állítás megbízhatósági intervallum oly módon történik, hogy könnyen félreérthető. Megvizsgáljuk a konfidencia-intervallumok helyes értelmezését, és négy hibát fogunk megvizsgálni, amelyek a statisztikák ezen területével kapcsolatban készültek.
Mi az a bizalmi intervallum?
A megbízhatósági intervallum értéktartományban vagy a következő formában fejezhető ki:
Becslés ± Hibahatár
A konfidencia intervallumot általában a konfidencia szintjével adják meg.Közös bizalom szintje 90%, 95% és 99%.
Nézzünk egy példát, ahol egy minta átlagot akarunk használni a populáció átlagának következtetésére. Tegyük fel, hogy ez 25 és 30 közötti konfidencia intervallumot eredményez. Ha azt mondjuk, hogy 95% -ban biztosak vagyunk abban, hogy az ismeretlen lakosság átlagos ebben az intervallumban van, akkor valóban azt mondjuk, hogy az intervallumot olyan módszerrel találtuk meg, amely sikeresen ad helyes eredményeket az idő 95% -ában. Hosszú távon módszerünk sikertelen lesz az idő 5% -a. Más szavakkal, sikertelen lesz a valódi populáció - azaz 20-szoros közül csak egy - megragadása.
1. hiba
Most megvizsgálunk egy sor különféle hibát, amelyek elkövethetők a konfidencia-intervallumok kezelésekor. Az egyik helytelen állítás, amelyet gyakran tesznek egy 95% -os megbízhatósági intervallummal kapcsolatban, hogy 95% esély van arra, hogy a konfidencia intervallum tartalmazza a populáció valódi átlagát.
Az az oka, hogy ez egy hiba, valójában nagyon finom. A konfidencia intervallumra vonatkozó fő ötlet az, hogy a használt valószínűség beírja a képet a konfidencia-intervallum meghatározásánál alkalmazott módszer az, hogy az arra a módszerre vonatkozik, amelyik van használt.
2. hiba
A második hiba az, ha a 95% -os konfidencia intervallumot úgy értelmezzük, hogy azt mondjuk, hogy a populáció összes adatértékének 95% -a esik az intervallumba. Ismét 95% beszél a teszt módszeréről.
A fenti állítás helytelenségének megértése érdekében megvizsgálhatjuk a normál populációt a szórás 1 és átlag 5. Egy mintán, amelynek két adatpontja van, mindegyik 6-os értékkel rendelkezik, a minta átlaga 6. A népesség átlagának 95% -os megbízhatósági intervalluma 4,6-7,4. Ez egyértelműen nem fedi át a 95% - át normális eloszlás, tehát nem fogja tartalmazni a népesség 95% -át.
3. hiba
A harmadik hiba azt állítani, hogy a 95% -os konfidencia-intervallum azt jelenti, hogy az összes lehetséges minta átlag 95% -a az intervallum tartományába esik. Vizsgálja meg újra az utolsó szakasz példáját. Bármely, a 2. méretű mintánál, amely csak 4,6-nél kevesebb értékeket tartalmazott, átlagos értéke kisebb, mint 4,6. Így ezek a mintavételi eszközök kívül esnek ezen a meghatározott konfidencia intervallumon. A leírásnak megfelelő minták a teljes mennyiség több mint 5% -át teszik ki. Tehát hibás azt mondani, hogy ez a konfidencia-intervallum az összes minta átlagának 95% -át megragadja.
4. hiba
A negyedik hiba a konfidencia-intervallumok kezelésében az, ha azt gondoljuk, hogy ezek a hibák egyetlen forrása. Noha a konfidencia-intervallumhoz hibaszint tartozik, vannak olyan helyek is, ahol a hibák statisztikai elemzésbe csúszhatnak. Néhány példa az ilyen típusú hibákra a kísérlet helytelen megtervezéséből, a mintavételi elfogultságból vagy a populáció egy bizonyos részhalmazától származó adatok megszerzésének képtelenségéből származhat.