Štatistika t-testu študenta

Študentov t-test, v štatistike, metóda testovania hypotéz o priemere malej vzorky vybratej z normálne distribuovanej populácie, keď nie je známa štandardná odchýlka populácie.

V roku 1908 William Sealy Gosset, Angličan vydávajúci pod pseudonymom Student, rozvinul t-test a distribúciu t. Rozloženie t je skupina kriviek, v ktorých počet stupňov voľnosti (počet nezávislých pozorovaní vo vzorke mínus jeden) určuje konkrétnu krivku. Keď sa veľkosť vzorky (a tým aj stupne voľnosti) zväčšuje, distribúcia t sa približuje k tvaru zvonku štandardného normálneho rozdelenia. V praxi sa pri skúškach zahrnujúcich priemer vzorky s veľkosťou väčšou ako 30 zvyčajne používa normálne rozdelenie.

Najprv je obvyklé formulovať nulovú hypotézu, ktorá uvádza, že neexistuje žiadny efektívny rozdiel medzi pozorovaným priemerom vzorky a predpokladaným alebo uvádzaným priemerom populácie - tj že akýkoľvek nameraný rozdiel je spôsobený iba náhodou. Napríklad v poľnohospodárskej štúdii by nulová hypotéza mohla spočívať v tom, že aplikácia hnojiva nemá žiadny vplyv na úrodu plodín, a mal by sa vykonať experiment, aby sa otestovalo, či zvýšila úrodu. Všeobecne platí, že t-test môže byť buď obojstranný (tiež nazývaný dvojstranný), pričom sa jednoducho uvádza, že prostriedky nie sú ekvivalentné alebo jednostranné, pričom sa určuje, či je pozorovaný priemer väčší alebo menší ako predpokladaný priemer. Potom sa vypočíta štatistika testu t. Ak je pozorovaná t-štatistika extrémnejšia ako kritická hodnota stanovená vhodným referenčným rozdelením, neplatná hypotéza sa zamietne. Vhodným referenčným rozdelením pre t-štatistiku je rozdelenie t. Kritická hodnota závisí od úrovne významnosti testu (pravdepodobnosť chybného odmietnutia nulovej hypotézy).

Predpokladajme napríklad, že výskumný pracovník chce testovať hypotézu, že vzorka s veľkosťou n = 25 so strednou hodnotou x = 79 a štandardnou odchýlkou s = 10 bola náhodne odobratá z populácie so strednou hodnotou μ = 75 a neznámou štandardnou odchýlkou. Použitím vzorca pre t-štatistiku sa vypočítané t rovná 2. Pre dvojstranný test pri spoločnej hladine významnosti α = 0,05 sú kritické hodnoty z rozdelenia t pri 24 stupňoch voľnosti -2,064 a 2,064. Vypočítané t nepresahuje tieto hodnoty, a preto nemožno nulovú hypotézu s 95% istotou odmietnuť. (Úroveň spoľahlivosti je 1 - α.)

Druhá aplikácia distribúcie t testuje hypotézu, že dve nezávislé náhodné vzorky majú rovnaký priemer. Distribúcia t sa môže tiež použiť na zostavenie intervalov spoľahlivosti pre skutočný priemer populácie (prvá aplikácia) alebo pre rozdiel medzi dvoma vzorkami (druhá aplikácia). Pozri tiež odhad intervalu.