Reliabilita

Měření či jiné zjišťování hodnoty veličiny je v praxi často zatíženo chybou. Tato chyba může být malá, například při použití velmi přesného měřicího přístroje, anebo velká, například při nedbalém měření či při chybném odečtení hodnoty ze stupnice. Jelikož testování je také měření určitého druhu (měření žákových znalostí a schopností), je žádoucí znát nebo aspoň odhadnout jeho přesnost, aby bylo možné stanovit, do jaké míry se lze na výsledek měření spolehnout a na základě něho vyvozovat důsledky.

U testů tuto informaci poskytuje do značné míry reliabilita. Tato charakteristika vyjadřuje, jak velká část z variability výsledků účastníků připadá na rozdílné úrovně znalostí a schopností účastníků a jaká část variability je daná vlivem náhody či chybou měření. Reliabilita se vyjadřuje jako číslo mezi 0 a 1. Hodnoty blízké jedné znamenají, že vliv náhody je minimální a výsledky testu dobře odpovídají skutečným znalostem a schopnostem účastníků. Naopak příliš nízké hodnoty reliability signalizují, že do výsledků silně promlouvají náhodné vlivy. Reliabilita má velký význam v situaci, kdy lze předpokládat, že výsledky všech účastníků jsou zatíženy přibližně stejně velkou chybou. V takovém případě je možné na základě velikosti reliability a směrodatné odchylky výsledku účastníků určit pro každého účastníka tzv. střední chybu měření. Pomocí střední chyby pak získáme rozpětí, v němž se nachází výsledek odpovídající skutečným znalostem a schopnostem každého žáka. Pokud nelze předpokládat přibližně stejně velkou chybu u všech žáků, má reliabilita hlavně informativní hodnotu.

Často se hodnoty reliability srovnávají s doporučenými hodnotami pro určité účely.

  • test s reliabilitou nad 0,9 se pokládá za dostatečný k tomu, aby výhradně na jeho základě bylo možné činit rozhodnutí (např. o přijetí či nepřijetí),
  • test s reliabilitou mezi 0,8 a 0,9 je vyhovující jako jeden z podkladů pro rozhodnutí
  • test s reliabilitou mezi 0,6 a 0,8 je na individuální úrovni nepostačující pro rozhodování, avšak pro rozhodování o malých skupinách (do 10 osob) je postačující

Pro rozhodování o větších skupinách (např. na úrovni tříd a škol) jsou na reliabilitu kladeny mnohem menší nároky, daleko důležitější je spolehlivost dosažených výsledků (zamezení opisování a napovídání, dodržení zásad administrace testu atd.). Skutečnou hodnotu reliability lze vypočítat jen za splnění speciálních předpokladů, zpravidla je třeba ji pouze odhadnout. Nejpoužívanějšími odhady jsou výpočty korelace výsledků účastníků ve dvou různých polovinách testu (tzv. split-half reliabilita) a výpočet vnitřní konsistence testu (Cronbachovo alfa a speciální vzorec KR-20, nověji též přesnější odhad koeficientem L2L2).

produkty