Kapitoly:

Ako citovať
túto učebnicu

Zisťovanie reliability

Existuje niekoľko spôsobov zisťovania reliability:

(A) Opakovanie administrácie výskumného nástroja

Táto metóda sa nazýva aj test – retest, ale pod testom sa chápe aj iný výskumný nástroj než test, napríklad škálovaný dotazník. Pri opakovaní administrácie sa postupuje tak, že sa ten istý výskumný nástroj zadáva dvakrát tým istým ľuďom s časovým odstupom. Potom sa vypočíta miera zhody medzi výsledkami prvého a druhého administrovania.

Tento spôsob pripomína zisťovanie presnosti merania pásmovým metrom. Keď sa chcete presvedčiť, či sme odmerali koberec správne, meriate dvakrát. Výsledok by mal byť totožný. Na rozdiel do kobercov meranie ľudských charakteristík je menej presné, pretože do hry vstupuje veľa faktorov, ktoré spôsobujú rozdiely medzi prvým a druhým meraním.

Miera zhody medzi obidvomi výsledkami sa obyčajne vyjadruje korelačným koeficientom ikona - slovník  Korelačný koeficient = index vyjadrujúci stupeň vzťahov medzi dvomi premennými. Môže nadobudnúť hodnoty od -1 (vôbec nijaká zhoda) po +1 (úplná zhoda). 0 znamená žiadny vzťah.. Od dobrých výskumných nástrojov sa požaduje, aby korelácia bola minimálne 0,70. Nižšie korelácie ukazujú na menšiu presnosť a spoľahlivosť. Samozrejme, záleží aj na type a obsahu výskumného nástroja. Napríklad od projektívnych nástrojov, akými sú testy slovných asociácií alebo kresba, nemožno očakávať takúto vysokú spoľahlivosť.

expand Príklad...

 TESTRETEST
MENO1.IX.21.XI.
Janko2018
Marienka3025
Mirka2015
Jožko2617
Berti2719
Albert1925
Adam2520
Róbert1920
Miriam2119
Xénia3533
Sisi3025
Monika3022
Iva1922
Samko2025
Bea1931
Rudi3530
Gejza2231
Šaňo2219
Ivo1929
priemer22,422,9

Vypočítaný korelačný koeficient r = 0,37 a je hlboko pod normou 0,70. Ako vidno, ide o veľmi málo reliabilný nástroj, ako je napokon zrejmé už pri vizuálnom porovnaní výsledkov v každom riadku. Aritmetický priemer vyjadruje niečo iné, neodhalí skutočnú reliabilitu.

Ako vypočítať korelačný koeficient? Koeficient korelácie sa dá ľahko vypočítať pomocou počítačového programu MS Excel. Predpokladajme, že chcete skorelovať výsledky testu pri prvom zadaní s výsledkom testu pri druhom zadaní, ako je to v príklade. V MS Exceli budete mať teda číselné údaje v dvoch stĺpcoch.

Najprv kliknite myšou do hociktorého voľného políčka – tam na konci výpočtu uvidíte výsledok.

Ďalej kliknite na príkazy v tomto poradí:

  1. ikonka Fx v paneli nástrojov,
  2. vybrať kategóriu,
  3. vybrať funkciu,
  4. štatistické,
  5. correl,
  6. OK.

Potom pokračujte takto:

  1. dajte kurzor do rámčeka Array 1 (Sada 1),
  2. prejdite zhora dolu myšou celý prvý stĺpec výsledkov žiakov,
  3. dajte kurzor do rámčeka Array 2 (Sada 2),
  4. prejdite zhora dolu myšou celý prvý stĺpec výsledkov žiakov,
  5. stlačte OK.

Aký veľký má byť časový odstup medzi prvou a druhou administráciou? Ak je interval medzi dvomi meraniami veľmi krátky, je možné, že si skúmané osoby zapamätajú predchádzajúce odpovede a budú ich opakovať. Pri veľmi dlhom intervale do hry môžu vstúpiť niektoré nepriaznivé okolnosti, napr. skúmaná vlastnosť sa môže v priebehu času čiastočne zmeniť. Napríklad pri výskume pomocou dotazníka o klíme triedy môže byť okolnosťou, ktorá zmení danú vlastnosť, odchod „lídra“ triedy alebo príchod nového učiteľa. Špecifický problém je najmä pri testovaní vedomostí, pretože tie u žiakov obyčajne „starnú“ rýchlo, takže napríklad po 8 týždňoch sú už vedomostí značne zredukované (možno sa mýlime!). Opakované zadanie testu neprinesie dobrú reliabilitu.

(B) Rozpolovanie výskumného nástroja

Ak je výskumný nástroj dostatočne homogénny, možno reliabilitu zisťovať tak, že stačí test administrovať jedenkrát. Pri výpočte sa test rozdelí na dve polovice. Jednu polovicu tvoria výsledky párnych položiek a druhú výsledky nepárnych položiek. To znamená, že sa osobitne vypočíta skóre pre párne a pre nepárne položky. Výsledky nepárnych a párnych položiek sa skorelujú. Je to podobný postup ako pri opakovaní administrácie s tým rozdielom, že ide len o jedinú administráciu výskumného nástroja.

expand Príklad...

Tabuľka skóre pri jednej administrácii toho istého výskumného nástroja – osobitne vyčíslené skóre v párnych a nepárnych položkách (Vypočítané r = 0,57)

MENOPárne položkyNepárne položky
Ivan2019
Juraj1515
Miriam1210
Karol1610
Peter2019
Pavol1510
Alexandra2018
Anna1115
Anabela149
Aurélia1511
Karla1013
Mária1310
Melinda1917
Móric2017
Arpád1912
Ján1516
Mário2014
Šaňo2013
Ivan 21920
priemer16,814,1

Pri tomto spôsobe sa ako keby porovnávali dva krátke výskumné nástroje. Keďže však kratší výskumný nástroj je obyčajne menej reliabilný ako dlhší, bude korelačný koeficient, čiže výsledná reliabilita, nižšia. Výsledok však nie je realistický. Výskumná nástroj bol umelo skrátený. Štatistika má fígeľ, ktorý umožní odhadnúť reliabilitu nástroja v plnej dĺžke. Je to korekčný vzorec Spearmana a Browna:

vzorec SB

kde Rtt je predpokladaná reliabilita nerozpolenej formy výskumného nástroja a r12 je koeficient korelácie medzi dvomi polovicami výskumného nástroja. Keď do tohto vzorca dosadíme korelačný koeficient z nášho príkladu, vypočítaná hodnota bude 0,73. Odhad reliability testu v celej dĺžke je teda podstatne vyšší ako jeho rozpolenej verzie.

Výpočet reliability pomocou rozpolovania výskumného nástroja je založený na predpoklade, že nástroj je dostatočne homogénny, v opačnom prípade je vypočítaný koeficient nižší.

(C) Odhad vnútornej konzistencie výskumného nástroja

Dobrý výskumný nástroj nie je zmesou rôznych položiek, naopak, položky sú zostavené tak, aby zisťovali ten istý konštrukt, tú istú vlastnosť. Potom hovoríme, že výskumný nástroj má dobrú vnútornú konzistenciu. Na jej zistenie sa používajú dva základné vzorce.

Vzorec Kudera a Richardsona č. 21

Ak sa vo výskumnom nástroji skóruje každá položka dichotomicky, napríklad správna odpoveď získava 1 bod, nesprávna odpoveď 0 bodov, na výpočet sa používa vzorec Kudera a Richardsona č. 21 (autori zostavili viacero vzorcov, ktoré sa odlišujú číslovaním):

vzorec KR

kde K je počet položiek výskumného nástroja, AP je aritmetický priemer výsledkov, S2 je druhá mocnina smerodajnej odchýlky ikona - slovník  Smerodajná odchýlka = štatistický údaj vyjadrujúci rozptyl dát okolo priemeru..

Príklad
Žiaci v teste, ktorý mal 50 položiek, dosiahli priemer 30 bodov. S2 bolo 100. Vypočítané KR21 je 0,90. Výskumný nástroj má vynikajúcu reliabilitu.

Cronbachovo alfa

Ak sa výskumný nástroj skladá z položiek, ktoré nie sú dichotomické ikona - slovník  Dichotomický = spôsob vyjadrenia dát len v dvoch hodnotách, napr. správne – nesprávne., ale majú väčšie rozpätie bodovania (napríklad 1 až 5), používa sa koeficient nazvaný Cronbachovo alfa. Tento koeficient sa používa typicky pri dotazníkoch, kde sú položky škálované (všetky položky v dotazníku majú škály rovnakej hodnoty a dĺžky). Jeho výpočet je prácnejší, a preto sa na výpočet používajú štatistické softvéry, napríklad SPSS alebo Statistica, pomocou ktorých sa výpočet uskutočňuje veľmi rýchlo.


Reliabilita pri metóde pozorovania

Pri výskumnej metóde pozorovania sa reliabilita zisťuje iným spôsobom, než opakovaním administrácie, rozpolovaním alebo zisťovaním vnútornej konzistencie. Najčastejšie sa používa metóda posúdenia dvomi nezávislými hodnotiteľmi (inter-rater reliability). Dvaja hodnotitelia pozorujú danú situáciu (napr. vyučovaciu hodinu), priebežne kódujú do záznamového hárku javy, ktoré sa vyskytujú v priebehu vyučovania. Po skončení pozorovania porovnajú svoje kódy a vypočítajú stupeň zhody (obyčajne v %). O dobrej reliabilite pozorovania možno hovoriť, keď je zhoda aspoň 80-precentná. Prirodzene, obidvaja hodnotitelia musia byť dobre zacvičení a musia dokonale poznať pozorovací systém, ktorý používajú.

Celkovo k reliabilite

Reliabilita sa vždy vzťahuje na konkrétny výskumný nástroj a súčasne na výskumný súbor, pri ktorom sa použil. Teda jeho reliabilita nemusí byť rovnaká, ale závisí od konkrétnej štruktúry daného výskumného súboru, a preto by sa mala vždy nanovo vypočítať pri každom výskume. Napríklad výskumný súbor, ktorý je homogénny, spravidla spôsobuje nižšiu reliabilitu výskumného nástroja ako výskumný súbor, ktorý je menej homogénny. Test schopností zadaný žiakom 8-ročného gymnázia bude mať spravidla nižšiu reliabilitu ako test zadaný žiakom základnej školy v tom istom veku. Je to preto, lebo žiaci 8-ročného gymnázia tvoria výkonovo homogénnejšiu skupinu ako žiaci základnej školy. Výskumný nástroj vykazuje lepšiu reliabilitu, keď je variabilita skóre v danej skupine ľudí vyššia a, naopak, dáva nižšiu reliabilitu, keď je variabilita skóre nižšia. Interpretácia výskumných zistení by mala vziať do ohľadu aj tieto okolnosti.