Test Mantel–Haenshel oraz modelowanie IRT jako narzędzia wykrywania DIF i opisu jego wielkości na przykładzie zadań ocenianych dychotomicznie
PBN-AR
Instytucja
Instytut Badań Edukacyjnych
Informacje podstawowe
Główny język publikacji
PL
Czasopismo
Edukacja
ISSN
0239-6858
EISSN
Wydawca
Instytut Badań Edukacyjnych
DOI
Rok publikacji
2013
Numer zeszytu
2
Strony od-do
34-55
Numer tomu
122
Identyfikator DOI
Liczba arkuszy
1,5
Autorzy
Słowa kluczowe
PL
zróżnicowane funkcjonowanie zadań
DIF
test Mantel–Haenshel
IRT
EN
differential item functioning
Mantel–Haenszel test
item response theory
Open access
Tryb otwartego dostępu
Otwarte czasopismo
Wersja tekstu w otwartym dostępie
Wersja opublikowana
Licencja otwartego dostępu
Czas opublikowania w otwartym dostępie
Streszczenia
Język
PL
Treść
Artykuł porównuje dwie metody wykorzystywane do identyfikacji zróżnicowanego funkcjonowania zadań (DIF) ocenianych dychotomicznie: nieparametryczne rozwiązanie opierające się na statystyce Mantel–Haenshel (MH) oraz podejście bazujące na teście ilorazu funkcji wiarygodności. Porównanie przeprowadzono na gruncie teoretycznym i za pomocą symulacji. Wyniki symulacji potwierdziły przypuszczenie, że podejście opierające się na statystyce MH jest bardziej czułe na jednorodne efekty DIF, jednak traci moc, gdy wielkość DIF zmienia się w zależności od poziomu zmiennej ukrytej mierzonej testem. Oprócz mocy statystycznej analizowano również specyficzne miary wielkości efektu DIF stosowane w obu metodach: miarę MH D – DIF, wykorzystywaną standardowo przez Educational Testing Service do klasyfikacji wielkości DIF, oraz różne miary P – DIF określone na metryce łatwości zadania.
Język
EN
Treść
The article compares two methods used to detect differential item functioning (DIF) of dichotomously scored items: a nonparametric solution based on the Mantel–Haenszel procedure (MH) and a parametric IRT approach with a likelihood ratio test. A Monte Carlo experiment was performed in order to evaluate performance of both statistics in various conditions of DIF uniformity. Results confirmed the theoretical prediction that the MH test has greater statistical power in detecting uniform DIF than the likelihood ratio test and less power than the LR test in cases of non-uniform DIF. Apart of examining statistical power of the test, specific measures of DIF effect size were compared: MH D–DIF and three measures of P–DIF expressed on the item easiness scale.
Inne
System-identifier
1061