IRT信度估計值的兩個重要影響因素研究
發(fā)布時間:2021-04-19 15:01
目的:項目反應理論下的測驗信度(以下簡稱IRT信度),能夠評價潛在特質估計的可靠性、穩(wěn)定性,是測驗分數精度和穩(wěn)定性的宏觀指標。本文旨在探討在不同模型-數據資料擬合條件下,選擇何種方法對IRT信度進行估計。 方法:本研究以模型-數據資料擬合度以及信度估計方法為自變量,研究其對于估計準確度的主效應及交互效應,能夠為不同模型-數據資料擬合度水平下IRT信度估計方法的選擇提供參考。本研究采用R軟件及其指令包編寫計算機模擬程序,采用3*5的兩因素混合實驗設計,其中模型-數據資料擬合度為被試間變量(“高度擬合”、“中度擬合”和“低度擬合”三種水平模擬數據),IRT信度估計方法為被試內變量(總體信度、邊際信度、理論信度、經驗信度、Nicewander信度三種水平),以信度估計值的絕對偏差(信度估計值與信度真值之差)為因變量IRT信度估計值偏差的指標。 結果:不同IRT信度估計方法對IRT信度影響顯著,估計偏差最小的是邊際信度,估計偏差最大的是Nicewander信度;不同模型-數據資料擬合度差異,,模型-數據資料擬合度越低,IRT信度估計偏差越大;信度估計方法與模型-數據資料擬合度交互效應顯著,邊際信度的估計絕對偏差最不易受到模型-數據資料擬合度影響,表現(xiàn)得最為穩(wěn)定,經驗信度稍次;在“高度擬合”水平下,總體信度估計偏差最;在“中度擬合”和“低度擬合”水平下,邊際信度估計偏差最;Nicewander信度在模型-數據資料擬合度的各水平均是估計偏差最大的。 結論:需要根據模型-數據資料擬合度選擇適當的IRT信度估計方法。在擬合度較為理想時,用總體信度是最優(yōu)選擇;擬合度一般,邊際信度是最佳選擇;更差的擬合條件下邊際信度依然是最佳選擇。而當無法預知擬合度的時候,邊際信度首選,其次就是經驗信度。
【學位授予單位】:江西師范大學
【學位級別】:碩士
【學位授予年份】:2014
【分類號】:B841
本文編號:2066326
【學位授予單位】:江西師范大學
【學位級別】:碩士
【學位授予年份】:2014
【分類號】:B841
文章目錄
摘要
Abstract
引言
1 文獻綜述
1.1 信度概念簡介
1.2 項目反應理論基本概念簡介
1.2.1 潛在特質理論
1.2.2 Logistic 模型
1.2.3 項目信息函數及測驗信息函數
1.2.4 模型-數據資料擬合
1.3 IRT 信度定義簡介
1.4 研究者對 IRT 信度作用的認識及其觀點
1.5 IRT 信度估計公式研究
1.5.1 總體信度(Total Reliability)
1.5.2 理論信度(Theoretical Reliability)
1.5.3 邊際信度(Marginal Reliability)
1.5.4 經驗信度(Empirical Reliability)
1.5.5 條件信度
1.5.6 Nicewander 信度公式
1.5.7 Raju 公式
1.6 IRT 信度的影響因素研究
1.6.1 項目的難度、區(qū)分度及猜測系數的影響
1.6.2 測驗長度的影響
1.6.3 項目的評分等級數的影響
1.6.4 潛在特質估計的影響
2 IRT 信度估計值影響因素的實證研究
2.1 提出問題
2.2 研究對象及研究假設
2.3 研究目標和各子目標擬解決的關鍵問題
2.4 研究方法
2.4.1 自變量設定
2.4.2 因變量指標選擇
2.5 數據模擬說明及實驗步驟
2.5.1 步驟一:項目參數的模擬
2.5.2 步驟二:被試能力參數
2.5.3 步驟三:作答反應矩陣的模擬
2.5.4 步驟四:能力參數估計
2.5.5 步驟五:計算 IRT 信度真值
2.5.6 步驟六:計算 5 種信度估計值
2.5.7 步驟七:計算因變量值
2.6 實驗結果
2.6.1 基本數據
2.6.2 統(tǒng)計檢驗與分析
3 討論
3.1 模型-數據資料擬合度對 IRT 信度真值的影響
3.2 模型-數據資料擬合度對 IRT 信度估計偏差的影響
3.3 信度估計方法之間的差異
3.4 指標使用建議
4 結論
5 本研究的特色與意義
5.1 研究的特色與創(chuàng)新之處
5.2 本研究的意義
6 當前研究局限與展望
6.1 缺乏復雜模型的信度估計方法
6.2 估計方法比較研究納入的因素和方式單一
6.3 估計方法依賴 Fisher 信息函數
6.4 信度估計上限和下限問題尚未定論
參考文獻
附錄
致謝
在讀期間公開發(fā)表論文(著)及科研情況
【參考文獻】
相關期刊論文 前7條
1 俞曉琳;項目反應理論與經典測驗理論之比較[J];南京師大學報(社會科學版);1998年04期
2 郭慶科,房潔;經典測驗理論與項目反應理論的對比研究[J];山東師大學報(自然科學版);2000年03期
3 馬江山,秦霞;兩種測量理論(CTT和IRT)的分析與比較[J];上饒師范學院學報(自然科學版);2005年03期
4 唐寧玉;三種心理測量理論的信度觀[J];心理科學;1994年01期
5 朱瑋;丁樹良;陳小攀;;IRT中最小化χ~2/EM參數估計方法[J];心理學報;2006年03期
6 李峰;朱彬鈺;辛濤;;十五年來心理測量學研究領域可視化研究——基于CITESPACE的分析[J];心理科學進展;2012年07期
7 戴海琦;羅照盛;;項目反應理論原理與當前應用熱點概覽[J];心理學探新;2013年05期
本文編號:2066326
本文鏈接:http://m.lk138.cn/shekelunwen/xinlixingwei/2066326.html