2026年3月3日 星期二

教育測驗中信度與效度之意涵、關係與實務應用(reliability)(validity)


教育測驗中信度與效度之意涵、關係與實務應用
在教育測驗與評量中,「信度(reliability)」與「效度(validity)」是判斷測驗品質的兩大核心指標,分別代表測驗結果的穩定性與測量目標的正確性,兩者相互關聯卻不可混為一談。

一、 信度:測量結果的「穩定性」
信度是指測驗結果的一致性(Consistency)。簡單來說,如果同一個學生在排除學習進步的前提下,連續接受兩次相同的測驗,其得分是否能保持穩定?
1. 誤差的干擾
測驗分數往往由「真實分數」與「測量誤差」組成。當誤差愈小,信度就愈高。常見的誤差來源包括:
(1)受試者因素: 考生當天的身體狀況、焦慮程度或運氣(猜題)。
(2)施測環境: 考場噪音、照明不足或限時壓力。
(3)評分主觀性: 尤其在申論題中,不同老師或同一老師在不同時間的評分標準不一。

2. 高信度的表現
一份具有高信度的測驗,其結果應該是可複製的。無論是由哪位老師閱卷,或是學生在哪個安靜的教室應考,測得的分數都應趨於一致。

二、 效度:測量內容的「正確性」
如果說信度是在問「量得穩不穩」,效度則是在問「量得準不準」。效度是指測驗是否真正測量到它「預期要測」的目標能力。
1. 構念的精準
一份數學推導測驗,若文字敘述過於艱澀,導致學生因為「讀不懂題目」而答錯,那麼這份測驗測到的其實是「閱讀能力」而非「數學能力」,其效度便大打折扣。

2. 效度的判斷標準
1)內容效度: 題目是否涵蓋了教學大綱的核心重點?
(2)建構效度: 測驗分數是否能反映出理論上的能力特質(如:批判思考、邏輯推理)?

三、 信度與效度的辯證關係
信度與效度的關係,是測驗理論中最引人入勝的部分。學術界有一句名言:「信度是效度的必要條件,而非充分條件。」
1.高效度,必有高信度:既然能量得「準」,結果必然非常「穩定」。例如,神射手每次都命中紅心。
2.高信度,不一定高效度:結果雖然穩定,但可能「穩定地測錯方向」。例如,一把刻度偏移的尺,每次量出的高度都一樣,但都不是真實身高。
3.低信度,必然低效度:結果若像隨機亂跳的數字,根本無法代表任何意義。例如,壞掉的體重計,數字跳動不停,毫無參考價值。

四、 實務應用:如何打造高品質的教育測驗?
教師在自編測驗時,常面臨信度不足的困擾。要優化測驗品質,可從以下五個維度著手:
1.增加題項數量: 統計學證明,適度增加題目數量能有效抵銷偶然誤差,讓分數更趨於真實。
2.優化題目品質: 進行試題分析(Item Analysis),剔除難度過高、過低或鑑別力不足(分不出好生與差生)的題目。
3.標準化流程: 統一施測說明、時間限制與環境控制,減少環境變項帶來的干擾。
4.建立客觀規準(Rubrics): 對於非選擇題,應設計明確的評分標準,甚至採取「雙閱卷制度」以提升評分者間信度。
5.對接教學目標: 定期檢核雙向細目表,確保題目分布與教學權重相符,從源頭保證效度。

五、 結論
信度確保了評價的「公平性」,效度則確保了評價的「診斷價值」。在教學實務中,我們不應盲目追求高分,而應追求「有意義的分數」。唯有在穩定的信度基礎上,不斷修正測驗內容以逼近效度核心,教育評量才能真正成為引導教學、促進學習的指路明燈。
關鍵字:
By 國考小幫手Youtube頻道
本講選自114年公務人員升官等考試薦任 教育測驗
信度管「穩不穩」,效度管「準不準」;信度是效度的必要條件,高信度不一定高效度,但高效度一定建立在高信度之上。

標籤:

0 個意見:

張貼留言

訂閱 張貼留言 [Atom]

<< 首頁