國考小幫手: 教育測驗中信度與效度之意涵、關係與實務應用（reliability）（validity）

教育測驗中信度與效度之意涵、關係與實務應用
在教育測驗與評量中，「信度（reliability）」與「效度（validity）」是判斷測驗品質的兩大核心指標，分別代表測驗結果的穩定性與測量目標的正確性，兩者相互關聯卻不可混為一談。

一、信度：測量結果的「穩定性」
信度是指測驗結果的一致性（Consistency）。簡單來說，如果同一個學生在排除學習進步的前提下，連續接受兩次相同的測驗，其得分是否能保持穩定？
1. 誤差的干擾
測驗分數往往由「真實分數」與「測量誤差」組成。當誤差愈小，信度就愈高。常見的誤差來源包括：
(1)受試者因素：考生當天的身體狀況、焦慮程度或運氣（猜題）。
(2)施測環境：考場噪音、照明不足或限時壓力。
(3)評分主觀性：尤其在申論題中，不同老師或同一老師在不同時間的評分標準不一。

2. 高信度的表現
一份具有高信度的測驗，其結果應該是可複製的。無論是由哪位老師閱卷，或是學生在哪個安靜的教室應考，測得的分數都應趨於一致。

二、效度：測量內容的「正確性」
如果說信度是在問「量得穩不穩」，效度則是在問「量得準不準」。效度是指測驗是否真正測量到它「預期要測」的目標能力。
1. 構念的精準
一份數學推導測驗，若文字敘述過於艱澀，導致學生因為「讀不懂題目」而答錯，那麼這份測驗測到的其實是「閱讀能力」而非「數學能力」，其效度便大打折扣。

2. 效度的判斷標準
1)內容效度：題目是否涵蓋了教學大綱的核心重點？
(2)建構效度：測驗分數是否能反映出理論上的能力特質（如：批判思考、邏輯推理）？

三、信度與效度的辯證關係
信度與效度的關係，是測驗理論中最引人入勝的部分。學術界有一句名言：「信度是效度的必要條件，而非充分條件。」
1.高效度，必有高信度：既然能量得「準」，結果必然非常「穩定」。例如，神射手每次都命中紅心。
2.高信度，不一定高效度：結果雖然穩定，但可能「穩定地測錯方向」。例如，一把刻度偏移的尺，每次量出的高度都一樣，但都不是真實身高。
3.低信度，必然低效度：結果若像隨機亂跳的數字，根本無法代表任何意義。例如，壞掉的體重計，數字跳動不停，毫無參考價值。

四、實務應用：如何打造高品質的教育測驗？
教師在自編測驗時，常面臨信度不足的困擾。要優化測驗品質，可從以下五個維度著手：
1.增加題項數量：統計學證明，適度增加題目數量能有效抵銷偶然誤差，讓分數更趨於真實。
2.優化題目品質：進行試題分析（Item Analysis），剔除難度過高、過低或鑑別力不足（分不出好生與差生）的題目。
3.標準化流程：統一施測說明、時間限制與環境控制，減少環境變項帶來的干擾。
4.建立客觀規準（Rubrics）：對於非選擇題，應設計明確的評分標準，甚至採取「雙閱卷制度」以提升評分者間信度。
5.對接教學目標：定期檢核雙向細目表，確保題目分布與教學權重相符，從源頭保證效度。

五、結論
信度確保了評價的「公平性」，效度則確保了評價的「診斷價值」。在教學實務中，我們不應盲目追求高分，而應追求「有意義的分數」。唯有在穩定的信度基礎上，不斷修正測驗內容以逼近效度核心，教育評量才能真正成為引導教學、促進學習的指路明燈。
關鍵字：
By 國考小幫手Youtube頻道
本講選自114年公務人員升官等考試薦任教育測驗
信度管「穩不穩」，效度管「準不準」；信度是效度的必要條件，高信度不一定高效度，但高效度一定建立在高信度之上。

標籤：教育測驗與統計

國考小幫手

2026年3月3日星期二

教育測驗中信度與效度之意涵、關係與實務應用（reliability）（validity）

0 個意見:

張貼留言

關於我自己

先前的文章