國考小幫手: 01/30/26

2026年1月30日星期五

效標關聯效度之意義、限制與應用原則（criterion-related validity）

效標關聯效度之意義、限制與應用原則
——兼論測驗使用者的實務判斷建議
在心理與教育測驗中，「效度」是評估測驗品質的核心概念，而效標關聯效度（criterion-related validity）則是其中最具實務導向的一種。效標關聯效度主要透過經驗性方法，檢驗測驗分數與外在效標之間的關聯程度，藉以判斷測驗是否能有效反映或預測實際表現。當測驗分數與效標之相關愈高，即表示效標關聯效度愈佳，測驗在實務應用上的價值亦隨之提升。

然而，效標關聯效度的建構與解釋，並非僅計算相關係數即可完成。測驗使用者若未審慎評估效標品質、研究設計與推論限制，極易導致錯誤解讀，進而影響教育與選才決策。

一、確認效標的適切性、可靠性、客觀性與可用性
效標關聯效度的品質，首先取決於「效標本身是否合宜」。理想的效標應同時具備四項特性：適切性、可靠性、客觀性與可用性。

所謂適切性（relevance），是指效標是否真正反映測驗欲測量的重要行為或表現；
可靠性（reliability）則要求效標資料本身具有穩定與一致性；
客觀性（freedom from bias）意味效標不應受到評分者偏見或外在干擾影響，以避免效標污染（criterion contamination）；
而可用性（availability）則關係到效標資料是否容易取得且具實務可行性。

若效標本身品質不佳，即使測驗設計良好，也難以獲得可信的效標關聯效度證據。

二、避免預先選擇導致團體同質性過高而降低效度
在實務研究中，常因「預先選擇（preselection）」問題而影響效標關聯效度。例如，若研究樣本僅限於已通過某項測驗或篩選的高成就團體，則其測驗分數與效標分數的變異範圍會明顯縮小。

當團體同質性過高時，即使測驗本身具有預測力，也可能因變異受限而導致相關係數偏低，進而低估測驗的實際效度。因此，在建構效標關聯效度時，研究者應盡可能納入具足夠差異性的樣本，以避免因研究設計限制而扭曲效度結果。

三、區分同時效度與預測效度的使用情境
效標關聯效度可依效標取得時間的不同，區分為同時效度（concurrent validity）與預測效度（predictive validity）。

同時效度指測驗分數與同一時間點所取得效標之相關，主要用於評估個體「當前實際表現」；
預測效度則著重於測驗分數與未來效標表現的關聯，常應用於升學、就業與選才情境。

測驗使用者應根據測驗目的與效標時間點，選擇合適的效度類型進行分析，避免混淆不同效度概念而產生錯誤推論。

四、避免僅依賴單一效度係數作為決策依據
效標關聯效度僅是效度證據的一環，而非測驗品質的唯一指標。在教育與心理評量中，測驗結果往往涉及教學診斷、學習輔導、甄選與分流等重要決策，若僅依賴單一效標關聯效度係數，容易導致不完整甚至不公平的判斷。

因此，測驗使用者應結合內容效度、建構效度等多元效度證據，進行整體性評估，以提升決策的合理性與公正性。

五、正確認識相關係數的意義與推論限制
最後，必須強調的是，效標關聯效度係數僅反映測驗分數與效標之間的「相關程度」，並不代表因果關係。即使相關係數偏高，也不必然表示測驗具有完全或長期的預測能力。

在教育評量實務中，測驗使用者應結合測驗目的、受試者特性與實際應用情境，審慎解讀效度數據，避免過度推論或不當擴大效度結果的意義。
關鍵字：
By 國考小幫手Youtube頻道
本講選自114年地方特考三等教育測驗與統計
效標關聯效度是連結測驗分數與實際表現的重要橋樑，對測驗應用具有高度實務價值。然而，其建構與解釋需建立在良好效標品質、適切研究設計與審慎推論之上。唯有在理解其限制與搭配多元效度證據的前提下，效標關聯效度才能真正發揮支持教育決策與專業判斷的功能。

標籤：教育測驗與統計

國考小幫手

2026年1月30日星期五

效標關聯效度之意義、限制與應用原則（criterion-related validity）

關於我自己

連結

先前的文章

封存

國考小幫手

2026年1月30日 星期五

效標關聯效度之意義、限制與應用原則（criterion-related validity）

關於我自己

連結

先前的文章

封存

2026年1月30日星期五