2026年1月30日 星期五

效標關聯效度之意義、限制與應用原則(criterion-related validity)


效標關聯效度之意義、限制與應用原則
——兼論測驗使用者的實務判斷建議
在心理與教育測驗中,「效度」是評估測驗品質的核心概念,而效標關聯效度(criterion-related validity)則是其中最具實務導向的一種。效標關聯效度主要透過經驗性方法,檢驗測驗分數與外在效標之間的關聯程度,藉以判斷測驗是否能有效反映或預測實際表現。當測驗分數與效標之相關愈高,即表示效標關聯效度愈佳,測驗在實務應用上的價值亦隨之提升。

然而,效標關聯效度的建構與解釋,並非僅計算相關係數即可完成。測驗使用者若未審慎評估效標品質、研究設計與推論限制,極易導致錯誤解讀,進而影響教育與選才決策。

一、確認效標的適切性、可靠性、客觀性與可用性
效標關聯效度的品質,首先取決於「效標本身是否合宜」。理想的效標應同時具備四項特性:適切性、可靠性、客觀性與可用性。

所謂適切性(relevance),是指效標是否真正反映測驗欲測量的重要行為或表現;
可靠性(reliability)則要求效標資料本身具有穩定與一致性;
客觀性(freedom from bias)意味效標不應受到評分者偏見或外在干擾影響,以避免效標污染(criterion contamination);
而可用性(availability)則關係到效標資料是否容易取得且具實務可行性。

若效標本身品質不佳,即使測驗設計良好,也難以獲得可信的效標關聯效度證據。

二、避免預先選擇導致團體同質性過高而降低效度
在實務研究中,常因「預先選擇(preselection)」問題而影響效標關聯效度。例如,若研究樣本僅限於已通過某項測驗或篩選的高成就團體,則其測驗分數與效標分數的變異範圍會明顯縮小。

當團體同質性過高時,即使測驗本身具有預測力,也可能因變異受限而導致相關係數偏低,進而低估測驗的實際效度。因此,在建構效標關聯效度時,研究者應盡可能納入具足夠差異性的樣本,以避免因研究設計限制而扭曲效度結果。

三、區分同時效度與預測效度的使用情境
效標關聯效度可依效標取得時間的不同,區分為同時效度(concurrent validity)與預測效度(predictive validity)。

同時效度指測驗分數與同一時間點所取得效標之相關,主要用於評估個體「當前實際表現」;
預測效度則著重於測驗分數與未來效標表現的關聯,常應用於升學、就業與選才情境。

測驗使用者應根據測驗目的與效標時間點,選擇合適的效度類型進行分析,避免混淆不同效度概念而產生錯誤推論。

四、避免僅依賴單一效度係數作為決策依據
效標關聯效度僅是效度證據的一環,而非測驗品質的唯一指標。在教育與心理評量中,測驗結果往往涉及教學診斷、學習輔導、甄選與分流等重要決策,若僅依賴單一效標關聯效度係數,容易導致不完整甚至不公平的判斷。

因此,測驗使用者應結合內容效度、建構效度等多元效度證據,進行整體性評估,以提升決策的合理性與公正性。

五、正確認識相關係數的意義與推論限制
最後,必須強調的是,效標關聯效度係數僅反映測驗分數與效標之間的「相關程度」,並不代表因果關係。即使相關係數偏高,也不必然表示測驗具有完全或長期的預測能力。

在教育評量實務中,測驗使用者應結合測驗目的、受試者特性與實際應用情境,審慎解讀效度數據,避免過度推論或不當擴大效度結果的意義。
關鍵字:
By 國考小幫手Youtube頻道
本講選自114年地方特考三等 教育測驗與統計
效標關聯效度是連結測驗分數與實際表現的重要橋樑,對測驗應用具有高度實務價值。然而,其建構與解釋需建立在良好效標品質、適切研究設計與審慎推論之上。唯有在理解其限制與搭配多元效度證據的前提下,效標關聯效度才能真正發揮支持教育決策與專業判斷的功能。

標籤: