標準參照測驗

測驗回顧

標準參照測驗思想的淵源可以追溯得較遠，但是標準參照測驗理論的產生與發展則是20世紀50年代以後的事情。弗拉納根在1951年和埃貝爾在1962年都比較過兩種信息的價值，這兩種信息就是：從一個具體的領域或內容中作出推理被試的信息；有關一個團體中等第關係的被試的信息。但是"標準參照測驗"術語的明確提出則要歸功於格拉澤和克勞斯（1962），而對該術語的明確解釋則是格拉澤的貢獻。格拉澤於1963年在《美國心理學家》雜誌上撰文論述了這兩種信息的定義，並進行了比較。然而由於格拉澤論述的晦澀和深奧，以及這種新思想的陌生，因而這種思想未能立即轉化為實踐，正如波帕姆和赫塞克的評述："除了在技術辭彙中增加了兩個新概念之外，在測量實踐中並沒有對它們進行區分。"

1969年波帕姆和赫塞克在《教育測量雜誌》上發表了《標準參照測驗的套用》一文，此文不僅評述了以前的發展狀況，而且進一步闡述了格拉澤的思想，並且列舉了在教學決策中常模參照和標準參照兩種方法和利和弊。這篇論文引起了教育和心理測量專家們的廣泛注意，從而使得70年代成為標準參照測驗贏得測量待業關注的10年。這可從兩個統計數據中得到印證：格拉澤1963年發表的論文至1986年8月止，已被124篇文章引用，其中只有10篇是1971年以前發表的；從1967~1978年20年間，美國教育資料情報中心（ERIC）收集到了1913篇有關標準參照測驗研究課題的論文。

70年代期間，教育與心理測量專家對標準參照測驗的概念進行了進一步探討，而且對該測驗的編制原理及方法、標準水平的確立方法、信度估計及效度驗證等方面進行了研究，並提出了一系列數學化模型。1980年，標準參照測驗領域已變得十分複雜，乃至尼特克撰寫了長達24頁的評述性論文，以幫助我們區分標準參照測驗不同類型的差異。

自1968年以後，標準參照測驗的實踐也得到了發展。波帕姆及其同事們構建和散發了許多標準參照測驗，每一套都與一套可測量的（或詳述的）目標相聯繫。這些測驗在許多課堂中得到了使用，並使課堂使用者成為標準參照測驗的狂熱支持者。1982年有調查表明，美國全國教育學會發言人明確表示，他們寧可要標準參照測驗而不要常模參照測驗，許多州立教育部門也編制了與州所設立的課程相關聯的標準參照測驗。

標準參照測驗從興起到發展之所以如此迅速，有其深刻的原因。本世紀五六十年代美國的教育改革轟轟烈烈、聲勢浩大，人們提出"為掌握而教學"、"個別化教學"等教學改革主張。為了能有效地實現這些改革，教師必須能為某種知識、技能的"掌握"下定義，並且在實踐中能識別學生是否已達到了掌握和程度。這就對傳統的測量方法提出了挑戰。此時，如果成績評定準則仍然是相對性、競爭性，即根據學生在常模組內的相對位置來判斷他的成績，則雖然學生在團體組內的等第次序變化也能為說明其學習是否進步提供證據，但如果把這種變化僅僅看作是競爭性的，那么這種成績評定準則可能會摧毀學生的學習和發展。其原因在於：為了檢查學生對某學科內容的掌握情況，如採用以傳統的區分度指數為根據的常模參照測驗的選題程式編制測驗，則會將人們本來希望在測驗中包含的題目剔除，因而不能實現測量目的；同時，常模參照測驗的內容領域通常較廣，難以確切說出被試實際掌握了多少，其分數結果不宜用來判別學生是否已達到所希望的要求。因而，人們提出了絕對標準的成績評定思想，這是一種排除相對性的成績評定準則，可鼓勵學生經過努力都能達到這一標準。這樣，新型的測驗類型--標準參照測驗應運而生，且由於其有著傳統的常模參照測驗所不具有的某些優點，如各個被試的成績水平能直接說明其具有的真實水平狀況等等，百獲得迅速發展。

標準參照測驗

基本介紹

測驗回顧

基本思想

研究展望

相關詞條

熱門詞條