個別差異診斷測量:概念簡介,心理測驗,基本要求,第一，標準條件。,第二，可靠性。,

個別差異是客觀存在的。中國古代最早的教育文獻《學記》就論述了在規定的九年時間內，對學生的閱讀能力、知識廣度、學識運用、論學本領以及學習興趣、專業思想、集體觀念、師生關係、意志堅定性各方面的個別差異進行考查的事情。

基本介紹

中文名：個別差異診斷測量
特點：越來越受到重視
方法：對各個領域中個人的作業進行比較
目的：確定它們的相對優點和缺點

概念簡介,心理測驗,基本要求,第一，標準條件。,第二，可靠性。,第三，準確性。,第四，分數。,第五，實用性。,參考書目,

概念簡介

在教育過程中個別差異的診斷越來越受到重視。診斷就是對各個領域中個人的作業進行比較，來確定它們的相對優點和缺點。一般說來，當學生在學習某一學科遇到困難的時候就需要進行診斷。一旦看出某種能力缺陷的跡象，就應當採取糾正的措施。例如一種閱讀診斷測驗可能提供語音、詞義、句義、段落意義以及閱讀速度的分數。其目的在於識別學生的特殊缺點和優點，以便安排相應的處理方案進行幫助。學業方面個別差異的診斷具有這樣的目的，智力、能力傾向和性格各方面個別差異的診斷也是如此。準確的診斷也是評級、分班、選拔、安置等決策的基礎。

孟軻提出：“權然後知輕重，度然後知長短。物皆然，心為甚。”這句話說明了個別差異測量的可能性和必要性。測量的意義就是按照一定的尺度對所測的對象作出量的描述。就心理的個別差異說來，這種對象就是人的行為的各種屬性（學識、智慧型、性格）。測量的結果明確了一個人在某些行為維度測試連續統上的相對位置。例如，記憶力的強弱是一條連續統，推理速度的快慢是另一條連續統，性格的內向到外向又是一條連續統，如此等等。

所謂量的描述，其初級形式就是按順序排列的等第量表，這是心理測量相對性的現實反映。例如孔丘從他的學生中選出標兵，按品德、能力分類排隊。德行：顏淵、閔子騫、冉伯牛、仲弓；言語：宰我、子貢；政事：冉有、季路；文學：子游、子夏。又如，唐代初期科舉考試中的秀才科，注重博識高才。測試方略策五條，錄取標準如下：文理俱高者為上上，文高理平、理高文平者為上中，文理俱平者為上下，文理粗通為中上，凡四等,為及第,文劣理滯為不第（《通考·選舉考》）。目前的五級計分制基本上就是一種等第量表。

心理測驗

心理測驗是一種高級形式的測量法。在中國還沒有出現標準化的測驗之前就有人提出過關於心理測驗的基本原則。約在公元245年劉劭寫了《人物誌》這本書,書中說道: “眾人之察不能盡備”,"觀其感變以審常度”。這指出了，在心理觀察中不可能把所有的行為變數都包括在內，所得到的只是一定條件下具有代表性的行為樣例。這個原則的不足之處在於它沒有說明行為樣例的處理問題。

根據A.阿納斯塔西“心理測驗實質上是行為樣例的客觀的和標準化的測量”的看法，F.G.布朗提出，測驗是測量行為樣例的一種系統程式。一般認為這兩個定義是比較典型的。劉劭的原則和阿納斯塔西與布朗的典型定義都強調行為的樣例。所謂樣例，它不是有關行為的全體，而只是它的具有代表性的部分。另外，所測到的只是被試人對測驗（觀察）項目的反應，因而所從事的不是直接的測量，而是從項目反應中推理出被試的個性特徵。如果測驗項目所揭露的行為適當地反映了所要測量的內容結構，則測驗將能提供有用的信息；否則，根據測驗分數進行推理就毫無意義。

上述兩個有關測驗的典型定義提到“客觀的和標準化的測量”，或者“測量的系統程式”，這是十分重要的。客觀化、標準化或系統程式要求測驗的編制、施行和計分都要按規定的法則進行。測驗項目應該有計畫地加以選擇，以便符合測驗的規範。應使用同樣的（或等值的）項目向所有受試者施測。對全體受試應一律使用同一的說明語和時限。答語的評分標準應預先制定，以保證不同計分員之間標準一致。

心理測量和物理測量相比，有著顯著的不同。首先，在心理測量中有著更多的變數要加以控制。例如當測量閱讀速度的時候，要注意的有：項目的性質（長度、辭彙、詞的表達方式），測驗的條件（說明語、時限、物理環境），受試者的身心狀態（動機、健康情況）。這些變數不至於顯著地影響物理測量。其次，心理測量不如物理測量準確，假設一位教師按五級計分法評定一篇作文的成績時，一級之差不是很清楚的，可是用一個合適的量具，就有可能成功地測量萬分之一的長度。第三，在心理測量中受試者知道他是在被觀察的情境中，有人感到不安而急躁；有人則異常努力，以取得好成績。不論何種情況，都會影響測量結果。但在物理測量中，沒有類似的情況。

基本要求

因為心理測量具有這些特殊性，它特別注意在下列幾方面滿足測量學的基本要求。

第一，標準條件。

測驗的目的是要盡最大可能取得對受試人作業的準確估計。也象其他科學領域一樣，心理測驗中的準確估計依靠誤差的控制，即儘量縮小那些與測驗目的無關的因素的影響。這就要求使所有受試的測驗情境儘可能保持一致。上述標準條件包括測驗過程的三個主要方面：測驗的內容、測驗的施行、測驗的計分。

第二，可靠性。

指測驗結果的一致性或穩定性。它表現在：①一個測驗內部各項目的得分是否基本相符。②兩次測驗的分數是否基本上前後一致。一種測驗如果沒有信度，就等於用橡皮尺進行長度的測量，隨著尺的任意拉長，而得到不同的結果，這就無從知道一次測試所得的分數能否代表受試人作業的正確指標。一種可靠的測量必須對那些在不同時間內或不同條件下可能產生不穩定分數的變數進行控制。方法之一就是利用上述的標準測驗條件。另外必須編出意義明確的項目，通過加多項目，增加測驗的長度。套用意義明確的項目和標準化的測驗條件都會減少無關因素的影響。由於機遇因素（如猜測）的作用傾向於相互抵消，所以增加項目提高了測驗的信度，從而形成較準確的估計。

第三，準確性。

指測驗確能測出它所要測量的特徵或功能的程度。一種測驗如果提不出效度的證據，則無從知道它真正測得的是什麼特徵，它將起什麼作用，因而就不能對測驗分數進行解釋。怎樣確定一種測驗的效度，視測驗內容結構的性質和測驗的目的而定。效度的確定方法有三大類：①內容效度，旨在系統地檢查測驗內容的適切性，主要分析測驗項目是否反映出足夠的典型行為樣例並具有適當的比例分配。在學業測驗中項目必須切合教材的內容並依據教學目標就學生行為變化的不同層面加以評量，而內容效度的高低視測驗所包括的項目是否適當地反映教材內容的重點與行為目標的層次而定。②和效標相關的效度是以測驗分數和效標（如教師的評定，在校學業成績、就業後的工作成績等）之間的相關係數來表示測驗效度的高低。③構念效度，旨在用心理學的某種理論觀點來說明、分析測驗分數的意義。在構念效度考驗的過程中，應先從某一構念的理論出發，導出各項關於心理功能或行為的基本假設，並根據這些假設去設計和編制測驗，然後由果求因，以相關、實驗和因素分析等方法，檢查測驗結果是否符合這種理論觀點。

第四，分數。

上面的探討只有一個目的,即保證測驗的分數能夠提供有用的信息。如果一個測驗不可靠、不正確，那就無從保證它能提供信息用來進行實際決定或理論驗證。同時，可靠的和正確的分數是通過審慎的測驗編制策略(其中包括標準化條件的運用)而求得的。為了便於比較，通常使用百分等級分數以及各種形式的標準分數來表示一個人的作業成績在團體中居於何種位置。這些分數稱為參照常模的分數。另外還有兩種分數：參照能量的分數（又稱參照效標的分數，強調不同專業受試人所應達到的水平）和參照後果的分數（預測受試人在另一種量度上將達到的水平）。

第五，實用性。

測驗的施行、作答和計分的手續愈簡便，就愈容易得到準確和有用的結果。如果說明語不清楚，就會被誤解；如果測驗的手續過於複雜，就可能不被遵循；如果計分困難，將會造成錯誤。另外，還有兩點要著重考慮：一是時間，不僅施測所需的時間，還有計分和解釋結果所需的時間。二是費用，包括直接費用和間接費用。但在條件許可的情況下，應該首先保證的是測驗的質量。

參考書目

A. Anastasi , Psychological Testing ,New York,Macmillan Publishing Co.,1982. 　F. G. Brown , Principles of Educational ɑnd Psychological Testing,New York, Holt, Kinchart and Winston,1983.

個別差異診斷測量