難度

難度

項目的難度即指一個項目的難易程度。對於能力測驗來講,可以講一個項目的難度或者容易程度,但對於興趣動機人格這些無所謂正誤的測驗來說,這類測驗使用的指標為通俗性,表示在答案的方向上,回答人數的多少,其計算方法與難度相同。

在心理與教育測量中,每個題目都有自己的難度值,通常以每一個題目的通過率作為難度指標,表示為:p=R/N(p指項目難度,N為全體被測者人數,R為答對或通過該項目的人數)。

由公式可知,難度值的變化範圍為0.00~1.00,p值越大代表題目越簡單,p值越小說明題目越難。難度為0.00意味著這個題目太難,沒有人能答對;難度為1.00說明題目太簡單,所有人都能答對。

基本介紹

  • 中文名:難度
  • 外文名:difficulty
  • 指標:通過率
  • 用途:衡量能力測驗的難度水平
  • 相似詞:流行性水平,通俗性水平
  • 最佳難度值:0.50
  • 學科:心理測量
定義,指標,相對性,計算方法,測驗的影響,難度分數分布,

定義

難度就是指測驗項目的難易程度。一道試題,如果大部分被試都能答對,則該題的難度就小;如果大部分的被試不能答對,則該題的難度就大。
難度的概念在能力測驗中稱為項目的難度水平,而在非能力測驗(如人格測驗)中,與此相應的指標叫“通俗性”或“流行性”水平,即取自相同總體的樣本中,在答案範圍里回答項目的人數;其計算方法與難度相同。
項目難度(item difficulty)是指項目的難易程度。這一概念在能力測驗里稱為項目的難度水平;而在人格測驗里則稱為:“通俗性”或“流行性”水平,指被試團體在答案範圍里回答項目的程度。兩者合為一體,項目難度是指被試反應符合項目答案的程度。

指標

在心理測驗中最常用的難度指標以通過率表示,即以受測者答對或者通過每個項目的人數百分比來表示;
P=R/N×100%(P指項目難度,N為全體被測者人數,R為答對或通過該項目的人數)。
P值越大,表示通過的人數越多,項目越容易,則難度越低;P值越小,表示通過人數越少,項目越難,則難度越高。因為P值大小與難度高低成反比,所以也將其稱作易度,而將受測者未通過每個項目的人數百分比作為難度的指標。

相對性

一個項目的難度大小,除了與所測的內容本身的難易程度有關外,還與測驗的編制技術和被試的知識經驗有關。由於表述不清或是因被試沒學過,一個本來容易的項目可能會很難。這就是說,測驗的難度具有相對性,正因如此,必須進行試測,通過實踐來對難度作出檢驗。

計算方法

二分法記分的項目
1.難度的計算
心理和教育測驗的項目多為二分法項目的選擇題,即“通過”記1分,“錯誤”記0分。對這類項目,P值可以直接用P=R/N×100%的公式計算。
當被試人數較多時,計算難度的一個簡便方法是根據測驗總成績將被試分成三組:先將受試者依據測驗總分的高低次序排列,然後劃出人數相等的高分組和低分組,即分數最高的27%被試作為高分組(H),分數最低的27%作為低分組(L),中間46%的被試作為中間組;再分別求出高分組和低分組在每一題目上的通過率,以這兩組通過率平均值作為每一題目的難度。其公式為:
式中,P代表難度,PH和PL分別代表高分組和低分組通過率。此公式還可以轉化成:
式中,RH和RL分別代表高分組和低分組通過該題的人數,n代表每個組的人數。
2.選擇題難度修正
在選擇題中,由於允許猜測,通過率可能因機遇作用而變大。備選答案的數目越少,機遇的作用越大,越不能真實地反映測驗的難度。為了平衡備選項目對難度的影響,吉爾福德(Guilford,J P)提出了一個難度的校正公式:
式中,CP為校正後的通過率,P為實際得到的通過率,K為備選項目的數目。
非二分法記分的項目
當測驗項目為問答題或其他不能用二分法記分的形式時,常常對部分正確的反應也給一定分數。對於這種項目,一般用下面的公式計算難度:
式中,
為全體受測者在該題上所得的平均數,Xmax為該題目的滿分分數。
等距量表的難度指數
以通過率作為難度指標實際上是以順序量表來表示難度,它僅僅能指出項目難易的相對位置,即題目難度的順序或相對難度高低,並不能指出各項目之間在難度上差異的大小。較為常用的美國教育測驗服務社(ETS)採用的難度指標:
式中,
表示常態化等距難度指數;13為平均數,4為標準差,X為常態化Z分數值。
值越大,則難度越高;
值越小,則難度越低。

測驗的影響

影響測驗分數分布的形態
當P=1時,全體被試都得滿分;當P=0時,全體被試都得0分。在這兩種極端情況下,全體被試的分數不能有效地形成分數分布,被試之間在知識、能力水平上實際存在的個體差異都被掩蓋了。如果是一個擇優錄取的選拔測驗,就失去了選拔的功能。
當P值接近1,測驗分數形成負偏態分布,當P接近0,測驗分數形成正偏態分布。正負偏態分布都縮小了分數的離散程度
影響測驗的信度
題目過難或過易會使測驗分數形成正偏態或負偏態分布,與常態分配相比較,分數的離散程度都變小,會導致測驗信度降低。
影響測驗的鑑別能力
常模參照性測驗的基本功能在於鑑定個體之間的差異。要鑑別差異,個體之間就要作比較,因此,在測驗中被試之間相互配對比較的機會越多,就越有利於準確地鑑別出被試之間在知識和能力水平上的差異。當測驗題目的平均難度在0.50左右,被試之間相互比較的機會最多,因而測驗的鑑別力最高。

難度分數分布

整個測驗的難度,自然取決於組成測驗的各個項目的難度。根據測驗總分的分布,可以知道整個測驗的難度。如果測驗難度適當,則標準化樣本的測驗分數,應該大致為常態分配
若測驗難度不當,測驗分數可能出現兩種典型的偏態分布。一種是正偏態分布,分數集中在低端。這表明測驗太難,缺乏足夠數量的較易項目,本來應該在正態曲線的左端分布範圍較大的被試,在這個項目上得零分或接近零分。測驗因此不能區分能力水平低端的被試。另一種是負偏態分布,分數集中在高端。這表明測試太易,缺乏足夠數量的較難項目。本來應該在正態曲線右端分布範圍較大的被試,在這個項目上得滿分或接近滿分。測驗因此不能區分能力水平高端的被試。
測驗分數出現偏態分布,應該調整測驗的難度。對於正偏態分布,需要減少較難項目而增加較易項目;對於負偏態分布,則需要減少較易項目而增加較難項目。直到測驗分數至少大致為常態分配。在這種條件下,大多數被試答對50%左右的項目,測驗能夠最大限度區分各種能力水平的個體。
如何選取項目難度,這與測驗目的有關係。在一般情況下,測驗目的是有效區分不同水平之間的被試,項目的平均難度應為0.50左右。
若項目的目的是選優,則項目的平均難度應大致等同於優選率;若測驗的目的是選差,項目的平均難度應大致等同於(1-選差率)。箇中理由是,我們只需區分接收組和拒絕組,而在接受組或拒絕組內,則無需區分。

相關詞條

熱門詞條

聯絡我們