變異係數

變異係數

變異係數(Coefficient of Variation):當需要比較兩組數據離散程度大小的時候,如果兩組數據的測量尺度相差太大,或者數據量綱的不同,直接使用標準差來進行比較不合適,此時就應當消除測量尺度和量綱的影響,而變異係數可以做到這一點,它是原始數據標準差與原始數據平均數的比。CV沒有量綱,這樣就可以進行客觀比較了。事實上,可以認為變異係數和極差、標準差和方差一樣,都是反映數據離散程度的絕對值。其數據大小不僅受變數值離散程度的影響,而且還受變數值平均水平大小的影響。

基本介紹

  • 中文名:變異係數/變差係數
  • 外文名:Coefficient of Variation
  • 套用領域:數學
  • 類別:計數方法
  • 又名:離散係數
  • 定義機率分布離散程度的歸一化量度
定義,基本含義,舉例,公式,優缺點,優點,缺陷,套用,

定義

機率論統計學中,變異係數,又稱“離散係數”(英文:coefficient of variation),是機率分布離散程度的一個歸一化量度,其定義為標準差平均值之比:
變異係數(coefficient of variation)只在平均值不為零時有定義,而且一般適用於平均值大於零的情況。變異係數也被稱為標準離差率單位風險
變異係數只對由比率標量計算出來的數值有意義。舉例來說,對於一個氣溫的分布,使用開爾文攝氏度來計算的話並不會改變標準差的值,但是溫度的平均值會改變,因此使用不同的溫標的話得出的變異係數是不同的。也就是說,使用區間標量得到的變異係數是沒有意義的。

基本含義

一般來說,變數值平均水平高,其離散程度的測度值越大,反之越小。
變異係數是衡量資料中各觀測值變異程度的另一個統計量。當進行兩個或多個資料變異程度的比較時,如果度量單位與平均數相同,可以直接利用標準差來比較。如果單位和(或)平均數不同時,比較其變異程度就不能採用標準差,而需採用標準差與平均數的比值(相對值)來比較。標準差與平均數的比值稱為變異係數,記為C·V。變異係數可以消除單位和(或)平均數不同對兩個或多個資料變異程度比較的影響。
變異係數的計算公式為:變異係數 C·V =( 標準偏差 SD / 平均值Mean )× 100%
在進行數據統計分析時,如果變異係數大於15%,則要考慮該數據可能不正常,應該剔除。

舉例

已知某良種豬場長白成年母豬平均體重為190kg,標準差為10.5kg,而大約克成年母豬平均體重為196kg,標準差為8.5kg,試問兩個品種的成年母豬,那一個體重變異程度大。
此例觀測值雖然都是體重,單位相同,但它們的平均數不相同,只能用變異係數來比較其變異程度的大小。
由於,長白成年母豬體重的變異係數:C.V = 10.5 / 190 * 100% = 5.53%
大約克成年母豬體重的變異係數:C.V = 8.5 / 196 * 100% = 4.34%
所以,長白成年母豬體重的變異程度大於大約克成年母豬。
注意,變異係數的大小,同時受平均數和標準差兩個統計量的影響,因而在利用變異係數表示資料的變異程度時,最好將平均數和標準差也列出。

公式

(標準偏差SD、平均值MN)

優缺點

優點

比起標準差來,變異係數的好處是不需要參照數據的平均值。變異係數是一個無量綱量,因此在比較兩組量綱不同或均值不同的數據時,應該用變異係數而不是標準差來作為比較的參考。

缺陷

  1. 當平均值接近於0的時候,微小的擾動也會對變異係數產生巨大影響,因此造成精確度不足。
  2. 變異係數無法發展出類似於均值的置信區間的工具。

套用

變異係數在機率論的許多分支中都有套用,比如說在更新理論、排隊理論和可靠性理論中。在這些理論中,指數分布通常比常態分配更為常見。
由於指數分布的標準差等於其平均值,所以它的變異係數等於一。變異係數小於一的分布,比如愛爾朗分布稱為低差別的,而變異係數大於一的分布,如超指數分布則被稱為高差別的。

相關詞條

熱門詞條

聯絡我們