統計決策理論:基本介紹,三要素,樣本空間,行動空間,損失函式,選擇準則,決策論,

由統計學家A.瓦爾德在1950年提出的一種數理統計學的理論，這種理論把數理統計問題看成是統計學家與大自然之間的博弈；用這種觀點把各種各樣的統計問題統一起來，以對策論的觀點來研究。

基本介紹

中文名：統計決策理論
外文名：Statistical decision theory
學科：統計學、數學
提出者：A.瓦爾德
提出時間：1950年

基本介紹,三要素,樣本空間,行動空間,損失函式,選擇準則,決策論,

基本介紹

第二次世界大戰期間，數理統計學研究中一些重要的新動向，在很大程度上決定了這門學科在戰後的發展方向。其中影響最大的是美籍羅馬尼亞數學家沃爾德（A。Wald，1902-1950）提出的序貫分析和統計決策理論。

在此以前，人們對數理統計，主要是著眼於其推斷的功能，亦即從觀測數據出發對總體作出某種論斷（見統計推斷）。至於由此應該採取什麼決策或行動，會產生什麼後果，則被認為不屬於統計的範疇。瓦爾德的理論則把後面這一部分內容也納入統計的範圍之內，這在數理統計學上是一項革新，有較大的實際意義。

在一個統計問題中，統計工作者掌握的資料是樣本X=(x₁，x₂…，x_n)，X所來自的總體的分布F_θ中包含的參數θ為未知，而只知道θ所屬的集合（為θ所有可能取值的集合，稱為參數空間）。但是，採取什麼決策最好，則取決於未知的θ值。用形象化的說法，θ是由大自然在參數空間中選定的，人們力圖去找到它。大自然掌握了θ的秘密，而這個秘密又通過樣本泄露出來，統計工作者的任務就是根據樣本 X中所包含的關於θ的信息，去作出良好的決策。例如，一家商店根據抽樣決定是否接受一批來貨，一個工廠根據市場調查的結果決定某種產品生產多少等，希望所採取的行動取得儘可能好的效果，或者說，使“行動不當”所造成的損失儘可能小。

三要素

可以通過三個要素把一個統計決策問題表達出來。

樣本空間

樣本空間 H與樣本分布族{F_θ：θ∈}這個要素規定了問題的機率模型。樣本空間是樣本可能的取值範圍，而樣本分布族是樣本所可能遵從的分布的集合。

行動空間

②行動空間A　它是統計工作者可以採取的單純策略（或稱行動）的集合。例如，設 θ為一維參數，要對θ作區間估計，則實軸上任一區間[α，b]構成一個單純策略，這時行動空間為所有[α，b]構成的集合。若問題是要檢驗有關 θ的假設，則行動空間 A由α₀（接受假設）和α₁（拒絕假設）兩個元素構成。

損失函式

損失函式L 統計決策理論有一個基本出發點：所採取的行動的後果可以數量化。設參數真值為 θ，統計工作者採取的行動為α，則所遭受的損失可表為 α與θ的函式L(θ，α），稱之為損失函式。在一個具體問題中，採取什麼損失函式最好，是一個需要進行大量調查研究以至理論工作的問題，這也是在使用決策理論時的一個困難點。

統計決策函式　當三個要素都已給定時，統計工作者採取什麼行動，取決於他所掌握的樣本。求一個統計決策問題的解，就是制定一個規則，以便對樣本空間中每一點，在行動空間中都有一個元素與之對應，也就是找一個定義於樣本空間 H而取值於行動空間A的函式或分布函式δ，就按δ採取行動，稱δ為決策函式。用對策論的語言，δ就是統計工作者所採取的策略。

選擇準則

對一個統計決策問題，為選定一個較優的決策函式，需要建立反映決策函式優劣的指標。風險函式R（θ，δ）就是這樣的指標，定義為R（θ，δ）=E_θ [L（θ，δ（X））]，即採取決策函式δ而參數真值為θ時所遭受的平均損失。風險函式愈小，決策函式愈好。在這個原則下，可以引進種種更具體且可行的準則。

容許性準則

容許性準則　設δ為一決策函式，若存在另一決策函式δ，使對一切θ∈有R（θ，δ）≤R（θ，δ），且不等號至少在中的某一點成立，則稱δ為不可容許的，否則為可容許的。從風險愈小愈好的原則出發，當δ不可容許時，便沒有理由使用它。判定一個決策函式是否可容許，是統計決策理論中一個重要而且困難的問題。在風險函式愈小愈好的原則下，若存在決策函式δ₀，對一切θ∈必成立R（θ，δ₀）≤R（θ，δ），其中δ為任一決策函式，則δ₀是最好的決策函式，稱為一致最優決策函式。但這種決策函式一般不存在，因而不得不放寬條件，常採用的有兩種方法：一種是不對風險函式在上作逐點比較，而採用某種綜合性指標；另一種方法是先從一定角度對允許使用的決策函式加以一定限制，然後再找一致最優的，從而又引出下列準則。

最小化最大準則

最小化最大準則　最大風險是一種綜合性指標，若存在使最大風險最小的決策函式δ，使得對一切決策函式δ都有：M（δ）≥M（δ），則稱δ是最小化最大決策函式，它反映了一種較穩健或保守的策略思想。

貝葉斯準則

貝葉斯準則　它以貝葉斯風險為指標，在參數空間上選定一機率測度ξ，稱ξ為θ（θ∈）的先驗分布，而稱為決策函式δ的相對於ξ的貝葉斯風險，它也是一個綜合性指標。若對一切決策函式δ都成立，稱δ為ξ的貝葉斯決策函式。

最優同變性準則

最優同變性準則這是一種在限制決策函式有同變性的條件下，求一致最優決策函式的準則。同變性是指當問題由於平移、刻度等變換而發生變化時，相應的決策（對策）也能有同步地變換的性質。例如，在正態總體N（μ，1）中抽樣x₁，x₂，…，x_n以估計μ，若將度量原由零點（O）移到с處，則樣本在新坐標系下變為x₁+с，x₂+с…，x_n+с，而參數變為μ+с，如果接受“估計結果不應與坐標原點的取法有關”的原則，則所用的決策δ應滿足：對任何實數с，有；稱這樣的 δ在平移變換下有同變性。可以在樣本空間H上考慮更複雜的一一變換群，而定義在這個變換群之下的同變性，在所有具有同變性的決策函式類中，風險一致最小的決策函式被稱為最優同變決策函式。

在點估計中，限制使用的估計量有無偏性，採用平方損失函式，在這個限制下，一致最優估計量就是一致最小方差無偏估計。這是另一個在限制決策函式下，求一致最優策略的例子。

一旦選定了優良性標準，統計決策問題的解決，就相當於一個數學上的最最佳化問題。1950年後的幾十年來在這方面做了不少工作，這不僅使統計問題有了嚴格的數學提法，同時也在形式上部分地突出了瓦爾德的想法，把形式不一樣的統計問題歸併在一個模式下統一處理。決策函式的觀點使統計更注重了所採取行動的效果，也使統計問題提法更加多樣化，從而開拓了某些新的研究領域，例如前面提到的關於容許性及最小化最大準則的研究。因此，瓦爾德的理論受到統計學界的重視，成為二次大戰後統計學史上一個重大事件。但是，在這個問題上的看法也並不一致，英國統計學家M。肯德爾認為“損失的數量化”並非在任何情況下都合理可行，而且他還認為，把統計問題歸之於統計工作者與大自然之間的博弈的觀點，是值得懷疑的。

決策論

一些統計工具對於決策過程中的信息收集，風險估計是非常有幫助的。人們可以計算第一類錯誤和第二類錯誤發生的機率，從而正確的評估風險損失，做出更好的理性選擇。

下面這個例子說明了在審判過程中的決策過程：

	實際情況
無罪	錯誤 (放過嫌犯) 第二類錯誤	正確

第一型及第二型錯誤（英語：Type I error & Type II error）或型一錯誤及型二錯誤為統計學中推論統計學的名詞。

在假設檢驗中，有一種假設稱為“零假設”。假設檢定的目的就是利用統計的方式，推測零假設是否成立。若零假設事實上成立，但統計檢驗的結果不支持零假設（拒絕零假設），這種錯誤稱為第一型錯誤。若零假設事實上不成立，但統計檢驗的結果支持零假設（接受零假設），這種錯誤稱為第二型錯誤。

以利用驗孕棒驗孕為例，此時未懷孕為零假設。若用驗孕棒為一位未懷孕的女士驗孕，結果是已懷孕，這是第一型錯誤。若用驗孕棒為一位孕婦驗孕，結果是未懷孕，這是第二型錯誤。

統計決策理論

基本介紹

基本介紹

三要素

樣本空間

行動空間

損失函式

選擇準則

決策論

相關詞條

熱門詞條