決策樹

組成

□——決策點，是對幾種可能方案的選擇，即最後選擇的最佳方案。如果決策屬於多級決策，則決策樹的中間可以有多個決策點，以決策樹根部的決策點為最終決策方案。

○——狀態節點，代表備選方案的經濟效果（期望值），通過各狀態節點的經濟效果的對比，按照一定的決策標準就可以選出最佳方案。由狀態節點引出的分支稱為機率枝，機率枝的數目表示可能出現的自然狀態數目每個分枝上要註明該狀態出現的機率。

△——結果節點，將每個方案在各種自然狀態下取得的損益值標註於結果節點的右端。

【概述來源】

畫法

機器學習中，決策樹是一個預測模型；他代表的是對象屬性與對象值之間的一種映射關係。樹中每個節點表示某個對象，而每個分叉路徑則代表的某個可能的屬性值，而每個葉結點則對應從根節點到該葉節點所經歷的路徑所表示的對象的值。決策樹僅有單一輸出，若欲有複數輸出，可以建立獨立的決策樹以處理不同輸出。數據挖掘中決策樹是一種經常要用到的技術，可以用於分析數據，同樣也可以用來作預測。

從數據產生決策樹的機器學習技術叫做決策樹學習, 通俗說就是決策樹。

一個決策樹包含三種類型的節點：

決策節點：通常用矩形框來表示
機會節點：通常用圓圈來表示
終結點：通常用三角形來表示

決策樹學習也是資料探勘中一個普通的方法。在這裡，每個決策樹都表述了一種樹型結構，它由它的分支來對該類型的對象依靠屬性進行分類。每個決策樹可以依靠對源資料庫的分割進行數據測試。這個過程可以遞歸式的對樹進行修剪。當不能再進行分割或一個單獨的類可以被套用於某一分支時，遞歸過程就完成了。另外，隨機森林分類器將許多決策樹結合起來以提升分類的正確率。

決策樹同時也可以依靠計算條件機率來構造。

決策樹如果依靠數學的計算方法可以取得更加理想的效果。資料庫已如下所示：

(x, y) = (x1, x2, x3…, xk, y)

相關的變數 Y 表示我們嘗試去理解，分類或者更一般化的結果。其他的變數x1, x2, x3 等則是幫助我們達到目的的變數。

決策樹

基本介紹

組成

畫法

決策樹的剪枝

優點

缺點

算法

C4.5

CART

實例

相關詞條

熱門詞條