C4.5 算法

C4.5 算法

C4.5 算法是機器學習算法中的一種分類決策樹算法,其核心算法是 ID3 算法。

基本介紹

  • 中文名:C4.5 算法
  • 核心:ID3 算
  • 優點:分類規則易於理解,準確率較高
  • 缺點:多次掃描和排序導致算法的低效
算法簡介,優缺點,

算法簡介

C4.5 算法是機器學習算法中的一種分類決策樹算法,其核心算法是 ID3 算
法. 分類決策樹算法是從大量事例中進行提取分類規則的自上而下的決策樹. C4.5
算法繼承了 ID3[27]算法的優點,並在以下幾方面對 ID3 算法進行了改進:
(1)用信息增益率來選擇屬性,克服了用信息增益選擇屬性時偏向選擇取值
多的屬性的不足;
(2)在樹構造過程中進行剪枝;
(3)能夠完成對連續屬性的離散化處理;
(4)能夠對不完整數據進行處理。

優缺點

C4.5算法有如下優點:產生的分類規則易於理解,準確率較高。其缺點是:在構造樹的過程中,需要對數據集進行多次的順序掃描和排序,因而導致算法的低效。

相關詞條

熱門詞條

聯絡我們