實用機器學習

內容簡介

大數據時代為機器學習的套用提供了廣闊的空間，各行各業涉及數據分析的工作都需要使用機器學習算法。本書圍繞實際數據分析的流程展開，著重介紹數據探索、數據預處理和常用的機器學習算法模型。本書從解決實際問題的角度出發，介紹回歸算法、分類算法、推薦算法、排序算法和集成學習算法。在介紹每種機器學習算法模型時，書中不但闡述基本原理，而且討論模型的評價與選擇。為方便讀者學習各種算法，本書介紹了R語言中相應的軟體包並給出了示例程式。

本書的一大特色就是貼近工程實踐。首先，本書僅側重介紹當前工業界常用的機器學習算法，而不追求知識內容的覆蓋面；其次，本書在介紹每類機器學習算法時，力求通俗易懂地闡述算法思想，而不追求理論的深度，讓讀者藉助代碼獲得直觀的體驗。

作者簡介

孫亮，阿里巴巴數據科學與技術研究院高級專家。曾任微軟Azure機器學習（Azure Machine Learning）部門高級數據科學家，先後畢業於南京大學計算機系（1999-2003）、中國科學院軟體研究所（2003-2006）、美國亞利桑那州立大學計算機系（2006-2011），研究興趣包括機器學習、數據挖掘及其實際套用等。近年來參加了KDD Cup、Heritage HealthPrize等多項數據挖掘競賽並多次取得優異成績。在IEEE T-PAMI、NIPS、ICML、SIGKDD等機器學習領域的知名國際期刊和國際會議上發表論文近20篇，著有機器學習英文專著1部。

黃倩，河海大學副研究員，先後畢業於南京大學計算機系（1999-2003）、中國科學院計算技術研究所（2003-2010），研究興趣包括多媒體大數據處理、機器學習、雲計算等。參加過多個973、863、國家自然科學基金項目的研究，參與過AVS、H.265/HEVC等國內外視頻壓縮標準的制訂。現主持包括國家自然科學基金在內的多個國家、省市級項目，並獲南京市江寧區首批高層次創業人才“創聚工程”項目資助。在相關領域的知名國際期刊和國際會議上發表論文逾20篇，出版譯著4本，參編專著1部。

圖書目錄

第1章　引論　1

1.1　什麼是機器學習　1

1.2　機器學習算法的分類　2

1.3　實際套用　3

1.3.1　病人住院時間預測　3

1.3.2　信用分數估計　4

1.3.3　Netflix上的影片推薦　4

1.3.4　酒店推薦　5

1.3.5　討論　6

1.4　本書概述　7

1.4.1　本書結構　9

1.4.2　閱讀材料及其他資源　10

第2章　R語言　12

2.1　R的簡單介紹　12

2.2　R的初步體驗　13

2.3　基本語法　14

2.3.1　語句　14

2.3.2　函式　17

2.4　常用數據結構　19

2.4.1　向量　19

2.4.2　因子　23

2.4.3　矩陣　24

2.4.4　數據框　26

實用機器學習

基本介紹

內容簡介

作者簡介

圖書目錄

相關詞條

熱門詞條