R語言實現

內容簡介

R提供了一個免費、開源的環境，這對於學習預測建模以及在真實環境下部署解決方案是很理想的。隨著不斷增長的社區和大量擴展包的出現，R提供了一個應對一系列問題的切實解決方案。
本書可以作為學習預測建模基礎知識的指南和參考讀物。本書的開篇是關於模型術語和預測建模過程的一個專門章節。後續的每個章節會講解具體的一類模型（例如神經網路），並把重點放在三個重要問題上：模型如何工作，如何利用R語言訓練模型，以及如何利用實際環境下的數據集來衡量和評估模型的性能。

作者簡介

魯伊·米格爾·福特（Rui Miguel Forte）是Workable公司的首席數據科學家。他是土生土長的希臘人，後留學於英國。他是一位經驗豐富的數據科學家，有超過10年的工作經驗，覆蓋了移動市場、健康信息學、教育科技和人力資源技術等多種行業。他負責的項目包括移動市場行銷中的用戶行為預測建模，智慧型教學系統中對發言者意圖的識別，用於工作申請簡歷的信息提取技術，以及針對工作詐欺的欺詐檢測等。目前，他在雅典經濟與商業大學（Athens University of Economics and Busi。

圖書目錄

第1章　準備預測建模1
1.1　模型1
1.1.1　從數據中學習2
1.1.2　模型的核心組成部分5
1.1.3　我們的第一個模型：k近鄰5
1.2　模型的類型7
1.2.1　有監督、無監督、半監督和強化學習模型7
1.2.2　參數化和非參數化模型8
1.2.3　回歸和分類模型8
1.2.4　實時和批處理機器學習模型9
1.3　預測建模的過程9
1.3.1　定義模型的目標9
1.3.2　收集數據10
1.3.3　選取模型11
1.3.4　數據的預處理12
1.3.5　特徵工程和降維19
1.3.6　訓練和評估模型22
1.3.7　重複嘗試不同模型及模型的最終選擇25
1.3.8　部署模型25
1.4　性能衡量指標25
1.4.1　評估回歸模型26
1.4.2　評估分類模型26
1.5　小結30
第2章　線性回歸31
2.1　線性回歸入門31
2.2　簡單線性回歸33
2.3　多元線性回歸36
2.3.1　預測CPU性能37
2.3.2　預測二手汽車的價格38
2.4　評估線性回歸模型40
2.4.1　殘差分析42
2.4.2　線性回歸的顯著性檢驗45
2.4.3　線性回歸的性能衡量指標47
2.4.4　比較不同的回歸模型49
2.4.5　在測試集上的性能50
2.5　線性回歸的問題51
2.5.1　多重共線性51
2.5.2　離群值52
2.6　特徵選擇53
2.7　正則化55
2.7.1　嶺回歸55
2.7.2　最小絕對值收縮和選擇運算元56
2.7.3　在R語言裡實現正則化57
2.8　小結59

R語言實現

基本介紹

內容簡介

作者簡介

圖書目錄

相關詞條

熱門詞條