監督學習

監督學習詞性解釋

【計】 supervised learning

supervised learning

基本定義：

利用一組已知類別的樣本調整分類器的參數，使其達到所要求性能的過程，也稱為監督訓練或有教師學習。

監督學習是從標記的訓練數據來推斷一個功能的機器學習任務。

監督學習中需要注意的問題：

1、偏置方差權衡

第一個問題就是偏置和方差之間的權衡。假設我們有幾種不同的,但同樣好的演算數據集。一種學習算法是基於一個未知數的輸入，在經過這些數據集的計算時,系統會無誤的預測到並將正確的未知數輸出。一個學習算法在不同的演算集演算時如果預測到不同的輸出值會對特定的輸入有較高的方差。一個預測誤差學習分類器是與學習算法中的偏差和方差有關的。一般來說,偏差和方差之間有一個權衡。較低的學習算法偏差必須“靈活”,這樣就可以很好的匹配數據。但如果學習算法過於靈活,它將匹配每個不同的訓練數據集,因此有很高的方差。許多監督學習方法的一個關鍵方面是他們能夠調整這個偏差和方差之間的權衡(通過提供一個偏見/方差參數,用戶可以調整)。

2、功能的複雜性和數量的訓練數據

第二個問題是訓練數據可相對於“真正的”功能（分類或回歸函式）的複雜度的量。如果真正的功能是簡單的，則一個“不靈活的”學習算法具有高偏壓和低的方差將能夠從一個小數據量的學習。但是，如果真功能是非常複雜的（例如，因為它涉及在許多不同的輸入要素的複雜的相互作用，並且行為與在輸入空間的不同部分），則該函式將只從一個非常大的數量的訓練數據，並使用可學習“靈活”的學習算法具有低偏置和高方差。因此，良好的學習算法來自動調整的基礎上可用的數據量和該函式的明顯的複雜性要學習的偏壓/方差權衡。

3、輸入空間的維數

第三個問題是輸入空間的維數。如果輸入特徵向量具有非常高的維數，學習問題是很困難的，即使真函式僅依賴於一個小數目的那些特徵。這是因為許多“額外”的尺寸可混淆的學習算法，並使其具有高方差。因此，高的輸入維數通常需要調整分類器具有低方差和高偏置。在實踐中，如果工程師能夠從輸入數據手動刪除不相關的特徵，這是有可能改善該學習功能的準確性。此外，還有許多算法的特徵選擇，設法確定相關特徵，並丟棄不相關的。這是維數降低，其目的是將輸入數據映射到較低維空間中運行的監督學習算法之前的更一般的策略的一個實例。

4、噪聲中的輸出值

第四個問題是在所需要的輸出值（監控目標變數）的噪聲的程度。如果所希望的輸出值，通常是不正確的（因為人為錯誤或感測器的錯誤），則學習算法不應試圖找到一個函式完全匹配的訓練示例。試圖以適應數據過於謹慎導致過度擬合。當沒有測量誤差（隨機噪聲），如果你正在努力學習功能，是您學習模式太複雜，你甚至可以過度擬合。在這種情況下的目標函式，該函式不能被模擬“腐化”你的訓練數據的那部分-這一現象被稱為確定性的噪聲。當任一類型的噪聲存在時，最好是去一個更高的偏見，低方差估計。

監督學習

基本介紹

監督學習詞性解釋

基本定義：

監督學習中需要注意的問題：

實例分析：

相關詞條

熱門詞條