讀古今文學網 > 機器學習實戰 > 1.3 機器學習的主要任務 >

1.3 機器學習的主要任務

本節主要介紹機器學習的主要任務,並給出一個表格,幫助讀者將機器學習算法轉化為可實際運作的應用程序。

上節的例子介紹了機器學習如何解決分類問題,它的主要任務是將實例數據劃分到合適的分類中。機器學習的另一項任務是回歸,它主要用於預測數值型數據。大多數人可能都見過回歸的例子——數據擬合曲線:通過給定數據點的最優擬合曲線。分類和回歸屬於監督學習,之所以稱之為監督學習,是因為這類算法必須知道預測什麼,即目標變量的分類信息。

與監督學習相對應的是非監督學習,此時數據沒有類別信息,也不會給定目標值。在非監督學習中,將數據集合分成由類似的對象組成的多個類的過程被稱為聚類;將尋找描述數據統計值的過程稱之為密度估計。此外,非監督學習還可以減少數據特徵的維度,以便我們可以使用二維或三維圖形更加直觀地展示數據信息。表1-2列出了機器學習的主要任務,以及解決相應問題的算法。

表1-2 用於執行分類、回歸、聚類和密度估計的機器學習算法

監督學習的用途 k-近鄰算法 線性回歸  樸素貝葉斯算法 局部加權線性回歸 支持向量機 Ridge 回歸 決策樹 Lasso 最小回歸係數估計 無監督學習的用途 K-均值 最大期望算法 DBSCAN Parzen窗設計

你可能已經注意到表1-2中的很多算法都可以用於解決同樣的問題,有心人肯定會問:「為什麼解決同一個問題存在四種方法?精通其中一種算法,是否可以處理所有的類似問題?」本書的下一節將回答這些疑問。