機器學習實戰：1.3 機器學習的主要任務_Peter Harrington

本節主要介紹機器學習的主要任務，並給出一個表格，幫助讀者將機器學習算法轉化為可實際運作的應用程序。

上節的例子介紹了機器學習如何解決分類問題，它的主要任務是將實例數據劃分到合適的分類中。機器學習的另一項任務是回歸，它主要用於預測數值型數據。大多數人可能都見過回歸的例子——數據擬合曲線：通過給定數據點的最優擬合曲線。分類和回歸屬於監督學習，之所以稱之為監督學習，是因為這類算法必須知道預測什麼，即目標變量的分類信息。

與監督學習相對應的是非監督學習，此時數據沒有類別信息，也不會給定目標值。在非監督學習中，將數據集合分成由類似的對象組成的多個類的過程被稱為聚類；將尋找描述數據統計值的過程稱之為密度估計。此外，非監督學習還可以減少數據特徵的維度，以便我們可以使用二維或三維圖形更加直觀地展示數據信息。表1-2列出了機器學習的主要任務，以及解決相應問題的算法。

表1-2　用於執行分類、回歸、聚類和密度估計的機器學習算法

監督學習的用途 k-近鄰算法線性回歸　樸素貝葉斯算法局部加權線性回歸支持向量機 Ridge 回歸決策樹 Lasso 最小回歸係數估計無監督學習的用途 K-均值最大期望算法 DBSCAN Parzen窗設計

你可能已經注意到表1-2中的很多算法都可以用於解決同樣的問題，有心人肯定會問：「為什麼解決同一個問題存在四種方法？精通其中一種算法，是否可以處理所有的類似問題？」本書的下一節將回答這些疑問。