機器學習實戰：1.8 本章小結_Peter Harrington

儘管沒有引起大多數人的注意，但是機器學習算法已經廣泛應用於我們的日常生活之中。每天我們需要處理的數據在不斷地增加，能夠深入理解數據背後的真實含義，是數據驅動產業必須具備的基本技能。

學習機器學習算法，必須瞭解數據實例，每個數據實例由多個特徵值組成。分類是基本的機器學習任務，它分析未分類數據，以確定如何將其放入已知群組中。為了構建和訓練分類器，必須首先輸入大量已知分類的數據，我們將這些數據稱為訓練樣本集。

儘管我們構造的鳥類識別專家系統無法像人類專家一樣精確地識別不同的鳥類，然而構建接近專家水平的機器系統可以顯著地改進我們的生活質量。如果我們可以構造的醫生專家系統能夠達到人類醫生的準確率，則病人可以得到快速的治療；如果我們可以改進天氣預報，則可以減少水資源的短缺，提高食物供給。我們可以列舉許許多多這樣的例子，機器學習的應用前景幾乎是無限的。

第一部分的後續６章主要研究分類問題，它是監督學習算法的一個分支，下一章我們將介紹第一個分類算法——k-近鄰算法。