機器學習實戰：2.4 本章小結_Peter Harrington

k近鄰算法是分類數據最簡單最有效的算法，本章通過兩個例子講述了如何使用k近鄰算法構造分類器。k近鄰算法是基於實例的學習，使用算法時我們必須有接近實際數據的訓練樣本數據。k近鄰算法必須保存全部數據集，如果訓練數據集的很大，必須使用大量的存儲空間。此外，由於必須對數據集中的每個數據計算距離值，實際使用時可能非常耗時。

K近鄰算法的另一個缺陷是它無法給出任何數據的基礎結構信息，因此我們也無法知曉平均實例樣本和典型實例樣本具有什麼特徵。下一章我們將使用概率測量方法處理分類問題，該算法可以解決這個問題。