讀古今文學網 > 機器學習實戰 > 2.4 本章小結 >

2.4 本章小結

k近鄰算法是分類數據最簡單最有效的算法,本章通過兩個例子講述了如何使用k近鄰算法構造分類器。k近鄰算法是基於實例的學習,使用算法時我們必須有接近實際數據的訓練樣本數據。k近鄰算法必須保存全部數據集,如果訓練數據集的很大,必須使用大量的存儲空間。此外,由於必須對數據集中的每個數據計算距離值,實際使用時可能非常耗時。

K近鄰算法的另一個缺陷是它無法給出任何數據的基礎結構信息,因此我們也無法知曉平均實例樣本和典型實例樣本具有什麼特徵。下一章我們將使用概率測量方法處理分類問題,該算法可以解決這個問題。