機器學習實戰：第14章利用SVD簡化數據_Peter Harrington

本章內容

SVD矩陣分解

推薦引擎

利用SVD提升推薦引擎的性能

餐館可劃分為很多類別，比如美式、中式、日式、牛排館、素食店，等等。你是否想過這些類別夠用嗎？或許人們喜歡這些的混合類別，或者類似中式素食店那樣的子類別。如何才能知道到底有多少類餐館呢？我們也許可以問問專家？但是倘若某個專家說應該按照調料分類，而另一個專家則認為應該按照配料分類，那該怎麼辦呢？忘了專家，我們還是從數據著手吧。我們可以對記錄用戶關於餐館觀點的數據進行處理，並且從中提取出其背後的因素。

這些因素可能會與餐館的類別、烹飪時所用的某個特定配料，或其他任意對像一致。然後，我們就可以利用這些因素來估計人們對沒有去過的餐館的看法。

提取這些信息的方法稱為奇異值分解（Singular Value Decomposition，SVD）。從生物信息學到金融學等在內的很多應用中，SVD都是提取信息的強大工具。

本章將介紹SVD的概念及其能夠進行數據約簡的原因。然後，我們將會介紹基於Python的SVD實現以及將數據映射到低維空間的過程。再接下來，我們就將學習推薦引擎的概念和它們的實際運行過程。為了提高SVD的精度，我們將會把其應用到推薦系統中去，該推薦系統將會幫助人們尋找到合適的餐館。最後，我們講述一個SVD在圖像壓縮中的應用例子。