讀古今文學網 > 機器學習實戰 > 第14章 利用SVD簡化數據 >

第14章 利用SVD簡化數據

本章內容

  • SVD矩陣分解
  • 推薦引擎
  • 利用SVD提升推薦引擎的性能

餐館可劃分為很多類別,比如美式、中式、日式、牛排館、素食店,等等。你是否想過這些類別夠用嗎?或許人們喜歡這些的混合類別,或者類似中式素食店那樣的子類別。如何才能知道到底有多少類餐館呢?我們也許可以問問專家?但是倘若某個專家說應該按照調料分類,而另一個專家則認為應該按照配料分類,那該怎麼辦呢?忘了專家,我們還是從數據著手吧。我們可以對記錄用戶關於餐館觀點的數據進行處理,並且從中提取出其背後的因素。

這些因素可能會與餐館的類別、烹飪時所用的某個特定配料,或其他任意對像一致。然後,我們就可以利用這些因素來估計人們對沒有去過的餐館的看法。

提取這些信息的方法稱為奇異值分解(Singular Value Decomposition,SVD)。從生物信息學到金融學等在內的很多應用中,SVD都是提取信息的強大工具。

本章將介紹SVD的概念及其能夠進行數據約簡的原因。然後,我們將會介紹基於Python的SVD實現以及將數據映射到低維空間的過程。再接下來,我們就將學習推薦引擎的概念和它們的實際運行過程。為了提高SVD的精度,我們將會把其應用到推薦系統中去,該推薦系統將會幫助人們尋找到合適的餐館。最後,我們講述一個SVD在圖像壓縮中的應用例子。