讀古今文學網 > 機器學習實戰 > 第三部分 無監督學習 >

第三部分 無監督學習

這一部分介紹的是無監督機器學習方法。該主題與前兩部分有所不同。在無監督學習中,類似分類和回歸中的目標變量事先並不存在。與前面「對於輸入數據X能預測變量Y」不同的是,這裡要回答的問題是:「從數據X中能發現什麼?」 這裡需要回答的X方面的問題可能是:「構成X的最佳6個數據簇都是哪些?」或者「X中哪三個特徵最頻繁共現?」

第10章介紹了無監督學習中的聚類(將相似項聚團)方法,包括k均值聚類算法。第11章介紹了基於Apriori算法的關聯分析或者稱購物籃分析。關聯分析可以用於回答「哪些物品經常被同時購買?」之類的問題。無監督學習部分的最後一章,即第12章將介紹一個更高效的關聯分析算法:FP-growth算法。