- 譯者序
- 前言
- 致謝
- 關於本書
- 關於作者
- 關於封面
- 第一部分 分類
- 第1章 機器學習基礎
- 1.1 何謂機器學習
- 1.2 關鍵術語
- 1.3 機器學習的主要任務
- 1.4 如何選擇合適的算法
- 1.5 開發機器學習應用程序的步驟
- 1.6 Python語言的優勢
- 1.7 NumPy函數庫基礎
- 1.8 本章小結
- 第2章 k-近鄰算法
- 2.1 k-近鄰算法概述
- 2.2 示例:使用k近鄰算法改進約會網站的配對效果
- 2.3 示例:手寫識別系統
- 2.4 本章小結
- 第3章 決策樹
- 3.1 決策樹的構造
- 3.2 在Python中使用Matplotlib註解繪製樹形圖
- 3.3 測試和存儲分類器
- 3.4 示例:使用決策樹預測隱形眼鏡類型
- 3.5 本章小結
- 第4章 基於概率論的分類方法:樸素貝葉斯
- 4.1 基於貝葉斯決策理論的分類方法
- 4.2 條件概率
- 4.3 使用條件概率來分類
- 4.4 使用樸素貝葉斯進行文檔分類
- 4.5 使用Python進行文本分類
- 4.6 示例:使用樸素貝葉斯過濾垃圾郵件
- 4.7 示例:使用樸素貝葉斯分類器從個人廣告中獲取區域傾向
- 4.8 本章小結
- 第5章 Logistic回歸
- 5.1 基於Logistic回歸和Sigmoid函數的分類
- 5.2 基於最優化方法的最佳回歸係數確定
- 5.3 示例:從疝氣病症預測病馬的死亡率
- 5.4 本章小結
- 第6章 支持向量機
- 6.1 基於最大間隔分隔數據
- 6.2 尋找最大間隔
- 6.3 SMO高效優化算法
- 6.4 利用完整Platt SMO算法加速優化
- 6.5 在複雜數據上應用核函數
- 6.6 示例:手寫識別問題回顧
- 6.7 本章小結
- 第7章 利用AdaBoost元算法提高分類性能
- 7.1 基於數據集多重抽樣的分類器
- 7.2 訓練算法:基於錯誤提升分類器的性能
- 7.3 基於單層決策樹構建弱分類器
- 7.4 完整AdaBoost算法的實現
- 7.5 測試算法:基於AdaBoost的分類
- 7.6 示例:在一個難數據集上應用AdaBoost
- 7.7 非均衡分類問題
- 7.8 本章小結
- 第二部分 利用回歸預測數值型數據
- 第8章 預測數值型數據:回歸
- 8.1 用線性回歸找到最佳擬合直線
- 8.2 局部加權線性回歸
- 8.3 示例:預測鮑魚的年齡
- 8.4 縮減係數來「理解」數據
- 8.5 權衡偏差與方差
- 8.6 示例:預測樂高玩具套裝的價格
- 8.7 本章小結
- 第9章 樹回歸
- 9.1 複雜數據的局部性建模
- 9.2 連續和離散型特徵的樹的構建
- 9.3 將CART算法用於回歸
- 9.4 樹剪枝
- 9.5 模型樹
- 9.6 示例:樹回歸與標準回歸的比較
- 9.7 使用Python的Tkinter庫創建GUI
- 9.8 本章小結
- 第三部分 無監督學習
- 第10章 利用K-均值聚類算法對未標注數據分組
- 10.1 k均值聚類算法
- 10.2 使用後處理來提高聚類性能
- 10.3 二分k均值算法
- 10.4 示例:對地圖上的點進行聚類
- 10.5 本章小結
- 第11章 使用Apriori算法進行關聯分析
- 11.1 關聯分析
- 11.2 Apriori原理
- 11.3 使用Apriori算法來發現頻繁集
- 11.4 從頻繁項集中挖掘關聯規則
- 11.5 示例:發現國會投票中的模式
- 11.6 示例:發現毒蘑菇的相似特徵
- 11.7 本章小結
- 第12章 使用FP-growth算法來高效發現頻繁項集
- 12.1 FP樹:用於編碼數據集的有效方式
- 12.2 構建FP樹
- 12.3 從一棵FP樹中挖掘頻繁項集
- 12.4 示例:在Twitter源中發現一些共現詞
- 12.5 示例:從新聞網站點擊流中挖掘
- 12.6 本章小結
- 第四部分 其他工具
- 第13章 利用PCA來簡化數據
- 13.1 降維技術
- 13.2 PCA
- 13.3 示例:利用PCA對半導體製造數據降維
- 13.4 本章小結
- 第14章 利用SVD簡化數據
- 14.1 SVD的應用
- 14.2 矩陣分解
- 14.3 利用Python實現SVD
- 14.4 基於協同過濾的推薦引擎
- 14.5 示例:餐館菜餚推薦引擎
- 14.6 示例:基於SVD的圖像壓縮
- 14.7 本章小結
- 第15章 大數據與MapReduce
- 15.1 MapReduce:分佈式計算的框架
- 15.2 Hadoop流
- 15.3 在Amazon網絡服務上運行Hadoop程序
- 15.4 MapReduce上的機器學習
- 15.5 在Python中使用mrjob來自動化MapReduce
- 15.6 示例:分佈式SVM的Pegasos算法
- 15.7 你真的需要MapReduce嗎?
- 15.8 本章小結
- 附錄A Python入門
- A.1 Python安裝
- A.2 Python入門
- A.3 NumPy快速入門
- A.4 Beautiful Soup包
- A.5 Mrjob
- A.6 Vote Smart
- A.7 Python-Twitter
- 附錄B 線性代數
- B.1 矩陣
- B.2 矩陣求逆
- B.3 矩陣范數
- B.4 矩陣求導
- 附錄C 概率論複習
- C.1 概率論簡介
- C.2 聯合概率
- C.3 概率的基本準則
- 附錄D 資源
讀古今文學網 > 機器學習實戰小說線上看 >
機器學習實戰
內容簡介:機器學習是人工智能研究領域中一個極其重要的研究方向,在現今的大數據時代背景下,捕獲數據並從中萃取有價值的信息或模式,成為各行業求生存、謀發展的決定性手段,這使得這一過去為分析師和數學家所專屬的研究領域越來越為人們所矚目。本書第一部分主要介紹機器學習基礎,以及如何利用算法進行分類,並逐步介紹了多種經典的監督學習算法,如k近鄰算法、樸素貝葉斯算法、Logistic回歸算法、支持向量機、AdaBoost集成方法、基於樹的回歸算法和分類回歸樹(CART)算法等。第三部分則重點介紹無監督學習及其一些主要算法:k均值聚類算法、Apriori算法、FP-Growth算法。第四部分介紹了機器學習算法的一些附屬工具。全書通過精心編排的實例,切入日常工作任務,摒棄學術化語言,利用高效的可復用Python代碼來闡釋如何處理統計數據,進行數據分析及可視化。通過各種實例,讀者可從中學會機器學習的核心算法,並能將其運用於一些策略性任務中,如分類、預測、推薦。另外,還可用它們來實現一些更高級的功能,如匯總和簡化等。……