讀古今文學網 > 機器學習實戰 > 第8章 預測數值型數據:回歸 >

第8章 預測數值型數據:回歸

本章內容

  • 線性回歸
  • 局部加權線性回歸
  • 嶺回歸和逐步線性回歸
  • 預測鮑魚年齡和玩具售價

本書前面的章節介紹了分類,分類的目標變量是標稱型數據,而本章將會對連續型的數據做出預測。讀者很可能有這樣的疑問:「回歸能用來做些什麼呢?」。我的觀點是,回歸可以做任何事情。然而大多數公司常常使用回歸法做一些比較沉悶的事情,例如銷售量預測或者製造缺陷預測。我最近看到一個比較有新意的應用,就是預測名人的離婚率。

本章首先介紹線性回歸,包括其名稱的由來和Python實現。在這之後引入了局部平滑技術,分析如何更好地擬合數據。接下來,本章將探討回歸在「欠擬合」情況下的縮減(shrinkage)技術,探討偏差和方差的概念。最後,我們將融合所有技術,預測鮑魚的年齡和玩具的售價。此外為了獲取一些玩具的數據,我們還將使用Python來做一些採集的工作。這一章的內容會十分豐富。