讀古今文學網 > 機器學習實戰 > 第1章 機器學習基礎 >

第1章 機器學習基礎

本章內容

  • 機器學習的簡單概述
  • 機器學習的主要任務
  • 學習機器學習的原因
  • Python語言的優勢

最近我和一對夫婦共進晚餐,他們問我從事什麼職業,我回應道:「機器學習。」妻子回頭問丈夫:「親愛的,什麼是機器學習?」她的丈夫答道:「T-800型終結者。」在《終結者》系列電影中,T-800是人工智能技術的反面樣板工程。不過,這位朋友對機器學習的理解還是有所偏差的。本書既不會探討和計算機程序進行對話交流,也不會與計算機探討人生的意義。機器學習能讓我們自數據集中受到啟發,換句話說,我們會利用計算機來彰顯數據背後的真實含義,這才是機器學習的真實含義。它既不是只會徒然模仿的機器人,也不是具有人類感情的仿生人。

現今,機器學習已應用於多個領域,遠超出大多數人的想像,下面就是假想的一日,其中很多場景都會碰到機器學習:假設你想起今天是某位朋友的生日,打算通過郵局給她郵寄一張生日賀卡。你打開瀏覽器搜索趣味卡片,搜索引擎顯示了10個最相關的鏈接。你認為第二個鏈接最符合你的要求,點擊了這個鏈接,搜索引擎將記錄這次點擊,並從中學習以優化下次搜索結果。然後,你檢查電子郵件系統,此時垃圾郵件過濾器已經在後台自動過濾垃圾廣告郵件,並將其放在垃圾箱內。接著你去商店購買這張生日卡片,並給你朋友的孩子挑選了一些尿布。結賬時,收銀員給了你一張1美元的優惠券,可以用於購買6罐裝的啤酒。之所以你會得到這張優惠券,是因為款台收費軟件基於以前的統計知識,認為買尿布的人往往也會買啤酒。然後你去郵局郵寄這張賀 卡,手寫識別軟件識別出郵寄地址,並將賀卡發送給正確的郵車。當天你還去了貸款申請機構,查看自己是否能夠申請貸款,辦事員並不是直接給出結果,而是將你最近的金融活動信息輸入計算機,由軟件來判定你是否合格。最後,你還去了賭場想找些樂子,當你步入前門時,尾隨你進來的一個傢伙被突然出現的保安給攔了下來。「對不起,索普先生,我們不得不請您離開賭場。我們不歡迎老千。」圖1-1集中展示了使用到的機器學習應用。

圖1-1 機器學習在日常生活中的應用,從左上角按照順時針方向依次使用到的機器學習技術分別為:人臉識別、手寫數字識別、垃圾郵件過濾和亞馬遜公司的產品推薦

上面提到的所有場景,都有機器學習軟件的存在。現在很多公司使用機器學習軟件改善商業決策、提高生產率、檢測疾病、預測天氣,等等。隨著技術指數級增長,我們不僅需要使用更好的工具解析當前的數據,而且還要為將來可能產生的數據做好充分的準備。

現在正式進入本書機器學習的主題。本章我們將首先介紹什麼是機器學習,日常生活中何處將用到機器學習,以及機器學習如何改進我們的工作和生活;然後討論使用機器學習解決問題的一般辦法;最後介紹為什麼本書使用Python語言來處理機器學習問題。我們將通過一個Python模塊NumPy來簡要介紹Python在抽像和處理矩陣運算上的優勢。