讀古今文學網 > 機器學習實戰 > 譯者序 >

譯者序

這是我翻譯的第三本書了,前兩本分別是《信息檢索導論》和《大數據:大規模互聯網數據挖掘與分佈式處理》。與圖靈公司有了這兩次合作後,我們一直保持著十分密切的聯繫。2012年11月,圖靈的編輯和我說,這本書的原譯者不能繼續翻譯了,問我能否續譯後面的十二章。我翻閱了一下,覺得這本書不錯,能幫助不少人,於是很快就接下了這個翻譯任務,並在11月底啟動了我的第三次圖靈翻譯之旅。

我翻譯的這三本書分別涉及信息檢索、數據挖掘和機器學習。雖然這幾個領域各不相同,但是它們之間有著十分密切的關聯。簡單地說,機器學習算法在包含信息檢索和數據挖掘在內的多個領域中都有著十分廣泛的應用。現代互聯網中的搜索引擎、社交網絡、推薦引擎、計算廣告、電子商務等應用中,都包含大量的機器學習算法。「機器學習」已經成為學術界和工業界炙手可熱的術語。瞭解機器學習算法,是很多研究人員和互聯網從業人員的基本要求。

翻譯本書期間,業界和研究界也出現了大量熱點名詞,包括「大數據」(big data)、「深度學習」(deep learning)、「知識圖譜」(knowledge graph)等,基於社交網絡的研究和應用也層出不窮。可以說,機器學習與這些名詞之間都具有十分密切的聯繫,瞭解機器學習對於把握業界和研究界的脈搏至關重要。

本書沒有從理論角度來揭示機器學習算法背後的數學原理,而是通過「原理簡述+問題實例+實際代碼+運行效果」來介紹每一個算法。學習計算機的人都知道,計算機是一門實踐學科,沒有真正實現運行,很難真正理解算法的精髓。這本書的最大好處就是邊學邊用,非常適合於急需邁進機器學習領域的人員學習。實際上,即使對於那些對機器學習有所瞭解的人來說,通過代碼實現也能進一步加深對機器學習算法的理解。

本書的代碼採用Python語言編寫。Python代碼簡單優雅、易於上手,科學計算軟件包眾多,已經成為不少大學和研究機構進行計算機教學和科學計算的語言。相信Python編寫的機器學習代碼也能讓讀者盡快領略到這門學科的精妙之處。

由於個人精力有限,加上時間緊迫,和前兩本書都是獨立翻譯有所不同,本書邀請了多名頗具實力的譯者共同完成。全書共包括15章4個附錄,曲亞東翻譯第1-3章,李鵬博士翻譯第4、10、11、12章及附錄A、B,李銳博士翻譯第5、8、9、15章及附錄C、D,王斌翻譯第6、7、13、14章及其他部分並審校全文。

感謝翻譯過程中圖靈公司謝工、傅志紅、李鑫、郭志敏、劉紫鳳等人給予的幫助,感謝所有譯者的家人朋友一如既往的支持和鼓勵,感謝所有幫助和指導過我們的人。

由於譯者水平有限,書中難免會有疏漏,還望讀者不吝提出意見和建議。同前幾本書一樣,本書的勘誤也會在網上及時公佈,地址在:http://ir.ict.ac.cn/~wangbin/mli-book。讀者可以通過郵件[email protected]或者新浪微博和我聯繫。

王斌

2013年1月15日凌晨於中關村