“終於出了一本以Java實作資料科學應用程式的書,且它還討論到機器學習所需的線性代數與統計。這本書是Michael Brzustowicz在這個領域中經驗的精華,我強力推薦”。 --Terence Parr 舊金山大學分析學院創辦人、ANTLR解析產生器創建者
資料科學因R與Python而蓬勃發展,但Java為今日的資料科學應用帶來堅實、方便與擴展性。Java軟體工程師可透過本書循序學習資料科學技能。作者Michael Brzustowicz在本書中闡述資料科學每個處理程序背後的數學理論以及如何以Java實作這些概念。
你會學到資料I/O、線性代數、統計、資料操作、學習與預測,以及Hadoop MapReduce在程序中扮演的角色。本書的程式範例可用於你的應用程式。
‧檢視最純形式資料的取得、清理與安排的方法
‧認識資料應有的矩陣結構
‧學習檢驗資料的基本概念
‧轉換資料成穩定可用的數值
‧認識監督式與非監督式學習演算法
‧安裝與執行MapReduce,運用適合資料科學演算法的自定元件
Michael Brzustowicz 是個擅長資料科學的物理學者,專精於建構分散式資料系統以及從大量資料擷取知識。他大部分的時間用於撰寫處理大數據的統計模型與機器學習的自定多執行緒程式碼,目前在舊金山大學教授資料科學。