讀書日
內容連載 頁數 1/1
為什麼要學資料科學?

想像你是一名年輕醫生。

當患者進入你的診所,抱怨呼吸困難、胸腔疼痛,以及偶爾發作的胃部灼熱症狀。你測量他的血壓及心跳數,發現一切指數都正常,而且這位患者過去並沒有上述病史。

觀察他的體型,你注意到這位患者有些胖。基於他所敘述的病狀常常出現在體重過重的人們當中,身為醫生的你告訴他一切都在控制之中,並建議這位患者找時間多運動。

很多時候,像是上述例子的情況,會導致對於潛在心臟病的錯誤診斷—因為心臟疾病患者的病狀與普通肥胖症的症狀非常相似,醫生們通常需藉由更進一步的檢查,檢測出更為嚴重的病情。

身為人類,我們的判斷常常受制於有限的、主觀的經驗和不全面的知識。將影響我們的決策過程,就像一位缺乏經驗的的年輕醫生,放棄可能導出更準確結論的進一步測試 。
這正是資料科學可以發揮功效的地方。

資料科學並不是依賴單獨個體的價值判斷,而是幫助我們駕馭來自多元資料來源的資訊,做出更完善的決策。舉例來說,我們可以查閱患者歷史紀錄,尋找類似病狀的患者資料,以便發現過去被忽略的可能診斷。

現代的運算技術及先進的演算法,可以幫助我們:
.辨識大資料集中的潛在趨勢
.善用趨勢來進行預測
.計算每一個可能結果的機率
.迅速取得準確分析結果。

本書是介紹資料科學與演算法的入門書,具有通俗易懂的風格(本書可不談數學!)。為了幫助你掌握關鍵概念,我們使用直觀的解釋與大量的視覺效果。

每一個演算法有獨立的章節,以現實世界的實例應用來解釋各演算法如何運作。在網路上可以取得這些例子的資料,資料來源列於參考文獻一章中。如果想要複習你在本書中學到什麼,可以翻閱每一章節最後的「本章小結」。

在本書的最後,你也可以找到比較各演算法優缺點的參考清單,以及常用術語的字彙表。

我們希望能幫助你對資料科學有更實際的理解,而你也可以善用資料科學的優勢,做出更好的決策。
 
11 跳到