新到貨2本75折
數據天才:數據科學家修煉之道

數據天才:數據科學家修煉之道

  • 定價:510
  • 運送方式:
  • 臺灣與離島
  • 海外
  • 可配送點:台灣、蘭嶼、綠島、澎湖、金門、馬祖
  • 可取貨點:台灣、蘭嶼、綠島、澎湖、金門、馬祖
載入中...
  • 分享
 

內容簡介

這是一本跟數據科學和數據科學家有關的「手冊」,它還包含傳統統計學、編程或計算機科學教科書中所沒有的信息。 本書有3個組成部分:一是多層次地討論數據科學是什麼,以及數據科學涉及哪些其他學科;二是數據科學的技術應用層面,包括教程和案例研究;三是給正在從業和有抱負的數據科學家介紹一些職業資源。本書中有很多職業和培訓相關資源(如數據集、網絡爬蟲源代碼、數據視頻和如何編寫API),所以借助本書,你現在就可以開始數據科學實踐,並快速地提升你的職業水平。

Vincent Granville博士是一名富有遠見的數據科學家,有 15 年大數據、預測建模、數字分析和業務分析的經驗。Vincent 在評分技術、欺詐檢測和網絡流量優化及增長等領域,是舉世公認的權威專家。在過去的 10 年中,他曾與 Visa 一起研究實時信用卡欺詐檢測,與CNET一起研究廣告組合優化,與Microsoft(微軟公司)一起研究「改變點檢測」,與Wells Fargo(富國銀行)一起研究在線用戶體驗,與InfoSpace一起研究搜索智能,與eBay一起研究自動競價,與各大搜索引擎、廣告網絡和大型廣告客戶一起研究點擊欺詐檢測。Vincent 也管理着LinkedIn上最大的「大數據及分析數據科學家」小組,該小組擁有超過100 000名成員。

最近,Vincent推出了數據科學中心(Data Science Center)這個大數據、業務分析和數據科學界的領先社區。Vincent曾是劍橋大學和美國國家統計科學學院的博士后。他曾入圍沃頓商業計划競賽和比利時數學奧林匹克的決賽。Vincent 已經在統計期刊上發表了40篇論文,並且是許多國際會議的受邀演講嘉賓。他還開發了一種新的數據挖掘技術,被稱為隱性決策樹,他還擁有多項專利,是發表數據科學書籍的第一人,並籌集了600萬美元的創業啟動資金。根據福布斯的排名,Vincent 是大數據領域前20位有影響力的人物之一,被VentureBeat、MarketWatch和美國有線新聞網(CNN)專門報道。Vincent的Twitter賬號為@Analyticbridge。
 

目錄

第1章 數據科學是什麼 1
真偽數據科學對比 2
偽數據科學的兩個例子 5
新大學的面貌 7
數據科學家 10
數據科學家與數據工程師 10
數據科學家與統計學家 12
數據科學家與業務分析師 13
13個真實世界情景中的數據科學應用 14
情景1:國家對烈性酒銷售的壟斷結束后,DUI(酒后駕駛)逮捕量減少 15
情景2:數據科學與直覺 17
情景3:數據故障將數據變成亂碼 19
情景4:異常空間的回歸 21
情景5:分析與誘導在提升銷量上有何不同價值 22
情景6:關於隱藏數據 24
情景7:汽油中的鉛會導致高犯罪率。真的嗎 25
情景8:波音787(夢幻客機)問題 26
情景9:NLP的7個棘手句子 27
情景10:數據科學家決定着我們所吃的食品 28
情景11:用較好的相關性增加亞馬遜的銷售量 30
情景12:檢測Facebook上的假檔案或假「喜歡」數 32
情景13:餐廳的分析 33
數據科學的歷史、開拓者和現代趨勢 33
統計學將會復興 34
歷史與開拓者 36
現代的趨勢 38
最近的問答討論 40
總結 44

第2章 大數據的獨特性 45
兩個大數據的問題 45
大數據「詛咒」 45
數據快速流動問題 50
大數據技術示例 56
大數據問題是數據科學所面臨挑戰的縮影 56
大規模數據集的聚類和分類 58
1億行的Excel 63
MapReduce不能做什麼 67
問題 67
3種解決方案 68
結論:何時使用MapReduce 69
溝通問題 70
數據科學:統計學的終結 72
8種最差的預測建模技術 72
把計算機科學、統計學和行業專業知識結合在一起 74
大數據生態系統 78
總結 79

第3章 成為一名數據科學家 80
數據科學家的主要特征 80
數據科學家的職能 80
橫向與縱向數據科學家 83
數據科學家的類型 86
偽數據科學家 86
自學成才的數據科學家 86
業余數據科學家 87
極限數據科學家 89
數據科學家人群特征 90
數據科學方面的培訓 91
大學課程 91
公司和協會培訓項目 95
免費培訓項目 96
數據科學家職業道路 98
獨立顧問 98
創業者 105
總結 118

第4章 數據科學的技術(Ⅰ) 119
新型指標 120
優化數字營銷活動的指標 121
欺詐檢測的指標 122
選擇合適的分析工具 124
分析軟件 124
可視化工具 125
實時產品 126
編程語言 128
可視化 128
用R生成數據視頻 129
更復雜的視頻 133
無模型的統計建模 134
無模型的統計建模是什麼 135
該算法是如何工作的 135
源代碼生成數據集 137
三類指標:中心性、波動性、顛簸性 137
中心性、波動性和顛簸性之間的關系 138
定義顛簸性 138
在Excel中計算顛簸性 139
使用顛簸系數 141
大數據的統計聚類 141
大數據的相關性和擬合度 143
一系列新的秩相關性 146
漸近分布與歸一化 148
計算復雜度 152
計算q(n) 152
理論上的解決方案 155
結構系數 156
確定簇的數量 157
方法 157
例子 158
網絡拓撲映射 159
安全通信:數據加密 163
總結 166

第5章 數據科學的技術(Ⅱ) 167
數據字典 168
什麼是數據字典 168
建立數據字典 169
隱性決策樹 169
實現方法 171
示例:互聯網流量打分 173
結論 175
與模型無關的置信區間 175
方法 175
分析橋第一定理 176
應用 177
源代碼 178
隨機數 179
解決問題的4個辦法 181
擁有超強直覺能力的業務分析師的直觀法 182
軟件工程師的蒙特卡洛模擬法 182
統計學家的統計建模方法 183
計算機科學家的大數據方法 183
因果關系和相關性 183
怎樣檢測因果關系 184
數據科學項目的生命周期 186
預測模型的錯誤 189
邏輯相關回歸 191
變量之間的相互作用 191
一階近似 191
二階近似 193
用Excel進行回歸分析 195
實驗設計 196
有趣的指標 196
把患者分成不同的人群進行治療 196
私人定制的治療 197
分析即服務和應用程序接口 198
工作原理 199
實施案例 199
關鍵詞相關的API的源代碼 200
其他主題 204
當數據庫改變時,保存好數值 204
優化網絡爬蟲 205
哈希連接 206
用於模擬簇的簡單源代碼 207
Hadoop和大數據的新型合成方差 208
Hadoop和MapReduce的介紹 208
綜合指標 209
Hadoop、數值的和統計的穩定性 210
方差的抽象概念 211
一個新的大數據定理 213
平移不變性的度量標准 214
實現:通信和計算成本 214
最終意見 215
總結 215

第6章 數據科學應用案例研究 217
股票市場 217
使回報率提高500%的模式 217
優化統計交易策略 220
股票交易的API:統計模型 222
股票交易的API:具體實現 225
股票市場模擬 226
些許數學知識 229
新趨勢 231
加密 232
數據科學應用:隱寫術 232
好的電子郵件加密 236
驗證碼破解 239
欺詐檢測 240
點擊欺詐 241
連續點擊評分與二進制欺詐/非欺詐 242
數學模型與基准 244
虛假轉化產生的偏差 245
一些誤解 246
統計面臨的挑戰 246
點擊評分優化關鍵詞出價 247
組合優化自動快速的特征選擇 249
特征的預測能力:交叉驗證 250
勾連檢測和僵屍網絡的關聯規則檢測 254
模式檢測的極值理論 255
數字分析 256
在線廣告:到達率和頻率的計算公式 256
電子郵件營銷:提高300%的性能 257
在7天內優化關鍵詞廣告宣傳活動 258
自動新聞提要優化 260
用bit.ly進行競爭情報分析 261
測量Twitter哈希標簽(hashtag)的收益 263
用3個修補方法提升谷歌搜索 267
改進相關性的算法 270
廣告循環問題 272
雜項 273
簡單模型會獲得更好的銷售預測 273
更好的醫療欺詐檢測 275
歸因模型 276
預測隕石撞擊 277
在路口停車場收集數據 281
數據科學的其他應用 282
總結 282

第7章 踏上你的數據科學職業之路 283
面試問題 283
關於工作經驗的問題 283
技術問題 285
一般性問題 286
關於數據科學項目的問題 288
測試你自己的視覺和分析思維 291
通過肉眼的檢測模式 292
識別偏差 294
誤導性的時間序列和隨機游走 295
從統計學家到數據科學家 296
數據科學家也是統計從業人員 297
誰應該給數據科學家教統計學 298
雇佣問題 298
數據科學家與數據架構師密切合作 299
誰應該參與戰略思考 299
兩種類型的統計學家 300
大數據與取樣 301
數據科學家的分類 302
數據科學最流行的技能集合 302
LinkedIn上的頂 級數據科學家 306
400個數據科學家職位頭銜 309
薪酬調查 311
根據技能和位置的薪酬分類 312
創建自己的薪酬調查表 316
總結 317

第8章 數據科學資源 318
專業資源 318
數據集 318
書籍 319
會議與組織 322
網站 324
概念定義 324
職業建設資源 327
招聘數據科學家的公司 328
數據科學招聘廣告的樣本 329
簡歷樣本 329
總結 331
 

詳細資料

  • ISBN:9787121308833
  • 規格:331頁 / 21 x 14.8 x 1.5 cm / 普通級 / 1-1
  • 出版地:中國

最近瀏覽商品

 

相關活動

  • 用一代人的努力終結氣候危機《再生》|自然科普展7折起
 

購物說明

溫馨提醒您:若您訂單中有購買簡體館無庫存/預售書或庫存於海外廠商的書籍,建議與其他商品分開下單,以避免等待時間過長,謝謝。

大陸出版品書況:因裝幀品質及貨運條件未臻完善,書況與台灣出版品落差甚大,封面老舊、出現磨痕、凹痕等均屬常態,故簡體字館除封面破損、內頁脫落...等較嚴重的狀態外,其餘所有商品將正常出貨。 

 

請注意,部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

調貨時間:若您購買海外庫存之商品,於您完成訂購後,商品原則上約45個工作天內抵台(若有將延遲另行告知)。為了縮短等待的時間,建議您將簡體書與其它商品分開訂購,以利一般商品快速出貨。 

若您具有法人身份為常態性且大量購書者,或有特殊作業需求,建議您可洽詢「企業採購」。 

退換貨說明 

會員所購買的商品均享有到貨十天的猶豫期(含例假日)。退回之商品必須於猶豫期內寄回。 

辦理退換貨時,商品必須是全新狀態與完整包裝(請注意保持商品本體、配件、贈品、保證書、原廠包裝及所有附隨文件或資料的完整性,切勿缺漏任何配件或損毀原廠外盒)。退回商品無法回復原狀者,恐將影響退貨權益或需負擔部分費用。 

訂購本商品前請務必詳閱商品退換貨原則

  • 888現折88
  • 分寸與好運
  • 終結氣候危機