新到貨2本75折
數據挖掘與應用:以SAS和R為工具

數據挖掘與應用:以SAS和R為工具

  • 定價:348
  • 優惠價:87303
  • 運送方式:
  • 臺灣與離島
  • 海外
  • 可配送點:台灣、蘭嶼、綠島、澎湖、金門、馬祖
  • 可取貨點:台灣、蘭嶼、綠島、澎湖、金門、馬祖
載入中...
  • 分享
 

內容簡介

《資料採擷與應用:以SAS和R為工具(第二版)》是資料採擷領域的經典教材,基於北京大學光華管理學院“資料採擷與應用”課程。書中系統、全面地介紹了資料採擷領域的理論、技術工具以及實踐方法。主要內容包括:資料採擷方法論、資料理解和資料準備、缺失資料、關聯規則挖掘、多元統計降維、聚類分析、線性回歸和廣義線性回歸、回歸模型規則化、神經網路、決策樹、支援向量機、模型評估、模型組合、協同過濾等。

書中在每種資料採擷技術後,均輔以大量醫療、金融、行銷、保險、政府部門等應用案例,並均配有相關應用的SAS和R語言代碼,以及視頻課程二維碼。

第二版更新:第二版在頭一版的基礎上,增加了缺失資料、回歸模型中的規則化和變數選擇、卷積神經網路、支援向量機、協同過濾這5章內容。在已有各章內,本書亦增加了新的內容和示例。近些年來,R因為其自由、免費、開源,已經發展為資料分析領域最強大的軟體之一。因此,本書除了繼續展示SAS程式,還增加了R程式。
 

作者介紹

張俊妮:美國哈佛大學統計學博士,北京大學光華管理學院商務統計及經濟計量系副教授。研究領域包括:貝葉斯分析、因果推斷、資料採擷及文本挖掘。在Journal of American Statistical Association、Statistica Sinica、等期刊上發表二十餘篇論文,出版英文專著。曾獲北京大學教學優秀獎、光華管理學院優秀課程獎。
 

目錄

前言

第 1 章 資料採擷概述 01
1.1 什麼是資料採擷 02
1.2 統計思想在資料採擷中的重要性 02
1.3 資料採擷的應用案例 07
1.4 CRISP-DM 資料採擷方法論 14
1.5 SEMMA 資料採擷方法論 15

第 2 章 資料理解和資料準備 17
2.1 資料理解 19
2.2 數據準備 22
2.3 資料理解和資料準備示例: FNBA 信用卡數據 35

第 3 章 缺失數據 51
3.1 缺失資料模式和缺失資料機制 52
3.2 缺失資料機制對資料分析的影響 53
3.3 缺失值插補 62
3.4 缺失資料插補及分析示例:紐約空氣品質 64

第 4 章 關聯規則挖掘 73
4.1 關聯規則的實際意義 74
4.2 關聯規則的基本概念及 Apriori 演算法 74
4.3 序列關聯規則 80
4.4 關聯規則挖掘示例 81
4.5 關聯規則挖掘的其他討論 85

第 5 章 多元統計中的降維方法 88
5.1 主成分分析 89
5.2 探索性因數分析 97
5.3 多維標度分析 104

第 6 章 聚類分析 111
6.1 距離與相似度的度量 113
6.2 k 均值聚類演算法 117
6.3 層次聚類法 122

第 7 章 預測性建模的一些基本方法 130
7.1 判別分析 131
7.2 樸素貝葉斯分類演算法 134
7.3 k 近鄰法 137
7.4 線性回歸 141
7.5 廣義線性模型 149

第 8 章 回歸模型中的規則化和變數選擇 168
8.1 線性回歸中的規則化和變數選擇 169
8.2 廣義線性模型中的規則化和變數選擇 181

第 9 章 神經網路的基本方法 184
9.1 神經網路架構及基本組成 185
9.2 誤差函數 190
9.3 神經網路訓練演算法 193
9.4 提高神經網路模型的可推廣性 198
9.5 數據預處理 200
9.6 神經網路建模示例 201
9.7 自組織圖 222

第 10 章 卷積神經網路 230
10.1 深度神經網路 231
10.2 卷積神經網路架構 232
10.3 卷積神經網路示例: Fashion-MNIST 數據 239

第 11 章 決策樹方法 245
11.1 決策樹簡介 246
11.2 決策樹的生長與修剪 248
11.3 對缺失資料的處理 155
11.4 變數選擇 256
11.5 決策樹的優缺點 257

第 12 章 支持向量機 274
12.1 支持向量機用於二分類問題 275
12.2 支持向量機用於多分類問題 284
12.3 支持向量機用於回歸問題 285

第 13 章 模型評估 290
13.1 因變數為二分變數的情形 291
13.2 因變數為多分變數的情形 301
13.3 因變數為連續變數的情形 303
13.4 模型評估示例:德國信用資料的模型評估 304

第 14 章 模型組合與兩階段模型 312
14.1 模型組合 313
14.2 隨機森林 321
14.3 兩階段模型 324

第 15 章 協同過濾 326
15.1 基於用戶(User-based)的協同過濾 327
15.2 基於物品(Item-based)的協同過濾 328
15.3 基於 SVD 的協同過濾 328
15.4 基於 Funk SVD 的協同過濾 329
15.5 協同過濾示例:動漫片推薦 331

參考文獻 337
 

詳細資料

  • ISBN:9787301299098
  • 規格:平裝 / 339頁 / 23.8 x 17 x 2.2 cm / 普通級 / 單色印刷 / 1-1
  • 出版地:中國

最近瀏覽商品

 

相關活動

  • 【其他】2024采實電子書全書系:春暖花開‧享閱讀,參展書單書85折起、任選3本79折
 

購物說明

溫馨提醒您:若您訂單中有購買簡體館無庫存/預售書或庫存於海外廠商的書籍,建議與其他商品分開下單,以避免等待時間過長,謝謝。

大陸出版品書況:因裝幀品質及貨運條件未臻完善,書況與台灣出版品落差甚大,封面老舊、出現磨痕、凹痕等均屬常態,故簡體字館除封面破損、內頁脫落...等較嚴重的狀態外,其餘所有商品將正常出貨。 

 

請注意,部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

調貨時間:若您購買海外庫存之商品,於您完成訂購後,商品原則上約45個工作天內抵台(若有將延遲另行告知)。為了縮短等待的時間,建議您將簡體書與其它商品分開訂購,以利一般商品快速出貨。 

若您具有法人身份為常態性且大量購書者,或有特殊作業需求,建議您可洽詢「企業採購」。 

退換貨說明 

會員所購買的商品均享有到貨十天的猶豫期(含例假日)。退回之商品必須於猶豫期內寄回。 

辦理退換貨時,商品必須是全新狀態與完整包裝(請注意保持商品本體、配件、贈品、保證書、原廠包裝及所有附隨文件或資料的完整性,切勿缺漏任何配件或損毀原廠外盒)。退回商品無法回復原狀者,恐將影響退貨權益或需負擔部分費用。 

訂購本商品前請務必詳閱商品退換貨原則

  • 翦商作者新作79折
  • 針灸匠張寶旬
  • 浪漫小說精選3本72折