2025簡體週年慶
數據挖掘:實用機器學習工具與技術(原書第4版)

數據挖掘:實用機器學習工具與技術(原書第4版)

  • 定價:594
  • 優惠價:87517
  • 運送方式:
  • 臺灣與離島
  • 海外
  • 可配送點:台灣、蘭嶼、綠島、澎湖、金門、馬祖
  • 可配送點:台灣、蘭嶼、綠島、澎湖、金門、馬祖
載入中...
  • 分享
 

內容簡介

本書是數據挖掘和機器學習領域的經典暢銷教材,被國內外眾多名校選用。第4版新增了關於深度學習和概率方法的重要章節,同時,備受歡迎的機器學習軟體Weka也再度升級。書中全面覆蓋了該領域的實用技術,致力於幫助讀者理解不同技術的工作方式和應用方式,從而學會在工程實踐和商業項目中解決真實問題。

本書適合作為高等院校相關課程的教材,同時也適合業內技術人員閱讀參考。
 

作者介紹

伊恩 H.威騰(Ian H.Witten)紐西蘭懷卡托大學電腦科學系教授,ACM會士,紐西蘭皇家學會會士,曾榮獲2004年國際信息處理研究協會(1FIP)頒發的Namur獎。

埃貝·弗蘭克(Eibe Frank)紐西蘭懷卡托大學電腦科學系副教授,因Weka軟體的成功而與Witten及Hall一道獲得了2005年ACMSIGKDD服務獎。

馬克A.霍爾(Mark A.Hall)紐西蘭懷卡托大學名譽副研究員。Weka軟體的核心開發者。

克里斯多夫 J.帕爾(Christopher J.Pal)蒙特利爾工程學院副教授。研究方向包括人工智慧、電腦視覺和模式識別等。

李川,博士,副教授,四川大學資料庫與知識工程研究所所長,中國電腦學會資料庫專委會委員,中國通信學會雲計算專委會委員,SIGMOD China委員,SIGCSE China委員,YOCSEF成者DAC委員兼學術秘書。擔任《IEEE知識與數據工程會刊》等國內外10余部期刊的審稿專家,譯著包括《高效機器學習》《資料庫系統》等。
 

目錄

Data Mining: Practical Machine Learning Tools and Techniques, Fourth Edition
譯者序
前言
致謝

第一部分 數據採擷基礎
第1章 緒論 2
1.1 數據採擷和機器學習 2
1.1.1 描述結構模式 3
1.1.2 機器學習 5
1.1.3 數據採擷 6
1.2 簡單的例子:天氣問題和其他問題 6
1.2.1 天氣問題 6
1.2.2 隱形眼鏡:一個理想化的問題 8
1.2.3 鳶尾花:一個經典的數值型數據集 9
1.2.4 CPU性能:引入數值預測 10
1.2.5 勞資協商:一個更真實的例子 11
1.2.6 大豆分類:一個經典的機器學習的成功例子 12
1.3 應用領域 14
1.3.1 Web挖掘 14
1.3.2 包含判斷的決策 15
1.3.3 圖像篩選 15
1.3.4 負載預測 16
1.3.5 診斷 17
1.3.6 市場和銷售 17
1.3.7 其他應用 18
1.4 數據採擷過程 19
1.5 機器學習和統計學 20
1.6 將泛化看作搜索 21
1.6.1 枚舉概念空間 22
1.6.2 偏差 22
1.7 數據採擷和道德問題 24
1.7.1 再識別 24
1.7.2 使用個人資訊 25
1.7.3 其他問題 26
1.8 拓展閱讀及參考文獻 26
第2章 輸入:概念、實例和屬性 29
2.1 概念 29
2.2 實例 31
2.2.1 關係 31
2.2.2 其他實例類型 34
2.3 屬性 35
2.4 輸入準備 36
2.4.1 數據收集 37
2.4.2 ARFF格式 37
2.4.3 稀疏數據 39
2.4.4 屬性類型 40
2.4.5 缺失值 41
2.4.6 不正確的值 42
2.4.7 非均衡數據 42
2.4.8 瞭解數據 43
2.5 拓展閱讀及參考文獻 43
第3章 輸出:知識表達 44
3.1 表 44
3.2 線性模型 44
3.3 樹 46
3.4 規則 49
3.4.1 分類規則 49
3.4.2 關聯規則 52
3.4.3 包含例外的規則 53
3.4.4 表達能力更強的規則 54
3.5 基於實例的表達 56
3.6 聚類 58
3.7 拓展閱讀及參考文獻 59
第4章 演算法:基本方法 60
4.1 推斷基本規則 60
4.2 簡單概率模型 63
4.2.1 缺失值和數值屬性 65
4.2.2 用於文檔分類的樸素貝葉斯 67
4.2.3 討論 68
4.3 分治法:創建決策樹 69
4.3.1 計算信息量 71
4.3.2 高度分支屬性 73
4.4 覆蓋演算法:建立規則 74
4.4.1 規則與樹 75
4.4.2 一個簡單的覆蓋演算法 76
4.4.3 規則與決策清單 79
4.5 關聯規則挖掘 79
4.5.1 項集 80
4.5.2 關聯規則 81
4.5.3 高效地生成規則 84
4.6 線性模型 86
4.6.1 數值預測:線性回歸 86
4.6.2 線性分類:logistic回歸 87
4.6.3 使用感知機的線性分類 89
4.6.4 使用Winnow的線性分類 90
4.7 基於實例的學習 91
4.7.1 距離函數 92
4.7.2 高效尋找最近鄰 92
4.7.3 討論 96
4.8 聚類 96
4.8.1 基於距離的反覆運算聚類 97
4.8.2 更快的距離計算 98
4.8.3 選擇簇的個數 99
4.8.4 層次聚類 100
4.8.5 層次聚類示例 101
4.8.6 增量聚類 102
4.8.7 分類效用 104
4.8.8 討論 106
4.9 多實例學習 107
4.9.1 聚集輸入 107
4.9.2 聚集輸出 107
4.10 拓展閱讀及參考文獻 108
4.11 Weka實現 109
第5章 可信度:評估學習結果 111
5.1 訓練和測試 111
5.2 預測性能 113
5.3 交叉驗證 115
5.4 其他評估方法 116
5.4.1 留一交叉驗證法 116
5.4.2 自助法 116
5.5 超參數選擇 117
5.6 數據採擷方法比較 118
5.7 預測概率 121
5.7.1 二次損失函數 121
5.7.2 資訊損失函數 122
5.7.3 討論 123
5.8 計算成本 123
5.8.1 成本敏感分類 125
5.8.2 成本敏感學習 126
5.8.3 提升圖 126
5.8.4 ROC曲線 129
5.8.5 召回率–精確率曲線 130
5.8.6 討論 131
5.8.7 成本曲線 132
5.9 評估數值預測 134
5.10 最小描述長度原理 136
5.11 將MDL原理應用於聚類 138
5.12 使用驗證集進行模型選擇 138
5.13 拓展閱讀及參考文獻 139

第二部分 高級機器學習方案
第6章 樹和規則 144
6.1 決策樹 144
6.1.1 數值屬性 144
6.1.2 缺失值 145
6.1.3 剪枝 146
6.1.4 估計誤差率 147
6.1.5 決策樹歸納法的複雜度 149
6.1.6 從決策樹到規則 150
6.1.7 C4.5:選擇和選項 150
6.1.8 成本–複雜度剪枝 151
6.1.9 討論 151
6.2 分類規則 152
6.2.1 選擇測試的標準 152
6.2.2 缺失值和數值屬性 153
6.2.3 生成好的規則 153
6.2.4 使用全域優化 155
6.2.5 從局部決策樹中獲得規則 157
6.2.6 包含例外的規則 158
6.2.7 討論 160
6.3 關聯規則 161
6.3.1 建立頻繁模式樹 161
6.3.2 尋找大項集 163
6.3.3 討論 166
6.4 Weka 實現 167
第7章 基於實例的學習和線性模型的擴展 168
7.1 基於實例的學習 168
7.1.1 減少樣本集的數量 168
7.1.2 對雜訊樣本集剪枝 169
7.1.3 屬性加權 170
7.1.4 泛化樣本集 170
7.1.5 用於泛化樣本集的距離函數 171
7.1.6 泛化的距離函數 172
7.1.7 討論 172
7.2 擴展線性模型 173
7.2.1 最大間隔超平面 173
7.2.2 非線性類邊界
 

詳細資料

  • ISBN:9787111589167
  • 規格:平裝 / 417頁 / 16k / 19 x 26 x 2 cm / 普通級 / 單色印刷 / 1-1
  • 出版地:中國

最近瀏覽商品

 

相關活動

  • 【自然科普、電腦資訊】商業新視野:洞悉商機,提升核心競爭力,一手掌握每月最新商業趨勢!_1月新上檔
 

購物說明

溫馨提醒您:若您訂單中有購買簡體館無庫存/預售書或庫存於海外廠商的書籍,建議與其他商品分開下單,以避免等待時間過長,謝謝。

大陸出版品書況:因裝幀品質及貨運條件未臻完善,書況與台灣出版品落差甚大,封面老舊、出現磨痕、凹痕等均屬常態,故簡體字館除封面破損、內頁脫落...等較嚴重的狀態外,其餘所有商品將正常出貨。 

 

請注意,部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

調貨時間:若您購買海外庫存之商品,於您完成訂購後,商品原則上約21~30個工作天內抵台(若有將延遲另行告知)。為了縮短等待的時間,建議您將簡體書與其它商品分開訂購,以利一般商品快速出貨。 

若您具有法人身份為常態性且大量購書者,或有特殊作業需求,建議您可洽詢「企業採購」。 

退換貨說明 

會員所購買的商品均享有到貨十天的猶豫期(含例假日)。退回之商品必須於猶豫期內寄回。 

辦理退換貨時,商品必須是全新狀態與完整包裝(請注意保持商品本體、配件、贈品、保證書、原廠包裝及所有附隨文件或資料的完整性,切勿缺漏任何配件或損毀原廠外盒)。退回商品無法回復原狀者,恐將影響退貨權益或需負擔部分費用。 

訂購本商品前請務必詳閱商品退換貨原則

  • 簡體週年慶
  • 中信5折起
  • 曬書99元起