新到貨2本75折
深入淺出Python機器學習

深入淺出Python機器學習

  • 定價:414
  • 優惠價:87360
  • 運送方式:
  • 臺灣與離島
  • 海外
  • 可配送點:台灣、蘭嶼、綠島、澎湖、金門、馬祖
  • 可取貨點:台灣、蘭嶼、綠島、澎湖、金門、馬祖
載入中...
  • 分享
 

內容簡介

機器學習正在迅速改變我們的世界。我們幾乎每天都會讀到機器學習如何改變日常的生活。如果你在電子商務網站購買商品,或者在愛奇藝或是騰訊視頻這樣的視頻網站觀看節目,甚至只是進行一次百度搜索,就已經觸碰到了機器學習的應用。使用這些服務的用戶會產生數據,這些數據會被收集,在進行預處理之後用來訓練模型,而模型會通過這些數據來提供更好的用戶體驗。此外,目前還有很多使用機器學習技術的產品或服務即將在我們的生活當中普及,如能夠解放雙手的無人駕駛汽車、聰明伶俐的智能家居產品、善解人意的導購機器人等。

可以說要想深入機器學習的應用開發當中,現在就是一個非常理想的時機。本書內容涵蓋了有監督學習、無監督學習、模型優化、自然語言處理等機器學習領域所必須掌握的知識,從內容結構上非常注重知識的實用性和可操作性。全書採用由淺入深、循序漸進的講授方式,完全遵循和尊重初學者對機器學習知識的認知規律。本書適合有一定程序設計語言和演算法基礎的讀者學習使用。


 

作者介紹

段小手,君兮科技創始人,畢業於北京大學。具有10余年國內一線互聯網/電子商務公司項目管理經驗。其負責的跨境電子商務項目曾獲得「國家發改委電子商務示範項目」「中關村現代服務業試點項目」「北京市信息化基礎設施提升項目」「北京市外貿綜合公共平台」等專項政策支持。目前重點研究領域為機器學習和深度學習等方面。
 

目錄

第1章 概 述
1.1 什麼是機器學習——從一個小故事開始 / 002
1.2 機器學習的一些應用場景——蝙蝠公司的業務單元 / 003
1.3 機器學習應該如何入門——世上無難事 / 005
1.4 有監督學習與無監督學習 / 007
1.5 機器學習中的分類與回歸 / 008
1.6 模型的泛化、過擬合與欠擬合 / 008
1.7 小結 / 009

第2章 基於Python語言的環境配置
2.1 Python的下載和安裝 / 012
2.2 Jupyter Notebook的安裝與使用方法 / 013
2.2.1 使用pip進行Jupyter Notebook的下載和安裝 / 013
2.2.2 運行Jupyter Notebook / 014
2.2.3 Jupyter Notebook的使用方法 / 015
2.3 一些必需庫的安裝及功能簡介 / 017
2.3.1 Numpy——基礎科學計算庫 / 017
2.3.2 Scipy——強大的科學計算工具集 / 018
2.3.3 pandas——資料分析的利器 / 019
2.3.4 matplotlib——畫出優美的圖形 / 020
2.4 scikit-learn——非常流行的Python機器學習庫 / 021
2.5 小結 / 022

第3章 K最近鄰演算法——近朱者赤,近墨者黑
3.1 K最近鄰演算法的原理 / 024
3.2 K最近鄰演算法的用法 / 025
3.2.1 K最近鄰演算法在分類任務中的應用 / 025
3.2.2 K最近鄰演算法處理多元分類任務 / 029
3.2.3 K最近鄰演算法用於回歸分析 / 031
3.3 K最近鄰演算法專案實戰——酒的分類 / 034
3.3.1 對資料集進行分析 / 034
3.3.2 生成訓練資料集和測試資料集 / 036
3.3.3 使用K最近鄰演算法進行建模 / 038
3.3.4 使用模型對新樣本的分類進行預測 / 039
3.4 小結 / 041

第4章 廣義線性模型——“耿直”的演算法模型
4.1 線性模型的基本概念 / 044
4.1.1 線性模型的一般公式 / 044
4.1.2 線性模型的圖形表示 / 045
4.1.3 線性模型的特點 / 049
4.2 最基本的線性模型——線性回歸 / 050
4.2.1 線性回歸的基本原理 / 050
4.2.2 線性回歸的性能表現 / 051
4.3 使用L2正則化的線性模型——嶺回歸 / 053
4.3.1 嶺回歸的原理 / 053
4.3.2 嶺回歸的參數調節 / 054
4.4 使用L1正則化的線性模型——套索回歸 / 058
4.4.1 套索回歸的原理 / 058
4.4.2 套索回歸的參數調節 / 059
4.4.3 套索回歸與嶺回歸的對比 / 060
4.5 小結 / 062

第5章 樸素貝葉斯——打雷啦,收衣服啊
5.1 樸素貝葉斯基本概念 / 064
5.1.1 貝葉斯定理 / 064
5.1.2 樸素貝葉斯的簡單應用 / 064
5.2 樸素貝葉斯演算法的不同方法 / 068
5.2.1 貝努利樸素貝葉斯 / 068
5.2.2 高斯樸素貝葉斯 / 071
5.2.3 多項式樸素貝葉斯 / 072
5.3 樸素貝葉斯實戰——判斷腫瘤是良性還是惡性 / 075
5.3.1 對資料集進行分析 / 076
5.3.2 使用高斯樸素貝葉斯進行建模 / 077
5.3.3 高斯樸素貝葉斯的學習曲線 / 078
5.4 小結 / 080

第6章 決策樹與隨機森林——會玩讀心術的演算法
6.1 決策樹 / 082
6.1.1 決策樹基本原理 / 082
6.1.2 決策樹的構建 / 082
6.1.3 決策樹的優勢和不足 / 088
6.2 隨機森林 / 088
6.2.1 隨機森林的基本概念 / 089
6.2.2 隨機森林的構建 / 089
6.2.3 隨機森林的優勢和不足 / 092
6.3 隨機森林實例——要不要和相親物件進一步發展 / 093
6.3.1 資料集的準備 / 093
6.3.2 用get_dummies處理資料 / 094
6.3.3 用決策樹建模並做出預測 / 096
6.4 小結 / 098

第7章 支援向量機SVM——專治線性不可分
7.1 支持向量機SVM基本概念 / 100
7.1.1 支持向量機SVM的原理 / 100
7.1.2 支援向量機SVM的核函數 / 102
7.2 SVM的核函數與參數選擇 / 104
7.2.1 不同核函數的SVM對比 / 104
7.2.2 支持向量機的gamma參數調節 / 106
7.2.3 SVM演算法的優勢與不足 / 108
7.3 SVM實例——波士頓房價回歸分析 / 108
7.3.1 初步瞭解資料集 / 109
7.3.2 使用SVR進行建模 / 110
7.4 小結 / 114

第8章 神經網路——曾入“冷宮”,如今得寵
8.1 神經網路的前世今生 / 116
8.1.1 神經網路的起源 / 116
8.1.2 第一個感知器學習法則 / 116
8.1.3 神經網路之父——傑弗瑞•欣頓 / 117
8.2 神經網路的原理及使用 / 118
8.2.1 神經網路的原理 / 118
8.2.2 神經網路中的非線性矯正 / 119
8.2.3 神經網路的參數設置 / 121
8.3 神經網路實例——手寫辨識 / 127
8.3.1 使用MNIST資料集 / 128
8.3.2 訓練MLP神經網路 / 129
8.3.3 使用模型進行數位識別 / 130
8.4 小結 / 131

第9章 資料預處理、降維、特徵提取及聚類——快刀斬亂麻
9.1 數據預處理 / 134
9.1.1 使用StandardScaler進行資料預處理 / 134
9.1.2 使用MinMaxScaler進行資料預處理 / 135
9.1.3 使用RobustScaler進行資料預處理 / 136
9.1.4 使用Normalizer進行資料預處理 / 137
9.1.5 通過資料預處理提高模型準確率 / 138
9.2 數據降維 / 140
9.2.1 PCA主成分分析原理 / 140
9.2.2 對資料降維以便於進行視覺化 / 142
9.2.3 原始特徵與PCA主成分之間的關係 / 143
9.3 特徵提取 / 144
9.3.1 PCA主成分分析法用於特徵提取 / 145
9.3.2 非負矩陣分解用於特徵提取 / 148
9.4 聚類演算法 / 149
9.4.1 K均值聚類演算法 / 150
9.4.2 凝聚聚類演算法 / 153
9.4.3 DBSCAN演算法 / 154
9.5 小結 / 157

第10章 資料表達與特徵工程——錦上再添花
10.1 資料表達 / 160
10.1.1 使用啞變數轉化類型特徵 / 160
10.1.2 對資料進行裝箱處理 / 162
10.2 數據“升維” / 166
10.2.1 向資料集添加互動式特徵 / 166
10.2.2 向資料集添加多項式特徵 / 170
10.3 自動特徵選擇 / 173
10.3.1 使用單一變數法進行特徵選擇 / 173
10.3.2 基於模型的特徵選擇 / 178
10.3.3 反覆運算式特徵選擇 / 180
10.4 小結 / 182

第11章 模型評估與優化……
11.1 使用交叉驗證進行模型評估 / 184
11.1.1 scikit-learn中的交叉驗證法 / 184
11.1.2 隨機拆分和“挨個兒試試” / 186
11.1.3 為什麼要使用交叉驗證法 / 188
11.2 使用網格搜索優化模型參數 / 188
11.2.1 簡單網格搜索 / 189
11.2.2 與交叉驗證結合的網格搜索 / 191
11.3 分類模型的可信度評估 / 193
11.3.1 分類模型中的預測準確率 / 194
11.3.2 分類模型中的決定係數 / 197
11.4 小結 / 198

第12章 建立演算法的管道模型——團結就是力量
12.1 管道模型的概念及用法 / 202
12.1.1 管道模型的基本概念 / 202
12.1.2 使用管道模型進行網格搜索 / 206
12.2 使用管道模型對股票漲幅進行回歸分析 / 209
12.2.1 資料集準備 / 209
12.2.2 建立包含預處理和MLP模型的管道模型 / 213
12.2.3 向管道模型添加特徵選擇步驟 / 214
12.3 使用管道模型進行模型選擇和參數調優 / 216
12.3.1 使用管道模型進行模型選擇 / 216
12.3.2 使用管道模型尋找更優參數 / 217
12.4 小結 / 220

第13章 文本資料處理——親,見字如“數”
13.1 文本資料的特徵提取、中文分詞及詞袋模型 / 222
13.1.1 使用CountVectorizer對文本進行特徵提取 / 222
13.1.2 使用分詞工具對中文文本進行分詞 / 223
13.1.3 使用詞袋模型將文本資料轉為陣列 / 224
13.2 對文本資料進一步進行優化處理 / 226
13.2.1 使用n-Gram改善詞袋模型 / 226
13.2.2 使用tf-idf模型對文本資料進行處理 / 228
13.2.3 刪除文本中的停用詞 / 234
13.3 小結 / 236

第14章 從資料獲取到話題提取——從“研究員”到“段子手”
14.1 簡單頁面的爬取 / 238
14.1.1 準備Requests庫和User Agent / 238
14.1.2 確定一個目標網站並分析其結構 / 240
14.1.3 進行爬取並保存為本地檔 / 241
14.2 稍微複雜一點的爬取 / 244
14.2.1 確定目標頁面並進行分析 / 245
14.2.2 Python中的規則運算式 / 247
14.2.3 使用BeautifulSoup進行HTML解析 / 251
14.2.4 對目標頁面進行爬取並保存到本地 / 256
14.3 對文本資料進行話題提取 / 258
14.3.1 尋找目標網站並分析結構 / 259
14.3.2 編寫爬蟲進行內容爬取 / 261
14.3.3 使用潛在狄利克雷分佈進行話題提取 / 263
14.4 小結 / 265

第15章 人才需求現狀與未來學習方向——你是不是下一個“大牛”
15.1 人才需求現狀 / 268
15.1.1 全球AI從業者達190萬,人才需求3年翻8倍 / 268
15.1.2 AI人才需求集中於一線城市,七成從業者月薪過萬 / 269
15.1.3 人才困境仍難緩解,政策支援亟不可待 / 269
15.2 未來學習方向 / 270
15.2.1 用於大資料分析的計算引擎 / 270
15.2.2 深度學習開源框架 / 271
15.2.3 使用概率模型進行推理 / 272
15.3 技能磨煉與實際應用 / 272
15.3.1 Kaggle演算法大賽平臺和OpenML平臺 / 272
15.3.2 在工業級場景中的應用 / 273
15.3.3 對演算法模型進行A/B測試 / 273
15.4 小結 / 274

參考文獻 / 275
 

詳細資料

  • ISBN:9787302503231
  • 規格:平裝 / 274頁 / 23.4 x 16.8 x 1.6 cm / 普通級 / 單色印刷 / 1-1
  • 出版地:中國

最近瀏覽商品

 

相關活動

  • 現代出版,由此開始。商務印書館暢銷展,精選滿888現折88。
 

購物說明

溫馨提醒您:若您訂單中有購買簡體館無庫存/預售書或庫存於海外廠商的書籍,建議與其他商品分開下單,以避免等待時間過長,謝謝。

大陸出版品書況:因裝幀品質及貨運條件未臻完善,書況與台灣出版品落差甚大,封面老舊、出現磨痕、凹痕等均屬常態,故簡體字館除封面破損、內頁脫落...等較嚴重的狀態外,其餘所有商品將正常出貨。 

 

請注意,部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

調貨時間:若您購買海外庫存之商品,於您完成訂購後,商品原則上約45個工作天內抵台(若有將延遲另行告知)。為了縮短等待的時間,建議您將簡體書與其它商品分開訂購,以利一般商品快速出貨。 

若您具有法人身份為常態性且大量購書者,或有特殊作業需求,建議您可洽詢「企業採購」。 

退換貨說明 

會員所購買的商品均享有到貨十天的猶豫期(含例假日)。退回之商品必須於猶豫期內寄回。 

辦理退換貨時,商品必須是全新狀態與完整包裝(請注意保持商品本體、配件、贈品、保證書、原廠包裝及所有附隨文件或資料的完整性,切勿缺漏任何配件或損毀原廠外盒)。退回商品無法回復原狀者,恐將影響退貨權益或需負擔部分費用。 

訂購本商品前請務必詳閱商品退換貨原則

  • 翦商作者新作79折
  • 針灸匠張寶旬
  • 浪漫小說精選3本72折