新到貨2本75折
Python數據分析與大數據處理從入門到精通

Python數據分析與大數據處理從入門到精通

  • 定價:534
  • 優惠價:87465
  • 運送方式:
  • 臺灣與離島
  • 海外
  • 可配送點:台灣、蘭嶼、綠島、澎湖、金門、馬祖
  • 可取貨點:台灣、蘭嶼、綠島、澎湖、金門、馬祖
載入中...
  • 分享
 

內容簡介

《Python數據分析與大數據處理從入門到精通》主要講解數據分析與大數據處理所需的技術、基礎設施、核心概念、實施流程。從編程語言準備、數據採集與清洗、數據分析與視覺化,到大型數據的分散式存儲與分散式運算,貫穿了整個大數據專案開發流程。本書輕理論、重實踐,目的是讓讀者快速上手。

第1篇首先介紹了Python的基本語法、物件導向開發、模組化設計等,掌握Python的編程方式。然後介紹了多執行緒、多進程及其相互間的通信,讓讀者對分散式程式有個基本的認識。

第2篇介紹了網路數據採集、數據清洗、數據存儲等技術。

第3篇介紹了Python常用的數據分析工具,擴展了更多的數據清洗、插值方法,為最終的數據視覺化奠定基礎。

第4篇是大數據分析的重點。首先介紹了Hadoop的框架原理、調度原理,MapReduce原理與編程模型、環境搭建,接著介紹了Spark框架原理、環境搭建方式,以及如何與Hive等協力廠商工具進行交互,還介紹了最新的結構化流式處理技術。

第5篇通過三個專案實例,綜合介紹了如何分析網頁、如何搭建分散式爬蟲、如何應對常見的反爬蟲、如何設計數據模型、如何設計架構模型、如何在實踐中綜合運用前四篇涉及的技術。

本書既適合非電腦專業的編程“小白”,也適合剛畢業或即將畢業走向工作崗位的廣大畢業生,以及已經有編程經驗,但想轉行做大數據分析的專業人士。同時,還可以作為廣大職業院校、電腦培訓班的教學參考用書。
 

作者介紹

朱春旭

高級軟體工程師,長期對企業、軟體發展公司、政府機構培訓大資料開發與應用課程,對Python大資料處理與分析相關應用有深入研究,並編寫有《極客內參-大資料開發實戰》教程45篇,總共30000+字。
 

目錄

第1篇 Python程式設計
第1章 Python入門 3
1.1 Python概述 4
1.2 搭建Python開發環境 6
1.3 Python開發工具介紹 11
1.4 Python套裝軟體的管理 13
1.5 實訓:編寫“Hello World” 15
本章小結 16
第2章 Python基礎 17
2.1 變數 18
2.2 識別字 24
2.3 代碼組織 26
2.4 輸入與輸出 28
2.5 運算子與優先順序 30
2.6 新手問答 30
2.7 實訓:設計一個簡易計算器 31
本章小結 31
第3章 資料類型與流程控制 32
3.1 數位類型 33
3.2 字串類型 37
3.3 集合類型 40
3.4 流程控制語句 45
3.5 新手問答 47
3.6 實訓:設計演算法,輸出乘法表 49
本章小結 50
第4章 函數、模組、包 51
4.1 自訂函數 52
4.2 函數參數 55
4.3 函數式程式設計 58
4.4 模組與包 63
4.5 新手問答 65
4.6 實訓:設計演算法,對清單進行排序 67
本章小結 68
第5章 物件導向的程式設計 69
5.1 物件導向 70
5.2 自訂類 71
5.3 屬性 73
5.4 方法 79
5.5 類的繼承 83
5.6 可調用物件 86
5.7 不可變對象 87
5.8 新手問答 88
5.9 實訓:設計演算法,構造一棵二叉樹 90
本章小結 92
第6章 高級主題 93
6.1 生成器 94
6.2 反覆運算器 96
6.3 非同步處理 97
6.4 錯誤、調試 103
6.5 新手問答 108
6.6 實訓:使用多進程技術統計資料並匯總 109
本章小結 110

第2篇 資料獲取與資料清洗
第7章 網路資料獲取 113
7.1 HTTP請求概述 114
7.2 XPath網頁解析 114
7.3 Scrapy資料獲取入門 119
7.4 Scrapy應對反爬蟲程式 126
7.5 CrawlSpider類 131
7.6 分散式爬蟲 132
7.7 新手問答 136
7.8 實訓:構建百度雲音樂爬蟲 136
本章小結 139
第8章 數據清洗 140
8.1 資料清洗的意義 141
8.2 資料清洗的內容 141
8.3 資料格式與存儲類型 142
8.4 資料清洗的步驟 145
8.5 資料清洗的工具 147
8.6 新手問答 151
8.7 實訓:清洗百度雲音樂資料並儲存到CSV  151
本章小結 152

第3篇 資料分析與視覺化
第9章 NumPy數值計算 155
9.1 NumPy基礎 156
9.2 形狀操作 164
9.3 副本、淺拷貝和深拷貝 166
9.4 高級索引 168
9.5 排序統計 171
9.6 新手問答 173
9.7 實訓:銷售額統計  174
本章小結 175
第10章 Matplotlib視覺化 176
10.1 圖形的基本要素 177
10.2 繪圖基礎 177
10.3 設置樣式 186
10.4 圖形樣例 189
10.5 新手問答 198
10.6 實訓:營業數據視覺化 199
本章小結 201
第11章 Pandas統計分析 202
11.1 Pandas資料結構 203
11.2 基礎功能 210
11.3 統計分析 217
11.4 時間資料 229
11.5 資料整理 231
11.6 高級功能 234
11.7 讀寫MySQL資料庫 236
11.8 新手問答 237
11.9 實訓:成績分析 237
本章小結 239
第12章 Seaborn視覺化 240
12.1 Seaborn概述 241
12.2 視覺化資料關係 242
12.3 根據資料分類繪圖 246
12.4 單變數與雙變數 251
12.5 線性關係 256
12.6 新手問答 258
12.7 實訓:成績分析視覺化 258
本章小結 260

第4篇 大資料存儲與快速分析篇
第13章 Hadoop資料存儲與基本操作 263
13.1 Hadoop概述 264
13.2 Hadoop資料存儲與任務調度原理 268
13.3 Hadoop基礎環境搭建 273
13.4 Hadoop部署模式 294
13.5 Hadoop常用操作命令 298
13.6 新手問答 300
13.7 實訓:動手搭建Hadoop集群環境 301
本章小結 309
第14章 Spark入門 310
14.1 Spark概述 311
14.2 Spark核心原理 312
14.3 Spark基礎環境搭建 315
14.4 Spark運行模式 317
14.5 新手問答 321
14.6 實訓:動手搭建Spark集群 322
本章小結 323
第15章 Spark RDD程式設計 324
15.1 RDD設計原理 325
15.2 RDD程式設計 328
15.3 鍵值對RDD 335
15.4 文件讀寫 340
15.5 程式設計進階 342
15.6 新手問答 347
15.7 實訓:統計海鮮銷售情況 348
本章小結 350
第16章 Spark SQL程式設計 351
16.1 Spark SQL概述 352
16.2 創建DataFrame對象 360
16.3 DataFrame常用API 364
16.4 保存DataFrame 370
16.5 新手問答 372
16.6 實訓:統計手機銷售情況 373
本章小結 375
第17章 Spark流式計算程式設計 376
17.1 流計算簡介 377
17.2 Discretized Stream 379
17.3 Structured Streaming 385
17.4 新手問答 397
17.5 實訓:即時統計貸款金額 397
本章小結 398

第5篇 專案實戰篇
第18章 分析電商網站銷售資料 401
18.1 目標分析 402
18.2 資料獲取 405
18.3 資料分析 411
本章小結 416
第19章 分析旅遊網站資料 417
19.1 目標分析 418
19.2 資料獲取 420
19.3 資料分析 425
本章小結 429
第20章 分析在售二手房資料 430
20.1 目標分析 431
20.2 資料獲取 434
20.3 資料分析 440
本章小結 446

附錄:Python常見面試題精選 447
主要參考文獻 450
 

詳細資料

  • ISBN:9787301307656
  • 規格:平裝 / 449頁 / 16k / 19 x 26 x 2.25 cm / 普通級 / 單色印刷 / 1-1
  • 出版地:中國

最近瀏覽商品

 

相關活動

  • 高木直子新作《便當實驗室開張》!跟著高木直子一起回憶屬於她的便當記憶
 

購物說明

溫馨提醒您:若您訂單中有購買簡體館無庫存/預售書或庫存於海外廠商的書籍,建議與其他商品分開下單,以避免等待時間過長,謝謝。

大陸出版品書況:因裝幀品質及貨運條件未臻完善,書況與台灣出版品落差甚大,封面老舊、出現磨痕、凹痕等均屬常態,故簡體字館除封面破損、內頁脫落...等較嚴重的狀態外,其餘所有商品將正常出貨。 

 

請注意,部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

調貨時間:若您購買海外庫存之商品,於您完成訂購後,商品原則上約45個工作天內抵台(若有將延遲另行告知)。為了縮短等待的時間,建議您將簡體書與其它商品分開訂購,以利一般商品快速出貨。 

若您具有法人身份為常態性且大量購書者,或有特殊作業需求,建議您可洽詢「企業採購」。 

退換貨說明 

會員所購買的商品均享有到貨十天的猶豫期(含例假日)。退回之商品必須於猶豫期內寄回。 

辦理退換貨時,商品必須是全新狀態與完整包裝(請注意保持商品本體、配件、贈品、保證書、原廠包裝及所有附隨文件或資料的完整性,切勿缺漏任何配件或損毀原廠外盒)。退回商品無法回復原狀者,恐將影響退貨權益或需負擔部分費用。 

訂購本商品前請務必詳閱商品退換貨原則

  • 翦商作者新作79折
  • 針灸匠張寶旬
  • 浪漫小說精選3本72折