新到貨2本75折
統計分析:從小數據到大數據

統計分析:從小數據到大數據

  • 定價:474
  • 運送方式:
  • 臺灣與離島
  • 海外
  • 可配送點:台灣、蘭嶼、綠島、澎湖、金門、馬祖
  • 可取貨點:台灣、蘭嶼、綠島、澎湖、金門、馬祖
載入中...
  • 分享
 

內容簡介

面對小資料和大資料,資料分析師應該如何收集資料資訊?傳統的業務框架如何與統計學相關聯?測量學扮演著什麼角色?建模過程有哪些預分析技術和修正技術?建模工作完成後,如何解析?如何歸因?如何預測?等等,這些資料分析能力構成了本書的分析框架。

本書分為8章,小資料與大資料分析模式的動態切換貫穿全書,展示了資料分析案例的模組化分析思路。第1~3章為資料預分析部分,強調業務問題與統計問題的銜接;第4~6章為統計建模階段,其中附有對行業案例和業務敏感度的訓練、對統計和業務整合的審美建議,進而構造出一套具有靈活調校的資料分析模式。第7~8章解決的問題是,如何將晦澀難懂的統計解釋轉換成業務解釋。由衷地希望本書能夠成為資料運營人員與初中級數據分析師分析資料的行動指南。
 

作者介紹

丁亞軍
 
自由職業者,兼CDA資料科學研究院研究員、電子工業出版社大資料專家委員會成員、學習路徑圖國際技術中心顧問、經管之家培訓中心講師。研究方向:統計軟體與資料分析、市場調查研究、電商CRM資料採擷、銀行申請與行為評分卡。
 

目錄

第1部分 資料分析準備

第1章 從業務到統計
1.1 業務需求從哪來 / 002
1.1.1 學習業務的最快途徑:閱讀運營報告 / 002
1.1.2 當務之急:研究痛點 / 004
1.1.3 資料分析之錨:未來戰略方向 / 005
1.1.4 對資料分析“小白”的有益建議 / 005
1.2 從小資料到大資料:資料體量與資訊分佈 / 008
1.2.1 實驗室:理論驗證 / 009
1.2.2 問卷:理論驗證 探索 / 011
1.2.3 資料庫:業務驗證 探索 / 012
1.2.4 資料資訊與統計模型 / 013
1.2.5 演算法應用:是否跨界 / 015
1.2.6 演算法特徵:角色 / 016
1.3 資料分析流程的啟示 / 019
1.3.1 假設:驗證與歸因 / 021
1.3.2 小概率:黑天鵝的不確定 / 025
1.3.3 抽樣技術:經濟是根本 / 026
1.3.4 選擇模型:方法論 / 028
1.3.5 顯著性判斷:可證偽 / 029

第2章 變數角色與描述
2.1 如何描述變數 / 032
2.1.1 分類變數與連續變數的分界線 / 032
2.1.2 分類變數及視覺化 / 033
2.1.3 連續變數及視覺化 / 037
2.2 因變數的測量 / 040
2.2.1 測量級別問題 / 040
2.2.2 是否存在測量誤差 / 045
2.2.3 誰會成為“主角” / 047
2.2.4 y 的量化場景 / 050
2.3 引數的選擇 / 053
2.3.1 驗證性:x 的選擇 / 054
2.3.2 探索性:x 的選擇 / 054

第3章 資料預分析
3.1 填補缺失 / 056
3.1.1 描述缺失資料:行、列、儲存格 / 056
3.1.2 缺失類型:隨機性 / 060
3.1.3 小資料填補方案:精確性探討 / 061
3.1.4 大資料填補方案:速度問題探討 / 068
3.2 處理異常值 / 069
3.2.1 單變數與雙變數異常 / 069
3.2.2 無監督異常:聚類分析 / 070
3.2.3 監督異常:回歸殘差分析 / 073
3.2.4 小資料與大資料如何看待異常值 / 076
3.3 消除共線性 / 080
3.3.1 共線性及其危害 / 081
3.3.2 小資料的方案:嶺回歸 / 082
3.3.3 大資料方案:專案合併與逐步回歸 / 084
3.4 內生性問題 / 088
3.4.1 內生性及其危害 / 088
3.4.2 問題核心:特徵選擇 / 089
3.4.3 三駕馬車之一:資料庫的應對策略 / 094
3.5 變數變換技術 / 102
3.5.1 正態分佈變換:對數變換 / 102
3.5.2 從0 到1:老闆最喜歡的符號% / 104
3.5.3 強異常值:秩的應用 / 105
3.5.4 量綱:標準化變換 / 106
3.6 編碼技術 / 107
3.6.1 為什麼需要分箱化 / 107
3.6.2 分箱技術要義:數據拐點 / 111
3.7 避免過擬合 / 113
3.7.1 導致過擬合:行列問題 / 113
3.7.2 小資料為什麼不談過擬合 / 114
3.7.3 避免過擬合:方法學 / 115

第2部分 構建模型與修正技術

第4章 線性回歸與統計家族
4.1 差異性問題:方差分析 / 121
4.1.1 差異的來源:主效應 / 121
4.1.2 差異的來源:交互效應 / 128
4.1.3 交互性解釋:交互效應圖製作 / 129
4.2 結構性問題:回歸分析 / 131
4.2.1 回歸分析流程 / 131
4.2.2 相關的風向標作用:文氏圖 / 135
4.2.3 偏相關的歸因:仲介和調節 / 137
4.2.4 回歸係數解釋:偏回歸圖 / 142
4.2.5 如何相信R2 / 149
4.2.6 以殘差看假設 / 152
4.2.7 殘差信息的有和無 / 158
4.2.8 小資料需求歸納:重結構輕預測 / 158
4.3 演算法進化REG:小資料專家的努力 / 159
4.3.1 演算法1.0:精確度 結構 / 160
4.3.2 演算法2.0:精確度 結構與預測 / 163
4.3.3 演算法3.0:速度 預測 / 164
4.3.4 演算法4.0:加速度 / 167

第5章 Logistic 回歸與統計家族
5.1 預測性問題:Logistic 回歸 / 168
5.1.1 卡方的風向標作用 / 169
5.1.2 不一樣的R2:預測分類表 / 170
5.1.3 回歸係數解釋:or 值與rr 值 / 171
5.1.4 修正技術:是x 而不是y / 174
5.1.5 大資料需求歸納:輕結構重預測 / 177
5.2 演算法進化Logistic:大資料與智慧 / 178
5.2.1 演算法1.0:穩定性 結構 / 178
5.2.2 演算法2.0:穩定性 結構與預測 / 179
5.2.3 演算法3.0:速度 預測 / 179
5.2.4 演算法4.0:加速度 / 179
5.3 演算法3.0 的榜樣:神經網路 / 180
5.3.1 神經網路演算法 / 180
5.3.2 DM 演算法預分析 / 183
5.3.3 基於神經網路的常規應用 / 185

第6章 降維技術
6.1 主成分回歸與壓縮技術 / 192
6.1.1 四駕馬車:實驗室、問卷、資料庫、雲 / 192
6.1.2 主成分演算法:降維 / 192
6.1.3 主成分與因數:誰應該有名字? / 194
6.1.4 主成分回歸:“回歸 回歸”模式 / 196
6.2 對應分析:一個市場調查案例 / 197
6.2.1 案例背景介紹 / 197
6.2.2 模型預分析 / 199
6.2.3 構建模型:“廣義”雙標圖 / 203
6.2.4 結論及行銷 / 214

第3部分 模型應用與評估

第7章 回歸類模型應用
7.1 結構性問題:偏回歸係數 / 216
7.1.1 單結構:偏的意義 / 216
7.1.2 整體結構:條件規則 / 217
7.2 預測性問題:估計值 / 217
7.2.1 老樣本預測:內衍與市場細分 / 218
7.2.2 新樣本預測:外推與潛在行為 / 219
7.3 模型優劣與模型評價 / 219
7.3.1 R2 變形記 / 219
7.3.2 圖示R2:R2 圖與ROC 曲線 / 221
7.4 模型優劣與業務評價 / 221
7.4.1 小資料的標準:R2 / 221
7.4.2 大資料的標準:老闆 / 222

第8章 資料分析報告
8.1 視覺化圖形製作 / 223
8.1.1 橫條圖與折線圖 / 223
8.1.2 頻數與分佈 / 223
8.1.3 多變箱體圖 / 224
8.1.4 散點圖與氣泡圖 / 225
8.2 圖形製作與格式 / 227
8.2.1 圖形製作:繪圖、顏色 / 227
8.2.2 圖形範本製作與調用 / 229
8.3 表格製作與格式 / 230
8.3.1 表格製作:製錶、格式 / 230
8.3.2 表格範本製作與調用 / 232
8.3.3 OMS 控制台 / 234

附錄A 資料集
 

詳細資料

  • ISBN:9787121377532
  • 規格:平裝 / 240頁 / 16k / 19 x 26 x 1.2 cm / 普通級 / 單色印刷 / 1-1
  • 出版地:中國

最近瀏覽商品

 

相關活動

  • 破關人生,I'm in!職場「破」力養成指南,電子書/有聲書/影音課程6折起
 

購物說明

溫馨提醒您:若您訂單中有購買簡體館無庫存/預售書或庫存於海外廠商的書籍,建議與其他商品分開下單,以避免等待時間過長,謝謝。

大陸出版品書況:因裝幀品質及貨運條件未臻完善,書況與台灣出版品落差甚大,封面老舊、出現磨痕、凹痕等均屬常態,故簡體字館除封面破損、內頁脫落...等較嚴重的狀態外,其餘所有商品將正常出貨。 

 

請注意,部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

調貨時間:若您購買海外庫存之商品,於您完成訂購後,商品原則上約45個工作天內抵台(若有將延遲另行告知)。為了縮短等待的時間,建議您將簡體書與其它商品分開訂購,以利一般商品快速出貨。 

若您具有法人身份為常態性且大量購書者,或有特殊作業需求,建議您可洽詢「企業採購」。 

退換貨說明 

會員所購買的商品均享有到貨十天的猶豫期(含例假日)。退回之商品必須於猶豫期內寄回。 

辦理退換貨時,商品必須是全新狀態與完整包裝(請注意保持商品本體、配件、贈品、保證書、原廠包裝及所有附隨文件或資料的完整性,切勿缺漏任何配件或損毀原廠外盒)。退回商品無法回復原狀者,恐將影響退貨權益或需負擔部分費用。 

訂購本商品前請務必詳閱商品退換貨原則

  • 翦商作者新作79折
  • 針灸匠張寶旬
  • 浪漫小說精選3本72折