客服公告:4/17-4/18樂購日限定!百貨/影音結帳滿千再88折!詳情

  • 今日66折
  • 天天BUY
高效
  • 電子書
大數據、資料探勘與智慧運營 (電子書)
試閱
收藏試閱本 55
人收藏
適合手機 適合平板

大數據、資料探勘與智慧運營 (電子書)

  • 定價:750
  • 優惠價:350
  • 不可銷售區域:中國
載入中...

電子書閱讀軟體

支援瀏覽器說明

APP下載:

  • 分享
 

內容簡介

本書系統地介紹大資料探勘的基本概念、經典資訊算法、資訊工具和企業智慧運營應用案例,以運用大資料探勘方法提升企業運營業績與效率為主線,從運營商實際工作中選取了大量運營和銷售案例,詳細講述數據採集、資訊建模、模型落地與精準行銷的全部過程。
全書分為九章,內容包括:大資料探勘與智慧運營的概念,數據預處理,資料探勘中的四種主流算法:群集分析、分類分析、迴歸分析、關聯分析,增強型資料探勘算法,資料探勘在運營商智慧運營中的應用案例,未來大資料探勘的發展趨勢等。主要提供給運營商及其他高科技企業員工、高等院校相關專業本科生和研究生,以及其他對資料探勘與精準行銷感興趣的讀者。

 

目錄

版權資訊
內容簡介
前言
第1章 大數據、資料探勘與智慧運營綜述
1.1 資料探勘的發展史
1.1.1 資料探勘的定義與起源
1.1.2 資料探勘的早期發展
1.1.3 資料探勘的算法前傳
1.1.4 資料探勘的第一個里程碑
1.1.5 最近十年的發展與應用
1.2 資料探勘的主要流程與金字塔模型
1.2.1 資料探勘的任務
1.2.2 資料探勘的基本步驟
1.2.3 資料探勘的架構——雲計算
1.2.4 「金字塔」模型
1.3 資料探勘對智慧運營的意義
1.3.1 「互聯網+」時代的來臨及其對運營商的衝擊和挑戰
1.3.2 大數據時代的來臨及其對運營商的挑戰和機遇
1.3.3 電信運營商運營發展面臨的主要瓶頸
1.3.4 電信運營商發展的「三條曲線」
1.3.5 智慧運營與大數據變現
1.3.6 資料探勘對於提升智慧運營效率的意義
1.4 大數據時代已經來臨
1.4.1 大數據的定義
1.4.2 大數據的「4V」特徵
1.4.3 結構化數據與非結構化數據
1.5 非結構化資料探勘的研究進展
1.5.1 文字探勘
1.5.2 模式識別
1.5.2.1 模式識別概述
1.5.2.2 模式識別方法
1.5.2.3 模式識別的應用
1.5.3 語音辨識
1.5.3.1 語音辨識技術的發展
1.5.3.2 語音辨識基礎
1.5.3.3 語音辨識基本原理
1.5.3.4 聲學建模方法
1.5.3.5 語音辨識的應用
1.5.4 影片識別
1.5.4.1 影片分析方法概述
1.5.4.2 基於深度學習的影片技術
1.5.4.3 結語
1.5.5 其他非結構化資料探勘
1.5.5.1 Web資料探勘
1.5.5.2 空間群資料探勘
1.6 資料探勘與機器學習、深度學習、人工智慧及雲計算
1.6.1 機器學習
1.6.2 深度學習
1.6.3 人工智慧
1.6.4 雲計算
1.7 現有資料探勘的主要分析軟體與系統
1.7.1 Hadoop
1.7.2 Storm
1.7.3 Spark
1.7.4 SPASS(SPSS)
1.7.5 SAS
參考文獻
第2章 數據統計與數據預處理
2.1 數據屬性類型
2.1.1 數據屬性定義
2.1.2 離散屬性
2.1.3 連續屬性
2.2 數據的統計特性
2.2.1 中心趨勢度量
2.2.2 數據散佈度量
2.2.2.1 等分位數
2.2.2.2 均值
2.2.2.3 變異數與標準差
2.2.2.4 高階統計特性
2.2.3 數據相關性
2.2.3.1 卡方相關性
2.2.3.2 雙變數相關
2.2.3.3 偏相關
2.3 數據預處理
2.3.1 數據預處理概述
2.3.2 數據預處理的主要任務
2.3.3 數據清理
2.3.3.1 缺失值
2.3.3.2 噪音數據
2.3.4 數據集成
2.3.4.1 數據冗餘
2.3.4.2 元組重複
2.3.5 數據規約
2.3.5.1 主成分分析
2.3.5.2 小波變換
2.3.5.3 屬性子集選擇
2.3.6 數據變換和離散化
2.3.6.1 數據歸一化/標準化的主要方法
2.3.6.2 數據離散化的主要方法
2.4 數據字段的衍生
2.4.1 數據字段的拆分
2.4.2 統計特徵的構造
2.4.3 數據域的變換
2.5 SPSS軟體中的數據預處理案例
2.5.1 缺失值的實操處理
2.5.2 噪音數據的實操處理
2.5.3 主成分分析的實操處理
參考文獻
第3章 群集分析
3.1 概述
3.2 聚類算法的評估
3.3 基於劃分的聚類:K-means
3.3.1 基於劃分的聚類算法概述
3.3.2 K-means聚類算法原理
3.3.3 K-means算法的優勢與劣勢
3.3.4 K-means算法優化
3.3.5 SPSS軟體中的K-means算法應用案例
3.4 基於層次化的聚類:BIRCH
3.4.1 基於層次化的聚類算法概述
3.4.2 BIRCH算法的基本原理
3.4.3 BIRCH算法的優勢與劣勢
3.5 基於密度的聚類:DBSCAN
3.5.1 基於密度的聚類算法概述
3.5.2 DBSCAN算法的基本原理
3.5.3 DBSCAN算法的優勢與劣勢
3.6 基於網格的聚類:CLIQUE
3.6.1 基於網格的聚類算法概述
3.6.2 CLIQUE算法的基本原理
3.6.3 CLIQUE算法的優勢與劣勢
參考文獻
第4章 分類分析
4.1 分類分析概述
4.2 分類分析的評估
4.3 決策樹分析
4.3.1 決策樹算法的基本原理
4.3.2 CHAID決策樹
4.3.2.1 CHAID算法簡介
4.3.2.2 CHAID算法原理
4.3.2.3 CHIAD算法實例分析
4.3.3 ID3決策樹
4.3.3.1 ID3算法原理
4.3.3.2 熵和資訊增益
4.3.3.3 ID3算法偽程式碼
4.3.3.4 ID3算法的特點
4.3.3.5 ID3算法的案例分析
4.3.4 C4.5決策樹
4.3.4.1 C4.5算法原理
4.3.4.2 C4.5算法的偽程式碼
4.3.4.3 C4.5算法的特點
4.3.4.4 C4.5算法案例分析
4.3.5 CART決策樹
4.3.5.1 CART決策樹原理介紹
4.3.5.2 Gini係數
4.3.5.3 使用基尼係數進行決策樹分析案例
4.3.6 決策樹中的剪枝問題
4.3.7 決策樹在SPSS中的應用
4.4 最近鄰分析(KNN)
4.4.1 KNN算法的基本原理
4.4.2 KNN算法流程
4.4.3 KNN算法的若干問題
4.4.4 KNN分類器的特徵
4.4.5 KNN算法在SPSS中的應用
4.4.5.1 用KNN算法預測用戶是否流失
4.4.5.2 用KNN算法填充缺失值
4.5 貝葉斯分析
4.5.1 貝葉斯定理
4.5.2 樸素貝葉斯分類
4.5.2.1 條件獨立性
4.5.2.2 樸素貝葉斯分類的工作過程
4.5.2.3 樸素貝葉斯分類的特徵
4.5.2.4 樸素貝葉斯分類實例分析
4.5.3 貝葉斯網路
4.5.3.1 貝葉斯網路原理
4.5.3.2 模型表示
4.5.3.3 貝葉斯網路實例分析
4.5.3.4 BBN的特點
4.6 神經網路
4.6.1 感知器
4.6.2 多重人工神經網路
4.6.2.1 多重人工神經網路介紹
4.6.2.2 多層前饋神經網路
4.6.2.3 定義網路拓撲
4.6.3 人工神經網路的特點
4.7 支持向量機
4.7.1 支持向量機簡介
4.7.2 最大邊緣超平面
4.7.3 數據線性可分的情況
4.7.4 數據非線性可分的情況
4.7.5 支持向量機的特徵
參考文獻
第5章 迴歸分析
5.1 迴歸分析概述
5.2 一元線性回歸
5.2.1 一元線性回歸的基本原理
5.2.1.1 最小二乘法
5.2.1.2 回歸係數
5.2.2 一元線性回歸效能評估
5.2.3 SPSS軟體中一元線性回歸應用案例
5.2.3.1 一元線性迴歸分析的操作步驟
5.2.3.2 一元線性迴歸分析的結果解讀
5.3 多元線性回歸
5.3.1 多元線性回歸基本原理
5.3.2 自變數選擇方法
5.3.2.1 雙變數相關
5.3.3 SPSS軟體中的多元線性回歸應用案例
5.3.3.1 多元線性回歸預測用戶信用等級
5.3.3.2 多元線性回歸預測用戶是否流失
5.4 非線性回歸
5.4.1 非線性回歸基本原理
5.4.2 冪函數迴歸分析
5.4.3 指數迴歸分析
5.4.4 對數迴歸分析
5.4.5 多項式迴歸分析
5.4.6 非線性模型線性化和曲線回歸
5.5 邏輯迴歸
5.5.1 邏輯迴歸基本原理
5.5.1.1 Logistic函數
5.5.1.2 損失函數
5.5.1.3 梯度下降法
5.5.2 二元邏輯迴歸
5.5.3 多元邏輯迴歸
5.5.4 SPSS軟體中的邏輯迴歸應用案例
參考文獻
第6章 關聯分析
6.1 關聯分析概述
6.2 關聯分析的評估指標
6.2.1 支持度
6.2.2 信賴度
6.2.3 算法複雜度
6.3 Apriori算法
6.3.1 頻繁項集的定義與產生
6.3.2 先驗原理
6.3.3 基於支持度的計數與剪枝
6.3.4 候選項集生成
6.3.5 基於信賴度的剪枝
6.3.6 Apriori算法規則生成
6.4 FP-tree算法
6.4.1 頻繁模式樹
6.4.2 FP-tree算法頻繁項集的產生
6.4.3 FP-tree算法規則生成
6.4.4 算法效能對比與評估
6.5 SPSS Modeler關聯分析實例
參考文獻
第7章 增強型資料探勘算法
7.1 增強型資料探勘算法概述
7.1.1 組合方法的優勢
7.1.2 構建組合分類器的方法
7.2 隨機森林
7.2.1 隨機森林的原理
7.2.2 隨機森林的優缺點
7.2.3 隨機森林的泛化誤差
7.2.4 輸入特徵的選擇方法
7.3 Bagging算法
7.4 AdaBoost算法
7.4.1 AdaBoost算法簡介
7.4.2 AdaBoost算法原理
7.4.3 AdaBoost算法的優缺點
7.5 提高不平衡數據的分類準確率
7.5.1 不平衡數據
7.5.1.1 不平衡數據的介紹
7.5.1.2 不平衡數據分類問題的難點
7.5.2 不平衡數據的處理方法——數據層面
7.5.2.1 過抽樣
7.5.2.2 欠抽樣
7.5.3 不平衡數據的處理方法——算法層面
7.6 遷移學習
7.6.1 遷移學習的基本原理
7.6.2 遷移學習的分類
7.6.3 遷移學習與資料探勘
7.6.4 遷移學習的發展
參考文獻
第8章 資料探勘在運營商智慧運營中的應用
8.1 概述
8.2 單個業務的精準行銷——合約機外呼行銷
8.2.1 總結歷史行銷規律
8.2.2 預測潛在客戶群體
8.2.3 客戶群體細分
8.2.4 制定層次化、個性化精準行銷方案
8.3 多種互聯網業務的精準推送
8.3.1 根據歷史行銷規律總結單個業務的歷史行銷規律
8.3.2 預測潛在客戶群體、預測單個業務的潛在客戶群體及多個業務的聯合建模
8.3.3 制定多業務層次化個性化聯合精準行銷方案
8.3.4 落地效果評估
8.4 套餐精準適配
8.4.1 痛點
8.4.2 資訊潛在客戶群體
8.4.3 探尋強相關字段
8.4.4 多元線性回歸建模
8.4.5 制定層次化、個性化精準行銷方案
8.4.6 落地效果評估與模型調優
8.5 客戶保有
8.5.1 總結客戶流失的歷史規律
8.5.2 細分潛在流失客戶群體
8.5.3 客戶保有效益建模與最優決策
8.5.4 落地效果評估
8.6 投訴預警
8.6.1 客戶投訴現象分析
8.6.2 資訊潛在客戶群體
8.6.3 制定個性化關懷方案
8.7 網路質量柵格化呈現
8.7.1 柵格化呈現的基本原理
8.7.2 覆蓋柵格化
8.7.3 基於流量聚叢集的網路優化策略
8.8 無線室內定位
8.8.1 傳統室內定位方法
8.8.2 基於Wi-Fi信號的指紋定位算法
8.8.3 基於資料探勘算法的改進定位方法
8.8.3.1 基於主成分分析和聚類的定位算法
8.8.3.2 基於四叉樹的定位算法
參考文獻
第9章 面向未來大數據的資料探勘與機器學習發展趨勢
9.1 大數據時代資料探勘與機器學習面臨的新挑戰
9.2 IEEE ICDM會議資料探勘與機器學習的最新研究進展
9.3 「電腦奧運會」——Sort Benchmark
參考文獻

 

詳細資料

  • ISBN:9789865162436
  • 規格:普通級
  • 出版地:台灣
  • 檔案格式:EPUB流動版型
  • 建議閱讀裝置:手機、平板
  • TTS語音朗讀功能:無
  • 檔案大小:63.8MB

最近瀏覽

 

相關活動

  • 【理想人生的時間解壓術】高效生活電子書展,特價再88折、精選雙書85折
 

購物說明

使用博客來電子書服務即為同意『 博客來電子書服務條款』請詳見客服中心說明

自備暢通的網際網路連線及符合博客來支援的行動裝置、電腦作為閱讀工具如下:

瀏覽器閱讀:無需安裝,即可閱讀。支援瀏覽器Chrome、Safari(建議升級至最新版)。

APP閱讀:支援IOS11及Android5.1以上系統。

容量建議:建議裝置需具備2G以上的 RAM。

若因個人裝置因素(如:其他應用程式衝突、裝置記憶體不足),無法使用博客來電子書閱讀服務或影響服務效能,需自行進行排除待符合博客來支援項目再行閱讀。

電子書、 電子雜誌因版本屬性因素,恕無法比照紙本書籍提供MP3、DVD實體光碟,亦無提供相關影音檔案下載,請先確認無此需求再行下單購買。

退換貨說明

電子書購買前請務必先行試閱,不提供10天的猶豫期。

下列商品購買後博客來不提供10天的猶豫期,請務必詳閱商品說明並再次確認確有購買該項商品之需求及意願時始下單購買,有任何疑問並請先聯繫博客來客服詢問:

1.易於腐敗、保存期限較短或解約時即將逾期。
2.客製化之商品。
3.報紙、期刊或雜誌。
4.經消費者拆封之影音商品或電腦軟體。
5.下載版軟體、資訊及電子書
6.涉及個人衛生,並經消費者拆封之商品,如:內衣褲、刮鬍刀…等。
7.藝文展覽票券、藝文表演票券。