• 開學書展
  • 今日66折
  • 天天BUY
新到貨2本75折
電腦視覺度量:從特徵描述到深度學習

電腦視覺度量:從特徵描述到深度學習

  • 定價:888
  • 優惠價:87773
  • 運送方式:
  • 臺灣與離島
  • 海外
  • 可配送點:台灣、蘭嶼、綠島、澎湖、金門、馬祖
  • 可取貨點:台灣、蘭嶼、綠島、澎湖、金門、馬祖
載入中...
 

內容簡介

全面介紹了電腦視覺中被廣泛使用的各種方法,包括局部特徵描述子、區域描述子、全域特徵描述子以及評價這些內容的度量方法和分類方法,並用將近一半的篇幅重點介紹了基於深度學習的特徵學習方法,以及FNN、RNN和BFN三類深度學習架構的特點。

本書內容豐富、前沿,強調理論分析,旨在探討各種電腦視覺研究方法背後的技術和原理,同時也探討了深度學習與神經科學之間的關係,展望了未來深度神經網路的發展方向。

本書用專門一章講解了電腦視覺流程和演算法的優化,通過汽車識別、人臉檢測、圖像分類和增強現實等實例具體探討了硬體優化和軟體優化的方法。

本書每章末尾都配有相應的思考題,附錄給出了許多有效的實踐資源和一些有用的分析,同時提供了原始程式碼,既適合高校電腦視覺課程的教學,也適合從事電腦視覺的研究人員和工程技術人員參考使用。
 

作者介紹

Scott Krig是電腦成像學、電腦視覺和圖形視覺化方面的先驅。他在1988年成立了Krig Research公司,該公司提供了基於高性能工程工作站、超級電腦和專有硬體的成像和視覺系統,並為來自全球25個國家的客戶提供服務。

近年來,Scott主要為大型公司和服務於商業市場的初創公司提供服務,説明它們解決電腦視覺、圖形成像、視覺化、機器人、程式控制、工業自動化以及成像學和機器視覺在電子消費品(如筆記型電腦、手機和平板電腦)方面的應用問題。

Scott也是全球範圍的許多專利應用的發明人,並在斯坦福大學做過研究。

劉波,副教授(博士),重慶工商大學電腦科學與資訊工程學院教師,主要從事機器學習理論、電腦視覺技術研究,同時愛好Hadoop和Spark平臺上的大資料分析。
 

目錄

第 1章 圖像的獲取和表示1
1.1 圖像感測器技術 1
1.1.1 感測器材料 2
1.1.2 感測器光電二極體元件 3
1.1.3 感測器配置:馬賽克、Foveon和BSI 3
1.1.4 動態範圍、雜訊和超解析度 4
1.1.5 感測器處理 5
1.1.6 去馬賽克 5
1.1.7 壞圖元校正 5
1.1.8 色彩和光照校正 6
1.1.9 幾何校正 6
1.2 照相機和計算成像 6
1.2.1 計算成像概述 7
1.2.2 單圖元可計算相機 7
1.2.3 二維可計算照相機 8
1.2.4 三維深度的照相機系統 9
1.3 三維深度處理 18
1.3.1 方法概述 18
1.3.2 深度感知和處理中存在的問題 18
1.3.3 單目深度處理 23
1.4 三維表示:體元、深度圖、網格和點雲 26
1.5 總結 27
1.6 習題 27

第 2章 圖像預處理 29
2.1 影像處理概述 29
2.2 圖像預處理要解決的問題 29
2.2.1 電腦視覺的流程和圖像預處理 30
2.2.2 圖像校正 31
2.2.3 圖像增強 31
2.2.4 為特徵提取準備圖像 32
2.3 影像處理方法分類 36
2.3.1 點運算 36
2.3.2 直線運算 36
2.3.3 區域運算 37
2.3.4 演算法 37
2.3.5 資料轉換 37
2.4 色彩學 37
2.4.1 色彩管理系統概述 38
2.4.2 光源、白點、黑點和中性軸 38
2.4.3 設備色彩模型 39
2.4.4 色彩空間與色彩感知 39
2.4.5 色域映射與渲染的目標 40
2.4.6 色彩增強的實際考慮 41
2.4.7 色彩的準確度與精度 41
2.5 空間濾波 41
2.5.1 卷積濾波與檢測 41
2.5.2 核濾波與形狀選擇 43
2.5.3 點濾波 44
2.5.4 雜訊與偽像濾波 45
2.5.5 積分圖與方框濾波器 46
2.6 邊緣檢測器 46
2.6.1 核集合 47
2.6.2 Canny檢測器 48
2.7 變換濾波、Fourier變換及其他 48
2.7.1 Fourier變換 48
2.7.2 其他變換 50
2.8 形態學與分割 51
2.8.1 二值形態學 51
2.8.2 灰度和彩色形態學 52
2.8.3 形態學優化和改進 53
2.8.4 歐氏距離映射 53
2.8.5 超圖元分割 53
2.8.6 深度圖分割 54
2.8.7 色彩分割 55
2.9 閾值化 55
2.9.1 全域閾值化 56
2.9.2 局部閾值化 59
2.10 總結 60
2.11 習題 60

第3章 全域特徵和區域特徵 63
3.1 視覺特徵的歷史概述 63
3.1.1 全域度量、區域度量和局部度量的核心思想 64
3.1.2 紋理分析 65
3.1.3 統計方法 68
3.2 紋理區域度量 68
3.2.1 邊緣度量 69
3.2.2 互相關性和自相關性 70
3.2.3 Fourier譜、小波和基簽名 71
3.2.4 共生矩陣、Haralick特徵 71
3.2.5 Laws紋理度量 78
3.2.6 LBP局部二值模式 79
3.2.7 動態紋理 80
3.3 統計區域度量 81
3.3.1 圖像矩特徵 81
3.3.2 點度量特徵 81
3.3.3 全域長條圖 83
3.3.4 局部區域長條圖 83
3.3.5 散點圖、3D長條圖 84
3.3.6 多解析度、多尺度長條圖 85
3.3.7 徑向長條圖 87
3.3.8 輪廓或邊緣長條圖 87
3.4 基空間度量 88
3.4.1 Fourier描述 90
3.4.2 Walsh-Hadamard變換 90
3.4.3 HAAR變換 91
3.4.4 斜變換 91
3.4.5 Zernike多項式 91
3.4.6 導向濾波器 92
3.4.7 Karhunen-Loeve變換與Hotelling變換 93
3.4.8 小波變換和Gabor濾波器 93
3.4.9 Hough變換與Radon變換 95
3.5 總結 96
3.6 習題 96

第4章 局部特徵設計 97
4.1 局部特徵 97
4.1.1 檢測器、興趣點、關鍵點、錨點和特徵點 98
4.1.2 描述子、特徵描述和特徵提取 98
4.1.3 稀疏局部模式方法 98
4.2 局部特徵屬性 99
4.2.1 選擇特徵描述子和興趣點 99
4.2.2 特徵描述子和特徵匹配 99
4.2.3 好特徵的標準 99
4.2.4 可重複性,困難和容易的查找 101
4.2.5 判別性與非判別性 101
4.2.6 相對位置和絕對位置 101
4.2.7 匹配代價和一致性 101
4.3 距離函數 102
4.3.1 距離函數的早期工作 102
4.3.2 歐氏或笛卡兒距離度量 103
4.3.3 網格距離度量 104
4.3.4 基於統計學的差異性度量 105
4.3.5 二值或布林距離度量 106
4.4 描述子的表示 107
4.4.1 座標空間和複合空間 107
4.4.2 笛卡兒座標 107
4.4.3 極座標和對數極座標 107
4.4.4 徑向座標 107
4.4.5 球面座標 108
4.4.6 Gauge座標 108
4.4.7 多元空間和多模資料 108
4.4.8 特徵金字塔 109
4.5 描述子的密度 109
4.5.1 丟棄興趣點和描述子 109
4.5.2 稠密與稀疏特徵描述 110
4.6 描述子形狀 110
4.6.1 關聯性範本 111
4.6.2 塊和形狀 111
4.6.3 對象多邊形 113
4.7 局部二值描述子與點對模式 113
4.7.1 FREAK視網膜模式 114
4.7.2 BRISK模式 115
4.7.3 ORB和BRIEF模式 116
4.8 描述子的判別性 116
4.8.1 譜的判別性 117
4.8.2 區域、形狀和模式的判別性 118
4.8.3 幾何判別因素 118
4.8.4 通過特徵視覺化來評價判別性 119
4.8.5 精度與可跟蹤性 121
4.8.6 精度優化、子區域重疊、Gaussian加權和池化 122
4.8.7 亞圖元精度 123
4.9 搜索策略與優化 123
4.9.1 密集搜索 124
4.9.2 網格搜索 124
4.9.3 多尺度金字塔搜索 124
4.9.4 尺度空間和圖像金字塔 125
4.9.5 特徵金字塔 126
4.9.6 稀疏預測搜索與跟蹤 127
4.9.7 跟蹤區域限制搜尋 127
4.9.8 分割限制搜索 127
4.9.9 深度或Z限制搜索 127
4.10 電腦視覺、模型和結構 128
4.10.1 特徵空間 128
4.10.2 物件模型 129
4.10.3 約束 130
4.10.4 選擇檢測器和特徵 131
4.10.5 訓練概述 131
4.10.6 特徵和物件的分類 132
4.10.7 特徵學習、稀疏編碼和卷積網路 136
4.11 總結 139
4.12 習題 139

第5章 特徵描述屬性的分類 141
5.1 一般的魯棒性分類 143
5.2 一般的視覺度量分類 146
5.3 特徵度量評估 155
5.3.1 SIFT的示例 156
5.3.2 LBP的示例 156
5.3.3 形狀因數的示例 157
5.4 總結 158
5.5 習題 158

第6章 興趣點檢測與特徵描述子 159
6.1 興趣點調整 159
6.2 興趣點的概念 160
6.3 興趣點方法概述 162
6.3.1 Laplacian和LoG 163
6.3.2 Moravac角點檢測器 163
6.3.3 Harris方法、Harris-Stephens、Shi-Tomasi和Hessian類型的檢測器 163
6.3.4 Hessian矩陣檢測器和Hessian-Laplace 164
6.3.5 Gaussian差 164
6.3.6 顯著性區域 164
6.3.7 SUSAN、Trajkovic-Hedly 165
6.3.8 FAST 165
6.3.9 局部曲率方法 166
6.3.10 形態興趣區域 167
6.4 特徵描述簡介 167
6.4.1 局部二值描述子 168
6.4.2 Census 173
6.4.3 改進的Census變換 174
6.4.4 BRIEF 174
6.4.5 ORB 175
6.4.6 BRISK 176
6.4.7 FREAK 176
6.5 譜描述子 177
6.5.1 SIFT 177
6.5.2 SIFT-PCA 181
6.5.3 SIFT-GLOH 181
6.5.4 SIFT-SIFER 182
6.5.5 SIFT CS-LBP 182
6.5.6 ROOTSIFT 183
6.5.7 CenSurE和STAR 183
6.5.8 相關範本 185
6.5.9 HAAR特徵 186
6.5.10 使用類HAAR特徵的Viola和Jones演算法 187
6.5.11 SURF 187
6.5.12 改進的SURF演算法 189
6.5.13 梯度長條圖(HOG)及改進方法 189
6.5.14 PHOG和相關方法 190
6.5.15 Daisy和O-Daisy 191
6.5.16 CARD 193
6.5.17 具有魯棒性的快速特徵匹配 194
6.5.18 RIFF和CHOG 195
6.5.19 鏈碼長條圖 196
6.5.20 D-NETS 196
6.5.21 局部梯度模式 197
6.5.22 局部相位量化 198
6.6 基空間描述子 198
6.6.1 Fourier描述子 199
6.6.2 用其他基函數來構建描述子 200
6.6.3 稀疏編碼方法 200
6.7 多邊形形狀描述 200
6.7.1 MSER方法 201
6.7.2 針對斑點和多邊形的目標形狀度量 202
6.7.3 形狀上下文 204
6.8 3D和4D描述子 205
6.8.1 3D HOG 206
6.8.2 HON 4D 206
6.8.3 3D SIFT 207
6.9 總結 208
6.10 習題 208

第7章 基準資料、內容、度量和分析 210
7.1 基準資料 210
7.2 先前關於基準資料方面的工作:藝術與科學 212
7.2.1 品質的一般度量 212
7.2.2 演算法性能的度量 212
7.2.3 Rosin關於角點方面的工作 213
7.3 構造基準資料的關鍵問題 214
7.3.1 內容:採用、修改或創建 214
7.3.2 可用的基準資料集 215
7.3.3 擬合基準資料的演算法 215
7.3.4 場景構成和標注 216
7.4 定義目標和預期 218
7.4.1 Mikolajczyk和Schmid的方法 218
7.4.2 開放式評價系統 219
7.4.3 極端情況和限制 219
7.4.4 興趣點和特徵 219
7.5 基準資料的魯棒性準則 220
7.5.1 舉例說明魯棒性標準 220
7.5.2 將魯棒性標準用於實際應用 221
7.6 度量與基準資料配對 222
7.6.1 興趣點、特徵和基準資料的配對和優化 222
7.6.2 一般的視覺分類例子 223
7.7 合成的特徵字母表 224
7.7.1 合成資料集的目標 224
7.7.2 合成興趣點字母表 226
7.7.3 將合成字母表疊加到真實圖像上 228
7.8 總結 229
7.9 習題 230

第8章 可視流程及優化 231
8.1 階段、操作和資源 231
8.2 計算資源預算 233
8.2.1 計算單元、ALU和加速器 234
8.2.2 能耗的使用 235
8.2.3 記憶體的利用 235
8.2.4 I O性能 238
8.3 電腦視覺流程的實例 238
8.3.1 汽車識別 239
8.3.2 人臉檢測、情感識別和年齡識別 244
8.3.3 圖像分類 250
8.3.4 增強現實 254
8.4 可選的加速方案 258
8.4.1 記憶體優化 258
8.4.2 粗細微性並行 260
8.4.3 細細微性資料並行 261
8.4.4 高級指令集和加速器 263
8.5 視覺演算法的優化與調整 263
8.5.1 編譯器優化與手工優化 264
8.5.2 特徵描述子改進、檢測器和距離函數 265
8.5.3 Boxlets與卷積加速 265
8.5.4 資料類型優化(整數與浮點) 265
8.6 優化資源 266
8.7 總結 266

第9章 特徵學習的架構分類和神經科學背景 267
9.1 電腦視覺中的神經科學思想 268
9.2 特徵生成與特徵學習 269
9.3 電腦視覺中所使用的神經科學術語 269
9.4 特徵學習的分類 274
9.4.1 卷積特徵權重學習 275
9.4.2 局部特徵描述子學習 275
9.4.3 基本特徵的組合和字典學習 275
9.4.4 特徵學習方法總結 276
9.5 電腦視覺中的機器學習模型 276
9.5.1 專家系統 277
9.5.2 統計和數學分析方法 278
9.5.3 受神經科學啟發的方法 278
9.5.4 深度學習 278
9.6 機器學習和特徵學習的歷史 280
9.6.1 歷史回顧:20世紀40年代至21世紀初 280
9.6.2 人工神經網路(ANN)分類 284
9.7 特徵學習概述 285
9.7.1 通過學習得到的各類描述子 285
9.7.2 層次特徵學習 285
9.7.3 要學習多少特徵 286
9.7.4 深度神經網路的優勢 286
9.7.5 特徵編碼的有效性 286
9.7.6 手工設計的特徵與深度學習 287
9.7.7 特徵學習的不變性和魯棒性 288
9.7.8 最好的特徵和學習架構 288
9.7.9 大資料、分析和電腦視覺的統一 289
9.7.10 關鍵技術的推動因素 291
9.8 神經科學的概念 292
9.8.1 生物學及其整體結構 293
9.8.2 難以找到統一的學習理論 294
9.8.3 人類視覺系統的架構 295
9.9 特徵學習的結構分類 299
9.9.1 架構拓撲 301
9.9.2 架構組件和層 302
9.10 總結 313
9.11 習題 313

第 10章 特徵學習和深度學習架構概述 315
10.1 架構概述 315
10.1.1 FNN架構簡介 316
10.1.2 RNN的結構簡介 372
10.1.3 BFN的結構簡介 395
10.2 集成方法 427
10.3 深度神經網路的未來 429
10.3.1 增加最大深度—深度殘差學習 429
10.3.2 使用更簡單的MLP來近似複雜模型(模型壓縮) 430
10.3.3 分類器的分解與重組 431
10.4 總結 432
10.5 習題 432

附錄A 合成特徵分析 435
附錄B 基準資料集概述 464
附錄C 成像和電腦視覺資源 470
附錄D 擴展SDM準則 474
附錄E 視覺基因組模型(VGM) 487
參考文獻 508
譯後記 541
 

詳細資料

  • ISBN:9787115505880
  • 規格:平裝 / 540頁 / 16k / 19 x 26 x 2.7 cm / 普通級 / 單色印刷 / 1-1
  • 出版地:大陸

最近瀏覽商品

 

相關活動

  • 【成為一位優秀的程式設計師】程式語言展,7折起!
 

購物說明

大陸出版品書況:因裝幀品質及貨運條件未臻完善,書況與台灣出版品落差甚大,封面老舊、出現磨痕、凹痕等均屬常態,故簡體字館除封面破損、內頁脫落...等較嚴重的狀態外,其餘所有商品將正常出貨。 

 

請注意,部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

調貨時間:若您購買海外庫存之商品,於您完成訂購後,商品原則上約45個工作天內抵台(若有將延遲另行告知)。為了縮短等待的時間,建議您將簡體書與其它商品分開訂購,以利一般商品快速出貨。 

若您具有法人身份為常態性且大量購書者,或有特殊作業需求,建議您可洽詢「企業採購」。 

退換貨說明 

會員所購買的商品均享有到貨十天的猶豫期(含例假日)。退回之商品必須於猶豫期內寄回。 

辦理退換貨時,商品必須是全新狀態與完整包裝(請注意保持商品本體、配件、贈品、保證書、原廠包裝及所有附隨文件或資料的完整性,切勿缺漏任何配件或損毀原廠外盒)。退回商品無法回復原狀者,恐將影響退貨權益或需負擔部分費用。 

訂購本商品前請務必詳閱商品退換貨原則

  • 商業書展3本75折
  • 語言書展3本75折
  • 一日三餐的生活美學

訂閱電子報

想獲得最新商品資訊,請訂閱免費電子報