新到貨599現折59
深度學習:語音識別技術實踐

深度學習:語音識別技術實踐

  • 定價:534
  • 優惠價:87465
  • 運送方式:
  • 臺灣與離島
  • 海外
  • 可配送點:台灣、蘭嶼、綠島、澎湖、金門、馬祖
  • 可取貨點:台灣、蘭嶼、綠島、澎湖、金門、馬祖
載入中...
  • 分享
 

內容簡介

語音辨識已經逐漸進入人們的日常生活。語音辨識技術是涉及語言、計算機、數學等領域的交叉學科。《深度學習:語音辨識技術實踐》介紹了包括C#、Perl、Python、Java在內的多種程式設計語言實踐,開源語音辨識工具包Kaldi的使用與代碼分析,深度學習的開發環境搭建,卷積神經網路,以及語音辨識中常見的語言模型——N元模型和依存模型等,讓讀者快速瞭解語音辨識基礎,掌握開發語音辨識程式的演算法。 《深度學習:語音辨識技術實踐》從語音辨識的基礎開始講起,並輔以翔實的案例,既適合需要具體實現語音辨識的程式師使用,也適合有一定機器學習或語音辨識基礎的學生、研究者或從業者閱讀。
 

作者介紹

柳若邊

獵兔搜索團隊核心成員,曾供職于中國萬網、三星等多家業內知名公司,現任某教育培訓機構專業講師。獵兔搜索創立於2004年,專注于自然語言處理等人工智慧領域的技術開發與實現。在北京和上海等地均有獵兔培訓的學員,獵兔搜索出版的相關技術圖書讀者遍及全國各省(市、區)及海外華人圈。
 

目錄

第1章 語音辨識技術    1
1.1  總體結構    1
1.2  Linux基礎    2
1.3 安裝Micro編輯器    4
1.4  安裝Kaldi    5
1.5  yesno例子    6
1.5.1  數據準備    7
1.5.2  詞典準備    8
1.6  構建一個簡單的ASR    12
1.7  Voxforge例子    21
1.8  數據準備    23
1.9  加權有限狀態轉換    34
1.9.1  FSA    35
1.9.2  FST    35
1.9.3  WFST    37
1.9.4  Kaldi對OpenFst的改進    38
1.10  語音辨識語料庫    39
1.10.1  TIMIT語料庫    39
1.10.2  LibriSpeech語料庫    40
1.10.3  中文語料庫    40
1.11  Linux shell腳本基礎    40
1.11.1  Bash    41
1.11.2  AWK    44

第2章 C#開發語音辨識    46
2.1  準備開發環境    46
2.2  計算卷積    47
2.3  記錄語音    48
2.4  讀入語音信號    52
2.5  離散傅裡葉變換    53
2.6  移除靜音    54

第3章 Perl開發語音辨識    58
3.1  變數    58
3.1.1  數字    58
3.1.2  字串    59
3.1.3  陣列    60
3.1.4  散列表    60
3.2  多維陣列    62
3.3  常量    62
3.4  操作符    63
3.5  控制流    66
3.6  檔與目錄    67
3.7  常式    68
3.8  執行命令    69
3.9  規則運算式    69
3.9.1  基本類型    69
3.9.2  規則運算式模式    70
3.10  命令列參數    72

第4章 Python開發語音辨識    73
4.1  Windows作業系統下安裝Python    73
4.2  Linux作業系統下安裝Python    75
4.3  選擇版本    76
4.4  開發環境    76
4.5  注釋    77
4.6  變數    77
4.6.1  數值    77
4.6.2  字串    79
4.7  陣列    80
4.8  列表    80
4.9  元組    80
4.10  字典    81
4.11  控制流    81
4.11.1  條件判斷    81
4.11.2  迴圈    82
4.12  模組    83
4.13  函數    84
4.14  讀寫文件    86
4.15  物件導向程式設計    87
4.16  命令列參數    88
4.17  資料庫    90
4.18  日誌記錄    90
4.19  異常處理    92
4.20  測試    92
4.21  語音活動檢測    93
4.22  使用numpy    93

第5章 Java開發語音辨識    94
5.1  實現卷積    95
5.2  KaldiJava    96
5.2.1  使用Ant    97
5.2.2  使用Maven    99
5.2.3  使用Gradle    100
5.2.4  概率分佈函數    102
5.3  TensorFlow的Java介面    104
5.3.1  在Windows作業系統下使用TensorFlow    104
5.3.2  在Linux作業系統下使用TensorFlow    106

第6章 語音信號處理    109
6.1  使用FFmpeg    109
6.2  標注語音    110
6.3  時間序列    112
6.4 端點檢測    113
6.5  動態時間規整    114
6.6  傅裡葉變換    117
6.6.1  離散傅裡葉變換    117
6.6.2  快速傅裡葉變換    120
6.7  MFCC特徵    124
6.8  說話者識別    125
6.9  解碼    125

第7章 深度學習    132
7.1  神經網路基礎    132
7.1.1  實現多層感知器    135
7.1.2  計算過程    143
7.2  卷積神經網路    150
7.3  搭建深度學習開發環境    156
7.3.1  使用Cygwin模擬環境    156
7.3.2  使用CMake    157
7.3.3  使用Keras    158
7.3.4  安裝TensorFlow    161
7.3.5  安裝TensorFlow的Docker容器    162
7.3.6  使用TensorFlow    164
7.3.7  一維卷積    208
7.3.8  二維卷積    210
7.3.9  擴張卷積    213
7.3.10  TensorFlow實現簡單的語音辨識    214
7.4  nnet3實現代碼    216
7.4.1  資料類型    217
7.4.2  基本資料結構    219
7.5  編譯Kaldi    230
7.6  端到端深度學習    232
7.7  Dropout解決過度擬合問題    232
7.8  矩陣運算    235

第8章 語言模型    238
8.1  概率語言模型    238
8.1.1  一元模型    240
8.1.2  資料基礎    240
8.1.3  改進一元模型    249
8.1.4  二元詞典    251
8.1.5  完全二叉樹陣列    257
8.1.6  三元詞典    261
8.1.7  N元模型    262
8.1.8  生成語言模型    264
8.1.9  評估語言模型    265
8.1.10  平滑演算法    266
8.2  KenLM語言模型工具包    271
8.3  ARPA檔案格式    275
8.4  依存語言模型    278
 

前言

作為人工智慧技術的重要組成部分,語音辨識旨在研究電腦如何聽懂人的講話。來源於人工神經網路的深度學習促進了語音辨識技術的發展。本書從使用開源的語音辨識構建系統Kaldi開始講起,引導讀者親自實現語音辨識系統,使用了C#、Perl、Python、Java等多種程式設計工具。第1章介紹語音辨識的基本原理和Kaldi的基本使用方法,以及使用Kaldi開發語音辨識系統應用到的Linux shell腳本基礎;第2章介紹使用C#開發語音辨識系統;第3章介紹Perl語言開發基礎;第4章介紹開發語音辨識系統所需要的Python基礎;第5章介紹使用Java開發語音辨識系統;第6章介紹傅裡葉變換、MFCC特徵等常用的語音信號處理方法;第7章介紹基本的神經網路和深度學習方法及訓練神經網路的反向傳播方法;第8章介紹語音辨識解碼階段用到的語言模型,以及語言模型工具包——KenLM。

本書適合需要具體實現語音辨識的程式師使用,對機器學習等相關領域的研究人員也有一定的參考價值。獵兔搜索技術團隊已經開發出以本書為基礎的專門培訓課程和商務軟體。

本書由柳若邊編著,羅剛、沙芸、張子憲、許想嬌、石天盈、張繼紅、羅庭亮、王全軍、劉宇、張天津也參與了本書的部分編創工作。本書相關的參考軟體和代碼在讀者QQ群(378025857)的附件中可以找到。Kaldi及其底層依賴的軟體,其複雜程度已經超越了一個人所能掌握的程度。此外,一些具體的細節也可以在讀者QQ群討論。在此,感謝早期合著者、合作夥伴、員工、學員、讀者的支持,他們為本書的編創提供了良好的工作基礎。技術的融合與創新永無止境,就如同在玻璃容器中水培植物一樣,這是一個持久的工作。

編著者
2018年12月
 

詳細資料

  • ISBN:9787302516927
  • 規格:平裝 / 280頁 / 16k / 19 x 26 x 1.4 cm / 普通級 / 單色印刷 / 1-1
  • 出版地:中國

最近瀏覽商品

 

相關活動

  • 【其他】2024采實電子書全書系:春暖花開‧享閱讀,參展書單書85折起、任選3本79折
 

購物說明

溫馨提醒您:若您訂單中有購買簡體館無庫存/預售書或庫存於海外廠商的書籍,建議與其他商品分開下單,以避免等待時間過長,謝謝。

大陸出版品書況:因裝幀品質及貨運條件未臻完善,書況與台灣出版品落差甚大,封面老舊、出現磨痕、凹痕等均屬常態,故簡體字館除封面破損、內頁脫落...等較嚴重的狀態外,其餘所有商品將正常出貨。 

 

請注意,部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

調貨時間:若您購買海外庫存之商品,於您完成訂購後,商品原則上約45個工作天內抵台(若有將延遲另行告知)。為了縮短等待的時間,建議您將簡體書與其它商品分開訂購,以利一般商品快速出貨。 

若您具有法人身份為常態性且大量購書者,或有特殊作業需求,建議您可洽詢「企業採購」。 

退換貨說明 

會員所購買的商品均享有到貨十天的猶豫期(含例假日)。退回之商品必須於猶豫期內寄回。 

辦理退換貨時,商品必須是全新狀態與完整包裝(請注意保持商品本體、配件、贈品、保證書、原廠包裝及所有附隨文件或資料的完整性,切勿缺漏任何配件或損毀原廠外盒)。退回商品無法回復原狀者,恐將影響退貨權益或需負擔部分費用。 

訂購本商品前請務必詳閱商品退換貨原則

  • 手作新書79折起
  • 浪漫小說精選3本72折
  • 888現折88