本書系統地介紹了語音辨識的原理和應用,全書共分 15 章,原理部分涵蓋聲學特徵、隱瑪律可夫模型(HMM)、高斯混合模型(GMM)、深度神經網路(DNN)、語言模型和加權有限狀態轉換器(WFST),重點描述了 GMM-HMM、DNN-HMM 和端到端(E2E)三種語音辨識框架。本書應用部分包含 Kaldi、Espnet、工業應用實踐介紹,內容主要來自工程經驗,極具實用性。
本書可以作為普通高等學校人工智慧、電腦科學與技術、電子資訊工程、自動化等專業的本科生及研究生教材,也適合作為從事智慧語音系統的科研和工程技術人員的參考用書。