本書介紹嵌入式系統中的機器學習算法優化原理、設計方法及其實現技術。內容涵蓋通用嵌入式優化技術,包括基於SIMD指令集的優化、記憶體訪問模式優化、參數量化等,並在此基礎上介紹了信號處理層面的優化、AI推理算法優化及基於神經網路的AI算法訓練一推理聯合的優化理論與方法。
其中信號處理層面優化介紹了基於線性代數的快速近似算法、基於多項式的快速卷積構造技術、基於資料二進位結構的快速乘法算法等;在AI推理層面,介紹了機器學習推理模型共性結構、運算圖中各個運算元的計算優化途徑;對基於神經網路的AI算法,闡述了如何將推理階段的運算量約束以及底層資料量化約束加入訓練代價函數,從算法訓練端減少運算量以提升AI嵌入式系統的運行效率。
此外,本書還通過多個自動搜索優化參數並生成C代碼的例子介紹了通用的嵌入式環境下機器學習算法自動優化和部署工具開發的基本知識,通過應用示例和大量代碼說明瞭AI算法在通用嵌入式系統中的實現方法,力求讓讀者在理解算法的基礎上,通過實踐掌握高效的AI嵌入式系統開發的知識與技能。