新到貨2本75折
自然語言處理:原理、方法與應用

自然語言處理:原理、方法與應用

  • 定價:354
  • 優惠價:87308
  • 運送方式:
  • 臺灣與離島
  • 海外
  • 可配送點:台灣、蘭嶼、綠島、澎湖、金門、馬祖
  • 可取貨點:台灣、蘭嶼、綠島、澎湖、金門、馬祖
載入中...
  • 分享
 

內容簡介

本書系統闡述自然語言處理基礎知識,以及自然語言處理高級模型應用等高級知識。全書共11章:第1~5章為自然語言處理的基礎知識,第6~11章則將自然語言處理知識應用於實戰。書中主要內容包括預訓練模型、文本分類、機器閱讀理解、命名實體識別、文本生成、模型蒸餾與剪枝及損失函數等知識。書中包含大量應用示例,不僅可以學會理論知識還可以靈活應用。

書中示例基於Linux與PyTorch環境開發,讀者在學習自然語言處理知識的同時還可學會PyTorch框架技術,內容完整、步驟清晰,提供了工程化的解決方案。本書可作為有一定深度學習基礎的讀者的入門書,也可作為從事自然語言處理算法工作的技術人員及培訓機構的參考書。
 

作者介紹

王志立,自然語言處理工程師,曾在國際與國內的學術會議上發表學術論文多篇,先後在騰訊等多家知名企業從事大資料與人工智慧算法工作,運營和分享人工智慧相關知識,曾獲得多項人工智慧比賽重量獎項。
 
雷鵬斌,深圳大學碩士,華為AI算法工程師,主要從事chatops、知識圖譜的研究與應用工作,對自然語言處理各項任務的研究與應用具有經驗豐富。2019—2021年在國內知名競賽的文本分類、命名實體識別、機器閱讀理解、智慧問答,以及文本生成任務中摘獲大量榮譽。曾參與多項課題研究,在AAAI、中文資訊學報等高影響力會議上發表多篇文章。
 
吳宇凡,騰訊算法應用研究員,長期從事業務安全和金融量化相關算法研究和實踐,已發表國際很好會議論文多篇,申請專利數篇。
 

目錄

第1章 導論(13min)
1.1基於深度學習的自然語言處理
1.2本書章節脈絡
1.3自然語言處理算法流程
1.4小結

第2章 Python開發環境配置(35min)
2.1Linux伺服器
2.1.1MobaXterm
2.1.2使用MobaXterm連接遠端伺服器
2.1.3在伺服器上安裝Python開發環境
2.1.4使用Anaconda國內源
2.1.5pip設定永久阿里雲源
2.2Python虛擬環境
2.3PyCharm遠端連接伺服器
2.4screen任務管理
2.5Docker技術
2.6小結

第3章 自然語言處理的發展進程
3.1人工規則與自然語言處理
3.2機器學習與自熱語言處理
3.2.1詞袋模型
3.2.2ngram
3.2.3頻率與逆文檔頻率
3.3深度學習與自然語言處理
3.4小結

第4章 無監督學習的原理與應用(30min)
4.1淺層無監督預模型
4.2深層無監督預模型
4.2.1BERT
4.2.2SelfAttention Layer原理
4.2.3SelfAttention Layer的內部運算邏輯
4.2.4MultiHead SelfAttention
4.2.5Layer Normalization
4.2.6BERT預
4.2.7BERT的微調過程
4.3其他預模型
4.3.1RoBERTa
4.3.2ERNIE
4.3.3BERT_WWM
4.3.4ALBERT
4.3.5Electra
4.3.6NEZHA
4.3.7NLP預模型對比
4.4自然語言處理四大下游任務
4.4.1句子對分類任務
4.4.2單句子分類任務
4.4.3問答任務
4.4.4單句子標注任務
4.5小結

第5章 無監督學習進階
5.1生成式對抗網路
5.2元學習
5.2.1MetricBased Method
5.2.2ModelBased Method
5.2.3PretrainBased Method
5.3小結

第6章 預
6.1賽題任務
6.2環境搭建
6.3代碼框架
6.4數據分析實踐
6.4.1數據預處理
6.4.2預任務模型構建與數據生成
6.4.3模型
6.5小結

第7章 文本分類(45min)
7.1數據分析
7.2環境搭建
7.3代碼框架
7.4文本分類實踐
7.4.1數據預處理
7.4.2模型構建
7.4.3數據反覆運算器
7.4.4模型
7.4.5模型預測
7.5小結

第8章 機器閱讀理解(16min)
8.1機器閱讀理解的定義
8.1.1完形填空
8.1.2多項選擇
8.1.3片段抽取
8.1.4自由回答
8.1.5其他任務
8.2評測方法
8.3研究方法
8.3.1基於規則的方法
8.3.2基於神經網路的方法
8.3.3基於深層語義的圖匹配方法
8.4經典結構
8.4.1BiDAF模型
8.4.2QANet模型
8.4.3基於BERT模型的機器閱讀理解
8.5多文檔機器閱讀理解實踐
8.5.1疫情政務問答助手
8.5.2資訊檢索
8.5.3多工學習
8.5.4實踐
8.6小結

第9章 命名實體識別(15min)
9.1NER技術的發展現狀
9.2命名實體識別的定義
9.3命名實體識別模型
9.3.1預模型
9.3.2下接結構
9.3.3條件隨機場
9.4命名實體識別實驗
9.4.1數據介紹
9.4.2評估指標
9.4.3數據預處理
9.4.4模型構建
9.4.5數據反覆運算器
9.4.6模型
9.4.7模型預測
9.5小結

第10章 文本生成(26min)
10.1文本生成的發展現狀
10.1.1文本生成範本
10.1.2變分自編碼器
10.1.3序列到序列技術
10.2基於預模型的文本生成模型
10.3文本生成任務實踐
10.3.1數據介紹
10.3.2評估指標
10.3.3模型構建
10.3.4數據反覆運算器
10.3.5模型
10.3.6模型預測
10.4小結

第11章 損失函數與模型瘦身
11.1損失函數
11.2常用的損失函數
11.2.1回歸
11.2.2分類
11.3損失函數的進階
11.3.1樣本不均衡
11.3.2Focal Loss
11.3.3Dice Loss
11.3.4拒識
11.3.5帶噪學習
11.4模型瘦身
11.4.1知識蒸餾
11.4.2模型剪枝
11.5小結
 

詳細資料

  • ISBN:9787302617747
  • 規格:平裝 / 222頁 / 19 x 26 x 1.11 cm / 普通級 / 1-1
  • 出版地:中國

最近瀏覽商品

 

相關活動

  • 【科普、飲食、電腦】高寶電子書暢銷書展:人生就是選擇的總和,全展75折起
 

購物說明

溫馨提醒您:若您訂單中有購買簡體館無庫存/預售書或庫存於海外廠商的書籍,建議與其他商品分開下單,以避免等待時間過長,謝謝。

大陸出版品書況:因裝幀品質及貨運條件未臻完善,書況與台灣出版品落差甚大,封面老舊、出現磨痕、凹痕等均屬常態,故簡體字館除封面破損、內頁脫落...等較嚴重的狀態外,其餘所有商品將正常出貨。 

 

請注意,部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

調貨時間:若您購買海外庫存之商品,於您完成訂購後,商品原則上約45個工作天內抵台(若有將延遲另行告知)。為了縮短等待的時間,建議您將簡體書與其它商品分開訂購,以利一般商品快速出貨。 

若您具有法人身份為常態性且大量購書者,或有特殊作業需求,建議您可洽詢「企業採購」。 

退換貨說明 

會員所購買的商品均享有到貨十天的猶豫期(含例假日)。退回之商品必須於猶豫期內寄回。 

辦理退換貨時,商品必須是全新狀態與完整包裝(請注意保持商品本體、配件、贈品、保證書、原廠包裝及所有附隨文件或資料的完整性,切勿缺漏任何配件或損毀原廠外盒)。退回商品無法回復原狀者,恐將影響退貨權益或需負擔部分費用。 

訂購本商品前請務必詳閱商品退換貨原則

  • 翦商作者新作79折
  • 針灸匠張寶旬
  • 浪漫小說精選3本72折