新到貨2本75折
精通Python自然語言處理

精通Python自然語言處理

  • 定價:354
  • 優惠價:87308
  • 運送方式:
  • 臺灣與離島
  • 海外
  • 可配送點:台灣、蘭嶼、綠島、澎湖、金門、馬祖
  • 可取貨點:台灣、蘭嶼、綠島、澎湖、金門、馬祖
載入中...
  • 分享
 

內容簡介

自然語言處理是計算語言學和人工智能之中與人機交互相關的領域之一。

本書是學習自然語言處理的一本綜合學習指南,介紹了如何用Python實現各種NLP任務,以幫助讀者創建基於真實生活應用的項目。全書共10章,分別涉及字符串操作、統計語言建模、形態學、詞性標注、語法解析、語義分析、情感分析、信息檢索、語篇分析和NLP系統評估等主題。

本書適合熟悉Python語言並對自然語言處理開發有一定了解和興趣的讀者閱讀參考。
 

目錄

第1章字符串操作1
1.1切分1
1.1.1將文本切分為語句2
1.1.2其他語言文本的切分2
1.1.3將句子切分為單詞3
1.1.4使用TreebankWordTokenizer執行切分4
1.1.5使用正則表達式實現切分5
1.2標准化8
1.2.1消除標點符號8
1.2.2文本的大小寫轉換9
1.2.3處理停止詞9
1.2.4計算英語中的停止詞10
1.3替換和校正標識符11
1.3.1使用正則表達式替換單詞11
1.3.2用另一個文本替換文本的示例12
1.3.3在執行切分前先執行替換操作12
1.3.4處理重復字符13
1.3.5去除重復字符的示例13
1.3.6用單詞的同義詞替換14
1.3.7用單詞的同義詞替換的示例15
1.4在文本上應用Zipf定律15
1.5相似性度量16
1.5.1使用編輯距離算法執行相似性度量16
1.5.2使用Jaccard系數執行相似性度量18
1.5.3使用Smith Waterman距離算法執行相似性度量19
1.5.4其他字符串相似性度量19
1.6小結20
第2章統計語言建模21
2.1理解單詞頻率21
2.1.1為給定的文本開發MLE25
2.1.2隱馬爾科夫模型估計32
2.2在MLE模型上應用平滑34
2.2.1加法平滑34
2.2.2Good Turing平滑35
2.2.3Kneser Ney平滑40
2.2.4Witten Bell平滑41
2.3為MLE開發一個回退機制41
2.4應用數據的插值以便獲取混合搭配42
2.5通過復雜度來評估語言模型42
2.6在語言建模中應用Metropolis—Hastings算法43
2.7在語言處理中應用Gibbs采樣法43
2.8小結46
第3章形態學:在實踐中學習47
3.1形態學簡介47
3.2理解詞干提取器48
3.3理解詞形還原51
3.4為非英文語言開發詞干提取器52
3.5形態分析器54
3.6形態生成器56
3.7搜索引擎56
3.8小結61
第4章詞性標注:單詞識別62
4.1詞性標注簡介62
默認標注67
4.2創建詞性標注語料庫68
4.3選擇一種機器學習算法70
4.4涉及n—gram的統計建模72
4.5使用詞性標注語料庫開發分塊器78
4.6小結80
第5章語法解析:分析訓練資料81
5.1語法解析簡介81
5.2Treebank建設82
5.3從Treebank提取上下文無關文法規則87
5.4從CFG創建概率上下文無關文法93
5.5CYK線圖解析算法94
5.6Earley線圖解析算法96
5.7小結102
第6章語義分析:意義很重要103
6.1語義分析簡介103
6.1.1NER簡介107
6.1.2使用隱馬爾科夫模型的NER系統111
6.1.3使用機器學習工具包訓練NER117
6.1.4使用詞性標注執行NER117
6.2使用Wordnet生成同義詞集id119
6.3使用Wordnet進行詞義消歧122
6.4小結127
第7章情感分析:我很快樂128
7.1情感分析簡介128
7.1.1使用NER執行情感分析134
7.1.2使用機器學習執行情感分析134
7.1.3NER系統的評估141
7.2小結159
第8章信息檢索:訪問信息160
8.1信息檢索簡介160
8.1.1停止詞刪除161
8.1.2使用向量空間模型進行信息檢索163
8.2向量空間評分及查詢操作符關聯170
8.3使用隱性語義索引開發IR系統173
8.4文本摘要174
8.5問答系統176
8.6小結177
第9章語篇分析:理解才是可信的178
9.1語篇分析簡介178
9.1.1使用中心理論執行語篇分析183
9.1.2指代消解184
9.2小結188
第10章NLP系統評估:性能分析189
10.1NLP系統評估要點189
10.1.1NLP工具的評估(詞性標注器、詞干提取器及形態分析器)190
10.1.2使用黃金數據執行解析器評估200
10.2IR系統的評估201
10.3錯誤識別指標202
10.4基於詞匯搭配的指標202
10.5基於句法匹配的指標207
10.6使用淺層語義匹配的指標207
10.7小結208
 

詳細資料

  • ISBN:9787115459688
  • 規格:208頁 / 普通級 / 1-1
  • 出版地:中國

最近瀏覽商品

 

相關活動

  • 以學術為錨,定位深度思考邏輯。文學│史地│社科 精選3本72折
 

購物說明

溫馨提醒您:若您訂單中有購買簡體館無庫存/預售書或庫存於海外廠商的書籍,建議與其他商品分開下單,以避免等待時間過長,謝謝。

大陸出版品書況:因裝幀品質及貨運條件未臻完善,書況與台灣出版品落差甚大,封面老舊、出現磨痕、凹痕等均屬常態,故簡體字館除封面破損、內頁脫落...等較嚴重的狀態外,其餘所有商品將正常出貨。 

 

請注意,部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

調貨時間:若您購買海外庫存之商品,於您完成訂購後,商品原則上約45個工作天內抵台(若有將延遲另行告知)。為了縮短等待的時間,建議您將簡體書與其它商品分開訂購,以利一般商品快速出貨。 

若您具有法人身份為常態性且大量購書者,或有特殊作業需求,建議您可洽詢「企業採購」。 

退換貨說明 

會員所購買的商品均享有到貨十天的猶豫期(含例假日)。退回之商品必須於猶豫期內寄回。 

辦理退換貨時,商品必須是全新狀態與完整包裝(請注意保持商品本體、配件、贈品、保證書、原廠包裝及所有附隨文件或資料的完整性,切勿缺漏任何配件或損毀原廠外盒)。退回商品無法回復原狀者,恐將影響退貨權益或需負擔部分費用。 

訂購本商品前請務必詳閱商品退換貨原則

  • 888現折88
  • 分寸與好運
  • 終結氣候危機