:::相關網站

:::會員服務|快速功能

  • 今日66折
  • 天天BUY

網站擷取:使用Python

Web Scraping with Python

  • 定價:580
  • 優惠價:79458
運送方式:
  • 可配送點:台灣、蘭嶼、綠島、澎湖、金門、馬祖、全球
  • 可取貨點:台灣、蘭嶼、綠島、澎湖、金門、馬祖
    香港、澳門、新加坡
載入中...

優惠組合

 

內容簡介

在現代網路蒐集資料

  「本書涵蓋的工具與範例,讓我輕易把好幾個重複的工作自動化,騰出時間解決更多有趣的問題。這是本重視成果、內容從實務問題與解法出發,又能很快讀完的好書。」 — Eric VanWyk, 電子計算機工程師,麻州歐林工程學院

  學會網頁搜刮(scraping)及爬行(crawling)技術,就能從任何網站來源取得任意格式的無限量資料。您可以從這本實務指南學到如何使用Python與web APIs,同時從上千,甚至上百萬的網頁之中獲取並處理資料。

  本書適合會寫Python的程式設計者、網路安全工作者以及網站管理者閱讀。不僅會提到網頁搜刮的基本機制,還會提到一些進階主題,像是分析原始資料,或是利用搜刮工具進行網站前端測試。本書也將提供程式範例協助您從實務的角度理解觀念。

  •學會如何解析複雜的HTML頁面
  •走訪許多頁面與網站
  •掌握APIs的概觀以及它們如何運作
  •學會多種儲存搜刮來的資料的方式
  •下載文件並讀取內容,從中擷取資料
  •使用工具與技巧整理格式雜亂的原始資料
  •讀寫自然語言
  •爬過表單與登入頁
  •瞭解如何搜刮JavaScript
  •學會影像處理與文字識別
 

作者介紹

作者簡介

Ryan Mitchell


  Ryan Mitchell 是波士頓LinkeDrive的軟體工程師,她為公司開發了API與資料分析工具,經常為金融與零售業界提供網站擷取技術的諮詢。
 

目錄

第一部分 建構 Scraper
第一章 您的第一個 Scraper
第二章 進階 HTML 解析
第三章 開始爬行
第四章 使用 API
第五章 儲存資料
第六章 讀取文件

第二部分 進階 Scraping
第七章 清理您的髒資料
第八章 讀寫自然語言
第九章 爬過表單與登入頁
第十章 搜刮 JavaScript
第十一章 影像處理與文字辨識
第十二章 避開 Scraping 陷阱
第十三章 以 Scrapers 測試您的網站
第十四章 遠端 Scraping

附錄A Python 概覽
附錄B Internet 概覽
附錄C 擷取網頁時的法律與道德考量
 
 

詳細資料

  • ISBN:9789864761753
  • 規格:平裝 / 256頁 / 18.5 x 23 cm / 普通級 / 單色印刷 / 初版
  • 出版地:台灣

會員評鑑 TOP

會員評鑑等級

5顆星

,共 1 位寫評鑑。

感謝您要為本商品發表您的看法,這是專屬於博客來會員的發表園地。請先 登入加入會員

 

特惠贈品

載入中...

最近瀏覽商品

 

相關活動

  • 專家之道【歐萊禮】全面79折,任選2書77折
 

購物說明

若您具有法人身份為常態性且大量購書者,或有特殊作業需求,建議您可洽詢「企業採購」。 

退換貨說明 

會員所購買的商品均享有到貨十天的猶豫期(含例假日)。退回之商品必須於猶豫期內寄回。 

辦理退換貨時,商品必須是全新狀態與完整包裝(請注意保持商品本體、配件、贈品、保證書、原廠包裝及所有附隨文件或資料的完整性,切勿缺漏任何配件或損毀原廠外盒)。退回商品無法回復原狀者,恐將影響退貨權益或需負擔部分費用。 

訂購本商品前請務必詳閱商品退換貨原則 

  • 1
  • 1

訂閱電子報

想獲得最新商品資訊,請訂閱免費電子報