作為一個自學爬蟲的過來人,曾經走過很多彎路,在自學的道路上也迷茫過。每次面對一個全新的網站,都像是踏進一個未知的世界。你不知道前面有哪些反爬手段在等著你;你不知道你會踩進哪個坑裡。我做爬蟲的幾年時間裡,爬過很多的網站、遇到過很多的難題。這本書就是我這幾年經驗的總結,從開始的工具的學習使用,到實戰專案的爬取,難度一步一步的升級,需求也越來越複雜,有各式各樣的爬取方式。
本書主要內容與資料爬取相關,包括編寫爬蟲所需要的基礎程式設計知識,如Requests包、Scrapy框架和資料庫的使用,到專案實戰教程,適合Python基礎入門的讀者。如果你是其他行業的從業者,想進入IT行業成為一位元爬蟲工程師,又或者你已經是IT行業的從業者,本書在能夠讓你在對爬蟲工程師的工作內容有所瞭解的同時,也能讓你掌握作為一個爬蟲工程師所需要具備的基礎技能。