資源簡介
《用Python寫網絡爬蟲》介紹了如下內容:
通過跟蹤鏈接來爬取網站;
使用lxml從頁面中抽取數據;
構建線程爬蟲來并行爬取頁面;
將下載的內容進行緩存,以降低帶寬消耗;
解析依賴于JavaScript的網站;
與表單和會話進行交互;
解決受保護頁面的驗證碼問題;
對AJAX調用進行逆向工程;
使用Scrapy創建高級爬蟲。

代碼片段和文件信息
?屬性????????????大小?????日期????時間???名稱
-----------?---------??----------?-----??----
?????文件????10348169??2017-10-16?14:28??用Python寫網絡爬蟲.pdf
-----------?---------??----------?-----??----
?????文件????10348169??2017-10-16?14:28??用Python寫網絡爬蟲.pdf
評論
共有 條評論