-
大小: 9.78 MB文件類型: .pdf金幣: 1下載: 0 次發(fā)布日期: 2020-12-14
- 語言: Python
- 標(biāo)簽: python??網(wǎng)絡(luò)爬蟲??
資源簡(jiǎn)介
本書講解了如何使用P川lOil來編寫網(wǎng)絡(luò)爬蟲程序, 內(nèi)容包括網(wǎng)絡(luò)爬蟲簡(jiǎn)介, 從頁面中抓取數(shù)據(jù)的三種方法, 提取緩存中 的數(shù)據(jù), 使用多個(gè)線程和進(jìn)程來進(jìn)行并發(fā)抓取, 如何抓取動(dòng)態(tài)頁面中 的內(nèi)容, 與表單進(jìn)行交互 , 處理頁面中的驗(yàn)證碼問題, 以及使用 Sca rpy和 Portia 來進(jìn)行數(shù)據(jù)抓取, 并在最后使 用本書介紹的數(shù)據(jù)抓取技術(shù)對(duì)幾個(gè)真實(shí)的網(wǎng)站進(jìn)行了抓取, 旨在幫助讀者活學(xué)活用書中介紹的技術(shù) 。
代碼片段和文件信息
- 上一篇:與孩子一起學(xué)編程(中文完整版)
- 下一篇:Python核心編程第二版本
評(píng)論
共有 條評(píng)論