-
大小: 1.49MB文件類型: .pdf金幣: 1下載: 0 次發(fā)布日期: 2023-10-25
- 語言: Python
- 標簽: python??for??information??
資源簡介
本書講解了如何使用python網(wǎng)絡(luò)爬蟲程序,內(nèi)容包括網(wǎng)絡(luò)爬蟲簡介,從頁面抓取數(shù)據(jù)的三種方法,提取緩存中的數(shù)據(jù)。使用多個線程和進程進行并發(fā)抓取。如何抓取動態(tài)頁面中的內(nèi)容。與表單進行交互,處理頁面中的驗證碼問題。以及使用scarpy和Portia來來進行數(shù)據(jù)抓取,并在最后使用本書介紹的數(shù)據(jù)抓取技術(shù)對幾個真實的網(wǎng)站進行了抓取
代碼片段和文件信息
評論
共有 條評論