python 微博爬蟲（lxml）

大小: 7.81KB

文件類型: .py

金幣: 1

下載: 0 次

發(fā)布日期: 2021-01-30
語言: Python
標(biāo)簽: 爬蟲??微博??

高速下載

資源簡介

需要創(chuàng)建 D:/weibo/weibo_crawl.txt 文件，然后運行該示例即可

資源截圖

小圖大圖

代碼片段和文件信息

#?-*-?coding:utf-8?-*-
‘‘‘
Created?on?2018年3月9日

@author:?ora_jason
‘‘‘
from?lxml?import?html
import?requests
import?json
import?re
import?os
import?time
import?urllib.request


class?CrawlWeibo:#?獲取指定博主的所有微博cards的list
??def?getCards（self?id?page）:??#?id（字符串類型）：博主的用戶id；page（整型）：微博翻頁參數(shù)
???ii?=?0
???list_cards?=?[]
???while?ii?????????????ii?=?ii?+?1
???print（‘正在爬取第%d頁cards‘?%?ii）
???url?=?‘https://m.weibo.cn/api/container/getIndex?type=uid&value=‘?+?id?+?‘&containerid=107603‘?+?id?+?‘&page=‘?+?str（ii）

???print（url）
???response?=?requests.get（url?headers=headers）
???ob_json?=?json.loads（response.text）??#?ob_json為dict類型

???list_cards.append（ob_json[‘data‘][‘cards‘]）??#?ob_json[‘data‘][‘cards‘]為list類型
???time.sleep（2）
???print（‘暫停2秒‘）??#?爬完一頁所有微博的card

上一篇：python 爬取QQ音樂并至本地
下一篇：Python3.x+ django2.x 在線教育系統(tǒng)源碼

91av视频/亚洲h视频/操亚洲美女/外国一级黄色毛片 - 国产三级三级三级三级

python 微博爬蟲（lxml）

資源簡介

資源截圖

代碼片段和文件信息

評論

相關(guān)資源

91av视频/亚洲h视频/操亚洲美女/外国一级黄色毛片 - 国产三级三级三级三级

python 微博爬蟲 （lxml）

資源簡介

資源截圖

代碼片段和文件信息

評論

相關(guān)資源

python 微博爬蟲（lxml）