91av视频/亚洲h视频/操亚洲美女/外国一级黄色毛片 - 国产三级三级三级三级

  • 大小: 4KB
    文件類型: .py
    金幣: 1
    下載: 0 次
    發布日期: 2021-05-12
  • 語言: Python
  • 標簽: python??爬蟲??微博??

資源簡介

才剛剛學習python不久,自己琢磨做的一個微博爬蟲小程序,可以自動下載其他人的微博圖片以及視頻,大佬勿噴。

資源截圖

代碼片段和文件信息

#?-*-?coding:?utf-8?-*-
“““
本腳本可以爬取用戶的圖片及其視頻
為了減少不必要的麻煩,以移動端(m.weibo.cn)為爬取目標
ID是其主頁面url后面數字,如https://m.weibo.cn/u/123456的ID就是123456
“““
import?requests
import?os
import?threading
import?sys
import?time

head?=?{
‘User-Agent‘:‘Mozilla/5.0?(Windows?NT?10.0;?Win64;?x64)?AppleWebKit/537.36?(KHTML?like?Gecko)?Chrome/64.0.3282.119?Safari/537.36‘
}

def?get_url():
????url?=?‘https://m.weibo.cn/api/container/getIndex?type=uid&value=‘?+?uid
????response?=?requests.get(url)
????containerid?=?response.json()[‘data‘][‘tabsInfo‘][‘tabs‘][1][‘containerid‘]
????url?=?url?+?‘&containerid=‘?+?containerid?+?‘&page=‘
????return?url

def?get_url_list():
????url?=?get_url()
????page?=?0
????pic_list?=?[]
????video_list?=?[]
????while?True:
????????page?+=?1
????????sys.stdout.write(‘page:{}\r‘.format(page))
????????sys.stdout.flush()
????????now_url?=?url+str(page)
????????response?=?requests.get(now_url?headers?=?head).json()
????????#?當用戶微博過多時,可能不會繼續返回后面的頁面,所以暫停一下
????????if?not?response[‘ok‘]:
????????????print(‘error?page:‘?page)
????????????page?-=?1
????????????time.sleep(10)
????????????continue
????????cards?=?response[‘data‘][‘cards‘]
????????for?card?in?cards:
????????????try:
????????????????mblog?=?card[‘mblog‘]
????????????except:
????????????????continue
????????????if?‘pics‘?in?mblog.keys():
????????????????for?pic?in?mblog[‘pics‘]:
????????????????????pic_list.append(pic[‘large‘][‘url‘])
????????????elif?‘page_info‘?in?mblog.keys():
????????????????try:
????????????????????video_list.append(mblog[‘page_info‘][‘media_info‘][‘stream_url‘])
????????????????except:
????????????????????pass
????????if?response[‘data‘][‘cardlistInfo‘][‘page‘]?==?None:
????????????break
????#?total?=?response.json()[‘data‘][‘cardlistInfo‘][‘total‘]
????return?pic_list?video_list

def?get_pic(pic_urlpic_num):
????name?=?str(pic_num)?+?‘

評論

共有 條評論