資源簡介
代碼片段和文件信息
import?reurllib.request
import?os
from?sqlalchemy?import?false
index=0
headers?=?{‘User-Agent‘:‘Mozilla/5.0?(Windows?NT?6.1;?WOW64;?rv:23.0)?Gecko/20100101?Firefox/23.0‘}
#?for?i?in?range(2256):
for?i?in?range(25):#2-4頁
????req?=?urllib.request.Request(url=‘https://www.mzitu.com/page/‘+str(i)+‘/‘?headers=headers)
????request?=?urllib.request.urlopen(req).read()
????buf?=?request.decode(‘utf-8‘)
????listurl?=?re.findall(r‘data-original.+\.jpg‘buf)
????res=[]
????for?src?in?listurl:
????????a=?re.findall(r‘data-original.+\.[jp][pn]g‘src)
????????res.append(a[0])
????res1=[]
????url1=[]
????for?url?in?res:
????????url1.append(url.partition(‘?‘)[0])
????for?src?in?url1:
????????b?=?re.findall(r‘https.
- 上一篇:深度學習YOLOv3分類算法
- 下一篇:python爬蟲爬取豆瓣電影信息
評論
共有 條評論