資源簡介
python爬取淘寶商品新信息,如果出現亂碼,請加上如下代碼:
import sys reload(sys) sys.setdefaultencoding('utf8')
代碼片段和文件信息
#coding=utf-8
#?根據輸入的關鍵字查詢淘寶商品數據
#?淘寶編碼是gbk
import?re
import?requests
url?=?‘https://s.taobao.com/search‘
sp?=?input(‘請輸入查詢商品:‘)
page_num?=?input(‘請輸入查詢頁碼(以逗號隔開):‘)
ll?=?page_num.split(‘‘)
if?len(ll)?==?2?:
????pass
elif?len(ll)?2:
????raise?ValueError(‘請輸入查詢頁碼信息格式如下:12‘)
payload?=?{‘q‘:?sp‘s‘:?‘1‘‘ie‘:‘utf8‘}??#字典傳遞url參數
#?file?=?open(‘taobao_test.txt‘‘w‘encoding=‘utf-8‘)
for?k?in?range(int(ll[0])int(ll[1])):????????#100次,就是100個頁的商品數據
#?for?k?in?range(int(1)100):
????payload?[‘s‘]?=?44*k+1???#此處改變的url參數為s,s為1時第一頁,s為45是第二頁,89時第三頁以此類推??????????????????????????
????resp?=?requests.get(url?params?=?payload)
????print((resp.url))??????????#打印訪問的網址
????resp.encoding?=?‘utf-8‘??#設置編碼
????print(resp.text)
????title?=?re.findall(r‘“raw_title“:“([^“]+)“‘resp
- 上一篇:python 爬取豌豆莢APP的爬蟲
- 下一篇:python 爬去代理ip
評論
共有 條評論