91av视频/亚洲h视频/操亚洲美女/外国一级黄色毛片 - 国产三级三级三级三级

<dl id="9ojc4"></dl>

源碼之巔峰

Python爬取豆瓣圖書信息

收藏(0)

大小: 3KB

文件類型: .py

金幣: 1

下載: 1 次

發布日期: 2021-09-02
語言: Python
標簽: 豆瓣爬蟲??Python??selenium??

高速下載

資源簡介

爬取指定標簽List下評分8.5分以上的圖書信息，包括書名、作者、評分、簡介，并保存到excel，以標簽分類，放到不同的sheet中。核心代碼： title= book.find_element_by_xpath('.//a[1]').text #獲取書名 zuozhe= book.find_element_by_xpath('.//div[1]').text.split('/',1)[0] jianjie= book.find_element_by_xpath('.//p[1]').text #獲取簡介 worksheet.write(i,0,fenshu); #分數寫入第i行的第一列 worksheet.write(i,1,title); #書名寫入第i行的第二列 worksheet.write(i,2,zuozhe); #作者寫入第i行的第三列 worksheet.write(i,3,jianjie); #簡介寫入第i行的第四列

資源截圖

小圖大圖

代碼片段和文件信息

#coding:utf-8
from?selenium?import?webdriver?#自動化測試模塊
from?urllib?import?parse?#url過濾特殊字符
import?xlwt?#excel寫入用

self?=?webdriver.Chrome（）??#指定selenium進行自動化操作時選用谷歌瀏覽器
workbook?=?xlwt.Workbook（encoding?=?‘ascii‘）?#創建workbook
k=0;
fenlei=[?
‘職場‘‘互聯網‘‘用戶體驗‘?
]
try:
	for?f?in?fenlei:
		print（f）
		worksheet?=?workbook.add_sheet（f）?#每各標簽創建一個sheet，sheet名為標簽名
		i=0;#記錄每個標簽爬取到了多少符合條件的數據
		j=0;#記錄每個標簽有多少數據結構不規范的數據
		self.get（‘https://book.douban.com/tag/‘+parse.quote（f）+‘?start=0&type=T‘）??#打開指定標簽第一頁的網頁
		pagesize?=?int（self.find_elements_by_class_name（‘paginator‘）[0].find_element_by_xpath（‘.//a[last（）]‘）.text）?#獲取該標簽下有多少頁數據
		if?pagesize>50:?#不知道為什么，每個標簽下，只能瀏覽前50頁
			pagesize=50
		for?num?in?range（0pagesize）:
			self.get（‘https://book.douban.com/tag/‘+parse.quote（f）+‘?start=‘+str（num*20）+‘&type=T‘）?#打開指定標簽、指定頁數的網頁
			total_book?=?self.find_element_by_id（‘subject_list‘）?#獲得當頁圖書列表所在容器
			books?=?total_book.find_elements_by_class_name（‘info‘）???#獲得當頁所有包含單個圖書信息的容器，返回一個數組
			for?book?in?books

上一篇：教務管理系統（Python）
下一篇：百度坐標轉WGS84坐標程序

評論

共有條評論

相關資源

二級考試python試題12套（包括選擇題和
pywin32_python3.6_64位
python+ selenium教程
PycURL（Windows7/Win32）Python2.7安裝包 P
英文原版-Scientific Computing with Python
7.圖像風格遷移基于深度學習 pyt
基于Python的學生管理系統
A Byte of Python（簡明Python教程）（第
Python實例174946
Python 人臉識別
Python 人事管理系統
基于python-flask的個人博客系統
計算機視覺應用開發流程
python 調用sftp斷點續傳文件
python socket游戲
基于Python爬蟲爬取天氣預報信息
python函數編程和講解
Python開發的個人博客
基于python的三層神經網絡模型搭建
python實現自動操作windows應用
python人臉識別（opencv）
python 繪圖（方形、線條、圓形）
python疫情卡UN管控
python 連連看小游戲源碼
基于PyQt5的視頻播放器設計
一個簡單的python爬蟲
csv文件行列轉換python實現代碼
Python操作Mysql教程手冊
Python Machine Learning Case Studies
python獲取硬件信息