91av视频/亚洲h视频/操亚洲美女/外国一级黄色毛片 - 国产三级三级三级三级

資源簡介

Python寫的爬蟲,可以實現通過isbn碼查詢書籍詳細信息。僅供學習,勿作商用,如有違反,后果自負。
注意:此為2.0版本,第一個版本由于某種原因已不能使用。

資源截圖

代碼片段和文件信息

#-*-?coding:utf-8?-*-

“““
????Author:萬俟淋曦
????Time:2019年10月13日11:00:28
????Function:通過isbn查詢書籍詳細信息
????Statement:僅供學習,勿作商用,如有違反,后果自負
????P.S.:如有問題可以聯系我,qq1055311345,好友驗證:isbn
“““

import?re
import?sys
import?urllib
import?requests
from?lxml?import?etree
from?bs4?import?BeautifulSoup
from?selenium?import?webdriver

def?isbn_search(isbn):
????“““
????????輸入:isbn
????????輸出:豆瓣搜索結果的書籍鏈接
????“““
????#?創建瀏覽器對象
????browser?=?webdriver.PhantomJS()
????#?請求網址
????browser.get(“https://book.douban.com/subject_search?search_text=“?+?isbn?+?“&cat=1001“)
????#?解析網頁信息
????soup?=?BeautifulSoup(browser.page_source?“lxml“)
????#?讀取標簽內容
????tags?=?soup.select(“#root?>?div?>?div?>?div?>?div?>?div?>?div?>?a“)
????#?print(type(tags))
????#?print(info)
????#?正則查找href鏈接
????link_list?=?re.findall(r“(?<=href=\“).+?(?=\“)|(?<=href=\‘).+?(?=\‘)“?str(tags[0]))
????#?關閉瀏覽器
????browser.close()
????return?link_list[0]

def?get_people_num(douban_link):
????“““
????獲取評價人數,未使用
????“““
????#?douban_link=‘http://book.douban.com/subject/6082808/?from=tag_all‘?#?For?Test
????g=requests.get(douban_link)
????soup=BeautifulSoup(g.content“lxml“)

????people_num?=?soup.find(‘div‘?{‘class‘:?‘rating_sum‘}).findAll(‘span‘)[1].string.strip()
????return?people_num

def?book_info(douban_link):
????“““
????????輸入:豆瓣書籍鏈接
????????輸出:書籍信息
????“““
????headers?=?{‘User-Agent‘:‘Mozilla/5.0?(Windows?NT?10.0;?Win64;?x64)?\
????????AppleWebKit/537.36?(KHTML?like?Gecko)?Chrome/80.0.3987.149?Safari/537.36‘}
????#?請求網址
????g=requests.get(douban_linkheaders=headers)
????#?解析網頁信息
????soup=BeautifulSoup(g.content“lxml“)
????#?由于書名和其他信息不在一起,單獨處理書名
????title?=?“書名:?《“?+?re.sub(‘[\f\n\r\t\v]‘‘‘re.sub(‘<([^>]+?)>‘‘‘str((soup.select(“#wrapper?>?h1?>?span“))[0])))?+?“》“
????#?存儲書籍信息
????infos?=?[title]
????#?返回特定區域的html代碼塊
????span_list?=?soup.findChild(‘div‘{‘id‘:‘info‘})
????#?try:
????for?item?in?str(span_list).spl

評論

共有 條評論