91av视频/亚洲h视频/操亚洲美女/外国一级黄色毛片 - 国产三级三级三级三级

資源簡介


資源截圖

代碼片段和文件信息

from?bs4?import?BeautifulSoup?#解析網頁
import?re?#正則表達式,進行文字匹配
import?urllib.requesturllib.error??#制定url,獲取網頁數據
import?xlwt??#進行excel操作
import?sqlite3??#進行SQLite數據庫操作

def?main():
????baseurl?=?“https://cy.ncss.cn/search/projects“
????#爬取網頁
????datalist?=?getData(baseurl)
????#保存數據
????savepath?=?“50.xls“
????saveData(datalistsavepath)
#電影鏈接
findlink?=?re.compile(r‘‘)
#封面圖片
findImgSrc?=?re.compile(r‘‘re.S)
#電影名稱
findtitle?=?re.compile(r‘tle“>(.*)‘)
#評分
findRating?=?re.compile(r‘(.*)‘)
#評價人數
findJudge?=?re.compile(r‘(\d*)人評價‘)
#概況
findInq?=?re.compile(r‘(.*)‘)
#電影詳細內容
findBd?=?re.compile(r‘(.*?)

‘re.S)

#爬取網頁
def?getData(baseurl):
????datalist?=?[]
????for?i?in?range(010):
????????url?=?baseurl?+?str(i*25)
????????html?=?askURL(url)


????????#逐一解析數據
????????soup?=?BeautifulSoup(html“html.parser“)
????????for?item?in?soup.find_all(‘div‘class_=“item“):
????????????#print(item)
????????????data?=?[]
????????????item?=?str(item)

????????????link?=?re.findall(findlinkitem)[0]
????????????data.append(link)

????????????ImgSrc?=?re.findall(findImgSrcitem)[0]
????????????data.append(ImgSrc)

????????????title?=?re.findall(findtitleitem)
????????????if?len(title)==2:
????????????????ctitle?=?title[0]
????????????????data.append(ctitle)
????????????????otitle?=?title[1].replace(“/“““)
????????????????data.append(otitle)
????????????else:
????????????????data.append(title[0])
????????????????data.append(‘?‘)

????????????Rating?=?re.findall(f

評論

共有 條評論