資源簡介
使用python對淘寶數據進行爬取,瀏覽器需要設置為搜狐瀏覽器,若不是搜狐瀏覽器,則需要對瀏覽器對象進行更改。

代碼片段和文件信息
#?coding:?utf-8
#?打開cmd命令行??輸入pip?install?selenium?下載包
#?從selenium中引入webdriver
from?selenium?import?webdriver
#?引入時間模塊
import?time
#?1.創建瀏覽器對象,并打開瀏覽器
driver?=?webdriver.Firefox()
#?2.在瀏覽器中訪問網址
driver.get(‘http://www.baidu.com‘)
#?當前頁的網頁源代碼
#?print?driver.page_source
#?根據id查找某個標簽
#?element?=?driver.find_element_by_id(‘kw‘)
#?#?輸入搜索關鍵詞
#?element.send_keys(u‘淘寶‘)
#?通過id找到百度一下按鈕
news_link?=?driver.find_element_by_link_text(‘新聞‘)
#?#?執行點擊操作
news_link.click()
#?程序休眠3秒
time.sleep(3)
#?退出瀏覽器
driver.quit()
#?element?不加s?找到的是一個標簽
#?driver.find_element_by_id()??#?根據id查找
#?driver.find_element_by_class_name()??#?根據class查找
#?driver.find_element_by_css_selector()??#?根據css選擇器查找
#?driver.find_element_by_name()??#?根據name查找
#?driver.find_element_by_link_text()?#?根據鏈接文本查找
#?elements?查找多個符合條件的標簽,并且返回一個列表
#?rs?=?driver.find_elements_by_class_name(‘mnav‘)
#?print?rs
?屬性????????????大小?????日期????時間???名稱
-----------?---------??----------?-----??----
?????目錄???????????0??2018-01-12?11:52??2018_1_12_am\
?????目錄???????????0??2018-01-12?11:55??2018_1_12_am\.idea\
?????文件?????????516??2018-01-12?09:29??2018_1_12_am\.idea\2018_1_12_am.iml
?????文件?????????598??2018-01-12?09:28??2018_1_12_am\.idea\deployment.xm
?????目錄???????????0??2018-01-12?09:28??2018_1_12_am\.idea\inspectionProfiles\
?????文件?????????270??2018-01-12?09:28??2018_1_12_am\.idea\inspectionProfiles\Project_Default.xm
?????文件?????????213??2018-01-12?09:29??2018_1_12_am\.idea\misc.xm
?????文件?????????276??2018-01-12?09:26??2018_1_12_am\.idea\modules.xm
?????文件???????17309??2018-01-12?11:55??2018_1_12_am\.idea\workspace.xm
?????文件????????1121??2018-01-12?10:29??2018_1_12_am\css_selector.html
?????文件????????6527??2018-01-12?11:55??2018_1_12_am\geckodriver.log
?????文件????????1207??2018-01-12?10:10??2018_1_12_am\sele_demo.py
?????文件???????69007??2018-01-12?11:53??2018_1_12_am\shops.txt
?????文件????????1505??2018-01-12?11:52??2018_1_12_am\taobao_spider.py
評論
共有 條評論