資源簡介
python爬蟲抓取北京天氣的一個超級簡單的案例
代碼片段和文件信息
#!/usr/bin/python
#-*-?coding=UTF-8?-*-
import?urllib
import?re
def?getHtml(url):
page?=?urllib.urlopen(url)
html?=?page.read()
page.close
return?html
def?get_city(html):
reg?=?r‘tle>【(.+?)天氣】.+? tle>‘
get_re?=?re.compile(reg)
get_list?=?re.findall(get_rehtml)
return?get_list[0]
def?get_start(html):
reg=r‘.+?(今天.+?
‘
get_re?=?re.compile(reg)
get_list?=?re.findall(get_rehtml)
return?get_list[0]
def?get_end(html):
reg=r‘.+?(明天.+?
‘
get_re?=?re.compile(reg)
get_list?=?re.findall(get_rehtml)
return?get_list[0]
def?get_block(html):
start=html.find(get_start(html))
end=html.find(get_end(html))
block=html[start:end]
return?block
def?get_block_date(block):
reg=r‘(.+?)(今天.+?
‘
get_re?=?re.compile(reg)
get_list?=?re.findall(get_reblock)
return?get_list[0]
def?get_block_air(block):
reg=r‘p?class=“wea“?title
評論
共有 條評論