-
大小: 0.17M文件類型: .rar金幣: 1下載: 0 次發布日期: 2021-01-31
- 語言: 其他
- 標簽:
資源簡介
通過python爬蟲,對德語專業的招聘數據做了數據爬取,之后采用seaborn庫作了可視化,包括了琴形圖、柱狀圖、曲線圖還有箱型圖,此處給出爬蟲python代碼和可視化代碼
代碼片段和文件信息
#?coding:?utf-8
#?In[196]:
import?pandas?as?pd
import?re
import?numpy?as?np
a=pd.read_csv(‘F:\\xiaofang\\1.csv‘)
t=[]
for?i?in?a[‘salary‘]:
????
?t1=re.sub(‘K‘‘‘str(i))
?t2=re.sub(‘k‘‘‘t1).split(‘-‘)
????
?t.append(np.mean([int(tt)?for?tt?in?t2]))
a.loc[:‘salary_average‘]=t
#print(a.loc[:‘salary_average‘])
y=-1
for?i?in?a[‘workYear‘]:
?y+=1?
?pat=‘.*\-.*‘
?p=re.compile(pat)
?p2=re.compile(‘.*年[以上|以下].*‘)???
????
?p3=re.compile(‘.*[應屆畢業生|不限].*‘)
?if(p.match(i)):
?????t1=re.sub(‘年‘‘‘str(i))
?????t2=re.sub(‘y‘‘‘t1).split(‘-‘)
????
?????vb=np.mean([int(tt)?for?tt?in?t2])
?????a.loc[y‘workyear_average‘]=vb
???
?elif(p2.match(i)):
?????t1=re.sub(‘年以上‘‘‘str(i))
?????t2=re.sub(‘年以下‘‘‘t1)
????
?????vb=np.mean([int(tt)?for?tt?in?t2])
?????a.loc[y‘workyear_average‘]=vb
????
?
?屬性????????????大小?????日期????時間???名稱
-----------?---------??----------?-----??----
?????文件?????285883??2018-09-21?16:23??keshi.ipynb
?????文件???????2950??2018-09-21?16:19??lagouspider.py
?????文件??????47487??2018-09-21?16:19??lagouspider.ipynb
?????文件???????7749??2018-09-21?16:23??keshi.py
-----------?---------??----------?-----??----
???????????????344069????????????????????4
評論
共有 條評論