91av视频/亚洲h视频/操亚洲美女/外国一级黄色毛片 - 国产三级三级三级三级

  • 大小: 654KB
    文件類型: .zip
    金幣: 2
    下載: 1 次
    發布日期: 2021-07-08
  • 語言: Python
  • 標簽: 數據分析??

資源簡介

某招聘網站數據分析案例,數據清洗、圖表顯示,python編寫及數據集

資源截圖

代碼片段和文件信息

#全國14個熱門城市,搜索數據分析崗位的結果條目,共4087條
import?numpy?as?np
import?pandas?as?pd
import?matplotlib.pyplot?as?plt
plt.rcParams[‘font.sans-serif‘]=[‘SimHei‘]?
plt.rcParams[‘axes.unicode_minus‘]?=?False
data?=?pd.read_excel(r‘boss_zhipin.xls‘sheet_name=‘boss_res‘)
data.head()

#將id列設為索引
data1?=?data.set_index(‘id‘)
data1.info()
#去除是實習工作的行,只保留全職工作
drop_lt?=?data1[data1[‘full_time‘]==‘否‘].index
data2?=?data1.drop(drop_ltaxis=0)
data2.info()?#刪除后還剩4011行,一共刪除了76行

#增加平均年薪列
data2[‘salary_max‘]=data2[‘salary_max‘].astype(‘int64‘)
data2[‘salary_year_avg‘]?=?((data2[‘salary_min‘]+data2[‘salary_max‘])/2)*data2[‘month‘]
data2[‘salary_avg‘]?=?data2[‘salary_year_avg‘]/12#增加平均工資列
data2.head()
#14城總體工資分布情況
data2[‘salary_avg‘].describe()
data2[‘salary_avg‘].plot(kind=‘box‘)
plt.show()

#工資的中位數為8k,最低工資1.5k最高工資95k
data2[data2[‘salary_avg‘].isin([1.595])]#其中沒有數據分析崗,而是其他的崗位,與這些公司發布職位的分類有關

#多數工資為6k-11k左右,其次為3k-6k
figax?=?plt.subplots(11figsize=(86))
ax.hist(data2[‘salary_avg‘]bins=20density=True)
#data2[‘salary_avg‘].plot(ax=axkind=‘kde‘)
ax.set_xticks(range(51005))
ax.grid(True)
plt.show()??

data2.city.value_counts()#不同城市的工資情況
ser?=?data2.groupby(‘city‘)[‘salary_avg‘].median()
figa?=?plt.subplots(11figsize=(126))
ser.plot(kind=‘bar‘ax=awidth=0.8color=‘gold‘label=‘各城市平均工資‘)
a.plot(ser.indexnp.array(np.random.randint(8914))linestyle=‘--‘label=‘全國平均工資‘)
plt.legend(loc=‘best‘)?#各城市的平均工資都高于6k其中高于全國平均線的為北京、上海、杭州、深圳、廣州
data2.head()

data2[‘education‘].value_counts()#各學歷分布情況
data2[data2[‘education‘]==‘博士‘]#要求博士學歷的很少,看一下是哪些職位要求博士的
se?=?data2.groupby(‘education‘)[‘salary_avg‘].median()#學歷與工資的關系
se?=?se.sort_values(ascending=False)
figaa?=?plt.subplots(11figsize=(86))
se.plot(kind=‘bar‘color=‘green‘)
plt.title(‘學歷與工資的關系‘)
plt.show()
#學歷越高,工資越高
#初中及以下的平均工資與本科一樣,高過大專,可能是這些公司為了在招聘時博得求職者關注,應該有問題,如培訓機構
data2[data2[‘education‘]==‘初中及以下‘]

#工作經驗與工資的關系
ss?=?data2.groupby(‘experience‘)[‘salary_avg‘].median()
ss?=?ss.sort_values()
ss.plot(kind=?‘bar‘figsize=(106))
ss.plot(color=‘orange‘)
plt.show()
#由圖可見,工作經驗越高,工資越高。經驗為一年以內的與經驗不限的工資水平基本一樣。
#從折線斜率看,新人在參加工作的前1-2年工資平穩增長,但越往后,則越值錢,可見數據分析是越老越吃香,與吃青春飯的程序員不一樣。

data2[‘industry‘].value_counts()#行業與工資的關系#招聘信息共來自于89個行業,其中最多的是互聯網

#繪制一個以地圖為背景的行業分布詞云圖
import?jieba
import?wordcloud
from?imageio?import?imread
mask=imread(‘Chinamap.jpg‘)
w?=?wordcloud.WordCloud(width=1000height=700font_path=‘msyh.ttf‘background_color=‘white‘max_words=20mask=mask)
txt?=?‘‘.join(data2[‘industry‘])
ls?=?jieba.lcut(txt)
txt?=?‘?‘.join(ls)
res?=?w.generate(txt)
plt.axis(‘off‘)
plt.imshow(res)

#挑選前10個熱門行業作分析
industry_lt?=?data2[‘industry‘].value_counts().head(10).index.tolist()
industry_data?=?data2[data2[‘industry‘].isin(industry_lt)]
res?=?industry_data.groupby([‘industry‘‘education‘])[‘salary_min‘].median()
df?=?res.unstack(-1)
df.plot(kind=‘bar‘figsize=(1510)width=1color=[‘g‘‘gold‘‘c‘‘m‘‘wheat‘‘cornflowerblue‘‘tomato‘‘y‘])
plt.show()
#可見平均工

?屬性????????????大小?????日期????時間???名稱
-----------?---------??----------?-----??----
?????文件?????3000320??2019-08-22?10:04??某招聘網站數據分析案例及數據集\boss_zhipin.xls
?????文件????????5549??2019-11-07?14:50??某招聘網站數據分析案例及數據集\源碼.py
?????目錄???????????0??2019-11-07?14:50??某招聘網站數據分析案例及數據集\

評論

共有 條評論