91av视频/亚洲h视频/操亚洲美女/外国一级黄色毛片 - 国产三级三级三级三级

資源簡介

爬蟲文件(Python實現)[爬取的成都所有房價]-爬取的數據文件(txt文件,空格分隔)[成都所有房價信息]-分析的文件(Python實現)(pandas+numpy+matplotlib分析)-簡單的分析結果圖(png圖)

資源截圖

代碼片段和文件信息

import?numpy?as?np
import?pandas?as?pd
import?matplotlib.pyplot?as?plt

data?=?pd.read_csv(‘58.csv‘?encoding=‘gbk‘)
print(data.head())??#?查看前5行
print(data.tail())??#?查看后5行
data.info()??#?查看數據信息
print(data.describe())??#?統計學指標查看數據概要

#?#?處理缺失數據
#?data[‘單價/每平米‘].fillna(‘無‘?inplace=True)
#?data[‘面積/每平米‘].fillna(‘無‘?inplace=True)
#?data[‘總價/萬‘].fillna(‘無‘?inplace=True)

print(data[‘地區‘].unique())??#?打印出地區唯一化后的值
print(len(data[‘地區‘].unique()))??#?打印出地區唯一化后的個數

print(data[‘地區‘].value_counts())??#?對每個地區的數量進行統計
print(data.groupby(‘地區‘)[‘單價/每平米‘].mean().sort_values(ascending=False))??#?單價平均值
print(data.groupby(‘地區‘)[‘面積/平方米‘].mean().sort_values(ascending=False))??#?面積平均值
print(data.groupby(‘地區‘)[‘總價/萬‘].mean().sort_values(ascending=False))??#?總價平均值

‘‘‘[‘郫縣‘?‘成都‘?‘成都周邊‘?‘都江堰‘?‘雙流‘?‘溫江‘?‘新都‘?‘龍泉驛‘?‘金?!?‘高新西區‘?‘武侯‘?‘成華‘?‘青羊‘?‘錦江‘?‘高新區‘?‘天府新區‘]‘‘‘

#?通過搜索引擎等途徑獲取到每個總統候選人的所屬黨派建立字典parties候選人名字作為鍵所屬黨派作為對應的值
parties?=?{‘郫縣‘:?‘郫縣區‘
???????????‘成都‘:?‘成都內‘
???????????‘成都周邊‘:?‘成都周邊‘
???????????‘都江堰‘:?‘都江堰‘
???????????‘雙流‘:?‘雙流區‘
???????????‘溫江‘:?‘溫江‘
???????????‘新都‘:?‘新都‘
???????????‘龍泉驛‘:?‘龍泉驛‘
???????????‘金?!??‘金牛區‘
???????????‘高新西區‘:?‘高新西區‘
???????????“武侯“:?‘武侯區‘
???????????‘成華‘:?‘成華區‘
???????????‘青羊‘:?‘青羊區‘
???????????‘錦江‘:?‘錦江區‘
???????????‘高新區‘:?‘高新區‘
???????????‘天府新區‘:?‘天府新區‘}
print(‘-----增加一列地區2存儲地區信息-----‘)
data[‘地區2‘]?=?data[‘地區‘].map(parties)
print(“data[‘地區2‘].value_counts():\n“?data[‘地區2‘].value_counts())??#?查看兩個黨派的情況

#?結局matplotlib圖標無法顯示中文的情況
from?pylab?import?mpl

mpl.rcParams[‘font.sans-serif‘]?=?[‘FangSong‘]??#?指定默認字體??#?調節matplotlib支持中文字體
mpl.rcParams[‘axes.unicode_minus‘]?=?False??#?解決保存圖像是負號‘-‘顯示為方塊的問題

#?數據離散化?單價
bins1?=?np.array([0?5000?10000?15000?20000?25000?30000?55000])
data_ls1?=?pd.cut(data[‘單價/每平米‘]?bins1)??#?bins1離散化數組?data_ls1?離散化數據

#?數據離散化?總價
bins2?=?np.array([0?40?80?150?250?500?2000])
data_ls2?=?pd.cut(data[‘總價/萬‘]?bins2)??#?bins2離散化數組?data_ls2?離散化數據

#?數據離散化?面積
bins3?=?np.array([0?50?75?100?125?150?175?200?300?1500])
data_ls3?=?pd.cut(data[‘面積/平方米‘]?bins3)??#?bins3離散化數組?data_ls3?離散化數據

#?數據透視表??#?不太清楚為什么需要增加一列?維度才會正常
#?使用數據透視表方法pivot_table?需要計算的列明?柱狀圖下標?????離散化數據區間??????聚合函數?統計
table?=?data.pivot_table(‘面積/平方米‘?index=‘地區‘?columns=data_ls1?aggfunc=‘count‘)
table.plot(kind=‘bar‘?stacked=True)??#?表數據畫圖?bar柱狀圖?stacked重疊?開
plt.show()

table2?=?data.pivot_table(‘總價/萬‘?index=‘地區‘?columns=data_ls2?aggfunc=‘count‘)
table2.plot(kind=‘bar‘?stacked=True)
plt.show()

table3?=?data.pivot_table(‘面積/平方米‘?index=‘地區‘?columns=data_ls3?aggfunc=‘count‘)
table3.plot(kind=‘bar‘?stacked=True)
plt.show()

count1?=?data[‘地區‘].value_counts()
plt.axes(aspect=1)??#?畫一個單位圓
plt.pie(x=dict(count1).values()?labels=dict(count1).keys()?autopct=‘%3.1f?%%‘?shadow=True?startangle=90)
plt.show()

list_dq?=?[‘郫縣‘?‘成都‘?‘成都周邊‘?‘都江堰‘?‘雙流‘?‘溫江‘?‘新都‘?‘龍泉驛‘?‘金?!?‘高新西區‘?‘武侯‘?‘成華‘?‘青羊‘?‘錦江‘?‘高新區‘?‘天府新區‘]

for?i?in?list_dq:
????pr

?屬性????????????大小?????日期????時間???名稱
-----------?---------??----------?-----??----

?????文件???????2514??2018-09-25?18:23??爬蟲文件\home_money.py

?????文件?????101376??2018-09-25?18:09??爬蟲文件\message.txt

?????文件??????67653??2018-09-16?12:35??分析畫圖文件\58.csv

?????文件???????4245??2018-09-17?17:07??分析畫圖文件\house_prices_58_2.py

?????文件??????28396??2018-09-25?18:33??數據簡單處理成品\Figure_1.png

?????文件??????26557??2018-09-25?18:33??數據簡單處理成品\Figure_2.png

?????文件??????30248??2018-09-25?18:33??數據簡單處理成品\Figure_3.png

?????文件??????51770??2018-09-25?18:33??數據簡單處理成品\Figure_4.png

?????目錄??????????0??2018-09-25?18:24??爬蟲文件

?????目錄??????????0??2018-09-25?18:32??分析畫圖文件

?????目錄??????????0??2018-09-25?18:35??數據簡單處理成品

-----------?---------??----------?-----??----

???????????????312759????????????????????11


評論

共有 條評論