資源簡介
星巴克數據分析案例及數據集,python語言,內含相應數據集,代碼可運行。

代碼片段和文件信息
import?numpy?as?np
import?pandas?as?pd
data?=?pd.read_csv(‘directory.csv‘)#?讀取數據,將文件轉換為Dataframe格式
data.head()
data.describe()#?用于查看數值型數據的分布情況
data.info()#?用于查看各字段的數據類型,以及缺失情況
data[‘Brand‘].unique()#?查看唯一品牌的類型
data?=?data[data[‘Brand‘]?==?‘Starbucks‘]#?只獲取品牌為Starbucks
data[‘Brand‘].unique()
data.isnull().sum()#?各個字段缺失值的數量
data[data[‘City‘].isnull()]#?查看缺失城市是哪些
#?用國家字段填充到城市字段上
def?fill_na(x):
????return?x
data[‘City‘]?=?data[‘City‘].fillna(fill_na(data[‘State/Province‘]))
data[data[‘Country‘]?==?‘EG‘]
#臺灣被美國當成一個國家,把他重新賦值到中國來
data[‘Country‘][data[‘Country‘]?==?‘TW‘]?=?‘CN‘
country_count?=?data[‘Country‘].value_counts()[0:10]
import?matplotlib.pyplot?as?plt
#import?matplotlib
#matplotlib.matplotlib_fname()??#?將會獲得matplotlib包所在文件夾
plt.rcParams[‘font.sans-serif‘]?=?[‘simhei‘]#?指定默認字體
plt.rcParams[‘axes.unicode_minus‘]?=?False#?用來正常顯示坐標軸上的負號(‘-’)
plt.title(‘全球星巴克數量前十的國家‘)
country_count.plot(kind?=?‘bar‘)
country_city_count?=?data[‘City‘].value_counts()[0:10]
plt.title(‘全球星巴克數量前十的城市‘)
country_city_count.plot(kind?=?‘barh‘)
china_data?=?data[data[‘Country‘]?==?‘CN‘]
china_data.head()
city_count?=?china_data[‘City‘].value_counts()[0:10]
plt.title(‘中國星巴克數量前十的城市‘)
city_count.plot(kind?=?‘barh‘)
?屬性????????????大小?????日期????時間???名稱
-----------?---------??----------?-----??----
?????文件?????4111462??2017-02-14?07:05??星巴克數據分析案例及數據集\directory.csv
?????文件????????1447??2019-11-07?13:52??星巴克數據分析案例及數據集\星巴克數據分析.py
?????目錄???????????0??2019-11-07?13:52??星巴克數據分析案例及數據集\
評論
共有 條評論