資源簡介
與本人博客https://blog.csdn.net/sinat_38068807/article/details/90703685配套使用,這個壓縮包里面有數據分析所用數據源,分析需求文檔以及本人編寫的代碼

代碼片段和文件信息
import?numpy?as?np
import?pandas?as?pd
import?matplotlib.pyplot?as?plt
from?sklearn.cluster?import?KMeans?#導入kmeans算法
airline_scale?=?np.load(‘airline_scale.npz‘)[‘arr_0‘]
k?=?5?##?確定聚類中心數
#構建模型
kmeans_model?=?KMeans(n_clusters?=?k)
fit_kmeans?=?kmeans_model.fit(airline_scale)???#模型訓練
#kmeans_model.cluster_centers_?#查看聚類中心
#kmeans_model.labels_?#查看樣本的類別標簽
print(‘樣本的類別標簽:‘kmeans_model.labels_)
print(‘樣本的類別標簽類型:‘type(kmeans_model.labels_))
#統計不同類別樣本的數目
#易錯:只用pandas中Series類型才有value_counts()屬性
r1?=?pd.Series(kmeans_model.labels_).value_counts()
print(‘最終每個類別的數目為:\n‘r1)
##做可視化:
plt.figure(figsize=(66))
L=5
angles?=?np.linspace(0?2*np.pi?L?endpoint=False)
labels?=?[‘L‘?‘F‘?‘R‘?‘C‘?‘M‘]
data?=?kmeans_model.cluster_centers_
##閉合曲線:
print(data)
angles?=?np.concatenate((angles?[angles[0]]))
#為了形成閉合,把二維數組每一行下標為0的數拼接到列
#?二維數組與二維數組拼接,
#所以reshape成二維的,且變成五列一行
data?=?np.concatenate((data?data[:0].reshape(51))axis=1).T
#?print(‘angles‘angles)
print(‘data‘data)
##繪圖:
plt.polar(angles?data)
plt.xticks(angles?labels)
plt.show()
?屬性????????????大小?????日期????時間???名稱
-----------?---------??----------?-----??----
?????文件???????1385??2019-05-30?20:57??航空公司客戶價值分析\airline_k_means.py
?????文件????2481956??2019-05-29?15:13??航空公司客戶價值分析\airline_scale.npz
?????文件???13919328??2019-05-30?19:04??航空公司客戶價值分析\air_data.csv
?????文件???????2113??2019-05-30?19:20??航空公司客戶價值分析\air_line.py
?????文件?????412672??2019-05-29?17:06??航空公司客戶價值分析\航空公司客戶價值分析.doc
?????目錄??????????0??2019-05-30?21:16??航空公司客戶價值分析
-----------?---------??----------?-----??----
?????????????16817454????????????????????6
- 上一篇:中國氣溫分布圖
- 下一篇:山東大學2018體系結構考試
評論
共有 條評論