資源簡介
ID3算法Python代碼和數據集
代碼片段和文件信息
#-*-?coding:?utf-8?-*-
#使用ID3決策樹算法預測銷量高低
import?pandas?as?pd
#參數初始化
inputfile?=?‘G:/code/data/sales_data.xls‘
data?=?pd.read_excel(inputfile?index_col?=?u‘序號‘)?#導入數據
#類別標簽‘好’,‘是’,‘高’?賦值為1,其他為-1
data[data?==?u‘好‘]?=?1
data[data?==?u‘是‘]?=?1
data[data?==?u‘高‘]?=?1
data[data?!=?1]?=?-1
x?=?data.iloc[::3].as_matrix().astype(int)#把數據中的前三列數據賦給x
y?=?data.iloc[:3].as_matrix().astype(int)#目標數據賦給y
print(y)
print(x)
from?sklearn.tree?import?DecisionTreeClassifier?as?DTC
dtc?=?DTC(criterion=‘entropy‘)?#建立基于信息熵的決策樹模型
dtc.fit(x?y)?#訓練模型
#導入相關函數,可視化決策樹
#導出dot文件,利用Graphviz轉換為pdf或者png
from?sklearn.tree?import?export_graphviz
x?=?pd.Dataframe(x)
from?sklearn.externals.six?import?StringIO
x?=?pd.Dataframe(x)
with?open(“tree.dot“?‘w‘)?as?f:
??f?=?export_graphviz(dtc?featur
?屬性????????????大小?????日期????時間???名稱
-----------?---------??----------?-----??----
?????文件??????27136??2015-12-05?21:05??sales_data.xls
?????文件???????1057??2017-06-26?11:09??decision_tree.py
-----------?---------??----------?-----??----
????????????????28193????????????????????2
- 上一篇:中科大高級計算機網絡實驗2代碼實驗報告
- 下一篇:遺傳算法python實現
評論
共有 條評論