資源簡介
本次實戰內容,將使用Logistic回歸來預測患疝氣病的馬的存活問題。原始數據集下載地址:http://archive.ics.uci.edu/ml/datasets/Horse+Colic
這里的數據包含了368個樣本和28個特征。這種病不一定源自馬的腸胃問題,其他問題也可能引發馬疝病。該數據集中包含了醫院檢測馬疝病的一些指標,有的指標比較主觀,有的指標難以測量,例如馬的疼痛級別。另外需要說明的是,除了部分指標主觀和難以測量外,該數據還存在一個問題,數據集中有30%的值是缺失的。
預處理數據做兩件事:
如果測試集中一條數據的特征值已經確實,那么我們選擇實數0來替換所有缺失值,因為本文使用
代碼片段和文件信息
?屬性????????????大小?????日期????時間???名稱
-----------?---------??----------?-----??----
?????文件???????3790??2019-03-21?20:26??數據集\horseColicTest.txt
?????文件??????60657??2019-03-21?20:33??數據集\horseColicTraining.txt
?????目錄??????????0??2019-03-22?16:45??數據集
-----------?---------??----------?-----??----
????????????????64447????????????????????3
-----------?---------??----------?-----??----
?????文件???????3790??2019-03-21?20:26??數據集\horseColicTest.txt
?????文件??????60657??2019-03-21?20:33??數據集\horseColicTraining.txt
?????目錄??????????0??2019-03-22?16:45??數據集
-----------?---------??----------?-----??----
????????????????64447????????????????????3
評論
共有 條評論