-
大小: 59.59MB文件類型: .zip金幣: 1下載: 0 次發(fā)布日期: 2023-05-02
- 語言: 其他
- 標(biāo)簽: python??數(shù)據(jù)??數(shù)據(jù)分析??數(shù)據(jù)挖掘??大數(shù)據(jù)??
資源簡介
包含數(shù)據(jù)分析和數(shù)據(jù)挖掘的學(xué)習(xí)代碼和實(shí)戰(zhàn)代碼
本項(xiàng)目很多內(nèi)容屬于邊學(xué)邊試。參考了書籍,但是很多代碼存在過時(shí)和錯(cuò)誤均被我修改。
數(shù)據(jù)挖掘是最近幾年才出現(xiàn)的一個(gè)名詞,其歸根到底的目的就是經(jīng)過一系列手段處理數(shù)據(jù)得到一個(gè)適合的建模數(shù)據(jù),利用建模數(shù)據(jù)建立模型挖掘已有數(shù)據(jù)的隱含價(jià)值。
一般步驟(詳細(xì)內(nèi)容子目錄有敘述,且后面的實(shí)戰(zhàn)項(xiàng)目我會(huì)嚴(yán)格按照這個(gè)步驟進(jìn)行)
數(shù)據(jù)獲取
利用各種手段獲取數(shù)據(jù),數(shù)據(jù)樣式不限制,但一般而言是形如excel或者csv這樣的表格格式。
數(shù)據(jù)探索
對(duì)數(shù)據(jù)進(jìn)行初步探索,得到數(shù)據(jù)特征(如每一列的平均值,分位數(shù),最大最小值,空值數(shù)目)。
數(shù)據(jù)預(yù)處理
毫不夸張,這是整個(gè)數(shù)據(jù)挖掘過程中最費(fèi)時(shí)間的部分。對(duì)原始數(shù)據(jù)進(jìn)行處理,得到合適的建模數(shù)據(jù)(如處理異常值,屬性規(guī)約,數(shù)據(jù)清洗,數(shù)據(jù)變換,數(shù)據(jù)標(biāo)準(zhǔn)化)。
數(shù)據(jù)挖掘建模
如果任務(wù)明確,模型的選擇是指定的,但是算法的優(yōu)化,準(zhǔn)確率的考究等是需要處理的。(如分類預(yù)測、關(guān)聯(lián)規(guī)則獲取。
后續(xù)處理
一般是指模型的實(shí)際應(yīng)用。
代碼片段和文件信息
?屬性????????????大小?????日期????時(shí)間???名稱
-----------?---------??----------?-----??----
?????文件???????????0??2020-07-23?01:26??鍖呭惈鏁版嵁鍒嗘瀽鍜屾暟鎹寲鎺樼殑瀛︿範(fàn)浠g爜鍜屽疄鎴樹唬鐮?
?????文件????63744343??2020-07-23?01:24??鍖呭惈鏁版嵁鍒嗘瀽鍜屾暟鎹寲鎺樼殑瀛︿範(fàn)浠g爜鍜屽疄鎴樹唬鐮?DataMining-master.zip
?????文件?????????520??2020-07-23?01:24??__MACOSX\鍖呭惈鏁版嵁鍒嗘瀽鍜屾暟鎹寲鎺樼殑瀛︿範(fàn)浠g爜鍜屽疄鎴樹唬鐮?._DataMining-master.zip
-----------?---------??----------?-----??----
?????文件???????????0??2020-07-23?01:26??鍖呭惈鏁版嵁鍒嗘瀽鍜屾暟鎹寲鎺樼殑瀛︿範(fàn)浠g爜鍜屽疄鎴樹唬鐮?
?????文件????63744343??2020-07-23?01:24??鍖呭惈鏁版嵁鍒嗘瀽鍜屾暟鎹寲鎺樼殑瀛︿範(fàn)浠g爜鍜屽疄鎴樹唬鐮?DataMining-master.zip
?????文件?????????520??2020-07-23?01:24??__MACOSX\鍖呭惈鏁版嵁鍒嗘瀽鍜屾暟鎹寲鎺樼殑瀛︿範(fàn)浠g爜鍜屽疄鎴樹唬鐮?._DataMining-master.zip
評(píng)論
共有 條評(píng)論