資源簡介
本書對數據挖掘的基本算法進行了系統介紹,每種算法不僅介紹了算法的基本原理,而且配有大量例題以及源代碼,并對源代碼進行了分析,這種理論和實踐相結合的方式有助于讀者較好地理解和掌握抽象的數據挖掘算法。
全書共分11章,內容同時涵蓋了數據預處理、關聯規則挖掘算法、分類算法和聚類算法,具體章節包括緒論、數據預處理、關聯規則挖掘、決策樹分類算法、貝葉斯分類算法、人工神經網絡算法、支持向量機、Kmeans聚類算法、K中心點聚類算法、神經網絡聚類算法以及數據挖掘的發展等內容。
本書可作為高等院校數據挖掘課程的教材,也可以作為從事數據挖掘工作以及其他相關工程技術工作人員的參考書。
第1章緒論 1
1.1數據挖掘的概念 1
1.2數據挖掘的歷史及發展 1
1.3數據挖掘的研究內容及功能 5
1.3.1數據挖掘的研究內容 5
1.3.2數據挖掘的功能 6
1.4數據挖掘的常用技術及工具 9
1.4.1數據挖掘的常用技術 9
1.4.2數據挖掘的工具 12
1.5數據挖掘的應用熱點 12
1.6小結 14
思考題 15
第2章數據預處理 16
2.1數據預處理的目的 16
2.2數據清理 18
2.2.1填充缺失值 18
2.2.2光滑噪聲數據 18
2.2.3數據清理過程 19
2.3數據集成和數據變換 20
2.3.1數據集成 20
2.3.2數據變換 21
2.4數據歸約 23
2.4.1數據立方體聚集 23
2.4.2維歸約 23
2.4.3數據壓縮 24
2.4.4數值歸約 25
2.4.5數據離散化與概念分層 28
2.5特征選擇與提取 302.5.1特征選擇 30
2.5.2特征提取 31
2.6小結 33
思考題 33
第3章關聯規則挖掘 35
3.1基本概念 35
3.2關聯規則挖掘算法——Apriori算法原理 36
3.3Apriori算法實例分析 38
3.4Apriori算法源程序分析 41
3.5Apriori算法的特點及應用 50
3.5.1Apriori算法特點 50
3.5.2Apriori 算法應用 51
3.6小結 52
思考題 52
第4章決策樹分類算法 54
4.1基本概念 54
4.1.1決策樹分類算法概述 54
4.1.2決策樹基本算法概述 54
4.2決策樹分類算法——ID3算法原理 56
4.2.1ID3算法原理 56
4.2.2熵和信息增益 57
4.2.3ID3算法 59
4.3ID3算法實例分析 60
4.4ID3算法源程序分析 64
4.5ID3算法的特點及應用 72
4.5.1ID3算法特點 72
4.5.2ID3算法應用 72
4.6決策樹分類算法——C4.5算法原理 73
4.6.1C4.5算法 73
4.6.2C4.5算法的偽代碼 75
4.7C4.5算法實例分析 76
4.8C4.5算法源程序分析 77
4.9C4.5算法的特點及應用 101
4.9.1C4.5算法特點 101
4.9.2C4.5算法應用 101
4.10小結 102
思考題 102
第5章貝葉斯分類算法 103
5.1基本概念 103
5.1.1主觀概率 103
5.1.2貝葉斯定理 104
5.2貝葉斯分類算法原理 105
5.2.1樸素貝葉斯分類模型 105
5.2.2貝葉斯信念網絡 107
5.3貝葉斯算法實例分析 110
5.3.1樸素貝葉斯分類器 110
5.3.2BBN 112
5.4貝葉斯算法源程序分析 114
5.5貝葉斯算法特點及應用 119
5.5.1樸素貝葉斯分類算法 119
5.5.2貝葉斯信念網 120
思考題 121
第6章人工神經網絡算法 122
6.1基本概念 122
6.1.1生物神經元模型 122
6.1.2人工神經元模型 123
6.1.3主要的神經網絡模型 124
6.2BP算法原理 126
6.2.1Delta學習規則的基本原理 126
6.2.2BP網絡的結構 126
6.2.3BP網絡的算法描述 127
6.2.4標準BP網絡的工作過程 129
6.3BP算法實例分析 130
6.4BP算法源程序分析 134
6.5BP算法的特點及應用 143
6.5.1BP算法特點 143
6.5.2BP算法應用 144
6.6小結 145
思考題 145
第7章支持向量機 146
代碼片段和文件信息
評論
共有 條評論