資源簡介
K-means算法是一種采用距離作為相似性評價指標的聚類算法,其快速簡潔的特點在異常檢測場景中有一定的應用價值。但是,傳統的K-means聚類算法在選取初始中心和度量相似性上有一定缺陷。針對傳統的K-means算法中存在的問題,本文對原有的方法進行了改進。第一,在初始化聚類中心時選取了一種優化的方法作為初始聚類中心,替代原有的隨機選擇方法以減少計算量和迭代次數。第二,采用基于信息熵屬性加權的樣本相似性度量來進一步精確樣本差異。實驗過程中,針對異常檢測數據含有冗余特征,對樣本數據做了冗余特征過濾,實驗結果表明改進之后的方法較傳統的K-means算法有更好的檢測效果。
代碼片段和文件信息
- 上一篇:excel省市區三級聯動
- 下一篇:圖書詳細清單
評論
共有 條評論