資源簡介
針對K-means聚類算法受初始類中心影響,聚類結果容易陷入局部最優導致聚類準確率較低的問題,提出了一種基于自適應布谷鳥搜索的K-means聚類改進算法,并利用MapReduce編程模型實現了改進算法的并行化。通過搭建的Hadoop分布式計算平臺對不同樣本數據集分別進行10次準確性實驗和效率實驗,結果表明:a)聚類的平均準確率在實驗所采用的四種UCI標準數據集上,相比原始K-means聚類算法和基于粒子群優化算法改進的K-means聚類算法都有所提高;b)聚類的平均運行效率在實驗所采用的五種大小遞增的隨機數據集上,當數據量較大時,顯著優于原始K-means串行算法,稍好于粒子群優化算法改進的并行K-means聚類算法。可以得出結論,在大數據情景下,應用該算法的聚類效果較好。
代碼片段和文件信息
- 上一篇:基于ZEMAX的手機照相鏡頭的光學設計
- 下一篇:訊代理模塊
評論
共有 條評論