-
大小: 1.44MB文件類型: .pdf金幣: 1下載: 1 次發(fā)布日期: 2023-10-02
- 語言: 其他
- 標(biāo)簽: 大數(shù)據(jù)??
資源簡(jiǎn)介
大數(shù)據(jù)的挖掘是當(dāng)今的研究熱點(diǎn),也有著巨大的商業(yè)價(jià)值。新型框架Spark部署在Hadoop平臺(tái)上,它的機(jī)器學(xué)習(xí)算法幾乎可以完全替代傳統(tǒng)的Mahout Map Reduce的編程模式,但由于Spark的內(nèi)存模型特點(diǎn),執(zhí)行速度快。該文研究了Spark中的機(jī)器學(xué)習(xí)中的聚類算法KMeans,先分析了算法思想,再通過實(shí)驗(yàn)分析其應(yīng)用的方法,然后通過實(shí)驗(yàn)結(jié)果分析其應(yīng)用場(chǎng)景和不足。
代碼片段和文件信息
評(píng)論
共有 條評(píng)論