資源簡介
對于超市銷售記錄進行關聯挖掘,項目集龐大,每次事務中涉及到項目數非常少。針對這類稀疏數據,提出了基于事務哈希表和線性對象表的FP-Tree改進算法,其只需掃描數據庫一次,把相關信息壓入事務哈希表和線性對象表中。當支持度和事務記錄變化時,可不用重新掃描數據庫或掃描數據庫更新部分。試驗結果驗證了該改進算法相對于原算法在建樹中的優勢,特別在大數據集下,降低了建立FP-Tree的時間
代碼片段和文件信息
- 上一篇:Hive操作筆記嘔心瀝血制作
- 下一篇:socket封裝dll
評論
共有 條評論