資源簡介
根據圖識,項目將分為三個部分。整個項目基本思路是如何通過爬蟲爬取大量數據放到Hbase,然后通過ETL工具初步轉化篩選將數據存到mongodb,抽取mongodb的數據進行清洗處理算出模型放到hdfs。后續進來數據通過模型運算出數據的類型。項目系統主要包括前端+后端+機器學習,前端采用React Native,Native,后端采用Dubbo+Spring+java,機器學習采用Spark進行實現,本項目機器學習-spark代碼運行在mesos上。
代碼片段和文件信息
評論
共有 條評論