資源簡介
利用Impala+Kudu構(gòu)建準(zhǔn)實時分析應(yīng)用
Kudu是Cloudera開源的新型列式存儲系統(tǒng),Apache Hadoop生態(tài)圈的頂級項目之一,解決了傳統(tǒng)Lamda架構(gòu)處理Hadoop上快速變化數(shù)據(jù)的存儲和處理技術(shù)過于復(fù)雜的問題,同時Kudu能夠與Hadoop生態(tài)的其他組件比如Impala、Spark、Flume和Kafka等組件集成,大大降低了對快速變化的數(shù)據(jù)進(jìn)行準(zhǔn)實時分析的架構(gòu)設(shè)計和實現(xiàn)的門檻。本演講主要對Kudu的動機(jī)、背景,以及架構(gòu)進(jìn)行簡單介紹,并通過實際的應(yīng)用場景介紹Impala+Kudu的組合實現(xiàn)通過SQL技術(shù)對快速變化的數(shù)據(jù)實現(xiàn)準(zhǔn)實時分析的能力
代碼片段和文件信息
評論
共有 條評論