資源簡介
Kudu是Cloudera開源的新型列式存儲系統,Apache Hadoop生態圈的頂級項目之一,解決了傳統Lamda架構處理Hadoop上快速變化數據的存儲和處理技術過于復雜的問題,同時Kudu能夠與Hadoop生態的其他組件比如Impala、Spark、Flume和Kafka等組件集成,大大降低了對快速變化的數據進行準實時分析的架構設計和實現的門檻。本演講主要對Kudu的動機、背景,以及架構進行簡單介紹,并通過實際的應用場景介紹Impala+Kudu的組合實現通過SQL技術對快速變化的數據實現準實時分析的能力
代碼片段和文件信息
評論
共有 條評論