Cloudera Impala
代碼托管地址: GitHub
Impala是由Cloudera開(kāi)發(fā),一個(gè)開(kāi)源的Massively Parallel Processing(MPP)查詢引擎 。與Hive相同的元數(shù)據(jù)、SQL語(yǔ)法、ODBC驅(qū)動(dòng)程序和用戶接口(Hue Beeswax),可以直接在HDFS或HBase上提供快速、交互式SQL查詢。Impala是在Dremel的啟發(fā)下開(kāi)發(fā)的,***個(gè)版本發(fā)布于2012年末。
Impala不再使用緩慢的Hive+MapReduce批處理,而是通過(guò)與商用并行關(guān)系數(shù)據(jù)庫(kù)中類(lèi)似的分布式查詢引擎(由Query Planner、Query Coordinator和Query Exec Engine三部分組成),可以直接從HDFS或者HBase中用SELECT、JOIN和統(tǒng)計(jì)函數(shù)查詢數(shù)據(jù),從而大大降低了延遲。






















