ClouderaがHadoop用リアルタイムクエリエンジンを発表SQLライクなクエリがHiveの10倍速に

Hadoop用のリアルタイムクエリを高速に実現するプロダクトがApacheライセンスで登場。リアルタイムデータクエリとBI的な利用を両立させる手法に選択肢が広まる

» 2012年10月29日 15時33分 公開
[原田美穂,@IT]

 Clouderaは2012年10月24日、ニューヨークで開催されたイベント「Strata+Hadoop World」において、Hadoop用リアルタイムクエリエンジン「Cloudera Impala」と、Impalaを管理・サポートする機能を持つ「Cloudera Enterprise RTQ」を発表した。

 Cloudera Impala(以降、Impala)は「HDFS」および「HBase」で構成されるHadoop向けのクエリエンジン。Apacheライセンスを採用するオープンソースプロダクトとして提供される。Clouderaでは、このImpalaの開発プロジェクトに、HBaseプロジェクトのコミッタであるMichael Stack氏ら3人を参加させる。

 Impalaは、MapReduceと同様の挙動を期待できる一方で、HiveのようなSQLライクなクエリも受け付ける。

 プレスリリースによると、Hadoop向けのSQLインターフェイスであるHiveを使ったクエリ応答に数分かかっていたものが、Impalaでは、数秒で応答可能になっているという。これにより、データウェアハウス的なバッチ処理系と、リアルタイムクエリアプリケーションの両方を、同一のプラットフォーム上で実現可能になるとしている。

 Clouderaでは、今後、Impalaエンジンを活用し、超並列SQLプラットフォームと同等の品質を目指すとしている。

Copyright © ITmedia, Inc. All Rights Reserved.

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。