ニュース
» 2016年01月18日 12時00分 UPDATE

オープンソースのストリームデータ処理基盤:PostgreSQL互換のストリームデータ分析DB「PipelineDB」に商用版が登場

ストリームデータ分析に適したオープンソースのデータベースに商用版が登場。PostgreSQL互換で、SQLで直接クエリを投げられるため、ETLなどが不要な点が特徴だという。

[@IT]

 2016年1月14日、PostgreSQLをベースにしたオープンソースのデータベース「PipelineDB」の商用版「PipelineDB Enterprise」がリリースされた。

 PipelineDBは、ストリームデータに対して継続的にSQLクエリを走らせることができるため、リアルタイムでデータを分析することが可能だ。SQLで定義できるものであればETL(データの取り出し、変形、読み込み)操作なしで利用できる。

 PipelineDBに特徴的な実装としては「Continuous view」が挙げられる。PipelineDBのWebサイトでは、Continuous viewを「非常にスループット性能が高くリアルタイムでインクリメンタルに更新されるマテリアライズドビューのようなもの」と説明されている。Continuous viewでは、ストリームデータを格納する「ストリームバッファ」から「Workerプロセス」を経て「combinerプロセス」で統合され、結果がデータベースに格納される(下図)。つまり、最終的なアウトプットが必ずデータベースに格納される点が大きな特徴だ。

streambuffer.gif ストリームバッファでは、メモリ上にストリームデータが格納される
worker.gif workerプロセスはストリームバッファからマイクロバッチで都度データを読み込んでは結果の断片をcombinerプロセスに送る
combiner.gif combinerプロセスはworkerプロセスから受け取った結果を継続的にマージして格納する(図はいずれもPipelineDBのWebサイトから引用)

 PipelineDBは企業のミッションとして、「スケーラブルなリアルタイムアプリケーションを特別な実装なしに構築できるようにすること」を掲げている。現在PostgreSQL 9.4ベースにしているが、2016年3月までにはPostgreSQL 9.5との互換性も持たせる予定だという。PipelineDBでは、2015年7月の会社設立以来、企業名は明かせないものの既に金融、テレコム、広告、ゲーム、ネットワークなどの業界で商用版の先行採用が進んでいるとしている。

Copyright© 2017 ITmedia, Inc. All Rights Reserved.

@IT Special

- PR -

TechTargetジャパン

この記事に関連するホワイトペーパー

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。