PostgreSQL互換のストリームデータ分析DB「PipelineDB」に商用版が登場オープンソースのストリームデータ処理基盤

ストリームデータ分析に適したオープンソースのデータベースに商用版が登場。PostgreSQL互換で、SQLで直接クエリを投げられるため、ETLなどが不要な点が特徴だという。

» 2016年01月18日 12時00分 公開
[@IT]

 2016年1月14日、PostgreSQLをベースにしたオープンソースのデータベース「PipelineDB」の商用版「PipelineDB Enterprise」がリリースされた。

 PipelineDBは、ストリームデータに対して継続的にSQLクエリを走らせることができるため、リアルタイムでデータを分析することが可能だ。SQLで定義できるものであればETL(データの取り出し、変形、読み込み)操作なしで利用できる。

 PipelineDBに特徴的な実装としては「Continuous view」が挙げられる。PipelineDBのWebサイトでは、Continuous viewを「非常にスループット性能が高くリアルタイムでインクリメンタルに更新されるマテリアライズドビューのようなもの」と説明されている。Continuous viewでは、ストリームデータを格納する「ストリームバッファ」から「Workerプロセス」を経て「combinerプロセス」で統合され、結果がデータベースに格納される(下図)。つまり、最終的なアウトプットが必ずデータベースに格納される点が大きな特徴だ。

ストリームバッファでは、メモリ上にストリームデータが格納される
workerプロセスはストリームバッファからマイクロバッチで都度データを読み込んでは結果の断片をcombinerプロセスに送る
combinerプロセスはworkerプロセスから受け取った結果を継続的にマージして格納する(図はいずれもPipelineDBのWebサイトから引用)

 PipelineDBは企業のミッションとして、「スケーラブルなリアルタイムアプリケーションを特別な実装なしに構築できるようにすること」を掲げている。現在PostgreSQL 9.4ベースにしているが、2016年3月までにはPostgreSQL 9.5との互換性も持たせる予定だという。PipelineDBでは、2015年7月の会社設立以来、企業名は明かせないものの既に金融、テレコム、広告、ゲーム、ネットワークなどの業界で商用版の先行採用が進んでいるとしている。

Copyright © ITmedia, Inc. All Rights Reserved.

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。