PFI、ビッグデータ分析製品「Sedue for BigData」を6月に発売SedueとJubatusを統合

「Sedue for BigData」は、検索エンジン「Sedue」と機械学習フレームワーク「Jubatus」を統合したビッグデータ分析製品。レスポンス性でHadoopより優れるなどの特徴がある。

» 2013年05月21日 17時44分 公開
[藤本和彦,@IT]

 プリファードインフラストラクチャー(PFI)は5月20日、検索技術と機械学習技術を統合し、リアルタイム処理に対応したビッグデータ分析製品「Sedue for BigData」を6月20日から販売開始すると発表した。

 Sedue for BigDataは、同社が開発する検索エンジン「Sedue」(関連記事)と機械学習フレームワーク「Jubatus」を統合したもの。秒間数千〜数万件の規模で流入するデータをリアルタイムに分析し、検索インデックスを作成する。非構造化データと構造化データを合わせて分析でき、分析結果をリアルタイムに可視化・集計する機能も提供する。レコメンデーション、連想検索、自然言語処理、機械学習などをサポートする。

 リアルタイムデータ処理には、CEP(複合イベント処理)という技術があるが、CEPはデータをどのように処理するかを事前にルールとして記述する必要があるのと、データを蓄積・参照する仕組みがないなどの課題がある。Sedue for BigDataでは、機械学習技術を利用することでデータから自動的にルールを抽出し、検索技術を使ってデータを蓄積・参照することができる。これにより、CEPの持つ課題を解決することができるとしている。

 DWHやApache Hadoopとも違った特徴があるという。Sedue for BigDataでは、DWHの苦手とする非構造化データに対する検索・分析が可能なほか、構造化データに対する分析においてもカラム指向アーキテクチャとオンメモリによる分析処理を取り入れている。1つの製品で構造化データと非構造化データに対する分析を同時に実現できる。

 一方のHadoopは、非構造化データに対する分析を得意とするが、基本的にはバッチ処理であるため、リアルタイム性で劣る。Sedue for BigDataでは、Hadoopと同様のデータ処理を、リアルタイムで実現することができるとしている。

Copyright © ITmedia, Inc. All Rights Reserved.

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。