Google、BigQueryにHadoop対抗の新機能SQL風のクエリで大規模データを分析

米Googleは3月14日、企業向けビッグデータ分析サービス「BigQuery」に、マルチテラバイト級の大規模データセットを横断的に分析できる新機能を導入した。

» 2013年03月15日 17時20分 公開
[鈴木聖子,@IT]

 米Googleは3月14日、企業向けビッグデータ分析サービス「BigQuery」に、マルチテラバイト級の大規模データセットを横断的に分析できる新機能を導入したと発表した。

 新機能は、SQLライクなクエリを使って大規模データセットを高速結合できる「Big JOIN」と、さまざまな値のデータをグループ化する「Big Group Aggregations」、新しいデータタイプの「Timestamp」の追加など。

 これにより、SQLライクのクエリまたはサードパーティ製のツールを使用して、マルチテラバイト級のデータセットを横断的に分析できるようになり、複雑なコーディングプロジェクトは不要になるという。

 今回の新機能には、Apache Hadoopに対抗する狙いがあると見られる。Googleは「従来のデータ分析では、テラバイト級のデータテーブルを組み合わせるためには高度なMapReduceの知識やパワフルなハードウェアが必要とされ、相当の時間を要していた。しかしBigQueryの新機能によってこの速度が大幅に向上し、手間は大幅に少なくなった」と解説している。

 この技術はこれまでGoogle社内で使っていたもので、例えばApp EngineチームはBig JOINを利用して2Tバイトのアプリ利用データと10Gバイトの設定データを60秒で結合し、Big Group Aggregationsによってこの情報を顧客別に分類。Tableauクライアントを使って情報をビジュアル化し、予想外のトレンドを見極めているという。

 BigQueryの料金に変更はなく、従来通りデータ処理量に応じて課金される。

Copyright © ITmedia, Inc. All Rights Reserved.

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。