Google、BigQueryにHadoop対抗の新機能：SQL風のクエリで大規模データを分析

米Googleは3月14日、企業向けビッグデータ分析サービス「BigQuery」に、マルチテラバイト級の大規模データセットを横断的に分析できる新機能を導入した。

» 2013年03月15日 17時20分公開

[鈴木聖子，＠IT]

　米Googleは3月14日、企業向けビッグデータ分析サービス「BigQuery」に、マルチテラバイト級の大規模データセットを横断的に分析できる新機能を導入したと発表した。

　新機能は、SQLライクなクエリを使って大規模データセットを高速結合できる「Big JOIN」と、さまざまな値のデータをグループ化する「Big Group Aggregations」、新しいデータタイプの「Timestamp」の追加など。

　これにより、SQLライクのクエリまたはサードパーティ製のツールを使用して、マルチテラバイト級のデータセットを横断的に分析できるようになり、複雑なコーディングプロジェクトは不要になるという。

　今回の新機能には、Apache Hadoopに対抗する狙いがあると見られる。Googleは「従来のデータ分析では、テラバイト級のデータテーブルを組み合わせるためには高度なMapReduceの知識やパワフルなハードウェアが必要とされ、相当の時間を要していた。しかしBigQueryの新機能によってこの速度が大幅に向上し、手間は大幅に少なくなった」と解説している。

　この技術はこれまでGoogle社内で使っていたもので、例えばApp EngineチームはBig JOINを利用して2Tバイトのアプリ利用データと10Gバイトの設定データを60秒で結合し、Big Group Aggregationsによってこの情報を顧客別に分類。Tableauクライアントを使って情報をビジュアル化し、予想外のトレンドを見極めているという。

　BigQueryの料金に変更はなく、従来通りデータ処理量に応じて課金される。

GoogleがCloud Platformを値下げ、インスタンス追加や新機能も
米Googleは11月26日、クラウドストレージ料金の値下げなどを柱とする「Google Cloud Platform」の強化を発表した。
Hadoop普及のキモは既存「言語」の取り込みにある
Hadoopを使ったビッグデータ分析はエンタープライズ領域に本当に浸透する？ Clouderaはエンタープライズ市場の開拓に向けて着実に開発を進めているようだ
いまさら聞けないHadoopとテキストマイニング入門