連載
» 2020年07月29日 05時00分 公開

ほぼ月刊Google Cloud(1):Google「BigQuery Omni」に関する素朴な疑問を、米国の総責任者にぶつけてみました (1/2)

Google Cloud Platformに関するさまざまな動きをまとめる連載、「ほぼ月刊Google Cloud」。第1回では、データウェアハウスサービス「BigQuery」のマルチクラウド対応やデータアナリティクス製品戦略に関する素朴な疑問を、総責任者にぶつけてみました。

[三木泉,@IT]

この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。

 Google Cloudは2020年7月、データウェアハウスサービスの「BigQuery」を、Amazon Web Services(AWS)やMicrosoft Azure上で動かせる「BigQuery Omni」を発表しました。現在のところAWS対応は「プライベートα版」という位置付けで、一部ユーザーとの検証を進めている段階です。発表内容についてはこちらの記事をご覧ください。

 このサービスについて、米Google Cloudでデータアナリティクス製品群に関する技術・ビジネスの総責任者を務めているデバンジャン・サハ(Debanjan Saha)氏(データアナリティクス担当ゼネラルマネージャー兼エンジニアリングバイスプレジデント)に単独インタビューをする機会が得られましたので、素朴な疑問を投げかけてみました。

 ちなみに、サハ氏はAWSからGoogle Cloudに来た人で、AWS時代には「Amazon Aurora」の開発を主導したそうです。そこでAWSとの比較で、Google Cloudのデータ分析戦略についても聞きました。

――BigQueryのマルチクラウド展開が顧客に与えるメリットを、どう考えていますか?

Google Cloudデータアナリティクス担当ゼネラルマネージャー兼エンジニアリングバイスプレジデントのデバンジャン・サハ氏

サハ氏 ユースケースは2通りあります。

 第1に、複数のクラウド上にデータがアプリケーション単位で分散しているケースは多数あります。BigQueryを気に入ってくれているユーザーは、AWS上のデータについても、GCP上のデータと同じ使い勝手で分析したいと考えています。そこで、BigQuery Omniに期待してくれています。

 第2に、さらに進んでGCP上のデータとAWS上のデータを何らかの形でJOINしたいというニーズがあります。これは、データを片方のクラウドに集めない限り困難でした。例えばGoogle Analyticsのデータと、AWS上のアプリケーションのログデータをJOINしたいというニーズがあります。こうした場合に、BigQuery OmniでAWS上のデータを処理し、結果をGCPに転送します。その後にGoogle AnalyticsのデータとJOINできます。

――このサービスは「Anthos」(Google CloudのマルチクラウドKubernetesサービス)の上で動いているということですが、Kubernetesクラスタはどのように構成されているのでしょうか? Google CloudがAWSやAzureの上で動かすBigQuery Omni専用のKubernetesクラスタで、クエリエンジンのコンテナ群を、マルチテナント形式で動かすということですか?

サハ氏 そうです。BigQuery OmniではAnthosを使っていますが、ユーザーは意識する必要がありません。

――例えばユーザーがBigQuery Omniを使うための前提として、自社用のAnthosクラスタをターゲットクラウド上に展開し、これをBigQuery Omniのクエリエンジン群とリンクするといった作業は発生しないのですか?

サハ氏 ユーザーにとっての使い勝手は、BigQueryとほとんど変わりません。現在のBigQueryでは、BigQueryストレージやGoogle Cloud Storage(GCS)上のデータを分析できます。GCSは「Amazon S3」と同様なサービスです。ユーザーがGCSのストレージバケットを指定すると、BigQueryがこれを外部テーブルとして認識し、処理ができます。BigQuery Omniでもこれと全く同じ手順でS3上のデータを扱えます。データがGCSにあるか、S3にあるかの違いだけです。

――BigQuery Omniのαユーザーから、データの秘匿性についての懸念を聞くことはないのでしょうか?

サハ氏 いえ、ありません。BigQuery Omni では、S3バケットをGCSバケットと同じやり方で扱います。現在のBigQueryと同じですので、データの秘匿性に関する問題は発生しません。

――では、サービスレベルについてはどうでしょう? BigQuery Omniでは少なくともデータの存在するクラウドのストレージ層を制御できないわけですから、現在のBigQueryと同じサービスレベルを提供できない可能性はありますよね?

サハ氏 S3は大まかにいえば、GCSと同様なサービスですので、同じようなパフォーマンスや可用性を提供できます。とはいえ、現在はα版の段階です。さらに多くの経験を積んでから、どのようなSLA(Service Level Agreement)を提供できるかを決めたいと思います。

――料金体系についてはどのようにするつもりですか?

サハ氏 料金体系は、BigQueryと同一です。クエリに関して、定額、オンデマンドの料金モデルを提供します。まだ、実際の料金については決めていません。また、リージョンに依存する要素があるため、どのリージョンで動かすかによって料金は変わってきます。それでも、他の同様な選択肢と比較して、競争力のある料金設定にすることはお約束します。

――「GCP上のBigQueryと同レベルの料金になる」とは言えないのですか?

サハ氏 例えばGCPの米国東部リージョンと、AWSの米国東部リージョンで比較すれば、同じ価格帯(“in the same ballpark”)になるとは言えます。ですが、完全に同一の料金になるとは断言できません。

――BigQuery Omniでは、GCP上のBigQueryで使える機能が使えないといったことはありますか? 例えばBigQueryには「BigQuery ML」という機能がありますが、これはBigQuery Omniでも使えるのでしょうか?

サハ氏 現在はα段階ですので、使える機能に制限があります。でも、ユーザーが親しんでいるBigQuery上の全ての機能は、最終的には使えるようになります。

       1|2 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。