「Google Cloud Dataproc」が正式リリース分単位でHadoop/Sparkが利用できるマネージドサービス

グーグルは、「Apache Hadoop」や「Apache Spark」を簡単に利用できるクラウドサービス「Google Cloud Dataproc」を正式にリリースした。

» 2016年02月23日 18時04分 公開
[@IT]

 米グーグルは2016年2月22日(米国時間)、「Apache Hadoop(Hadoop)」および「Apache Spark(Spark)」のマネージドサービス「Google Cloud Dataproc(Cloud Dataproc) 1.0.0」を正式にリリースした。Cloud Dataproc 1.0.0はHadoop 2.7.2、Spark 1.6.0および「Hive 1.2.1」「Pig 0.15.0」に対応する。

Cloud Dataprocの公式サイト

 この他、「BigQuery」「Cloud Storage」「Cloud Bigtable」「Google Cloud Logging」といったグーグルのクラウドサービス「Google Cloud Platform」と統合されており、Spark/Hadoopクラスタにとどまらず、包括的なデータ処理プラットフォームとして利用できるという。

 Cloud DataprocはGoogle Cloud Platformを構成するサービスの1つで、2015年9月からβ版が提供されていた。Hadoop/Sparkクラスタの構築/立ち上げ、スケーリング、停止といった一連の作業を自動化できる。

 Cloud Dataprocの料金単価は、仮想CPU当たり0.01ドル/時間(併用するGoogle Cloud Platformのリソースは別)。最低利用時間は10分で、分単位の課金となっている。

 マネージドサービスであることから、管理・運用工数が掛からず、テスト済みで最新安定版のSparkとHadoopを利用できる他、下位互換性も維持するという。オペレーションの開始、停止にかかる時間は平均90秒以下で、他のオンプレミスおよびIaaSソリューションと比べて2〜10倍高速だとしている。

Cloud Dataprocの特徴(出典:米グーグル)

 Cloud Dataprocクラスタの作成/監視/削除は、Google Cloud PlatformのコンソールとCloud SDKから行える。高度なユースケースの場合には「Cloud Dataproc REST API」と「Python」などのプログラミング言語を使って操作できるという。

Copyright © ITmedia, Inc. All Rights Reserved.

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。