クラウド型のデータウェアハウス技術で新機軸を打ち出すグリーンプラム企業に分散する生データを漏れなく活用

» 2010年04月27日 00時00分 公開
[伏見学,@IT]

 企業に眠る膨大なデータの活用や分析の重要性が叫ばれて久しい。古くからビジネスインテリジェンス(BI)データウェアハウス(DWH)の分野では、情報活用に関する技術や製品の開発が進められているが、増え続けるデータを保管するためのストレージの運用コストや、データを分析するために企業内のさまざまなシステムから情報を抽出し連携させる作業の煩雑さなどが、多くの企業において情報活用ツール導入の足かせとなっている。

 オープンソース技術を基盤としたDWHソフトウェアを開発する米グリーンプラムは、こうした企業の課題解決を支援する。同社が提供するソフトウェア「Greenplum Database」は、各サーバごとにディスクを用意してクエリやデータロードの並列処理を実現するアーキテクチャ「シェアード・ナッシング」に加えて、Googleが考案する分散処理アーキテクチャ「Map Reduce」を採用することで、大量データを高速に分析できる。また、特定のベンダに依存せずあらゆるハードウェアに対応する柔軟性が特徴だ。同社でアジア太平洋地域の副社長およびゼネラルマネージャを務めるキース・バッジ氏は「ユーザーは新たにDWH用のシステムを構築する必要なく、既存のハードウェア製品やデータベースをそのまま活用できるため、結果的に低コストでの導入、運用が可能だ」とメリットを説明する。

 新バージョンとなる「Greenplum Database 4.0」では、ワークロード管理においてユーザーに応じて動的にクエリに優先順位を与える機能を追加したほか、データベースのハードディスク部分などに不具合が生じても、即座に原因を判断して自己回復する機能などを強化した。

クラウド新技術で企業に分散する生データを収集

米グリーンプラム アジア太平洋地域 副社長およびゼネラルマネジャーのキース・バッジ氏 米グリーンプラム アジア太平洋地域 副社長およびゼネラルマネジャーのキース・バッジ氏

 さらに、このたび同社が満を持して発表するのが、クラウドベースのDWH製品「Greenplum Chorus」である。これは2009年6月に同社が提唱したプログラム「Enterprise Data Cloud(EDC)」のコンセプトを土台にしている。EDCは、クラウド技術を用いて物理的に分散しているDWHやデータマートを論理的に1つのプラットフォームにまとめようとするコンセプトで、それを具現化したのがChorusである。

 Chorusは、プロビジョニングの自動化、データの仮想化、データコラボレーションといった機能を持ち、DWHやデータマートとして企業内に分散するデータを統合するプラットフォーム。エンタープライズDWH(EDW)と併用することにより、EDWやデータマート、企業の各システムに分散するすべてのデータを収集、分析できるほか、これまでEDWではデメリットとされていた部分を補完する。EDWは財務情報などガバナンスを効かせなければならないデータを扱うことが多いため、より深く掘り下げた、あるいは包括的な分析をする際にはEDW以外のデータにアクセスする必要があった。また、EDWに取り込まれるデータは生データではなく統合されたデータであること、ビジネス傾向を見るような長期的なデータではなく短期的なデータであることなどから、柔軟なデータ分析が難しいとされていた。

 バッジ氏によると、EDWに関するこうした課題は今に始まったものではなく、EDWのコンセプトが生まれた25年以上前から存在しているという。

 「EDWを導入する企業に調査をしたところ、企業にあるデータのわずか10%しかEDWで扱われていなかった。裏を返せば、そのほか90%のデータが(Excelなどの)スプレッドシートや個人PCなどに存在していたのである。こうした従来からの問題に対処するのがChorusだ」(バッジ氏)

 Chorusを設計するうえで具体的に4つのポイントに重点を置いたという。1つ目はセキュリティだ。ユーザーの権限を細かく設定し、誰が社内データにアクセスできるか、公開できるかなどを具体的に管理する仕組みを構築した。2つ目は、異なる部門や事業所の拠点が遠く離れていても、Chorusにある同じデータを介してコラボレーションする点である。3つ目は、どのようにデータをクラウドの中で整合性、一貫性を持って管理していくかに注力した。4つ目は、カリフォルニア大学で研究開発が進められている「MAD(Magnetic、Agile、Deep)」という次世代データ分析技術を採用したことである。上述したように、これまでは各種EDWに合致した形式でデータを投入する必要があるため、分析に使うのは生データではなく制御されたデータになっていた。MADを活用することで企業に散在するすべての生データを引っ張り出し、自由度を持った分析が可能になった。

なぜ顧客はサービスを解約したのか

 現時点でChorusは、ドイツテレコムの子会社で、モバイル通信サービスを提供するT-Mobileで導入されている。同社は以前より100テラバイトの容量を持つ米テラデータのEDWを活用して事業報告書や財務指標レポートのためのデータを生成していたが、同社の事業において重要なデータ指標となるユーザー解約率の細かな分析はEDWでは適さなかった。そこで、EDWを補完する形でグリーンプラムのデータベースおよびChorusを導入し、社内のさまざまなシステムに散らばる顧客データやユーザーの明細書などを集約、分析した。その結果、2週間で「SNSでの接続性に問題があること」が解約率の最たる理由であることが明らかになった。

 「T-Mobileは、既存のEDWに加えて、分析のインフラとしてグリーンプラムのデータベースおよびクラウドサービスのChorusを抱き合わせることで、高度なデータ活用を実現した。また、テラデータのEDWに比べてグリーンプラムのEDCは10倍のデータ容量に当たる1ペタバイトをサポートするため、大量のデータを処理できるようになったのだ」(バッジ氏)

 Chorusの今後の販売戦略について、バッジ氏は「新しい技術であるため、まずはトライアルとして大企業の部門レベルなど小規模での導入が進むだろう」とする一方で、アジア市場に秋波を送る。同社の顧客はグローバルで約120社だが、そのうち半数はアジア太平洋地域だという。電気通信、インターネット、金融といった業界に主要な顧客を抱えるが、「アジアの多くの企業は大規模なデータを社内のあちこちに分散させており、情報活用がなされていない。販路拡大の見込みは十分ある」とバッジ氏は意気込む。DWHの競合他社と比べて製品の価格帯が低いというのもアジア市場において強みになっているという。

 「これまでグリーンプラムは、価格パフォーマンスの高いDWHベンダとして顧客から支持を得てきた。今後はこれに加えて、新しい技術開発で注目を集めるイノベーションリーダーとして地位を確立していきたい」(バッジ氏)

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ