「データレイク」の次の動きはどうなっている?Gartner Insights Pickup(5)

データレイクが盛んにもてはやされるようになって既に数年経つが、多くの企業で取り組みが難航している分野も幾つかあることが明白になっている。

» 2017年01月20日 05時00分 公開
[Andrew White, Gartner]

ガートナーの米国本社発のオフィシャルサイト「Smarter with Gartner」と、ガートナー アナリストらのブログサイト「Gartner Blog Network」から、@IT編集部が独自の視点で“読むべき記事”をピックアップして翻訳。グローバルのITトレンドを先取りし「今、何が起きているのか、起きようとしているのか」を展望する。

 データレイクが盛んにもてはやされるようになって既に数年経つが、多くの企業で取り組みが難航している分野も幾つかあることが明白になっている。別のブログ記事にも先日書いたが、私はこの分野のベンダーの最近の傾向について憤慨していることが1つある(この分野のベンダーに限ったことではないが)。それは、従来型データウェアハウス関連の、ベンダーが熟知していて売り込みたかった技術(ただし、顧客からは嫌われ、考慮の外に置かれた技術)を「再発明」して看板を付け替えるという動きがあることだ。

 それでも、誇大宣伝をうのみにしたり、データレイクを特効薬と考えたりすることなく、以下の3つの切り口から分析すると、この分野における次の新たな利用動向が見えてきそうだ。こうした動きが定着していくのかはまだ不明であり、以下の考察は突き詰めたものではないが、フィードバックをいただければ幸いだ(なお、以下は順不同)。

ディスカバリ対デリバリ

 われわれは、データレイクとそれに付随する設計および技術の課題を、合理的にとらえられそうなパターン分類を見いだしつつある。その分類はまた、課題の克服にも役立つ。具体的には、課題を次のように分けて考えるのが得策かもしれない。

  • 幅広い柔軟なデータディスカバリの方法を中心にして単一の機能セットを設計する(バイモーダルITの用語を使うと、モード2に該当)
  • 効率的で高度に最適化されたデリバリを中心にして機能セットを設計する(バイモーダルITの用語を使うと、モード1に該当)

 前者はデータレイクやHadoopに当てはまるが、これらと完全には相関しないだろう。同様に、後者はリレーショナルデータウェアハウスに当てはまるが、完全には相関しないだろう。各モードと、それぞれに実際に使われる技術とは、別のトピックだ。

 あなたは、どのような概念モデルをつくっているだろうか? それをどう実行しているだろうか?

情報スチュワードシップ:オペレーション対分析

 比較的新しい動きについて見てみよう。

 5年ほど前、われわれは「情報スチュワード」という役割が必要になると考えた。この役割は基本的に、ビジネス側の役割、つまり業務部門内の機能あるいは役割として最も適切に果たされる。

 ほとんどのアプリケーションにおいて、この役割の担い手として有力な候補は、“パワーユーザー”だ。すなわち、ビジネスの問題解決に大きく貢献する人たちだ。単にアプリケーションを使っているだけのユーザーには務まらず、また、IT部門の役割でもない。

 だが、社内に情報スチュワードを置くのは容易なことではない。なり手が見つかりにくいのが現状だ。多くの企業は、初めての試みとして便宜的に、IT部門内に情報スチュワードを置いているが、活用に苦労している。

 しかし、状況は再び変わりつつある。Gartnerには多くの顧客から、「“BIエクセレンスセンター”が“データサイエンスラボ”に取って代わられている」との報告が寄せられている。後者では、権限が広がり、より多くのツールが使われているが、ガバナンスの問題は悪化しているという。データサイエンスラボで、情報ガバナンスに関連するどのような役割が維持されるのか、あるいは新たに推進されるのかが問題となっている。

 あなたの組織では、この課題にどう対応しているだろうか?

(ビッグ)データカタログ:全社データか、ビッグデータか

 こちらについても、目新しいところはないものの、ビッグデータという要因が絡んで数年前のブームが盛り返しつつある。

 全社的なデータカタログやデータモデルの作成が、多くの企業で盛んに行われていた時代があった。皆さんはあの大騒ぎを覚えているだろうか。私が少し前に(3年前未満)、ベンダーが開催した顧客事例紹介のパネルディスカッションを聞いていたところ、司会のアーキテクトの質問に答えて、パネリストとして登場していたある大手銀行の担当者は、次のように話していた。

 「われわれのビジネスの理想的な将来像を踏まえたデータモデルを設計、開発するのに約6年かかった」

 「このデータモデルが当行にビジネス価値をもたらしているのか否かについて語るのは、時期尚早だ。われわれはまだ、その活用法を見いだしていないからだ」

 今また、ビッグデータカタログの作成がブームになっているように見える。多くの新興ITベンダーがセマンティック検出・分類ツールを再発見したかのようだ。もちろん、ビッグデータカタログの作成は、かつてのデータカタログのブーム時よりも迅速に行われるようになっている。少しは学習が進んだのかもしれない。

 あなたの組織は、最近どのような(ビッグ)データカタログの活用法を生み出しただろうか?

出典:Emerging Data Lake Best Practices?(Gartner Blog Network)

筆者 Andrew White

アンドリュー・ホワイト

ガートナー リサーチ部門 バイス プレジデント


Copyright © ITmedia, Inc. All Rights Reserved.

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。