特集
» 2017年01月27日 05時00分 公開

デジタルトランスフォーメーションで変わる、データ管理の在り方デジタル時代の「価値を生み出す」データ管理(1)(4/4 ページ)

[木島 亮,伊藤忠テクノソリューションズ]
前のページへ 1|2|3|4       

データの蓄積/分析に最適な基盤・技術とは?

 では今回の最後に、以上のようなデータ活用のサイクルを回す上では、どのようなデータ基盤が必要なのか振り返ってみたい。近年、それを指すものとして「データレイク」が知られているが、これがどのようなものか、またガートナーの言葉を引用しよう。

ガートナーによる「データレイク」の定義

ガートナーはデータレイクを「各種データ資産のストレージ・インスタンスの集合」と定義。「データレイクとはあくまで概念で、これをどのように実装するかは、さまざまな選択肢がある」と言及している


 もう少し分かりやすく紹介すると、「複数のファイル形式のデータや、非構造化データをまとめて格納でき、共通の方法で取り出すことができるファイル置き場」と言える。

 このデータレイクをより有効なものとする上では、既存ビジネスのデータ、デジタルビジネスのデータなど「自社のデータ」だけではなく、オープンデータや、DMP(データマネジメントプラットフォーム)事業者のデータなど、「社外のデータ」と連携させることも求められる。さらに、データのサイロ化を避け、分析のリアルタイム性を向上させる上では、データベース接続やREST API接続など、多様なアクセス方法に対応することも必要だ。

 具体的には、「NFSアクセス可能なHadoopプラットフォーム」「Hadoopとしてアクセス可能なストレージ基盤」、オペレーショナルデータベース管理システムや、DMP製品が求められる。データの品質向上、分析結果の品質向上のためのデータクレンジング(マスターデータ管理)や、増え続けるデータ量とデータフォーマットの多様化に対応するためのデータプレパレーションを行うことも必要だ。

データ基盤の「安心/安全/止まらない」を実現するテクノロジーとは?

 一方、冒頭で述べたように、デジタルトランスフォーメーションを推進する上では、「ビジネスを止めない」という大前提を守る上で、データ基盤の可用性を高めるテクノロジーも忘れてはならない。従来のシステムと比較して、データが大容量になり、マルチクラウド環境(プライベートクラウド〜パブリッククラウドの併用、複数のパブリッククラウドの併用)が前提となる他、取り扱うデータの形式/使用者も多様化するためだ。

 こうした中、データ基盤の可用性を高める上では、以下の項目それぞれにモダナイズが求められる。

  • アーカイブとバックアップ
  • ビジネス継続
  • 暗号化/セキュリティ
  • 情報ガバナンス、コンプライアンス、プライバシー対策

アーカイブとバックアップ

 クラウド上ではインフラ障害でデータを消失する可能性は低いが、オペレーションミスやアプリケーションの不具合などでデータが消失してしまうことも考慮して、「バックアップは必須である」と再認識するべきである。複製されたデータや、整形後のデータなど、再作成が可能なデータのバックアップは不要かもしれないが、「データごとのバックアップ要否」はしっかりと検討する必要がある。

 データが大容量になるので、バックアップ対象の容量を減らすことや、高速にバックアップを取得する方法も検討すべきだ。バックアップ対象を減らす方法としては、アーカイブが考えられる。保存先として、SDSやクラウドストレージを使用することでコスト削減も可能だ。オンプレミスのストレージとクラウドストレージの間でシングルネームスペースの階層化ストレージが実現できれば、運用コスト含め、さらなるコスト削減も期待できる。

 高速にバックアップを取得する方法としては、永久増分バックアップやストレージのコピー機能がある。バックアップで時間を要するのは、全データを取得するフルバックアップである。これらの技術によりフルバックアップが不要になり、バックアップ時間を大幅に削減できる。

 また、アーカイブ/バックアップしたデータを、可視化した上で意思決定に利用したり、分析/開発テスト用のサンドボックスや、コンプライアンス対策などに有効活用したりすることも検討したい。可能であれば、それらの活用をセルフサービスで行えることが望ましい。復旧時までデータを眠らせているのはいかにももったいないためだ。さらに、運用面においても、運用管理ツールから操作可能なAPIを使った運用自動化を検討したい。

ビジネス継続

 デジタルビジネスは、ユーザーの生活の細部にまで入り込むため、ビジネス継続は信頼性担保の上で、より一層重要になる。その点、プライベートクラウドに加えて、複数のパブリッククラウドを利用するなど、マルチククラウド環境が望ましいが、管理が複雑になりがちである。

 そこで、クラウド間のシームレスな連携、マルチクラウド対応のデータ移動/保護/DRソリューションが必要になる。それにより、クラウドベンダーのロックイン回避にも貢献できる。

暗号化/セキュリティ

 パブリッククラウド上にデータを配置する際は、暗号化できることが望ましい。それも、ファイル単位ではなくボリューム単位の暗号化が可能であれば管理が容易になる。

 データセンター外に存在するモバイルやIoT機器のセキュリティの確保はもちろんのこと、高度化する脅威をいかに迅速に検知するかも重要だ。データに対する適切な権限/アクセス権管理も不可欠だ。

情報ガバナンス、コンプライアンス、プライバシー対策

 ビジネスがグローバル化している今、データ保護法や訴訟への対応、コンプライアンスへの対応も必須である。また、データの所有者や責任範疇の定義、部署間/他社とのデータ連携における、プライバシーへの対策も急務となる。

全てを「目的起点」で考えることが大切

 さて、今回は「デジタルトランスフォーメーション」「デジタルビジネス」、それぞれの意味や内容を確認するとともに、その実践に求められるデータ管理の在り方、それを支えるデータ基盤の要件まで、ざっと俯瞰、整理してみたわけだが、いかがだっただろうか。

 実は本稿では、意図的にバズワードを多用してみた。その理由は、バズワードには最新の状況や事象、技術などを簡潔に理解する上では便利な側面もあるためだ。インターネット上で情報を探しやすいという利点もある。今回振り返った内容についても、より詳細におさらいしたい場合は、幾つかの言葉を拾うと情報を見つけやすいのではないだろうか。

 また今回は、ベンダー製品については言及せず、背景や課題、検討事項の言及にとどめた。ベンダーの記事を読むと、背景こそはDXについて書かれているが、すぐに自社製品の宣伝に話が移る。「データ管理」という言葉にしても、さまざまなベンダーがそれぞれの立場で使用している。インターネット上の記事/ニュースを読むときや、ベンダーと会話をする際は、以下のどのレイヤについて議論しているのかをしっかりと認識することが大切だ。

ALT 図3 「データ管理」のカバー範囲《クリックで拡大》

 まずはデジタルビジネスの目的、構成するテクノロジー、データ管理の全体像を認識した上で、「自社では何がやりたいのか」という目的起点で個々のベンダーと会話し、ゴールを見据えて“全体”をインテグレーションできるパートナーを探すことが大切だろう。最終目的はあくまで「自社ビジネスを発展させること」であり、「システムを構築/連携させること」ではないからだ。目的意識、主体性が求められるデジタルビジネス時代において、こうしたスタンスは一層重要になったといえるだろう。

 次回以降、本稿で挙げたデータ管理のポイントを数回にわたって個別に詳述していく。ぜひ参考にしてほしい。

筆者紹介

木島 亮(きじま りょう)

ITサービス事業グループ 製品・保守事業推進本部
ITインフラ技術推進第1部 ITマネジメント技術推進課

画像

2002年、伊藤忠テクノソリューションズ(CTC)入社。HAクラスタやLinux、ストレージの担当を経て、現在、データ保護/データ管理を担当する。2008年から、仮想環境/クラウド上のデータ保護や可用性/事業継続ついて、案件支援や技術検証、セミナーを実施し、社内外への啓発を行っている。


前のページへ 1|2|3|4       

Copyright © ITmedia, Inc. All Rights Reserved.

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。