「データレイク」を“澄んだ貯水池”にするために特集:IoT時代のビジネス&IT戦略(5)

センサーなどから大量に流れ込んでくるデータをどう蓄積・分析するか――そうした観点で「データレイク」が関心を集めている。だがIoTの取り組みに生かすためには、データレイクにも満たすべき要件がある。

» 2016年03月31日 05時00分 公開
[斎藤公二/@IT]

「とりあえず貯めておこう」は通用しない

 センサーなどを通じて常に流れ込んでくる構造化データ、非構造化データを確実に蓄積し、必要なときに必要な形で分析するための基盤として、企業にとって今後不可欠になると言われている“データレイク”。IoTトレンドが本格化する中で、そうした基盤を「具体的にはどう構築し、どうデータ活用を進めるべきか」というテーマが、いま多くの企業の関心を集めている。

 これに対して、複数のベンダーが“解決策”を提案しているが、言うまでもなく、そうしたソリューションを採用しさえすればIoTの取り組みがうまくいくわけではない。ビジネスに寄与するためには、どのベンダーの製品・サービスを採用するにしても、“自社の目的・要件を満たすデータレイク”に仕上げる必要がある。だが、IoTやデータレイクに対する関心の高さとは裏腹に、そうした観点を持って取り組みに当たっているケースはまだ多いとは言えないのではないだろうか。

 では、真に役立つデータレイクを構築する上での要件とは何か?――今回は、クラウドを使った「IoT向け予測分析ソリューション」など、IoT分野においてさまざまなサービスを開発・リリースしている、TIS プラットフォームサービス本部の内藤稔氏と須永哲生氏に、顧客企業に対するコンサルティング経験も踏まえ、IoTにおけるデータ収集・蓄積の前提条件を聞いた。

目的によって「集めるべきデータ」は変わる

 昨今のIoTにおけるデータ活用のトレンドについて、内藤稔氏は「例えばビジネスプロセスの改善や、工場設備などの故障予測、新規事業の立ち上げに至るまで、幅広い業界で取り組みが活発化しています」と語る。だが、データを有効に生かせている企業がある一方で、データの扱いに課題を感じている企業が多いという。

ALT TIS プラットフォームサービス本部プラットフォームサービス事業部 プラットフォームサービス企画部 副部長の内藤稔氏

 「多くの企業が課題としているのは、“業務に必要なデータ”をどう整理していくかということです。特にIoTにおけるデータ活用の場合、単にセンサーから得られるデータを蓄積するだけでは、業務に役立つ知見は得られません。むしろデータが膨大になるため、蓄積すること自体がコストになるケースもあります。データを活用するためには、まずデータを集める目的を明確化し、目的にかなうデータを選別することが前提となります」(内藤氏)

 ビッグデータトレンド以降、「とりあえずデータを蓄積しておこう」という風潮が広まった他、近年は機械学習などの技術を使えば、「蓄積した膨大なデータを機械的に分析し、ビジネスに意味のある知見が得られる」といった期待も高まっている。ただ、内藤氏によると、「そうした利用法が適切なケースもあるものの、ほとんどの場合はコストに見合わず、期待した結果が得られない」という。

 「例えば、モバイルの位置情報を分析できれば成り立つビジネスなのに、加速度センサーのデータまで取得するといった具合です。この場合、保存コストは少ないかもしれませんが、目的に対して必要のないデータを整理するコストは掛かります。それだけではなく、『本来必要なデータが何か』まで分かりにくくなることもあり得ます。当たり前のようですが、何をしたいのかという目的を基に、最適な手段を選ぶべきなのです」(内藤氏)

データ活用のキモはデータのクレンジング

 では具体的に、ビジネスに生かせるデータ整理にはどのような要件が求められるのだろうか、プラットフォームサービス企画部エキスパートの須永哲生氏は次のように説明する。

 「まずはビジネスの視点から見て『必要なデータは何か』を決めることが重要です。ユーザーの位置情報を利用した新規サービスなら、位置情報だけを効率よく取得・活用する手段を考えます。工場における部品の故障検知などなら、故障検知に必要なセンサーデータを選び取得する。次に、そのデータをクレンジングします。このクレンジングは、データ活用のキモともいえる作業です」(須永氏)

ALT TIS プラットフォームサービス企画部エキスパートの須永哲生氏

 周知の通り、データクレンジングとは、収集・蓄積したデータをRDBなどで分析できるよう加工・整形する作業だ。ただ、ここでは「フォーマットがバラバラのデータを、ETLツールで正規化する」前の段階のことを指している。

 例えば「冷蔵庫の節電」を目的にしたIoTアプリケーションを作る場合、扉の開け閉めが頻繁に行われれば、冷却のための電力が増える。そこで「開閉するたびにタイムスタンプを取り、そのデータを蓄積しよう」と考えたとする。しかし、よくよく考えると、冷蔵庫の開閉が頻繁に行われる時間はほぼ決まっている。家庭用、オフィス用、業務用、店舗用、それぞれでおおよそ使われる時間も推測できる。

 「従って、場合によっては『午前か午後のどちらかで節電すればいい』といった判断でも済むはずです。この場合、何時何分何秒といった細かいタイムスタンプのデータは目的に対して意義が薄く、午前か午後かというデータだけを集めた方が分析しやすいと判断できます。つまり、分析の目的となるビジネスの知識やノウハウがないと、集めるべきデータは何かすら正確に判断できないことになるわけです」(須永氏)

 収集するデータを正しく整理できるかどうかで分析の時間や手間は大きく変わってくる。事実、データ分析の担当者にデータを渡すと「これは分析できないですね」と言われるケースは多い。つまり、「分析できないのは業務に役立つ形に整理されていないから」だ。

 工場設備の稼働状況に関するデータでも同じことが言える。例えば「動いているか、いないか」という2値データの蓄積だけでは使えないことが多い。稼働状況の監視という目的に役立てるなら、「動いていない」のは「故障のため」「時間帯のため」など、稼働状況を知る上ではノイズとなり得るデータをあらかじめ取り除き、「分析する意味のあるデータ」のみに整理する作業が必要となる。

 すなわち、目的に応じて使えるデータをきれいな状態でくみ出せる、「澄んだ貯水池」にするための準備や仕組みが必要となるわけだ。

状況に応じてスケール/撤退できる蓄積・分析基盤が不可欠

 ではそうした前提条件をクリアしたとして、システム面ではどのような要件が求められるのだろうか。内藤氏は「システムについても、やはりビジネス起点での実装がポイントになります」と指摘する。

 「業務に必要な結果を得るために分析するわけですから、それに合ったシステムを構築することが大前提です。特にIoTにおけるサービス・製品開発は、市場環境変化の先が見通しにくい中で、換言すれば『何が当たるか分からない』中で、トライ&エラーを繰り返す必要があります。従って、システム面においても、データ蓄積・分析のための大掛かりなシステムを最初から整備するよりは、必要なデータを処理するための小さなシステムを作り、トライ&エラーを繰り返しながら必要に応じて拡大していくアプローチが求められます。もちろん目的が明確に分かっているなら、大きなシステムを最初に作って他社と差別化するという戦略もありです」(内藤氏)

 分析基盤としても、必ずしもNoSQLやHadoopが必要というわけではない。最初は小さなインスタンスを立ち上げて、一般的なRDBMSで分析を始め、スケールが求められた場合に段階的に基盤を整備していけばよい。幸いなことに、現在はDWHや分析基盤、BIがクラウドサービスとして提供されている。

 RDBMSで分析していたデータを、規模が増えた段階でNoSQL DBに移すといったことも可能になっている。規模への対応だけではなく、データの生成頻度に合わせて収集する頻度を変えることもできれば、ハイブリッド環境において、オンプレミスのデータとクラウド上のデータを組み合わせてBIで分析するといったことも可能だ。

 「大切なのは、分析する目的と方向性に応じて、シンプルに分析できる環境を作ること。また実際に分析してみると、分析の方向性を変えなければならなくなることも多くあります。分析基盤に求められる条件は、トライ&エラーに応じて方向性を素早く変えられること、スケールできること、状況に応じて撤退しやすいことなどが挙げられます。こうしたトライ&エラーを繰り返しながら、スケールアウトしていくアプローチを取る上では、パブリッククラウドを使うことが最も現実的と考えます」(内藤氏)

海兵隊のように果敢に挑戦できる組織とインフラを作る

 内藤氏と須永氏は、IoTに役立つ分析基盤の要件として、「失敗しても果敢に挑戦し続けられること」と述べ、東京大学先端科学技術研究センター教授 森川博之氏がIoTの取り組みについてなぞらえた「海兵隊」という言葉を挙げる。一般に、海兵隊は陸軍、海軍、空軍の各機能を持ち合わせ、敵陣に最初に乗り込んで、見通しが立てば本隊を呼ぶ。

ALT IoTのプレイヤーでもある両氏は、「IoTはスモールスタートでまずはやってみることが大切。蓄積・分析基盤にも状況に応じてスケールできることが求められる」とアドバイスする

 須永氏は、「見通しのきかない市場に最初に切り込み、作戦の失敗も許容しながら、状況に応じて少しずつ取り組みを拡大していくわけですから、そうしたチームの動きに俊敏・柔軟に対応できるインフラは不可欠といえます」とコメントする。

 TIS自身、そうしたデータ蓄積・分析基盤を顧客向けに構築するだけではなく、サービスとして分析ノウハウの提供を実施している。内藤氏と須永氏が所属するプラットフォーム企画部でも、IoTやAIなどのトレンドを踏まえながら、「顧客と共に新規事業を立ち上げる試み」を開始している。すなわちIoTのプレイヤーでもあるわけだが、両氏はそうした現場の視点から、IoTに取り組む多くの企業にエールを贈る。

 「データ蓄積・分析は目的が重要ではありますが、最初から明確な目的を持って取り組むことが難しいケースも少なくありません。中には『IoTで何かをやれ』とトップダウンでプロジェクトが始まったケースも多いと思います。しかし、現在はあらゆる手段が整っています。悩んでいるだけではいつまでたっても進めません。悩むよりは実際にやった方がいい。まずは身近にあるサービスを使って、スモールスタートしてみると、“自社にとっての分析の要件、データレイクの要件”が明確になってくるはずです」

特集:IoT時代のビジネス&IT戦略〜「チャンス」にするか、「リスク」になるか、いま決断のとき

今、IoT(Internet of Things)が世界を大きく変えようとしている。企業は現実世界から大量データを収集・分析して製品・サービスの開発/改善につなげ、社会インフラはあらゆる予兆を検知してプロアクティブに対策を打つ。だが、IoTはドライバーにもリスクにもなり得る。データの収集力、分析力、そして価値あるアクションに落とし込む力次第で、チャンスをモノにもできれば奪われもするためだ。企業・社会はこの流れをどう受けとめるべきか?――本特集ではIoTの意義から、実践ノウハウ、不可欠なテクノロジまでを網羅。経営層からエンジニアまで知っておくべき「IoT時代に勝ち残る術」を明らかにする。



Copyright © ITmedia, Inc. All Rights Reserved.

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。