ビッグデータ時代のキーテクノロジ、「CEP」とは何か戦略的ITを実現するキーテクノロジ(1)(1/2 ページ)

本連載では、戦略的IT活用を実現する「これからの技術要素」を紹介していく。現代のキーテクノロジのアウトラインをつかむことで、ビジネスの新たな可能性を考えたり、「経営に貢献する情報システム部門」への変革を図ったりするための一助にしてほしい。

» 2012年08月22日 12時00分 公開

「経営への貢献」を求められている情報システム部門

 ビジネスがグローバル化し、市場競争も激化している現在、企業は市場動向変化に俊敏に対応することが求められている。特に、新規サービスのリリー ス、新たな付加価値の提供など、何をするにもITの力抜きでは語れない今、システム活用の在り方そのものが企業の命運を握ると言っても、決して過言ではない。

 こうした中、情報システム部門に求められる役割も大きく変わろうとしている。言われた通りに作るだけだったり、パッケージを導入したりするだけの、いわゆる“お守り”を行うスキルは、自動化ツールやアウトソーシングサービスの充実によって急速にコモディティ化しつつある。これに代わって、今、情報システム部門にとっては「経営に貢献するIT」を作り、運用することが、社内での存在感を担保する上で不可欠な条件になりつつあるのだ。

 また、ビジネスが複雑化し、ITが支援するフィールドも大幅に増えたため、従来のように開発会社に一任するスタイルでは、満足なものを手に入れる ことが難しくなっている。むろん、大量の人月を投入すれば、より良いシステムが構築できるというわけでもない。こうしたことも、情報システム部門への“新たな期待”を後押している大きな要因と言えるだろう。

 では今後、情報システム部門はどう振る舞えば良いのだろうか???そう、これからは「“業務と技術を熟知した精鋭”が、あらゆる技術を活用して、 迅速にビジネスをIT化できる組織」を目指していくべきだろう。むろん、一朝一夕にそうした組織に脱皮することはできないが、自社のコアコンピタンスと自 社ビジネスの強みを基に、「ITを戦略的に使う」「真に有効なシステムを作る」という意識を持っているだけでも、“丸投げ”レベルとは比べようもないほど、新システムの着想や改善案がわいてくるはずだ。

 特に最新のテクノロジをキャッチアップすることは、ビジネスを変革するあらゆる可能性を獲得するのと同じことである。ビジネスの動向に合わせて、「自らの判断で、正しい技術・製品を選択できる情報システム部門への脱皮」を図る上では、不可欠な要件と言えるだろう。

 そこで本連載では、戦略的IT活用を実現する「これからの技術要素」を紹介していく。現代のキーテクノロジを解説することで、技術者や技術に興味を持っている業務部門の人に最新トレンドを楽しんでもらいながら、「経営に貢献する情報システム部門」への変革を少しでも支援することが狙いだ。ぜひ一種の読み物として、気軽に目を通していただければ幸いである。

 では早速本論に入ろう。第1回となる今回は、ビッグデータのトレンドにおいて、「今」をリアルタイムに処理する技術として注目を集めている「CEP(Complex Event Processing:複合イベント処理)」を紹介したい。

CEPとは

 昨今、「ビッグデータ」という言葉がクラウドに次ぐキーワードになっている。このビッグデータ活用をひと言で言えば「大量・多種のデータを高速で分析し、ビジネスに役立つ知見を得る取り組み」となる。

 ただ、これまでのビッグデータ分析の方法は、データベースやログファイルに蓄えられているさまざまなデータを、任意のタイミングで、バッチ的に処理する形態が大半だ。つまり、「蓄積→加工→集計→分析」が基本的な処理の流れであり、情報が生成されてから、数分?数時間以上かけないと処理結果が得られなかった。

 しかし、それでは間に合わないビジネスケースもある。金融のアルゴリズム取引や、クレジットカード不正利用の検知、ネットワークへのサイバーテロの検出などだ。これらはまさにリアルタイムで処理結果が得られなければ意味がない。金融なら取り引き自体が成り立たないし、クレジットカードの不正利用やサイバーテロなどは事件発生時に検出できなければ被害を防ぐことができない。こうした「まさに今、何が起きているかを把握し分析結果が欲しい」というニーズを満たすために、開発された技術がCEPである。

 CEPは、時々刻々と発生するデータを、まさに今、その場で処理するための技術だ。ストリームコンピューティングと呼ばれることもある。具体的には、データに対する処理条件や分析シナリオを、あらかじめCEPエンジンに設定しておき、データがその条件に合致すると、即座に決められたアクションを実行する仕組みだ。

 従来型の処理が「データをデータベースに蓄積しておき、そこから必要なデータを取り出して、集計や分析をする」というイメージに対し、CEPは「事前に定義した分析シナリオに、リアルタイムにデータを流し込む」といったイメージになる。データウェアハウス(DWH)とCEPの違いを表1に示す。

表1  DWHとCEPの相違点 表1 DWHとCEPの相違点

 CEPの特徴は、データをリアルタイムで高速に処理するために、データをディスクに格納せず、すべてメモリ上に取り込んで処理をする点にある。もちろん、膨大なデータの全てをメモリ上に持ち続けることはできないため、一定時間以上経過したデータはメモリから追い出される。

 これにより、「直近10分以内に」「この数秒以内に」などの設定条件に沿ってデータを処理することができる。冒頭で挙げたビジネスケースで言えば、「直近1秒以内に、急に取引高が増えた株式銘柄を検出し、そのまま自動取引を行う」といった証券のアルゴリズム取引や、「直近10分以内に遠隔地で同一のクレジットカードで3回以上決済されたら異常とみなし、クレジットカードを自動的に機能停止する」といったクレジットカードの不正利用防止などに利用できる。

 もちろん用途はそれだけではない。世の中には、自動車などに積まれたセンサデータ、GPSなどの位置情報、Webのアクセスログ、ネットワーク機器からのリアルタイム情報、TwitterやFacebookなどのソーシャルデータ、さらにはテキスト、音声、画像など、あらゆる構造化データ/非構造化データが存在する。これらを一定の条件に沿ってCEPという仕組みでリアルタイムに処理することによって、ビジネスや社会インフラの運用に、あらゆる可能性が生まれて来る。次のページでは、いくつか活用事例を紹介しよう。

       1|2 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ