デジタルビジネス時代、あらためて疑う運用管理の在り方：“システムのパフォーマンスは、ビジネスのパフォーマンス”

ほとんどのビジネスをITが支えている今、システム運用管理の在り方が企業の収益やブランドに大きな影響を与えるようになった。だが仮想化、クラウド、またマルチデバイスの浸透などを受けて、システムは年々複雑化している。では人的リソースも限られている中、仮想化、クラウドのメリットを引き出し、ビジネス要請に迅速に応えていくためには何が必要なのか？運用管理製品を包括的にラインアップしている日本HPに、新時代の運用管理の在り方を聞いた。

» 2015年01月13日 10時00分公開

[PR/＠IT]

デジタルビジネス時代、ITのパフォーマンスがビジネスパフォーマンスを決定する

　運用管理市場を長きにわたってリードしてきたHP。ビジネスとITが密接に結びつき、運用管理の重要性が一層高まっている今日の状況を受け、同社は「HP ITマネジメントソフトウェア」として、大きく5つの製品群を展開している。

エグゼクティブ向けKPIダッシュボード:ITの状況をKPIとダッシュボードで可視化
サービスポートフォリオ管理:プロジェクト管理やアセットマネジメント管理
クラウド・オートメーション:運用手順書の自動化、クラウド環境の管理
ビジネスサービス管理:ITサービスの監視と可視化
アプリケーション配信管理:アプリケーション開発の管理、テスト、自動化

図1　「HP IT Managementソフトウェア」のラインアップ《クリックで拡大》

　この中で、「ビジネスを支えるITサービスの監視」を実現する上で大きなポイントになるのが、「ビジネスサービス管理（Business Service Management：以下、BSM）」と呼ばれる製品群だ。HPソフトウェア事業統括 ITマネジメント統括本部戦略推進本部で、BSMビジネス推進担当部長を務める鉾木敦司氏は、BSMの位置付けを次のように説明する。

HPソフトウェア事業統括 ITマネジメント統括本部戦略推進本部 BSMビジネス推進担当部長鉾木敦司氏

　「HPでは今日のビジネスを“デジタルビジネス”という言葉で表現しています。あらゆるビジネス、あらゆるコンシューマーの営みがITの上で行われるようになったことを指す言葉です。デジタルビジネスの世界では、ITが止まれば世界そのものが止まってしまいます。BSMは、そうした意識と危機感を受けて、ITをサービスとして迅速にデリバリしていくことを支援する製品群です」

　具体的には、「ネットワーク管理」「サーバー管理」「アプリケーションパフォーマンス管理」「統合システム管理」「構成管理」などをラインアップ。これらは従来から提供してきた製品も多く含むが、「バージョンを重ねるたびに機能改善、使いやすさの向上を実現しつつ、今日のビジネス課題に即した新しい製品群に発展している」と話す。

図2　「HP IT Managementソフトウェア」における「HP BSM」のラインアップ（紫線で囲んだ部分）《クリックで拡大》

　ポイントは、「ITでビジネスに貢献する」ための、以下の“3つのアプローチ”を採っていることだ。

「ビジネス要求にシステムのパフォーマンスがどれほど応えているかを把握する」
「ビジネスに影響を与えるシステムの障害を予見し、プロアクティブに対応する」
「監視対象から上がってきたタスクに対し、自動的に迅速に対処する」

　では、この3つのアプローチを、具体的にはどの製品が、どのような機能で実現するのだろうか。その中核を担う製品を順に見ていこう。各種機能を通じて、現在のシステム環境に即した“新たな運用管理スタイル”が浮かび上がってくるはずだ。

“ビジネスとITとの連動”を支援する「HP Application Performance Management」

　まず、「ビジネス要求に対し、システムのパフォーマンスがどれほど応えているかを把握する」アプローチの中核を担うのが「HP Application Performance Management」だ。エンドユーザーが利用するアプリケーションが適切に機能していなければ、ビジネスそのもののパフォーマンスが落ちてしまう。そこで本製品はアプリケーションのパフォーマンスをシステムの観点、ユーザーの観点の双方から監視し、ユーザーエクスペリエンスの担保を支援する。

　具体的には、モニタリングを行うプローブを設置した上で、リモートからWebサーバーやメールサーバー、DNSサーバーにアクセス。その可用性とレスポンスをチェックする「ブローブ型」の監視を行う「HP Business Process Monitor (BPM)」と、「HP Real User Monitor（RUM）」と呼ばれる監視機能も提供する。

　「RUMは、ネットワーク機器からアプリケーションのパケットをキャプチャし、そのトランザクションをサービスの稼働状況として管理画面に表示します。あらゆるユーザー、場所、時間におけるアプリケーションパフォーマンスをリアルタイムで監視できる他、それを支えているインフラの自動検出や、パフォーマンスに影響を与えているユーザー操作の分類も可能です。つまり、エンドユーザーがどのアプリケーショントランザクションを実行し、どのような応答を得たか、問題があればインフラのどこが原因個所なのかを分析できる。このプローブ型とパケットキャプチャ型の両方の監視方式により、システムのパフォーマンス――すなわちビジネスのパフォーマンスの状況を、より正確に監視できる仕組みです。両方を提供できるベンダーは少なく、HP APMの一つの差別化要因と考えています」

　モバイルデバイスに対応したAPMも日本市場への投入を準備中だという。スマートフォン(iOS、Android)上で動作するアプリケーションに小さなエージェントをアドオンることで、データ自体へのアクセスは行わず、そのアプリケーションの起動や反応などのトランザクションデータだけを収集してアプリケーションパフォーマンスを監視する。

　「この小さなエージェントとRUMを組み合わせることで、ユーザーエクスペリエンスを監視します。デバイスの機種、OS、キャリアなどのパフォーマンスをユーザーごとに計測することで、さまざまなデバイスにおけるパフォーマンスを確実に監視、改善することができます」

障害を予兆検知する「Oprations Analytics」と「Service Health Analyzer」

　「ビジネスに影響を与えるシステムの障害を予見し、プロアクティブに対応する」アプローチについては、「HP Oprations Analytics」（以下、OpsA）と「HP Service Health Analyzer」（以下、SHA）の2製品が中核を担う。

　OpsAは、運用管理で生じる大量のデータを分析することで、障害の予兆を検知することでパフォーマンスの低下を抑制、サービス品質を維持・向上させる製品。ビッグデータ解析プラットフォーム「HAVEn」(「Hadoop／HDFS」「Autonomy IDOL」「Vertica」「Enterprise Security」「nApps」の頭文字)と特許取得済みのデータマイニング技術を使って、障害の予兆検知を実現する。

　「具体的には、クラスタリングによるログの構文分析や、障害発生頻度による分類、既知の障害原因などの分析を組み合わせて高速に分析することで、障害の予兆をリアルタイムに検知します。スタンドアロンのため、サードパーティー製品を含め、既存の全システムの運用データを分析することが可能です。事前に異常を発見し、問題を解決できるため、ビジネスやエンドユーザーの混乱を未然に防止できます」

　一方、Service Health Analyzer（SHA）は、仮想化、クラウド環境の障害予兆検知にフォーカスした製品。後述する統合管理コンソール「HP Operations Manager i」が持つ構成管理データベース「Run-time Service Model」で収集したシステムの構成情報、稼働状況などの情報を基に、平常時の稼働状況／過去の障害時の稼働状況と、現在の稼働状況の相関関係を分析。具体的には、3週間程度（最短3日）の統計データを機械学習し、それまでの稼働パターンと異なるパターンが出現したときに自動的にアラートを発信する。これにより、ライブマイグレーションなどでシステム構成が動的に変わる環境においても、問題の予兆を発見し、未然に問題を防止できる仕組みだ。

システム全体の状況を一元管理する「HP Operations Manager i」

　3つ目の「監視対象から上がってきたタスクに対し、自動的に迅速に対処する」アプローチについては、運用手順書の自動化「Runbook Automation」機能を持つ「HP Operations Orchestration」（以下、 OO）が実現する。BSM製品群において、OOと各種監視製品を連携させることで、監視によるデータ収集から、問題の予兆発見、修復までの一連のプロセスを、エンドトゥエンドで自動化できる。

　さらに、こうしたシステム環境を一元管理する環境を整えるのが、統合管理コンソール「HP Operations Manager i」だ。システム全体を見渡して各種監視製品から上がってくるデータをシングルビューで把握。問題があれば監視データをドリルダウンして、原因を追求することができる。

　特徴は大きく2つ。1つは、先に紹介した構成管理データベース「Run-time Service Model」（以下、RTSM）を備えていること。「各アプリケーションが、どの仮想サーバー、ハイパーバイザー、物理サーバーで稼働しており、どのビジネスサービスとひも付いているか」といったシステム構成を視覚的に把握できる。

　ポイントは自動的に構成管理情報を更新することで、動的にシステム構成が変わる環境でも常に最新のシステム構成を把握できること。基本的には1日1回の頻度でシステム全体から情報を自動的に収集・更新するが、変更があった際も逐一、変更情報を反映する。具体的には、ハイパーバイザーのログを「HP SiteScope」などのサーバー監視製品で監視し、その情報を基に、変更があれば即座に更新する仕組みだ。

　2つ目は、TBEC（Topology Based Event Correlation）と呼ぶ相関分析エンジンを搭載していること。前述のRTSMから収集したITトポロジやイベント情報、アラートの閾値などの情報を基に、関連するイベントを自動的に相関分析し、何らかの問題が起これば、根本原因を迅速に特定できるという。

　「障害復旧には迅速な対応が求められますが、根本原因を把握できなければ適切な手が打てないため、各種障害対応の作業フローを自動化したところで意味がありません。その点、OMiを使って原因を絞り込んだ上で、OOで自動的に修復することで、真に迅速な対応が可能になるのです」

システムが動的に変化する今、運用管理の在り方も見直すべきだ

　以上のように、「状況を監視（モニター）し、相関を分析（コリレート）し、対応を自動化（オートメーション）する」というコンセプトに沿って開発されているBSM製品群。だがシステムが複雑化し、動的に変化する現在、こうした開発コンセプトを表す言葉も、「センス、アナライズ、アダプト」といった表現に置き変えた方が適切だと考えている」と鉾木氏は話す。

図3　問題を予測し、解決に最適な自動化プロセスを判断し、プロアクティブに適用する「センス、アナライズ、アダプト」という概念

　「例えば監視についても、従来は『こういう問題が起こったことがある』という過去の経験知に基づいて、問題が起こりやすい特定個所を集中的に監視する、というアプローチでした。しかし仮想化、クラウドによってシステム構成が複雑化している上、状況に応じて動的にシステム構成が変化し続ける中では、『過去に経験のない問題』にも迅速に対処していくことが求められます。BSM製品群における『予兆検知』や『相関分析に基づいた問題原因追及』『対応の自動化』といった機能は、まさしくそうした課題に対応した機能なのです」

　単に設定した閾値に沿って監視するのではなく、各種監視結果からあらゆる問題を予測し、解決に最適な自動化プロセスを判断し、プロアクティブに適用する――「センス、アナライズ、アダプト」という概念は、仮想化、クラウドによってシステム環境がますます複雑化していながら、「システムのパフォーマンス」が「企業のパフォーマンス」により直接的に影響を与えるようになっている今、不可欠な概念になりつつあるといえるだろう。

　システム運用のあらゆる問題は、システム環境と運用管理の在り方のギャップから生じる例が多い。仮想環境からプライベートクラウド環境にステップアップする企業、さらに複数のパブリッククラウドを使い分けるマルチクラウド環境に取り組む企業も増えつつある今あらためて、“従来型の運用管理”を疑い、見直してみてはいかがだろうか。

　なお、システムの柔軟性と、高いパフォーマンス、安定性を担保できる“動的な運用管理”の事例を詳しくまとめたホワイトペーパーも用意した。以下のカコミをクリックすれば、簡単なアンケートに応えるだけでダウンロードできる。これらの先行事例からは貴重なヒントが多数つかめるはずだ。ぜひ今すぐ入手して役立ててほしい。

本記事に関連するホワイトペーパー

※ダウンロードの際に、簡単なアンケートのご協力をお願いしております。

デジタルビジネス時代、あらためて疑う運用管理の在り方：“システムのパフォーマンスは、ビジネスのパフォーマンス”

デジタルビジネス時代、ITのパフォーマンスがビジネスパフォーマンスを決定する

“ビジネスとITとの連動”を支援する「HP Application Performance Management」

障害を予兆検知する「Oprations Analytics」と「Service Health Analyzer」

システム全体の状況を一元管理する「HP Operations Manager i」

システムが動的に変化する今、運用管理の在り方も見直すべきだ

本記事に関連するホワイトペーパー

関連リンク

本記事に関連するホワイトペーパー

関連リンク