pr

jp1

「サービス視点、業務視点、物理リソース視点」
での監視が必要

ハイブリッド環境管理では予兆検知がポイント

2012/02/08


仮想化やクラウド環境が普及してきたことで、クラウドとオンプレミスのハイブリッド環境の運用を強いられている企業も多いだろう。複雑化するシステムに対して、コスト削減を実現しつつ、ハイブリッド環境を適切に管理・運営するためには、包括的かつ網羅的に管理可能なツールが必要だ。今回は、それを実現する統合システム運用管理ツール JP1を紹介する。

プライベートクラウド環境の運用管理に付きまとう課題

 今日の企業ITは、仮想化技術とクラウドコンピューティングを抜きにして語ることはできない。従来の企業ITは、多くの面で企業のビジネスの発展に寄与してきたが、各業務ごとにバラバラに構築されたシステム、つまり「サイロ化」されたシステムが持つ“非効率性”や“運用管理の煩雑さ”といった問題が長く指摘されてきた。また、長引く不況を背景に、多くの企業では経営合理化の一環としてITコストの削減が不可避となっている。

 企業ITにまつわるこうしたさまざまな課題を解決する技術として、現在多くの企業が積極的に取り組んでいるのが、ITリソースの仮想化と、それに続くシステム全体のクラウド化だ。この取り組みは通常、大きく分けて3段階のステップを踏んで行われる。

 まず第1段階が、サイロ化したシステムをセンタに集約し、一元管理することで運用管理コストを削減する取り組みだ。ある程度の規模の社内システムを運用する企業の多くでは、既にこの取り組みを完了したか、もしくは着手済みの段階にある。

 そして第2段階が、仮想化技術によってサーバ環境を仮想化・集約し、物理サーバの台数を削減することでコスト削減と運用の効率アップを図る取り組みだ。これも、先進企業の多くが既に本格的な取り組みを開始している。

zu01
システムのクラウド化は、センタ集約、サーバ統合、プライベートクラウドという3段階のステップで進んでいく(クリックで拡大)

 そして最終段階が、社内システムのプライベートクラウド化だ。仮想化したITリソースをプール化し、ユーザーの必要に応じて動的に割り当てることで、ITリソースのさらなる利用効率アップを図るとともに、ユーザーニーズに迅速に応えるITサービスの提供を可能にする。

 ただし、こうした仮想化とクラウドのメリットを享受するためには、クリアしなければならない問題も多々存在する。そして、その最たるものは運用管理の領域にある。確かに、仮想化とクラウドの導入はシステム運用管理の効率化に大きく貢献するが、同時に管理者に新たな課題を突き付けることにもなる。仮想環境では、物理マシンや仮想マシン、ハイパーバイザーなど、多様なコンポーネントが複雑に関連付けられているため、物理環境と比べて、状況把握や構成変更が困難になるからだ。

 また一口に仮想化といっても、そのベースとなるプラットフォーム技術にはVMware ESXやHyper-V、Virtageなど、さまざまなものが存在する。さらには、ITリソースのすべてが仮想化されているとは限らない。システム内には、仮想化された環境だけでなく物理環境も同居しているのが一般的だ。

 このようにプライベートクラウドは、さまざまなプラットフォーム技術が混在したハイブリッドな環境になる。こうした複雑な混在環境をいかに効率的に管理できるかが、プライベートクラウド導入の成否を分けることになる。

ノードではなく「サービスレベル」を監視することの重要性

 しかし、従来の運用管理の手法では、プライベートクラウド環境においては力不足になることが予想される。従来の運用管理方法は、個々のシステムコンポーネント監視に主眼を置いたものであり、多くのコンポーネントが複雑に絡み合ったクラウド環境においては、システムの状況把握や問題特定に手間と時間がかかってしまうのである。

 ユーザーからシステムの問題を指摘されてから調査に着手したのでは、調査と復旧に時間が余計にかかってしまう分、システム全体のサービスレベルが低下してしまうのだ。

 そこで重要になってくるのが、早期に問題を検知し、早め早めに手を打つことだ。そのためには、個々のシステムコンポーネントの監視だけでは十分ではない。それに加えて、ユーザーに提供するサービスの水準でサービスレベルの変化を検知し、サービス利用者の視点に立っていち早く問題を検出しなくてはいけない。つまり、「サービスレベル管理」の取り組みが重要な鍵を握るのである。

 では、具体的にどのような手段でサービスレベルを管理すればいいのか。よく見られるのが、ユーザーが直接利用するWebページの応答時間を監視し、それがある一定のしきい値を超えたら管理者に通知するという方法だ。実際、このような機能を提供する監視ツールも数多く存在する。

 確かに、応答時間のしきい値監視を行えば、サービスレベルの低下を自動的に検知することはできる。しかし、しきい値を超えてしまってから問題の調査と対策に乗り出したのでは、結局対策が後手に回ってしまい、システム利用者の不満を解消することはできない。そうではなく、サービスレベルの低下に至る前に潜在的な問題を検出し、それが顕在化する前に問題の芽を摘むことができれば理想的だ。

 日立製作所(以下、日立)では、まさにこのようなニーズに応えるためのシステム監視ツールを提供している。それが、「JP1/IT Service Level Management」(以下、JP1/ITSLM)だ。JP1/ITSLMは、ユーザーのシステムアクセスに関する情報を収集・分析し、その時点での各システムのサービスレベル状況を可視化するツールである。それだけでなく、JP1/ITSLMでは、サービスレベル低下に結び付く可能性がある問題の「予兆」を検知する機能も併せ持っている。

 具体的には、現時点での監視データの推移を、過去の正常時のもの(ベースライン)とリアルタイムに比較し、もし異なる傾向が現れた場合にはそれを検知し、いち早く管理者に通知する機能を持っている。

 これにより、問題が顕在化する前にいち早く調査と復旧作業に着手できるため、システムのサービスレベルを安定的に維持できるのである。

ハイブリッドな環境を単一のツールで一元管理

 こうして、いち早くサービスレベル低下の予兆を検知できたら、次はその原因を特定しなくてはいけない。

 ここで問題になってくるのが、先ほども述べたクラウド環境ならではのシステムの複雑性だ。特に、物理サーバと仮想サーバが混在している環境や、複数の仮想化ハイパーバイザーが混在しているハイブリッド環境では、システム構成がより複雑になるため、調査に困難をきたすことが多い。

 例えば、VMware ESXを使った仮想化環境の調査にはヴイエムウェアが提供する管理ツール(VMware vCenter)を使い、Hyper-V環境の調査にはマイクロソフトの管理ツール(System Center Virtual Machine Manager)を使い、さらに物理環境には従来のシステム管理ツールを使い……。このように、複数のツールを使い分けて調査するだけでも一苦労だ。

 そこで、日立ではこうしたハイブリッドな環境を一元的に監視できるツール「JP1/Integrated Management」(以下、JP1/IM)を提供している。このツールは、ハイパーバイザーの種類や物理/仮想環境を問わず、システム内に存在するすべてのコンポーネントの状態を単一の管理コンソール上に表示し、その稼働状況を監視できる。そのため、たとえ複雑なハイブリッド環境であっても、問題が発生している個所をすぐに一目で特定できるのだ。

 さらに、どのノードで問題が発生しているかを特定できたら、次にそのノード内でどのような事象が発生しているかを詳細に調べていく必要がある。ここでは、同じく日立が提供する「JP1/Performance Management」(以下、JP1/PFM)が活躍することになる。そのノードにおけるリソースの利用状況がグラフィカルに表示され、一目で把握できるため、具体的にどのような手を打てばいいかがすぐに導き出せる。

 ここまで、JP1/ITSLMとJP1/IM、そしてJP1/PFMを使ってハイブリッドなクラウド環境のサービスレベルを維持するための運用管理手法を簡単に紹介してきたが、これら高機能なツールをただそろえるだけでは意味がない。ツールを導入するだけではなく、それをきちんと使いこなせるだけのスキルを備えた人的リソースをそろえておくことも重要だ。

 とはいえ、必ずしもすべてのシステム管理要員が高いスキルを有しているとは限らない。また、システム障害は管理者がいるときに起きるとは限らない。メインの管理者がたまたま休んでいたり、あるいは休日などに問題が発生することも多々ある。

 こうした事態に備えて、サブの管理者に高度なトレーニングを施したり、作業手順書を整備したりといった対策が必要になってくるのだが、たとえそこまでやったとしても、いざというときに確実に問題に対処できるとは限らない。そこで、熟練の管理者でなくとも複雑なクラウド環境の管理を確実に行えるよう、管理作業の手順を詳細に、かつ分かりやすく見える化しておかなくてはいけない。

zu01
「JP1/Integrated Manager - Navigation Platform」の画面イメージ。フローチャートと解説が可視化されているのが特長だ

 この目的にぴったりなのが、JP1/IMシリーズの「JP1/Integrated Management - Navigation Platform」というツールだ。このツールの特長は、作業手順を文書だけではなく、フローチャートとガイド(解説)でビジュアルに可視化し、ユーザーがその内容をなぞることで自ずと正しい作業手順を踏めるようナビゲートできるという点だ。

 同ツールには、JP1を使った典型的なシステム管理作業のパターンが、テンプレートとして複数用意されているため、それを自社の環境に合わせてカスタマイズすれば、熟練管理者の作業ノウハウや手順を可視化し、広く社内で共有できるようになるのだ。

多種多様なITリソースの構成変更も一括管理

 以上のような手順を踏んで、システム異常の原因が突き止められたとしよう。

 クラウド環境においてそれは往々にして、仮想マシンに対するリソースの割り当てが不足していたり、あるいは仮想マシンそのものの数が足りなかったりと、リソースの配分が不適切なことに起因する。そこで、こうした状態を是正するには、リソースの追加や変更を行わなくてはいけない。ここでもまた、クラウド環境特有の課題が持ち上がってくる。

 リソースの追加や変更はすなわち、システム構成を変更することにほかならないが、前述の通りクラウド環境では実に多くのコンポーネントが複雑に絡み合っている。そのため、あるコンポーネントに対する変更がシステム全体のどの範囲に、どのような影響を及ぼすのか、予測困難となっているのだ。

 また、クラウド環境では通常、ITリソースを「リソースプール」と呼ばれる機構で一元管理し、必要に応じてリソースをそこから動的に引き出して利用する仕組みになっている。しかしリソースプールは通常、ハイパーバイザーの種類ごとに異なるツールを使って実装するのが一般的だ。従って、リソースプールから必要なリソースを取得したり、あるいは利用し終わったリソースを返却したりといった作業も、異なるツールをいちいち使い分けなければいけない。

 さらに、リソースプールから引き出したリソースをシステムに追加するためには、煩雑なインストール作業や設定作業を伴うことも多い。そのため、せっかくサービスレベル低下の潜在的な要因を特定できたとしても、いざ問題を解決する段になってさまざまな困難にぶつかり、結局はサービスレベルの維持が困難になってしまうことも考えられる。

 そこで、こうした課題の解決のために日立が提供しているのが「JP1/IT Resource Management」(以下、JP1/ITRM)だ。この製品は、仮想と物理、異種OS、異種ハイパーバイザーなど、さまざまな種類のITリソースのライフサイクルを、一元的に管理できる機能を持つ。当然のことながら、前述のリソースプールの機能も実装しており、異なるハイパーバイザー上で動作する仮想サーバをすべて一括して単一のプールで管理できる。

zu01
ハイブリッドなプライベートクラウド環境を安定的に、かつ効率的に管理するためには、「サービス視点での監視」「業務視点での監視」「物理リソース視点での監視」という3つのレイヤにおけるシステム監視が必要になる(クリックで拡大)

 また、単にリソースを管理するだけでなく、最適なリソース配備のためのプロビジョニングや、実際のリソースのインプリメントまで自動実行する機能も持つ。そのため、通常はさまざまな困難を伴うハイブリッドクラウド環境における構成変更を、大幅に簡素化・効率化できるのである。

 以上で見てきたように、ハイブリッドなプライベートクラウド環境を安定的かつ効率的に管理するためには、「サービス視点での監視」「業務視点での監視」「物理リソース視点での監視」という3つのレイヤにおけるシステム監視が必要になるのだ。

 そしてこれも既に紹介したように、日立ではJP1の各ツールを適用することで、これらすべての監視タスクを大幅に効率化するソリューションを提供している。プライベートクラウドのあるべき姿を明確に提示した上で、それを管理するための具体的なソリューションをここまで包括的に網羅したツールは、現時点では極めてまれな存在だといえるだろう。


関連リンク

統合システム運用管理 JP1

JP1/IT Service Level Management

JP1/Integrated Management

JP1/Performance Management

JP1/Integrated Management - Navigation Platform

JP1/IT Resource Management



提供:株式会社日立製作所
アイティメディア営業企画
制作:@IT情報マネジメント編集部
掲載内容有効期限:2012年03月07日