「複雑な混在環境を使いこなす」クラウド/OSS時代の運用管理、4つの視点特集:クラウド/OSS時代の「業務を止めない」運用ノウハウ(1)

近年の「先が見えない」市場環境の中、ビジネス要請へのスピーディな対応が求められるシステム運用管理にも新しいアプローチが求められている。本特集『クラウド/OSS時代の「業務を止めない」運用ノウハウ』では、そのアプローチを一つ一つ掘り下げていく。

» 2016年01月13日 05時00分 公開
[編集部,@IT]

着実に浸透が進む運用自動化

 市場環境変化が激しい現在、企業にとって日々変化するニーズへの俊敏な対応が、差別化の一大要件となっている。これを受けて、あらゆる業務を支えるシステム運用にも一層のスピードと柔軟性が求められている。

 だが現在は、OSS(オープンソースソフトウェア)も含め、マルチベンダー製品で構成されたヘテロジニアスな環境であることが一般的。加えて、サーバ仮想化やパブリッククラウドを導入している企業も多く、システム環境は複雑化の一途をたどっている。また多くの企業でITコストは厳しく制限されている他、人的リソース不足、スキルの属人化などに悩まされている例も多い。こうした中で、変化するビジネスニーズに対応しながら安定的・効率的にインフラを運用することは、人手だけでは難しい、場合によっては不可能な状況となっている。

 これを受けて、運用自動化が昨今あらためて注目されている。仮想化、クラウドが浸透し始めた2009年ごろ、商用の運用自動化ツールが国内でも提供され始めた当初は、例えば追加するリソース容量など「人の承認が必要なプロセスまで自動化しても大丈夫なのか」といった不安や懸念を抱く声も目立っていた。だが「人がすべきこと、自動化すべきことを切り分けて、ツールができる定型的な作業のみ自動化する」など、運用自動化に対する理解が浸透したこともあり、その導入は着実に進んでいるようだ。

 例えば、2015年9月、IDCジャパンが発表した資料によると、「2014年の国内システム管理ソフトウェア市場規模」は2946億7500万円で前年比4.2%増。これは「運用プロセスの自動化/最適化への需要の増加が、市場の成長をけん引」した結果であり、「2019年には3676億1200万円に達する」と予測している。特に「仮想環境の運用管理の効率化」「仮想環境のプライベートクラウドへの発展」を目的に、運用自動化を検討する企業が増えているという。

 2015年12月に回答を募集開始した@ITの読者調査にもその傾向は表れている。まだ途中経過ではあるが、「システム運用管理に関するトピックス/キーワードの中で注目しているもの/今後導入を予定・検討しているものをお選びください」という質問に対し、2016年1月7日時点での全回答者379人のうち、「ハイブリッドクラウド(オンプレ+パブリック)」が最多で29%、「パブリッククラウド」が26%、「プライベートクラウド」が25.9%と続く中、「運用自動化ツール(ランブックオートメーションなど)」が23%と、クラウドに次ぐ注目を集めている。

 ほとんどのビジネスをITが支えている今、いかにシステム環境が複雑であろうと、ビジネス要請に即座に応え、かつシステムの安定運用を担保できなければ、即、機会損失につながってしまう――いわば、「システムのパフォーマンスがビジネスのパフォーマンスに直結している」という認識が、着実に浸透していることの一つの現れといえるだろう。

「静的な運用管理」から「動的な運用管理」アプローチへの切り替えが必要

 ただ今後、システム運用にはより高度な要件が必要になると目されている。それはIoTやFinTechといった昨今のビジネストレンドで共通して求められている、「いち早くニーズを捉え、新たなITサービスを開発・リリースし、市場の反応を受けて継続的に改善/拡大する、あるいは廃棄する」といった動的な開発アプローチがますます不可欠になっていくためだ。

 これを運用管理側から見れば、新たなサービスのデプロイ先の迅速な整備をはじめ、突然のトラフィックの増減や、予期せぬインシデントなどにも耐えながら、サービスの安定運用を担保する、ということになる。社外向けの、いわゆるSoE(System of Engagement)領域のフロントシステムだけではない。フロントシステムがバックエンドの基幹系と連携していれば、当然その運用も、フロントの稼働状況や機能追加などの影響を受けることになるだろう。

 つまり、変化が激しい経営環境の中で、運用管理側も“先の見えない変化”に動的に対応する必要性が高まっており、市場競争を生き残る上では、もはや「変動するビジネス要請と、複雑なシステム環境に翻弄される」ことが許されない状況になりつつあるのだ。

 ではこうした時代に、運用管理はどうあるべきなのか? 「定型的な作業を自動化する」「人は人がすべき作業に集中する」ことが必要なのはもちろんだが、ポイントはそれだけではない。最も重要なのは、システムが変わらないことを前提とした「静的な運用管理」から、変わることを前提とした「動的な運用管理」への視点の切り替えにある。ここには以下のような、大きく二つのポイントがあるとされている。

システム全体の状況を一元的に可視化、監視できること

 例えば、仮想サーバの追加・削除・移動などが起こる仮想環境、あるいはそれを発展させたプライベートクラウド環境では、システム構成が変動する。また、一つのアプリケーションでも複数のサーバやネットワーク、ストレージといった各システム構成要素が連携して支えている。従って「今のシステム構成」を常に正確に把握できなければ、問題があった際に根本原因追及が遅れるなど、安定運用が難しくなるためだ。パブリッククラウドを使っていればガバナンス担保の上でも重要となる。それぞれの稼働状況を個別に監視するのではなく、各システム構成要素の相関関係をひも付けて監視する仕組みが求められる。

そのときどきの状況に適した対応を、自動的に行う仕組みがあること

 単に定型的な作業を自動化するだけではなく、「複数のツールを使った、複数の作業ステップ」を自動化し、そのときどきの状況に最適なプロセスを自動実行する必要がある。例えば、「仮想サーバの配備・廃棄に応じて、自動的にインベントリ情報を更新する」「過去のインシデントを管理・分類しておき、ユーザー部門からの問い合わせに自動的に回答する/その場での対応が難しい場合はインシデントチケットを自動的に発行する」「問題管理と切り分けて自動的に蓄積する」仕組みなどだ。

 仮想環境を発展させたプライベートクラウド環境では、こうした仕組みが一層重要になる。例えば、負荷状況に応じて自動的にサーバリソースを追加・削除するオートスケーリング機能があるが、「新しいサーバがいつのまにか増減している」といったことにならないためには、「サーバの増減を自動的に認識し、最新のシステム構成を自動的に更新する」「新しく立ち上がったサーバを自動的に監視対象に組み入れる/自動的に監視対象から外す」といった仕組みが求められる。

「運用自動化」は「運用自律化」へ

 だが前述のように、「先が見えない」中でも俊敏な対応が求められる昨今は、以上二つに加え、よりプロアクティブなアプローチが求められている。例えば、「システムに異常があるとアラートを発信し、管理者にメールで通知する」といった仕組みにおいて、現在はあらかじめ閾値を設定して、緊急度・深刻度が高いアラートのみに絞り込んでいる例が一般的だ。だがビジネスの状況に応じてシステム構成が変動する中では、この閾値の設定自体も難しくなっている。

 従って、確実・効率的に管理するためには、閾値も動的に判断・設定する仕組みが必要となる。また、安定的にビジネスを支え、機会損失を招かないためには「問題が起こってから対処」するのではなく、「起こる前に予兆を検知して対処する」アプローチが必要だ。そこで現在は、以下の二つも求められつつある。

ログ分析/イベントの相関関係の分析

 システムのトポロジ情報やストリーム情報などを各種イベントとひも付けて分析する。これにより、「緊急度が高く、本当に人手が必要なアラートのみに絞り込む」「問題の根本原因を明らかにする」「問題の予兆を検知する」といったプロアクティブな対応を狙う。

分析機能とランブックオートメーションの連携

 前述のように、状況に応じて実行すべき作業プロセスは複数存在する。よって「複数のツールを使った、複数の作業ステップ」を自動化しておいても、状況に最適な作業プロセスを適用できなければ、その意味も半減してしまう。そこで、「その時々の状況を自動的に分析→最適な対応を自動的に行う」といったアプローチが求められてくる。また「何が起こるか分からない」中では、分析→対応→結果という分析サイクルを回すことで知見を蓄積し、あらゆる状況に自律的に対応できる仕組みも必要性が高まると言われている。

 もちろんこうした仕組みは、場合によっては「まだ先のこと」と映るかもしれない。だが、変化の激しい市場環境の中で、ビジネスを安定的に支える上では、仮想化、クラウド、OSSが混在した複雑な環境からスピードやコストメリットを引き出し、ミスなく運用するとともに、予期せぬインシデントにも迅速に対処していかなければならない。ビジネスニーズへのスピーディな対応が企業にとって差別化の一大要件となっていることを考えれば、こうした仕組みの必要性も、現実味を帯びて見えてくるのではないだろうか。

 本特集「業務を止めない、クラウド/OSS時代の運用ノウハウ」では、複雑な混在環境が一般的であり、人手、スキル、コストに制約がある中で、「障害が起こる要因」をあらためてひもときつつ、クラウド/OSS時代の運用スタイルに不可欠な要件を解説。自律的な運用に向けて、無理なくステップアップするための運用ノウハウを分かりやすく解説する。

特集:クラウド/OSS時代の「業務を止めない」運用ノウハウ

ITサービスのパフォーマンスが、ビジネスのパフォーマンスを左右する時代になって久しい。こうした中、企業にはニーズビジネスを取り巻く環境の変化に応じてサービス、インフラをスピーディに最適化するための「動的な運用管理」が不可欠となっている。だが現在は、仮想化環境やクラウド、商用ソフトやOSSが混在した複雑なインフラが主流。ニーズの変化に応えながら、サービスを止めることなくシステムを運用するには、もはや人手中心の管理は限界を迎えている状況だ。にもかかわらず、サービス/インフラ運用には一層のスピードが求められている――。本特集では、人手、スキル、コストに制約がある中でも、こうした時代に対応できる運用スタイルを紹介。「障害が起こる要因」をひもときつつ、クラウド/OSS時代の運用スタイルに不可欠な要件、無理なくステップアップするための運用ノウハウを分わかりやすく解説する。




関連キーワード

運用管理 | 仮想化 | クラウド |


Copyright © ITmedia, Inc. All Rights Reserved.

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。