@IT|@IT自分戦略研究所|QA@IT|イベントカレンダー+ログ | ||
Loading
|
@IT > トラブル経験率は63%──しかし、IT物理インフラ脆弱性への意識はこれから |
企画:アットマーク・アイティ 営業企画局 制作:アットマーク・アイティ 編集局 掲載内容有効期限:2004年11月15日 |
|
規模の大小を問わず、ビジネスのITへの依存度が日増しに高まる中、ITインフラの“強さ”に話題が集まりつつある。これまでITインフラの強さとは、サーバ、ネットワーク機器、それぞれ単体の冗長性を高めることや、バックアップなどデータ保全の運用を工夫するなどの手法ばかりに偏ってきた。 しかし、実際のITシステム導入現場では、意外なところに落とし穴が待ちかまえている。先日、アットマーク・アイティとAPC Japanの協力によって行われたシステム管理についてのアンケートの結果からは、電源、空調、ラックシステムといった物理インフラへの意識の低さが明らかになった。そして、意識の低さと反比例するかのように、物理インフラによるトラブル経験率は63%にも上っている。
信頼性の高いITインフラを構築する。ITへの依存度が高まっている中、優先すべきは信頼性、システムの継続性であることに関して、異論を挟む余地はない。では、どのような手法で信頼性を確保しようとしているのか。 圧倒的に多いのはサーバ機器の冗長性強化、信頼性を優先したアプリケーション構築、柔軟かつ安全性の高いデータ管理など、情報技術による解決策を最も重視するというユーザーである。ついで標準化やシステム構築の文書化など方法論や手順による対策、人員配置やトレーニングなどの人的資源対策と続く。しかし、物理インフラの改善に積極的に取り組もうというユーザーは、大規模システムを持つユーザーでも13%を切り、小規模ユーザーでは10%以下となる。
このアンケートは@ITに登録している、いわばITに対して高い意識を持った読者に対して行ったものであり、一般的な利用者の間では物理インフラに対する意識はさらに低いと考えるのが妥当だろう。では物理インフラは軽視しても良いのだろうか? 実は別の設問では、まったく相反する結果が出ている。 過去1年にマシンルームで発生した障害もしくは課題を挙げてもらったところ、停電や電源故障によるシステム停止、UPSのバッテリ切れ、機器やラックの設置面積不足、室温上昇によるマシン暴走など、物理インフラに関する障害や課題を経験したユーザーは、実に全体の63%にも達している。
大企業の場合、サーバをクラスタ化し、データの冗長性を上げ、ネットワーク機器のバックアップ体制を整え、ウィルス/ワーム対策を万全にするといった、情報技術に関わる対策は徹底して行っている場合がほとんどだ。打てる手だてはすべて打っているように見えて、これだけのトラブルが物理インフラに発生していては、とても盤石とはいえないだろう。 いや、中規模以上のユーザーであれば、物理インフラのトラブルも十分に経験し、それなりの対策を整えているのでは? と考えるかも知れない。しかし実態は異なるようだ。 1日中停電した場合、1営業日を乗り切る自身があるか? との設問には、7割の回答者が自信がないと答えている。また、ユーザー規模別の解答結果を見ると、室温上昇によるマシンの暴走を経験しているユーザーは中規模がもっとも多く、大規模ユーザーでも15%を越えている。インフラ整備に対する意識そのものはあっても、理由が明確な情報技術による信頼性確保に比べ、物理インフラには予算が取りにくいという事情もあるようだ。
それでいて、サーバが止まることによる損害が大きいと答えるユーザーも少なくない。1時間止まるだけで1億円を越える被害が予想されると申告する回答者も全体の5%を越えており、100万円を越えるという回答者の比率は約15%。把握していないとする回答者も約28%いた。 またサーバルームの脆弱性に関して興味があると答えた回答者は全体の約半分。現場での意識の高まりに対して、なかなか物理インフラに対する理解が広がらない現状が伺える。
一方、導入済みの物理障害対策に関して、ほとんどのユーザーが、RAIDシステム、UPSの導入を行っている。ところが、それ以外の対策、電源の二重化やサーバ冗長化、電源バックアップ、温度調整/自動空調システムなどは、ユーザーの規模が小さくなるほど、導入率が極端に下がっていく。
これは例えば、アンチウィルスとファイアウォールは導入しているが、その後にどのような対策を行うべきか分からない、という状態に似ている。定番の対応策はすでに導入した。しかしその後、具体的にどのようにすれば良いのか分からないわけだ。もちろん、障害を経験すれば、それに対する対応策も思い浮かぶだろう。しかし、それでは遅すぎる。 一方、大規模ユーザーはアンケートで選択肢として挙げた対策の多くに着手済みだ。システム停止による影響が大きい分だけ、マシンルームの脆弱性に対する意識がより高いためであろう。 ところが物理インフラの検査・点検をどのように行っているかといえば、ほとんどは手動による検査である。これでは障害発生時の対応が遅れるだけでなく、検査・点検にかかる運用コストも馬鹿にできない。大規模ユーザーであれば、検査・点検を行うべき対象は膨大な数になる。一方、小規模ユーザーは専任のシステム管理者を置くことが難しく、同様に物理インフラの管理が大きな負担になっているケースが多い。
物理障害に対する対応策を施すのはもちろんだが、円滑かつローコストにそれらを運用するため、SNMPによる物理インフラの管理を、ITシステムと同様に行う必要性もありそうだ。
これらの結果は、ITシステムの障害対策に関する意識改革を促すものだ。従来型の情報システムの革新による障害対策は、相当なレベルにまで進化し、その信頼性は確実に高まっている。ところが、情報技術レベルの信頼性が高まってくると、それまでは陰に隠れていた物理的なインフラの脆弱性が顕在化してきたともいえる。 障害対策に対する意識を変え、最も基礎的な要素といえる物理インフラに対しても意識を向け、取り組み方を見直す機会が必要だ。 こうした意識改革の前提として、自社の物理インフラがどういう状態にあるのかを客観的に知ることが重要だ。この点に関して、アンケートを共同実施したAPC JapanがIT物理インフラのアセスメントサービスを提供している。これは、「NCPI診断サービス」と呼ばれるもので、詳細なアンケートに答えていくことで、その企業のIT物理インフラの脆弱点を明確にし、適切な改善策を提供するというサービスである。もちろん、お客様のセキュリティポリシーに従って実施されるので、診断を受けることに不安を感じるシステム管理者にも安心だ。 NCPIとは聞き慣れない言葉だが、これはNetwork-critical Physical Infrastructureの略。ネットワークに必須の物理インフラ──つまり電源、ラック、空調、サービス、管理といった、あらゆる情報技術の基盤となる要素を表した造語。障害対策の考え方を変え、これまでは見落としがちだったNCPIに注目することでシステムの可用性を向上させることを目的としている。 APC JapanではNCPI強化のためのセミナーおよび、NCPI診断サービスを現在、無料で行っているという。興味があるならば、セミナーもしくは無料のアセスメントサービスを申し込んでみてはいかがだろう。 次回は、NCPI診断サービスを含めて、物理インフラ強化のためのAPC Japanのソリューションを紹介していこう。
|
|