アットマーク・アイティ @IT@IT自分戦略研究所QA@ITイベントカレンダー+ログ
 @IT > 電源、ラック、空調をあわせて考える──解決策としての「NCPI」と「InfraStruXure」
 
@IT[FYI] 企画:アットマーク・アイティ 営業企画局
制作:アットマーク・アイティ 編集局
掲載内容有効期限:2004年11月15日

 
  ビジネス継続性を阻害するサーバルームの諸問題とは?
電源、ラック、空調をあわせて考える
──解決策としての「NCPI」と「InfraStruXure」

 前回は読者アンケートを通じて、システム管理者の方々のIT物理インフラへの意識についてリポートした。現状は物理インフラへの注意・認識が不十分であり、ビジネス継続性リスクをかかえている会社の多いことが浮き彫りになった。
 今回はITシステム可用性のリスク要因となる物理インフラ脆弱性にはどのようなものがあるのか、具体的に見ていきながら、そのソリューションとしてAPC Japanの「InfraStruXure(インフラストラクチャ)」シリーズに関して紹介しよう。

 さまざまなIT技術に投資を行い、システムの信頼性向上に努めている企業でも、それらIT技術を支えるサーバルーム自身の信頼性を高めることには、なかなか関心が向かない、あるいは予算が十分に取れないという実態が、前回のアンケート結果から分かってきた。

 では実際にサーバルームの中で起きている問題とはどのようなものなのか?

脆弱な状態にあるサーバの物理インフラ

 前回のレポートで紹介した物理インフラの脆弱性に関するアンケート結果を見ると、多くはサーバ向けの空調を整えた専用ルームが用意され、さらにUPSの導入率も高い。電源や温度環境に関して意識の高いユーザーが多いと考えることができるだろう。

 ところが、実際のトラブルを検証してみると、サーバラックの不備による温度管理の不徹底や、UPSがうまく機能しないなどの原因でシステムダウンが発生していることが分かる。これは、高密度に実装したサーバの熱を効率よく排出できないことが原因だと考えられる。管理者の気持ちの上では、物理インフラに対して関心も意識もあるが、実際の対策は不十分で、ちょっとした環境の変化に対応できていないといえそうだ。

 もう少し詳細に考えてみよう。例えばシステムを構築したばかりの運用初期段階では、ラック内では間隔を空けてサーバを設置していることが多い。ところが、システム規模がスケールアップし、実際にサーバ増強のために機器をラック内いっぱいに実装してみると、途端に熱暴走を起こし始めるケースがある。機器が増えることで発熱量が増加することも一因だが、背面の配線が複雑化し十分なエアフローが確保できなくなることもある。

ITシステムの高可用性を実現する上で、最下層の物理インフラを、NCPI :Network Critical Physical Infrastructurと定義する
 また、ラックのエアフローと並んで多いトラブルが電源周りだ。機器増設で電流量が規定値を超えたり、UPSのバッテリがきちんと性能を維持できていないなどのケースも少なくない。なかでもUPSは、サーバの新規導入と共にセットで導入されることが多く、無計画に数だけが増え、管理が行き届かずにバッテリが期限切れのまま放置される事例も多い。

 そこでAPC Japanが提唱しているのが、「NCPI(Network-critical Physical Infrastructure)<ネットワークに必須の物理インフラ>」というコンセプトだ。NCPIとは電源、ラック、空調、ビル管理など、サーバが動作する物理レベルの設備・環境のことを指し、これもシステムの管理対象として組み込み、トータルなシステム・マネジメントを行っていくという新しい枠組みを提示するものだ。

従来のITシステムが抱える問題点

 では具体的に、従来のシステムには可用性の向上という視点で、どのような問題があるのだろうか? 問題を大きく4つに分類してみたい。

■管理性
 これまで空調や電源など設備管理のシステムとITシステムはそれぞれ独立したものだった。空調や電源はビル管理システムに依存しており、ITシステムからの直接的な監視や制御は行われない。このため、例えばシステムが健全な状態か否かをネットワーク上で監視しても、電源や空調の異常に起因する問題は発見できないこともある。

■スピード
 ITシステムに対する依存度や要求が高まる中で、ビジネスの成長に合わせて増強が図れるよう、多くのシステムは設計されている。ところが、ITシステム自体は急激な業務拡大にも耐えられるよう設計されていても、それに見合うだけのインフラを用意することは簡単ではない。物理インフラの変更は機器のリプレースや追加のように簡単ではないからだ。無理なシステムの拡張や増強は物理インフラの負担を増加させ、無用なトラブルを引き起こす原因にもなる。

■適応性
 電源や空調などの設備は10年単位で設計されるが、IT機器は一般的に3年に1度のリプレースがある上、業務拡大に伴って追加されることも少なくない。また、IT技術のトレンドは常に変化しており、それに伴ってサーバの設置状況が大きく変わる可能性がある。例えば最近は分散処理から集中処理へとトレンドが変化しており、それに伴って電源や空調などの物理インフラに求められる要素も変化している。

■経済性
 冒頭でも述べたように、ユーザーは“ある程度”は、ITシステムの物理インフラが強固でなければならないという意識を持っている。しかし、長期的に信頼性の高い物理インフラとするためには、あらかじめシステムの拡大を想定した設計を行う必要があり、初期投資額が大きなものになりがちだ。サーバをスケールアウトするような、段階的な投資も行いにくいため、どうしても物理インフラに対して十分な投資を行えない。

ラック単位で物理インフラを改善するNCPI

 APC Japanが提唱するNCPI(Network-critical Physical Infrastructure)というコンセプトは、こうした問題点に応えるために、システムのアーキテクチャがどうあるべきかを考え直すことで生まれたものだ。NCPIは、これまでのように物理インフラとITシステムを別々に考えるのではなく、システムが稼働するサーバルームの環境を同時に改善する。

 とはいえ、前述したように物理インフラの整備には時間が掛かり、しかもシステムの増強に応じて必要な能力は異なる。物理インフラに将来性を持たせようとすると、初期投資は大きくならざるを得ない。

 そこでAPC Japanが着目したのが、現在ほとんどのITシステムで使われる19インチラックである。物理インフラの整備をサーバルーム全体の環境改善で行うのではなく、IT機器が収められるラック単位で空調制御を行い、電源の利用状況や温度などを統合的に管理するのだ。ラック単位でサーバが動作する際の物理インフラを管理することで、ネットワークを通じた管理・監視ソリューションをITシステムの管理ソフトウェアと統合することも可能になる。

 システム全体の初期導入コストに対して、UPSやラックといった物理インフラの導入に掛かる経費はわずか5%程度にしか過ぎない(APC Japan調べ)。この5%の投資を怠らずに“将来を見据えたもの”にすることで、ラック単位で物理インフラの脆弱性を抑え込むことができるのだ。

 また、サーバ増強時、ラック本数増加時などにも対応しやすい柔軟性を備えた設備・環境への配慮も必要だろう。

NCPIコンセプトに基づき設計されたInfraStruXureシリーズ

 こうしたNCPIコンセプトを実際の製品に反映しているのがAPC Japanの「InfraStruXure」シリーズである。InfraStruXureは、電源と空調、管理ツールなどをラックに最適化させた統合型物理インフラソリューションだ。

 例えば、ラック内の機器数が増加すれば、それに伴ってケーブル配線が複雑化するのは自明だ。冒頭で述べたとおり、ケーブルの増加でエアフローが滞り、想定された冷却性能を発揮できずにシステムダウンするケースは少なくない。

奥行き1070mmでも背面ドアが観音開きのため省スペース
 ならば、ケーブルが将来増加することをあらかじめ見越して、余裕のある配線が可能な環境を用意すべきだ。InfraStruXureで使用されるラック「NetShelterVX」は、通常900mmの奥行きで設計されるところを1070mmもの奥行きで設計されている。しかも背面ドアが左右観音開きになるため、ラックの有効な奥行きは大きいにもかかわらず、設置に必要な面積はほとんど変わらない。

 また、システムを構築する上で大きな問題となるのが、サーバがラックに搭載可能かどうかの判断だ。最初のサーバ導入時にサーバベンダー純正のラックを購入した場合、あとから他社製のサーバを追加しようとした際に搭載ができないことがある。また、複数ベンダーのサーバを同時に搭載する場合も同様だ。

 APCのNetShelterVXはマルチベンダーに対応した設計のため、EIA規格に準拠したサーバ取付方法である限り必ず搭載が可能だ。従って、複数ベンダーのサーバを搭載する際や、将来システムの拡張が予想される場合も安心して導入できる。

 同様の考え方に基づき、APC JapanはInfraStruXureシリーズ向けにさまざまなソリューションを用意している。前面吸気・背面排気設計となっているラックマウントサーバの熱暴走を防ぐためラック前面に“冷気のカーテンを作る”ラック内空調を実現するAir Distribution Unit(ADU)もその1つだ。

ラック最下段に取り付けたADUにより、ラック内にエアフローを作り出す

ラック内にPDUをマウントすることで、電源ケーブルを床下に通したりする必要はなく、またネットワークを介した電源管理が可能となる

 さらに各種Power Distribution Unit(PDU)には、利用中の電流値を表示するデジタルディスプレイとネットワーク管理用ポートが備わっている。このため、各ラックが利用している電力をネットワークでリアルタイムに監視可能となり、サーバ負荷の急激な増大などで予想以上の電流値が検出されると、監視コンソールに即座に警告を発することもできる。

物理インフラ改善の近道

 どれほど可用性を高めた大規模システムであっても、システムを構成するIT機器1つ1つの物理インフラが脆弱であれば意味がない。もし、物理インフラに関して十分な検討なしに導入しているならば、現行ITシステムの物理インフラがどのような状況かを再検証する必要があるだろう。

 とはいえ、問題があるからといって、稼働中のシステムを物理インフラ強化のためだけにリプレースすることは非現実的である。また、大規模な空調、電源システムの入れ替えや再構築には大きな予算が必要となるだろう。だからこそ、InfraStruXureのように必要なソリューションを自由に組み合わせ、ラック単位で物理インフラを強化する手法が有効ともいえる。

 APC Japanが提供している無料アセスメントサービス「NCPI診断サービス」は、物理インフラが内包している脆弱性を見つけ出し、適切な対処法を見つけることができるという。まずはどのような問題から対処すれば良いのか。アセスメントサービスを受けることが、一番の近道だ。

     

 
関連リンク
APCジャパン

InfraStruXure

NCPI:Network Critical Physical Infrastructure

@IT関連記事/ニュース
UPSをミッションクリティカルに、APC(@IT News)

クライアントPC向けの低価格UPSを選ぶポイント(@IT System Insider)

UPSで電源トラブルからマシンを守る!!(@IT Master of IP Network)


</comment> <tr> <td bgcolor="#EEEEEE"><font size="2"><a href="javascript:KeepIt();"> <img src="/club/keepoint/images/ico_kpt.gif" alt="kee&lt;p&gt;oint保存" border="0" align="absmiddle" width="24" height="18">kee&lt;p&gt;ointで保存</a></font></td> </tr> <comment>

 
@ITトップ@IT Special インデックス会議室利用規約プライバシーポリシーサイトマップ