@IT|@IT自分戦略研究所|QA@IT|イベントカレンダー+ログ | ||
Loading
|
@IT > 電源、ラック、空調をあわせて考える──解決策としての「NCPI」と「InfraStruXure」 |
企画:アットマーク・アイティ 営業企画局 制作:アットマーク・アイティ 編集局 掲載内容有効期限:2004年11月15日 |
|
|
さまざまなIT技術に投資を行い、システムの信頼性向上に努めている企業でも、それらIT技術を支えるサーバルーム自身の信頼性を高めることには、なかなか関心が向かない、あるいは予算が十分に取れないという実態が、前回のアンケート結果から分かってきた。 では実際にサーバルームの中で起きている問題とはどのようなものなのか?
前回のレポートで紹介した物理インフラの脆弱性に関するアンケート結果を見ると、多くはサーバ向けの空調を整えた専用ルームが用意され、さらにUPSの導入率も高い。電源や温度環境に関して意識の高いユーザーが多いと考えることができるだろう。 ところが、実際のトラブルを検証してみると、サーバラックの不備による温度管理の不徹底や、UPSがうまく機能しないなどの原因でシステムダウンが発生していることが分かる。これは、高密度に実装したサーバの熱を効率よく排出できないことが原因だと考えられる。管理者の気持ちの上では、物理インフラに対して関心も意識もあるが、実際の対策は不十分で、ちょっとした環境の変化に対応できていないといえそうだ。 もう少し詳細に考えてみよう。例えばシステムを構築したばかりの運用初期段階では、ラック内では間隔を空けてサーバを設置していることが多い。ところが、システム規模がスケールアップし、実際にサーバ増強のために機器をラック内いっぱいに実装してみると、途端に熱暴走を起こし始めるケースがある。機器が増えることで発熱量が増加することも一因だが、背面の配線が複雑化し十分なエアフローが確保できなくなることもある。
そこでAPC Japanが提唱しているのが、「NCPI(Network-critical Physical Infrastructure)<ネットワークに必須の物理インフラ>」というコンセプトだ。NCPIとは電源、ラック、空調、ビル管理など、サーバが動作する物理レベルの設備・環境のことを指し、これもシステムの管理対象として組み込み、トータルなシステム・マネジメントを行っていくという新しい枠組みを提示するものだ。
では具体的に、従来のシステムには可用性の向上という視点で、どのような問題があるのだろうか? 問題を大きく4つに分類してみたい。 ■管理性 ■スピード ■適応性 ■経済性
APC Japanが提唱するNCPI(Network-critical Physical Infrastructure)というコンセプトは、こうした問題点に応えるために、システムのアーキテクチャがどうあるべきかを考え直すことで生まれたものだ。NCPIは、これまでのように物理インフラとITシステムを別々に考えるのではなく、システムが稼働するサーバルームの環境を同時に改善する。 とはいえ、前述したように物理インフラの整備には時間が掛かり、しかもシステムの増強に応じて必要な能力は異なる。物理インフラに将来性を持たせようとすると、初期投資は大きくならざるを得ない。
システム全体の初期導入コストに対して、UPSやラックといった物理インフラの導入に掛かる経費はわずか5%程度にしか過ぎない(APC Japan調べ)。この5%の投資を怠らずに“将来を見据えたもの”にすることで、ラック単位で物理インフラの脆弱性を抑え込むことができるのだ。 また、サーバ増強時、ラック本数増加時などにも対応しやすい柔軟性を備えた設備・環境への配慮も必要だろう。
こうしたNCPIコンセプトを実際の製品に反映しているのがAPC Japanの「InfraStruXure」シリーズである。InfraStruXureは、電源と空調、管理ツールなどをラックに最適化させた統合型物理インフラソリューションだ。 例えば、ラック内の機器数が増加すれば、それに伴ってケーブル配線が複雑化するのは自明だ。冒頭で述べたとおり、ケーブルの増加でエアフローが滞り、想定された冷却性能を発揮できずにシステムダウンするケースは少なくない。
また、システムを構築する上で大きな問題となるのが、サーバがラックに搭載可能かどうかの判断だ。最初のサーバ導入時にサーバベンダー純正のラックを購入した場合、あとから他社製のサーバを追加しようとした際に搭載ができないことがある。また、複数ベンダーのサーバを同時に搭載する場合も同様だ。 APCのNetShelterVXはマルチベンダーに対応した設計のため、EIA規格に準拠したサーバ取付方法である限り必ず搭載が可能だ。従って、複数ベンダーのサーバを搭載する際や、将来システムの拡張が予想される場合も安心して導入できる。
同様の考え方に基づき、APC JapanはInfraStruXureシリーズ向けにさまざまなソリューションを用意している。前面吸気・背面排気設計となっているラックマウントサーバの熱暴走を防ぐためラック前面に“冷気のカーテンを作る”ラック内空調を実現するAir Distribution Unit(ADU)もその1つだ。
さらに各種Power Distribution Unit(PDU)には、利用中の電流値を表示するデジタルディスプレイとネットワーク管理用ポートが備わっている。このため、各ラックが利用している電力をネットワークでリアルタイムに監視可能となり、サーバ負荷の急激な増大などで予想以上の電流値が検出されると、監視コンソールに即座に警告を発することもできる。
どれほど可用性を高めた大規模システムであっても、システムを構成するIT機器1つ1つの物理インフラが脆弱であれば意味がない。もし、物理インフラに関して十分な検討なしに導入しているならば、現行ITシステムの物理インフラがどのような状況かを再検証する必要があるだろう。 とはいえ、問題があるからといって、稼働中のシステムを物理インフラ強化のためだけにリプレースすることは非現実的である。また、大規模な空調、電源システムの入れ替えや再構築には大きな予算が必要となるだろう。だからこそ、InfraStruXureのように必要なソリューションを自由に組み合わせ、ラック単位で物理インフラを強化する手法が有効ともいえる。 APC Japanが提供している無料アセスメントサービス「NCPI診断サービス」は、物理インフラが内包している脆弱性を見つけ出し、適切な対処法を見つけることができるという。まずはどのような問題から対処すれば良いのか。アセスメントサービスを受けることが、一番の近道だ。
|
|