「もはや避けられない」

グーグル、巨大データセンターの電力問題に悩む

2007/04/10

 米グーグルでは、自社の巨大なデータセンターのエネルギー効率の最適化を目指しており、同社のトップクラスの技術者たちがこの課題に取り組んでいる。

 4月5日にニューヨークにあるグーグルの総合施設で行われた講演において、同社のディスティングイッシュドエンジニアであるルイズ・バロゾ氏は、エネルギー効率の最適化を目指した同社のプロジェクトについて説明した。この講演のタイトルは「Watts, faults and other fascinating 'dirty' words computer architects can no longer afford to ignore」(コンピュータアーキテクトはもはや電力問題や障害を避けて通ることはできない)。

 Digital Equipmentの元エンジニアとして大規模システム用のロードバランシングシステムを開発した経験もあるバロゾ氏は、グーグルのコアインフラの設計を担当した。同氏は講演で、現在取り組んでいる2つのプロジェクトを紹介した。

 1つは電力プロビジョニングに関する研究で、今夏に報告書として正式に発表する予定だという。

 電力プロビジョニングの研究では、2つの重要なポイントが浮かび上がったという。「利用可能な電力を最大限に有効利用することが重要である。そしてシステムは一般に、非ピーク時において電力効率が非常に悪い」と同氏は指摘した。

 さらにバロゾ氏は、「今日、電力/エネルギー効率とフォールトトレランス(耐障害性)は、大規模コンピューティングシステムのデザインにおける中心的課題である。そして今後の技術トレンドとして、これらの課題はさらに重要性が増し、より小規模なシステムにも影響するようになるだろう」と語った。

 バロゾ氏によると、グーグルでは水力発電所がある地域でデータセンターを建設しており、「技術者たちはあらゆる手段から1ワットでも多くの電力を絞り出そうとしている」という。

40%もコンピュータを余分に配備

 回路設計者は温度などの問題で頭を悩ませているが、「われわれはデータセンターの建設費用で頭を悩ませている」とバロゾ氏は語る。

 バロゾ氏によると、データセンターを建設するには1ワット当たり10〜22ドルのコストが掛かるのに対し、米国のエネルギーコストは1ワット当たり平均で80セントに過ぎないという。「つまり、データセンターの建設コストは、その10年分の電力コストよりも高いのだ」と同氏は指摘する。

 「電力利用の最適化を目指しているのは、利用していない電力にもコストが掛かるからだ」(同氏)

 このため、グーグルでは電力プロビジョニングの研究に際して、この6カ月間で自社のマシンがどれだけのエネルギーを消費していたかという点に着目した。

 この研究の資料となったサンプルは、グーグルが使用する数千台のマシンのうちの800台だけであったが、「稼働時間の60%はピーク以下の利用率になっており、多数のラックに搭載されたマシンが同時にピーク状態になることは決してない」ことが分かったという。

 さらに「データセンター全体としての稼働率がその能力の70%を超えることは決してなく、これはわれわれが40%も余分にマシンを配備した可能性を示している」と同氏は指摘する。

DSMレース、メガヘルツレース

 バロゾ氏はまた、1990年代に注目されたものの、欠点があることが明らかになった2つのホットなコンピュータデザイン分野にもスポットライトを当てた。1つはシングルスレッド性能の高速化であり、同氏はこれを「メガヘルツレース」と呼んでいる。もう1つは、巨大な分散共有メモリ(Distributed Shared Memory)システムの構築であり、これは「DSMレース」と呼ばれている。

 DSMレースの背景にある理論は、大規模コンピューティングシステムはメモリ共有型プログラミングモデルを採用すべきだというものだ。このモデルがプログラマーになじみがあることや、高価なリソースを共有するのが容易であるなどの理由による。しかしバロゾ氏によると、DSMレースの再開は障害を閉じ込めことになったという。

 「単一の障害が共有メモリドメイン全体をダウンさせる可能性がある。これは非常に解決困難な問題であり、ほとんどのソリューションは不十分である」とバロゾ氏は語る。

 一方、メガヘルツレースでは、コンピュータアーキテクチャの特質によってソフトウェアを修正しなくても高速化を実現できるが、「メガヘルツレースは電力という壁に激突する」(バロゾ氏)

 同氏によると、企業は毎年、従来とほぼ同じ価格でより高速なサーバを購入できるが、「はるかに大量のエネルギーを使用しており、これはシステムの電力効率が低下していることを意味する」という。

 「電力コストがサーバのコストを上回るポイントに達すれば、携帯電話業界のモデルのような状況になるだろう。この業界では、電力会社が『この電力利用契約にサインしてもらえれば、サーバは無料で提供します』と言いかねないような状況だ」とバロゾ氏は冗談めかして語った。

 同氏は、昨年に可決された下院第4646号法案にも言及した。これは、米国でエネルギー効率に優れたコンピュータサーバの普及促進を目指した法律である。

 「エネルギー変換損失を削減するためにできることはたくさんある。単一電圧レールの電源ユニット(PSU)を採用することもその1つだ。これにより、変換損失の削減量を最大で4倍改善することができる」とバロゾ氏は話す。

 さらにバロゾ氏によると、グーグルでは「パートナー各社と共同で、効率に優れたPSUのためのオープンな標準の策定に取り組んでいる」。これらのパートナーには、インテルやAMDも含まれるという。

並列処理技術は有望

 一方、マルチコアプロセッサや並列処理の強化といった新技術には期待が持てるとしている。「しかし、落とし穴もある」とバロゾ氏は言う。「スレッドの数は十分なのか、プログラマーが効率的な並列処理プログラムを開発してくれるのだろうか、といった疑問が残る」。

 データ量が多いほうが、並列処理をしやすくなるという。「グーグルでは膨大な量のデータに関連した問題に関心を持っているため、当社の場合は並列処理をやや利用しやすいかもしれない」とバロゾ氏は話す。

 しかしバロゾ氏によると、フォールトトレラントソフトウェアは強力だが、十分ではないという。大規模システムでは、監視機能をさらに充実させる必要もあるとしている。

 グーグルでは「System Health Infrastructure」と同社が呼ぶ技術を採用している。これは、システム内のあらゆるサーバと頻繁に会話を行い、健康状態を示す信号や稼働情報を収集するという。

 グーグルがこの技術をオープンソース化する可能性はあるかとの質問に対して、バロゾ氏は「以前から、一部のコードをオープンソース化する可能性を検討してきた」と話している。しかし、「この技術の一部はインフラであり、当社のほかのソフトウェアと密接に絡み合っているので、個々の部分を切り離すのは難しい」と同氏は語る。

S.M.A.R.T.技術を利用

 またグーグルでは、早期に問題を発見するために、S.M.A.R.T.(Self-Monitoring, Analysis and Reporting Technology)技術を利用している。同社では、スキャンエラーが発生したディスクドライブは、エラーがないドライブよりも故障する確率が10倍高いことが分かったという。

 しかし、故障したディスクドライブの半数以上は前兆がなかったという。「実際、56%のドライブが明確な兆候をまったく示さなかった」と同氏は話す。

 「長期的なタイムフレームで考えれば、何が起きるのか予測するのはとても簡単だ。われわれは皆、いつか死ぬと予想できる」と同氏は軽口をたたいた。

 またバロゾ氏によると、グーグルの研究では、温度はディスク障害における重要な要因ではないことが分かった。温度が少しくらい高くても、温度が低いドライブよりも多くの故障が起きることはなかったという。

 「温度変化がそれほど激しくないのであれば、データセンターの設計者がエネルギー効率に優れた施設を設計する自由度がずっと高くなる」とバロゾ氏は話す。

原文へのリンク

(eWEEK Darryl K. Taft)

情報をお寄せください:



@ITメールマガジン 新着情報やスタッフのコラムがメールで届きます(無料)