HAを見守る「Watchdog」と「STONITH」
サービスの継続を確保するはずのHeartbeat自体が不安定になってしまったら、いったいどうすればいいのでしょう? この問題を解決してくれる2つの機能「Watchdog」と「STONITH」の使い方を紹介しましょう。
VA Linux Systems Japan株式会社
花島タケシ
2008/1/23
自浄機能として働く2つの機能
前回まで、オープンソースのHA(高可用性)クラスタ構築ソフトウェア「Heartbeat」の導入・設定方法を解説してきました。これを踏まえて今回は、予告どおり、Heartbeatのユニークな機能である「Watchdog」と「STONITH」に触れていきたいと思います。
第1回でも紹介したとおり、この2つは、Heartbeat自身の「自浄機能」ともいえる役割を果たすものです。簡単に説明しますと、
| 名称 | 役割 |
| Watchdog | 稼働しているノードが不安定になったときに、ホストをOSごと再起動する機能 |
| STONITH | 相手ノードが不安定になったときに、相手ノードをOSごと再起動/停止する機能 |
となります。
Heartbeatはあるサービスを監視し、そのサービスやOSに不具合が生じた場合にフェイルオーバーを行うことで、サービスの継続を確保します。しかしながら、Heartbeat自体が不安定になってしまった場合、サービスの二重起動などが発生して、いわゆる「スプリットブレイン(split brain)現象」に陥り、正常なサービスの継続が行えなくなってしまいます。
![]() |
| 図1 WatchdogやSTONITHの役割 |
また、heartbeatプロセスから起動される子プロセスがkillされたときにも、OSの再起動などが行われることがあります。
そうしたとき、WatchdogやSTONITHの機能を利用することで、こうした問題を回避できます。
では、それぞれの設定方法とテスト方法を紹介していきましょう。Heartbeatも含めた全体的な設定環境は、下記のとおり、前回紹介したApache向けの設定を流用することにします。
![]() |
| 図2 全体的な設定環境 |
また後述するコラムのように、新たにバージョン2.1.3がリリースされましたので、以降の解説はこのバージョンをベースに進めていきたいと思います。
| コラム●最新バージョン、2.1.3リリース |
2007年12月21日に、Heartbeatの最新バージョンとなる2.1.3がリリースされました。ここでの主な変更点としては、
例えばTomcatは、いままでもHeartbeatから使用できなかったわけではありません。しかしTomcat用RAが提供されたことにより、使用に当たっての敷居が低くなりました。実際のところ、ApacheとTomcatを組み合わせて使用されているケースも多いので、そうしたサイトでもHeartbeatを導入するメリットが増えたと思います。 また、Xen用RAがXenの最新版に追従したことも、現在のリソースリッチなハードウェア状況を考えるとうれしい限りです。個人的には、次期バージョンでは、DRBD(http://www.drbd.org/)の最新版(8.x系)への対応に期待したいと考えています。 なお、記事の執筆時点では、まだCentOS用のパッケージは提供されていませんが、これまで同様、間もなく提供されると思います。またRHEL用のものは、Heartbeat日本語サイトにて公開されています。 |
|
1/3 |
|
||||||
|
||||||
| Linux Square全記事インデックス |
| Linux Squareフォーラム サーバ構築・運用関連記事 |
| 連載:Heartbeatでかんたんクラスタリング(連載中) オープンソースソフトウェアの「Heartbeat」を使ってHAクラスタを実現し、サービスを「落とさない」仕組みを実現します |
|
| 特集:Apache 2.2でWebサイトをパフォーマンスアップ! 最新安定版Apache 2.2は、何が変わったのか? 最新のApacheを新機能の使い方とともに解説する |
|
| 連載:実用 Apache 2.0運用・管理術(全8回) 本連載では、Apache 2.0の運用や管理方法を解説する。まず必須設定と基本的なセキュリティ対策を行い今後の運用に備える |
|
| 連載:実用
BIND 9で作るDNSサーバ(全15回) 本連載では、BIND 9の構築/運用方法を解説していく。実際に役立つことを目的に、セキュリティや大規模運用などのテーマを取り上げていく |
|
| 連載:実用qmailサーバ運用・管理術(全14回) 本連載を通して、qmailによるメールサーバの高度な構築・運用・管理術を紹介。SPAM対策やML管理からサーバでのウイルスチェックなどまで |
|
| 特集:Samba
3.0の全貌 改訂版 Samba 3.0リリースから8カ月。ここであらためて、Samba 3.0系列の新機能、インストール方法、国際化の現状を解説する |
|
|
TechTargetジャパン
Linux Square フォーラム 新着記事
- クライアントがアクセスできる範囲を制限する (2012/2/10)
今回は、サーバ上のファイルの扱いに関係する設定項目について解説します - 新しい記事も入っていて安心しました (2012/2/7)
Linux Squareのアクセスランキングを公開します。定番の記事ばかりでなく、連載中の記事もよろしくお願いいたします - エラーメッセージをどう扱うか? (2012/2/2)
今回は、スクリプト実行時にエラーが発生したことを知らせるメッセージの扱い方を説明します - ファイルのアップロードを制限する (2012/1/30)
HTTPクライアントがアップロードしてくるファイルの扱いについて解説します。そもそも受け入れる必要があるのか? ということのほかにも、いろいろ設定が必要です
|
|
@IT 新着記事
キャリアアップ
スポンサーからのお知らせ
- - PR -
イベントカレンダー
- - PR -
お勧め求人情報
転職/派遣情報を探す
**先週の人気講座ランキング**
〜 Android編 〜
ホワイトペーパー(TechTargetジャパン)
ソリューションFLASH


