- PR -

Linuxでのbondingについて

1
投稿者投稿内容
Gregre
会議室デビュー日: 2008/11/18
投稿数: 4
投稿日時: 2008-11-18 08:23
はじめまして。

現在下記構成でbondingを使用しております。

■マシン1

 ・OS
  Red Hat Enterprise Linux ES4
  (BTO出荷時組み込みのOS)
 ・カーネル
  2.6.8-55EL
 ・bondingモード
  アクティブバックアップ

■マシン2

 ・OS
  Red Hat Enterprise Linux AS4
  (自分でインストールしたOS)
 ・カーネル
  2.6.8-55EL
 ・bondingモード
  アクティブバックアップ

上記構成にて、マシン1のネットワークがブート時に有効になりません。
ですが、ブート後に手動でネットワークサービスをリスタートすることにより、有効となります。
また、特に何もしていないのですが、ネットワークが突然落ちてしまいます。

こちら側で検証したのは以下の通りです。

 ・bondingを解除し、ブートを行う。
  →ネットワークが有効になる。
  →ネットワークが突然落ちない。
 ・実際にbonding動作を試すため、ケーブルを抜きフェイルオーバするか確認。
  →OK
 ・kernelのアップデート
 ・OSの再インストール

マシン2の構成の場合、bonding状態でもブート時ネットワークは有効になり、疎通は取れる状態となります。

現在手元に設定ファイルやログファイルが無く、記載することが出来ませんが、
/var/log/messagesでは、ブート後一瞬だけbondingインタフェースのまま、ネットワークが有効になりますが、すぐにダウンしているように見え、そのまま復旧もしません。
突然落ちる場合も、前後にログが特になく、突然ダウンしているように見えます。

何か他に原因があるのでしょうか。
どなたかご教示願います。
ゆっぽ
常連さん
会議室デビュー日: 2006/02/15
投稿数: 40
投稿日時: 2008-11-19 14:25
ちなみにネットワークドライバのバージョンは同一でしょうか?
またハードウェア構成は@、Aで同一でしょうか?
Gregre
会議室デビュー日: 2008/11/18
投稿数: 4
投稿日時: 2008-11-21 08:10
ご連絡ありがとうございます。

ネットワークドライバのバージョンは同一です。
ハードウェア構成は、同じメーカーのbladeなのですが、
製品自体は違います。

マシン1のほうは、大体20台程、全てのマシンでこの現象が起きており、
マシン2のほうは、4台程で構成しておりますが、全てのマシンで現象は起きておりません。

ハードとbondingとの相性などはあるのでしょうか。
ゆっぽ
常連さん
会議室デビュー日: 2006/02/15
投稿数: 40
投稿日時: 2008-11-21 09:07
Bonding自体がすべてのEnternetカードで動作することを保証していないです。
もしハードウェアが違うのであれば、そのようなことも発生するかもしれません。

ちなみにBondingは、Active-Backupモードで動作されているとのことですが、
リンク監視はMIIですか?それともARPですか?

MII監視ですと、ハードウェアのドライバーモジュールが対応していない場合、
そのようなことも起きるかもしれません。

もしMIIを使用されているのであれば、ARP監視に変更されてみてはいかがでしょうか。
Gregre
会議室デビュー日: 2008/11/18
投稿数: 4
投稿日時: 2008-11-25 21:34
ご連絡ありがとうございます。
返信が遅くなり申し訳ございません。

Bondingの監視は、MIIとARPどちらも試しましたが、駄目でした。
ハードウェアが怪しいですね。
色々と検証してみたいと思います。

kaz
ぬし
会議室デビュー日: 2003/11/06
投稿数: 5403
投稿日時: 2008-11-25 22:05
こんばんは.

network interface の primary を入れ替えてみたらドウでしょう?
angel
ぬし
会議室デビュー日: 2005/03/17
投稿数: 711
投稿日時: 2008-11-26 11:02
こんにちは。
NICのネゴシエーション(10/100, full/half)は確認された方が良いと思います。
Gregre
会議室デビュー日: 2008/11/18
投稿数: 4
投稿日時: 2008-11-26 22:15
ご返信いただいた皆様
申し訳ございません。単純なミスだったかもしれません。

本日、別件でsmpのカーネルをインストールしてきました。
経緯は、サーバのCPUがDualcoreや、Quadcoreにも関わらず、
/proc/cpuinfoで見てみると一つしか表示おりませんでした。
こちらについては私の知識不足で、CPUがDualやQuadだと通常のカーネルでは
一つしか有効にならず、smpカーネルでないと
CPUが有効にならないということが分かりました。

この作業のついでに、Bondingを有効(Bondingを解除しNIC単体で動作中だったため)にし
再起動を行いました。
すると、Bonding構成でもブート時にNICがDownしなくなりました。
再起動を10回程行い、全て正常にLinkupしてきます。
障害が出ていた他のサーバでも試しましたが、正常にLinkupしました。
起動時にNICがdownする現象はほぼ解決気味です。
後はマシン自体を、Bonding構成のままにしておき、
突然落ちる事象が出るかどうかを確認するため、そのまま帰宅してきました。
明日にでもデータセンタに向かってみて、確認してきます。

思えば、マシン1のほうについては、BTO出荷時では2.6.9-34.ELsmpのカーネルが入っており、
別途カーネルアップデートで、投稿時のカーネル2.6.9-55.ELにしました。
このカーネルのアップデート方法、SMPから通常カーネルへの変更が怪しいと思っております。

色々とお騒がせして申し訳ございません。
無事解決できるように祈っております。
ご返信いただいた方々、親身に接していただきありがとうございました。
1

スキルアップ/キャリアアップ(JOB@IT)