
第1回 運用管理に必須のツール/コマンド群
佐藤純也
ネットベイン
2001/11/23
|
■24時間365日の稼働を目指して
近年のコンピュータ業界の動向はネットワーク技術、特にインターネットに代表されるIPネットワーク技術を抜きに語ることはできない。いまや家庭でもPCを購入すればインターネットへの接続が当たり前となり、オフィスにおいてPCは筆記用具などの事務用品と同等(またはそれ以上)の道具である。複数のコンピュータがあれば、インターネットインフラなどの資産を共有するために、自然とLANなどのネットワークが構築される。
また企業では、メールやWebといったサービスを提供することが多い。これらのサービスは、単に社内向けのメール・システムであったり、大規模なeビジネスの根幹を成すサービスであったりとさまざまである。多くのユーザーが利用するシステムでは、規模によって要求される深刻さに違いはあるものの、24時間365日ノンストップで稼働することが理想である。しかし残念なことに、システムを構成する回線、ハードウェア、ソフトウェアには、必ず障害が発生する。絶対に止まらないシステムを構築することは不可能である。システム管理者の役割は「限りなく100%に近い状態でシステムを稼働させる」ことにあるといえるだろう。
■フリーの監視ツールとシステム管理のポイント
システム管理に当たって、何が必要になるのだろうか。市販の管理ツールの使用や、専門の業者に任せるという方法もあるだろう。だが、社内(部署)LANなど小・中規模のシステムでは、コスト面での問題から難しいということも多い。その場合、システム管理者にはある程度専門的な知識が必要になるが、定期的にコマンドやスクリプトを実行することでシステムを監視するという選択肢がある。また、フリーの監視ツールを使用して監視することも可能だ。定期的に監視しなければならない項目が多い場合は、専用の監視ツールを使用して監視を自動化した方が、結果的にシステム管理にかかるコストを軽減することができる。
システム監視ツールには、大きく分けて2種類の動作がある。1つは監視サーバ(監視ツールの動作しているサーバ)からリモートで監視する方式で、おもにICMPやTCPでの死活監視、SNMPのポーリングなどが挙げられる。もう1つは監視エージェントによる監視方式で、監視対象機器に監視を実行するエージェントをインストールし、取得したシステムの監視情報を監視サーバに通知する。いずれの方式にもメリット/デメリットがあるので、監視の目的にあった方式を選択する必要がある。
|
||
![]() |
||
| 図1 リモート監視のメリットとしては、監視対象となるシステムに影響を与えずに監視できることが挙げられる。デメリットは、取得できる監視情報に限界があることだ |
|
||
![]() |
||
| 図2 エージェント監視では、より詳細な監視データを取得できるメリットがある(そのほか、システム運用が可能になるエージェントもある)。反面、監視対象となるシステムに影響を与えるというデメリットがある |
監視ツールには、フリーのツールも含めて、かなりの種類が存在する。その中でも、やはりUNIXやLinuxでのみ動作可能というものが多い。代表的なフリーの監視ツールには、ネットワークの稼働状況をグラフ化する「MRTG」や高機能監視ツール「NetSaint」などがある。いずれにしても、監視ツールを使用する場合には、ツールを実行させる「監視サーバ」を独立させることを推奨する。
では具体的に、システム管理者はどのようにシステムの管理を実行すればいいのだろうか。最近では、PCやサーバ機器以外にも、ルータなどさまざまな機器がネットワークに接続されるようになった。管理者にとってシステムをどのように管理するかは重要な課題であり、常にシステム全体の状況を把握する必要がある。そのため、システムを監視し、障害発生にすぐに対処できるようにすることが重要となる。
システム管理の主なポイントは次のようにまとめることができる。
●機器の稼働状況監視
機器が正常に動作していることを定期的に監視する。ICMP(ping)やTCPによるポーリングや、SNMPによるトラップ(イベント)などで監視対象機器の死活を監視したり、HTTPやSMTP/POP3などのサービスの稼働を監視する場合もある。また、サービスの稼働監視には、不正アクセスによるWebページの改ざんなどのチェックが含まれることもある
●システムリソース監視
ネットワーク・トラフィックやCPU、HDDといったサーバのシステムリソースを監視する。ネットワーク・トラフィックに関しては、パケットの流量やスループットを定期的に計測する方法などが考えられる。また、著しくパフォーマンスが低下したりしている場合には、その原因を特定して対処する必要がある
●システムの安全性の確保
ファイアウォールの導入など、さまざまな方法が考えられる。ファイアウォールを導入した場合、そこにも監視が必要である。しかし、ファイアウォールの設計や具体的な実装に関しては、システム管理とは若干趣旨が異なるので、Security&Trustフォーラムなどでより詳細な記事を参照していただきたい
|
■監視に使用するコマンドとプロトコル
システム管理によく使用するコマンドには、次のようなものが挙げられる。基本的にUNIXのコマンドだが、Windows系のプラットフォームでも使用できることが多い。ただし、UNIXとWindowsでは動作が異なったり、微妙にコマンド名が違ったりするので注意してほしい。
|
||||||||||||||||||
| 表1 システム管理によく使用するコマンド一覧 |
監視に使用する主なプロトコルには、次のようなものが挙げられる。もし、監視サーバと監視対象機器との間にルータやファイアウォールなどが設置されており、アクセス制御を行っている場合には、これらのプロトコルに対して双方向のアクセス許可を設定する必要がある。
|
||||||||||||||
| 表2 監視に使用する主なプロトコルの例 |
■管理のポリシー
また、システム管理には、あらかじめ次のような管理ポリシーを策定しておく必要がある。
- 管理対象機器
- 具体的な管理範囲
- 担当者(あるいは責任者)
- 通常時管理手順
- 障害発生時管理手順
- 管理報告書など情報の共有方法
これらのポリシーをはっきりさせておくことで、効率よく安全にネットワークを監視することができる。また、複数のシステム管理者がいる場合には、これらの情報を共有する仕組みを確立しておくことも重要である。管理ポリシーの策定には、「何を監視したいのか」「知りたい情報は何か」「障害が発生したらどうしたらいいのか」などを検討する必要がある。管理ポリシーがあいまいなままでシステムを監視すると、本来の監視目的との間にズレが生じたり、障害の切り分けができなかったりすることがある。特にシステム障害発生時に、その障害の切り分けが遅れると、適切な対処ができないために復旧が大幅に遅れる原因になる。
それぞれの管理ポリシーは、監視対象や監視目的によって大きく異なるため、具体的な管理ポリシーの策定については次回以降に解説する。
■システム管理のスペシャリスト「MSP」
24時間365日の稼働を理想としているからといって、何も自社のスタッフが交代で24時間監視し続ける必要はない。この部分を専門の業者に任せるという道もある。それが、企業のシステムを専門的にマネジメントするMSP(Management Service Provider)の存在だ。筆者の所属するネットベインも、そのMSPの1つである。
顧客にはコンテンツプロバイダなどのeビジネスを展開する企業も多く、サービスの停止は致命的な損害を招く可能性もある。MSPはシステム管理専用の監視ツールと、専門知識を持つオペレータによって顧客ネットワークシステムを24時間365日、常に監視し、システムのトラブルを検知してその旨を通知する。また、障害発生記録やネットワーク・トラフィックの記録などを基に、顧客ネットワークシステムのコンサルティングなどを行うこともある。
ネットベインの監視サービスのメニューの中から、代表的なものをいくつか挙げてみよう。
|
||||||||||||||||
| 表3 監視サービスメニューの例 |
今回はネットワークシステムの管理についての概要を解説した。次回からはシステム管理について、具体的な例を挙げて解説していく。
|
| 「Master of IP Network総合インデックス」 |
ホワイトペーパー(TechTargetジャパン)
- どこまで出る? LTEの通信速度 (2010/3/17)
光ファイバに匹敵する通信速度を実現すると期待されているLTE。ホントにそんなに出るの? という疑問に答えます - インターネット世界の地図 (2010/2/23)
荷物の届け先まではどの道を通っていけばいいのでしょう? それを決める「経路選択」の仕組みを説明します - Androidアプリはビジネスになるのか (2010/2/12)
「iPhoneアプリの次はAndroid?!」NECビッグローブのAndroidアプリ販売サイト「andronavi」を通して、その可能性に迫る - 知られざるLTEのネットワーク構成 (2010/1/13)
LTEのネットワーク構成やプロトコルスタックを詳解。それぞれどんな役割を果たしているかを解説します
|
|
スキルアップ/キャリアアップ(JOB@IT)
スポンサーからのお知らせ
- - PR -
| 「いつかは壊れるサーバ」そんな故障に 迅速で安価に手軽に対応する方法とは? New! |
| 「特権ユーザー」の事件を防げ! 万能権限を持つユーザーの管理方法とは? New! |
| 仮想環境の構築とデータ保護の特効薬?! 実績と信頼性の高いパッケージで安心運用 |
| 仮想環境のバックアップもこれまでどおり 「まるごと取ってまるごと戻す」簡単運用 |
| おばかアプリ選手権、第4弾開催中!! ムダにカッコよくてくだらない作品求ム! |
| 社内ファイルサーバを“クラウド”に統合 VPN直結「クラウド型ストレージ」を紹介 |
| その数、なんと400台以上! グループ内 サーバの「統合管理」によるメリットは? |
| 美人!? まあまあ? 気になる いやし系!! PV急増で「美人時計」がとった手段とは? |
| 進化を続ける富士通ストレージETERNUS DX 製品開発者の自信を裏付けるものとは何か |
| 運用管理の課題を“2つの観点”から分析 ユーザー満足度の高い「仮想環境」とは? |
- - PR -
お勧め求人情報

**先週の人気講座ランキング**
〜CCNA編〜
| ◆ | TomcatやJBossなどAPサーバ環境に関する 情報を集約! “業務”用APサーバ大百科 New! |
| ◆ | 一気に解説! 最新のクラスタストレージ 「RAIDを超えたストレージ基準」……など New! |
| ◆ | クラウド的ユーザー体験の変化は脅威か? 仮想化技術を使いこなす運用管理術を紹介 New! |

| ◆ | 上司や部下、部署内メンバーとの情報共有 を“ガラッ”と変えるコラボツールとは? New! |
| ◆ | おばかアプリ選手権、第4弾開催中!! ムダにカッコよくてくだらない作品求ム! |
| ◆ | 社内ファイルサーバを“クラウド”に統合 VPN直結「クラウド型ストレージ」を紹介 |

| ◆ | Twitterのアカウントはなぜ突破された? メールによる新手の攻撃手法とその対策 |
| ◆ | もう仮想化のお試しフェイズは終わりだ! Hyper-V 2.0が基幹システムも仮想化 |
| ◆ | 美人!? まあまあ? 気になる いやし系!! PV急増で「美人時計」がとった手段とは? |

| ◆ | クライアント企業から求められる人材 ⇒IT技術と経営戦略を併せ持つ「戦略家」 |
| ◆ | .NET編集長が実践する「技術情報検索術」 サンプル・コードを簡単に探す“技”は? |
| ◆ | 業務効率と情報セキュリティ対策を両立! 手間なく確実に機密情報を守る方法とは? |

| ◆ | 進化を続ける富士通ストレージETERNUS DX 製品開発者の自信を裏付けるものとは何か |
| ◆ | 運用管理の課題を“2つの観点”から分析 ユーザー満足度の高い「仮想環境」とは? |

| ◆ | 【CTC事例】約30の基幹システムを統合! 膨大なバッジジョブを制御した方法は? |
| ◆ | 仮想化すればコストは削減できるか? 仮想化に必要な「3つの視点」を解説する |
| ◆ | その数、なんと400台以上! グループ内 サーバの「統合管理」によるメリットは? |








