検索
Special
勝手にサービスが復旧してくれる:

インフォバーンの情シスがAWSの監視を気にせず安眠できるようになった理由

Webサーバを安定運用するには監視が必要だが、監視ツールを利用した場合、通知はされるがその後の対応は運営側がやる必要がある。通知で深夜にたたき起こされ、業務に当たった経験のあるインフラエンジニアは多いはずだ。ところが、インフォバーンの情シス担当は、そんなことは気にせず安眠を手に入れたという。その秘訣を聞いた。

PC用表示
Share
Tweet
g+
LINE
Hatena
PR

落ちて初めて気付く自社サーバ運用体制

 自社の製品や関連技術に関する情報共有などを目的に、オウンドメディアやブログを独自に立ち上げる企業は増えている。その一方で、Webサーバを安定運用するには監視が必要だが、外部のマネージドサービスプロバイダー(MSP)に委託すればコストは想定以上にかさんでしまう。だからといってZabbixやNagiosなどのシステム監視ツールを利用した場合、通知はされるがその後の対応は運営側がやる必要がある。これはMSPに委託した場合も同様だ。通知で深夜にたたき起こされ、業務に当たった経験のあるインフラエンジニアは多いはずだ。


インフォバーングループ本社 情報システム室 天野優氏

 インフォバーングループ本社でインフラ管理を任せられている情報システム室の天野優氏も、そんな1人だ。

 インフォバーンは、UX戦略、オウンドメディアの構築・運営を含むデジタルブランディング全般を支援するデジタルエージェンシーだ。天野氏が所属するインフォバーングループ本社の事業子会社である。インフォバーングループ本社の情報システム室では、インフォバーンにおける顧客のオウンドメディア用サーバの設計構築と運用管理、同じインフォバーングループ本社の事業子会社であるメディアジーン(「ギズモード・ジャパン」「カフェグローブ」「ライフハッカー[日本版]」「BUSINESS INSIDER JAPAN」「ROOMIE」などのコンテンツメディアを運営)のサーバのテクニカルサポート、社内サーバの設計構築と運用管理を行っている。

 情報システム室には現在、天野氏を含む数名が在籍する。しかし、主に社内向けITサポートや「G Suite」などのクラウド型グループウェアの運用を担当するメンバーが多く、サーバの運用監視は天野氏をはじめとした少数メンバーで運用を行ってきた。

 顧客サーバや自社メディアのサーバの約8割はAmazon Web Services(AWS)を採用し、CMS(Contents Management System)などを実装して運用、監視をMSPに委託していた。顧客案件ではプロジェクト予算の中から監視の外部委託費用を確保できること、自社メディアではサイトを落とすと機会損失に直接つながるスポンサードコンテンツや(スマートニュースなど)外部サービスからの記事紹介による計画的なアクセス流入を逃さないことから予算が付いている。

 だが社内サーバについては「当時の監視は十分ではない面がありました。監視をMSPに丸投げしていたため“監視する”という意識が低く、Webサーバの冗長化や予防検知能力が高いとはいえない状況でした」。天野氏は3年前の入社当時を振り返りながらそう明かす。

監視ツールやMSPだけではインフラエンジニアの安眠は確保できない

 問題は、通常業務の大半が顧客案件や自社メディア案件に割かれ、社内サーバの運用がおろそかになりがちという点だ。そこで入社して早々、天野氏はZabbixやNagiosなどのオープンソースソフトウェアの監視ツールを導入し、監視体制を構築した。しかし、24時間365日対応できるわけでもなく、既存メンバーのインフラ運用関連のナレッジ強化もすぐには実現しない。人材募集をかけてもマッチする人材となかなか出会えない。

 そこで、Active DirectoryサーバやファイルサーバなどをAWSに全面移行。拠点間VPNで結びながらサーバの冗長化を実施、物理環境の運用管理の負担軽減を進めた。監視などは天野氏が対応する体制に切り替えた。


サイオステクノロジー 第1事業部 BC事業企画部 担当部長 吉岡大介氏

 それでも、障害通知は昼夜問わず舞い込む。そのたびに天野氏は起きて復旧作業に取り掛からなければならない。サイオステクノロジー 第1事業部 BC事業企画部 担当部長の吉岡大介氏は多くの企業が直面する課題の背景を次のように分析する。

 「パブリッククラウドは、構成変更やインスタンス増加の際に運用監視ツールの設定変更などの管理を利用者が行わなければならない上に、障害発生時やパフォーマンス低下などの通知に昼夜問わず利用者が対応しなければならないため、システム管理負担の増加が課題となってきている。監視ツールは障害通知を送信するだけで、MSPの監視委託でも復旧までに運用側のマニュアル対応が発生する。AWSの運用はシンプルでスケーラブルだが、監視のノウハウやスキル、リソースもそれに従って上がるが、見落とされがちだ」

 そんな中で天野氏が出会ったのが、サイオステクノロジーの「SIOS Coati」だ。同社とはG Suiteの販売サポートなどですでに付き合いがあり、事情を明かしたらベータ版が紹介された。

 「サービスを落とすなど検証を繰り返し、想定通りに起動することが確認でき、信頼できると判断した。また、最初の簡単な設定で自動監視と復旧が実現できることも分かった」(天野氏)


SIOS Coatiの監視と復旧手順の例

 コスト面も、初月は1万時間まで無料で利用や試すことができ、利用料金はインスタンス当たり1時間3円(税別)の従量課金で、満足できる価格帯だったという。

 「サーバ監視は、顧客案件ならともかく内部なら外注ではなく情報システム部門が自前でやるべきという感覚がどうしてもある。だが、たとえそれで当面は対応できても、事業拡大に伴いいずれ破綻するときが来てしまう。そこで外部委託が決まっても、相場は月額15万円以上とそれなりにかかってしまう」(天野氏)

 監視は運用工数がかかる業務だが見落とされがちで、外部委託時に価格を提示されて初めて気付くのが一般的だ。SIOS Coatiを採用することで、運用工数およびコストを抑えられるのは間違いない。

設定は15分、障害発生を忘れるほどスムーズな復旧

 SIOS Coatiは、AWS EC2の監視、復旧を自動化でサポートするクラウドサービスだ。Amazon VPCとサイオスのAmazon VPCをピアリングし、AWSのAPI経由で監視、障害を迅速に検知して復旧する。ほぼリアルタイムで監視しているのと、スケールアウトにも対応しているので、インスタンスの増加があっても監視漏れが起こることはない。障害時には、詳細な障害レポートをメールで配信するので、障害分析の手間も減る。

 SIOS Coatiによる社内サーバの監視を開始したのは、2017年3月初旬だ。「ピアリングの設定情報をWeb申し込み時に提出したら、あとは監視対象サーバを設定するだけ。WindowsとLinuxの設定手順書が用意されており、それに従ってクリックしていたら設定が終わった。正味10〜15分程度だった」(天野氏)


SIOS Coatiの導入の例

 復旧は自動で行われ、サービス再起動に失敗した場合は仮想マシンのOSを再起動する。その後、リカバリー前後に取得した仮想マシン、サービス、AWSの関連情報を基に障害発生からリカバリー成功までを障害レポートとして発行する。

 運用開始後、まだ日が浅いから障害は発生していないと述べながら、「そういえば誤って他の情報システムメンバーがADサーバを落としてしまったときがあったが、外出時にメール通知が届き、見たらサービス復旧完了の知らせだった。質問を受けるまで忘れるくらい復旧がスムーズに行われていた」と天野氏は笑う。

 基本的には勝手にサービスが復旧してくれるため、精神的にとても楽になったと天野氏は言う。「夜な夜な上がってくる障害通知に起こされ、慌てて対応することがなくなった。自社サーバとはいえ、障害から復旧、正常稼働までのプロセスが自動化、簡略化されたことがうれしい。もう安眠を妨害されることはない」(天野氏)

WordPressやMastodonの監視運用など、幅広い活用が可能なSIOS Coati

 現在は一部の社内サーバで採用しているが、今後はAWS上の情報システム室関連のサーバ全てをSIOS Coatiで監視したいと天野氏は述べる。

 また、将来的には顧客案件でも採用したいと明かす。

 「メディアサイトの立ち上げ案件で、十分な予算が確保できないが冗長化構成をミニマムでもいいので導入したいというのもある。解決策としホスティングサービスを利用することも考えられるが、内容によっては割高になることもある。このときSIOS Coatiがあれば、AWSでサーバ1台に必要なWordPressやMovable TypeのようなCMSを実装し、落ちても自動復旧できるという付加価値を提供できる」(天野氏)

 その意味で、より幅広い使い方ができるよう、今後のSIOS CoatiではWebサーバの関連性などプロセスを見ながらの自動立ち上げや、仮想マシンの自動立ち上げなどで機能拡充してほしいと期待を込める。機能の発展性が見込めるからこその要望だ。

 「まだ提供開始して日の浅いサービスだが、クラウドサービスだからこそ、カスタマーファーストでこうしたフィードバックを直接もらい、どんどん機能を充実させていきたい」と応える吉岡氏は、インフラエンジニアでなくても使えるようなGUIの充実、社内の障害レポートに置き換えられるような障害レポートのブラッシュアップ、APIの提供による他監視システムとの連携などを検討したいと話す。「顧客の予算に応じて提供するものを考えるのではなく、コストを抑えながらも自動化で付加価値を提供することが大切であり、そこも含めてサポートできるサービスにしたい」

 いま話題のMastodonサーバも、SIOS Coatiで安定運用が実現する。当初はサービスの安定性がサーバ運用者の手腕や労力に依存し、使えないという印象もぬぐえなかったMastodonだが、自前ソーシャルを立てる企業は増えている。SIOS Coatiは、こうしたサーバ運用の工数や不安を確実に軽減する。

 無料の試用申し込みは、Webフォームからできる。まずはどれだけ障害を意識しなくて済むようになるか、実感してみてはいかがだろうか。


提供:サイオステクノロジー株式会社
アイティメディア営業企画/制作:@IT 編集部/掲載内容有効期限:2017年6月21日

Copyright© 2017 ITmedia, Inc. All Rights Reserved.

ページトップに戻る