|
3通りの災害対策シナリオ
ICTがビジネスにとって必須のインフラとなった今日、企業システムの可用性を高めるための取り組みはこれまでになく重要性を増している。中でも、データベースに保管された業務データの保護は極めて重要だ。ICTがビジネスのすみずみにまで浸透し、ありとあらゆる業務データがデータベースに格納されるようになった今日、データベース障害がビジネスに与えるインパクトも深刻さを増しているのだ。
従って、今さら言うまでもないことだが、日ごろデータのバックアップを確実に行っておくことが重要だ。また、いざというとき、バックアップデータを確実かつ迅速にリカバリできる仕組みを平時からきちんと整備しておく必要がある。特にミッションクリティカルなシステムにおいては、ほんのわずかなシステム停止でも企業に莫大な損害を与える。確実なバックアップと迅速なリカバリの仕組みの構築は必須の取り組みなのである。
これは事業継続性を高める上でも欠かせない。2011年3月11日に発生した東日本大震災では、地震や津波による直接の被害はもちろん、その後に続いた計画停電によっても多くの企業が自社システムの停止を余儀なくされた。これ以降、災害対策や事業継続の見直しが進められてきたが、その過程でもバックアップとリカバリの重要性があらためてクローズアップされることになった。
しかし、ひと口にバックアップや災害対策と言っても、そこで求められる具体的な要件は個々のシステムの仕様によって異なる。例えば、データベースに保管されているデータの重要度や、それを使って遂行される業務の重要度によっても、求められるRTO(Recovery Time Objective:復旧時間目標)/RPO(Recovery Point Objective:復旧時点目標)のレベルは違ってくる。
富士通 ミドルウェア事業本部 マネージャー 杉山幸吉氏 |
もちろん、無尽蔵にコストを掛けられるなら、全てのデータ、全ての業務で最高レベルのRTO/RPOを追求すればよいのだろうが、それはどう考えても現実的ではない。
その点、富士通が提供する災害対策ソリューションは、極めて現実的な視点に立って構成されている。同社が提供するデータベース製品「Symfoware(シンフォウェア)」は、高速性・高信頼性を両立した製品として、特にミッションクリティカル領域において多くの実績を持つが、同時に、極めて柔軟に災害対策ソリューションを構成できるという点でも定評がある(関連記事:Symfoware開発者インタビュー[富士通])。富士通 ミドルウェア事業本部 マネージャー 杉山幸吉氏は、次のように説明する。
「Symfowareを使った災害対策ソリューションは、企業が抱えるニーズや予算に応じて大きく3通りに分けることができます。われわれはそれらをよく、『松・竹・梅』の例えを使ってお客さまに紹介しています」
以降では、この松・竹・梅、それぞれに対応するソリューションの中身を詳しく見ていこう。
まずは「松」。これは3通りの中で、最も高度で高性能な災害対策ソリューションとなる。万一のデータベース障害時には、わずか数秒〜数分以内にバックアップサイト側のバックアップシステムに切り替わり、即座に業務を再開できる。また、その際のデータのロストも限りなくゼロに近付けることが可能だ。
この仕組み全体を構成するのは、データベースソフトウェア「Symfoware Server」と、そのオプション製品「Symfoware Active DB Guard」、そしてストレージシステム「ETERNUS(エターナス)」だ。この3つを組み合わせたデータベース環境を、本番サイト側とバックアップサイト側、それぞれで構築する。
具体的な処理の流れは次の通りだ。まず、本番サイト側のデータベースで更新処理が発生すると、トランザクションがコミットされた時点でその内容がログファイルに書き込まれる。次にストレージシステムが、そのログファイルの更新内容を定期的にバックアップサイト側のストレージシステムに転送する。バックアップサイト側では、受け取った更新内容をログファイルに反映し、それを基にデータベースを最新の内容に更新する。こうして本番サイトのデータベースの複製が、バックアップサイト側でほぼリアルタイムに作成されるというわけだ。
図1 3つの災害対策シナリオの中での中で、最も高度で高性能な対策となる「松」の概念図。データベース障害時には、わずか数秒〜数分以内にバックアップサイト側のバックアップシステムに切り替わり、即座に業務を再開できる |
これにより、常に本番データベースの最新のコピーがバックアップサイト側に保持されるため、当然ながら、障害発生時にあらためてバックアップデータをロードして、データベースをリカバリする必要はない。データベースソフトウェアとストレージシステムの高度な連携により、極めて容易かつ高速にフェイルオーバーとフェイルバックを実行できるのである。
ちなみに、このようなストレージシステムのリモートコピー機能を使った災害対策ソリューションは、他社からも数多く提供されている。だが同社のソリューションのユニークな点は、リモートコピーを行うデータと行わないデータを、ユーザーが自由に選択できるところにある。これはSymfowareが備える「ロググループ」という機能により実現される。
ロググループとは、単一のデータベースのログを複数に分散配置できるSymfoware独自の機能である。この機能を使うことで、「複数に分割したログそれぞれにおいて、バックアップサイト側に更新内容を転送するかしないか」を個別に指定できるのだ。この機能を活用すれば、例えばミッションクリティカルな基幹系システムのデータに対応するログは転送してバックアップを行い、仮にダウンタイムが生じても、ある程度の停止なら許される情報系システムのログは転送を行わない、といった柔軟な運用が可能になる。これは他社製品では実現できない、Symfowareならではのメリットだ。
「実はこうした運用は、ユーザーにとってコスト面で非常に大きなメリットがあります」と杉山氏は解説する。
「こうしたリモートコピーのシステムで、最も運用コストを圧迫するのがネットワークの利用料金です。Symfowareのロググループ機能をうまく活用すれば、必要最小限のデータだけに絞って転送できるため、ネットワークコストを大幅に低減できます。この点はSymfowareの大きなアドバンテージと言えるでしょう」
次に「竹」だが、こちらは災害対策の要件とコストのバランスを取ったソリューションとなっている。というのも、前述した「松」のソリューションは、確かに最高レベルのRTO/RPOを実現できるが、やはりその分コストが掛かる。システムの規模や構成にもよるが、大まかに言って数千万円が1つの目安となる。そこで「そこまでの予算は確保できないが、それでもある程度は短いRTO/RPOを実現したい」というニーズを見据えたのが、この「竹」のソリューションとなる。
具体的には、本ソリューションに掛かるコストは数百万円と、かなり安価に抑えられている。その理由は、ストレージシステムのリモートコピー機能に依存せず、ソフトウェアの機能だけで全てをまかなう形としているためだ。Symfoware Serverの上位エディションに標準搭載されている「Linkexpress Replication option(下位エディションはオプション追加で利用可能)」を使い、ソフトウェアの機能だけでログの差分データをバックアップサイト側に転送する仕組みとしているのである。
その分、ログの転送間隔はストレージシステムのリモートコピー機能のように数秒間隔とまではいかない。更新量や通信速度に依存はするが、通常5分程度の間隔が空くことになるため、それに伴い、RPOも同じく数分〜10分間程度になる。また、業務再開にかかる時間も数十分間程度は要する。
図2 災害対策の要件とコストのバランスを取ったソリューション「竹」。ストレージシステムのリモートコピー機能に依存せず、ソフトウェアの機能だけで全てをまかなう形とすることでコストを数百万円に抑えている |
しかし、ゼロダウンタイムが要求されるミッションクリティカルな一部のシステムを除けば、大抵の業務システムはこのレベルで十分許容範囲と言えよう。事実、この構成による災害対策ソリューションは、すでに1000システム以上の稼働実績があるという。それどころか、ソフトウェアの機能だけで全ての仕組みを実装していることには、ハードウェアの機能に依存する方式にはない大きなメリットがある。
「ソフトウェアの機能でハードウェアやOSの違いを吸収できるので、異なるサーバやOS間での遠隔レプリケーションを実現できます。さらには『1対n』や『n対1』『n対n』といった、多様な形態のレプリケーションを行うことも可能です。こうした特長があるため、極めて柔軟にシステムを構成することができます」(杉山氏)
つまり、本番サイト側とバックアップサイト側のシステム構成を、必ずしも同じサーバ・OSでそろえる必要がないのだ。そのため、例えばバックアップサイトでは本番サイトで使っているものより安価なサーバとLinux OSでシステムを構築し、コストを大幅に抑えることもできる。さらに、この考えを押し進めていけば、バックアップサイトをクラウド環境上に構築することもできる。事実、すでに富士通では、同社が提供するパブリッククラウド基盤、Fujitsu Global Cloud Platform「FGCP/S5」上に構築したSymfowareのデータベース上に、遠隔レプリケーションでデータベースの複製を作成できるソリューションを提供しているのである。
それが3つ目となる「梅」のソリューションだ。こちらはクラウドのメリットを生かすことにより、わずか数十万円という低コストで災害対策を実現する。ここで使われるのは、先ほど挙げたFGCP/S5のパブリッククラウドサービスと、Symfowareのエントリ版「Symfoware Server Lite Edition」だ。
このソリューションの仕組みは、次の通りだ。まず、本番サイトでデータベースのバックアップを取る。次にそのバックアップデータを、FGCP/S5のクラウド基盤上に用意されたバックアップ領域に転送する。万一、災害が発生し、本番サイトのデータベースがダウンした際には、クラウド上に取ってあるバックアップデータをダウンロードして、それを基に代替サーバ上にデータベースを復旧する。
図3 クラウドのメリットを生かすことにより、わずか数十万円という低コストで災害対策を実現する「梅」。データベースのデータ部分だけでなく、“スキーマ情報やDBMSの設計情報なども含めたデータベース環境全て”を一括してバックアップする点が特長 |
こう聞くと、単にバックアップの媒体がテープやディスクからクラウド上のストレージ領域に置き換わっただけのように思われるかもしれない。しかしこのソリューションの要は、データベースのデータ部分だけでなく、“スキーマ情報やDBMSの設計情報なども含めたデータベース環境全て”を一括してバックアップする点にある。この方式の利点について、杉山氏は次のように説明する。
「中小企業などでは、データベースの設計情報やリストアの手順書が残されていなかったり、バックアップ運用の設計担当者がすでにいなくなっていたりすることがよくあります。そのため、せっかくバックアップを行っていても、いざバックアップデータを基にリカバリを行う段階になって『どうすればいいか分からない』ことが珍しくありません。その点、スキーマ情報や設計情報も含めた環境一式をバックアップしておけば、それを丸ごと一括してリストアすることで確実にデータベースを復旧できるわけです」
とはいえ、そうした形でのバックアップ・リストア作業は、通常は専門的なスキルを要する上に、多くの時間と手間が掛かる。だが富士通では、その点にも配慮している。それがSymfoware Server Lite Editionに搭載されている「スマートリカバリー」という機能だ。
スマートリカバリーは、いざというときのリカバリ作業を半自動で行ってくれる。具体的には、管理コンソールのGUI上でひと目で障害個所を確認でき、あとはボタンを数回クリックするだけで自動的にデータベースを復旧できるのである。
また、肝心のバックアップに関しては、誰でも簡単にデータベース環境一式を一括してバックアップできる機能が用意されている。バックアップディスク領域の設定など、通常なら手間がかかる作業は、Symfowareがサーバのハードウェア構成を自動的にチェックして全て行ってくれる。バックアップ運用の設計は一切不要なのだ。
この仕組みによる災害対策では、遠隔レプリケーションによるそれとは異なり、RPOがバックアップの実行間隔にそのまま依存する。RTOも、代替システムのサーバ環境があらかじめ準備されていても、数時間はかかる。しかし、このレベルのRPO/RTOでも災害対策と事業継続の要件を満たせるシステムであれば、以上のような低コストと運用管理の容易さが大きな武器になることは言うまでもない。
以上のように、Symfowareが提供する災害対策ソリューションは、幅広いユーザーニーズに応えられるよう構成されている。災害対策というと莫大なコストが必要といったイメージも強いが、ビジネスに対するシステムの優先順位を基準に考えれば、「松・竹・梅」のソリューションが示すように、非常に合理的かつ賢く災害対策を実現できるのである。自社のビジネスと各システムについて、3つのソリューションのうち、どれが最もマッチするのか、本記事を読みながら検討してみると、自社システムの災害対策のあるべき姿が明確に見えてくるのではないだろうか。
関連リンク |
|
富士通データベースによる事業継続 課題と対策とは Symfowareに込められた“高性能”という開発者のこだわりを聞く |
関連記事 |
|
ミッションクリティカルシステムで鍛え上げたRDBが備える“高性能”の中身とは? |
提供:富士通株式会社
アイティメディア営業企画
制作:@IT 編集部
掲載内容有効期限:2012年1月30日