連載
» 2013年07月05日 18時00分 公開

業務で使えるバックアップの基礎知識(2):これで差がつく、知っておくべきバックアップの技術と戦略 (3/4)

[伊吹山正郁,シマンテック]

重複排除でストレージの利用効率向上

 ここ数年で、利用者が増えているバックアップ技術が「重複排除」です。バックアップデータを重複して持たないようにすることで、バックアップデータ保存のために用意したストレージの利用効率を上げるとともに、書き込むべきバックアップデータを最小限に抑えます。これによって、バックアップにかかる時間の短縮が期待できます。さらに、バックアップに際してネットワークに流すデータの量を少なく抑えられるので、遠隔地にバックアップを取る場合など、拠点をまたいだバックアップの運用に大変役立ちます。

 一般的な重複排除の仕組みは次の通りです。重複排除機能を利用してバックアップを取る場合、バックアップソフトウェアはバックアップ対象のデータを数十KBごとに分割します。そして各ブロックの中身を調べ、同じ内容のブロックがあれば、そのブロックをすでにバックアップしたかどうか判定します。

 もし、まだバックアップしていないブロックであればバックアップ先に保存します。すでにバックアップしたブロックであれば、既存のブロックに対してどのファイルを構成するブロックであるかといったメタデータを付与するだけで、バックアップ先にはそのブロックのデータを保存しません。

 重複排除機能を利用してバックアップを取る場合には、大きく分けて次の2つの構成が考えられます。(1)バックアップ対象データが送られてきたバックアップサーバで重複排除処理を随時行い、バックアップのストレージ装置に書き込む構成。そして、(2)バックアップ対象となっている業務サーバであらかじめ重複排除処理を実施した結果のデータをバックアップサーバに送り、バックアップサーバではそのままバックアップ先のストレージ装置にデータを書き込む構成です。

 前者は、ネットワークに流れるデータ量は重複排除機能を利用しない場合とさほど変わりません。ただ、バックアップ先となるストレージ装置に書き込むデータの量は削減できるので、バックアップにかかる時間はある程度は短縮できます。

 それに対して後者は、ネットワークに流れるデータ量を大きく削減できるため、ネットワークを経由してバックアップを取る場合にバックアップ時間の大きな短縮が期待できます。その半面、バックアップ対象の業務サーバには、重複排除処理のための、ある程度の処理性能が必要です。

重複排除のメリットとデメリット

 重複排除機能を利用すると、バックアップ先のストレージ装置に書き込むデータ量を大幅に削減できるので、ストレージの利用効率の向上や、バックアップ時間の短縮といった、運用面に好影響の出るメリットを有しています。すでに述べたように、バックアップ対象とした業務サーバで重複排除の処理を実施する構成を採った場合は、ネットワーク経由のバックアップに大きな効果があります。そのため、地理的に離れた場所へバックアップを取る際にボトルネックとなっていたネットワーク速度のような、以前では解決が困難だった課題でも、場合によっては解決可能となります。そのため重複排除は、特に多数の拠点を持つ企業が会社全体のバックアップを考える上で、設計の自由度を大きく向上させられる技術だと考えられます。

 その半面、重複排除は高い演算処理性能を必要とするため、サーバにより高い性能が求められます。現在のCPUは演算性能が高いので導入へのハードルは下がっているものの、通常はミドルレンジクラスのサーバが必要となります。そのため当初の想定よりも、バックアップサーバへの初期投資額が大きくなる場合があります。

 なお、重複排除機能は、現在ではOSも備えるようになってきました。ただし、OSの重複排除機能はバックアップのためという位置づけではありません。重複排除機能が有効になったボリュームに業務データを保存することで、ストレージの利用効率向上を目的とするものです。重複排除が効いているボリュームをバックアップ対象にできるバックアップソフトウェアでは、バックアップ対象データ量が減るため、より短い時間でバックアップを完了できます。

Copyright © ITmedia, Inc. All Rights Reserved.

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。