
ストレージ仮想化の体系的理解(4)
ストレージの自動階層化を理解する
デル株式会社
桂島 航
2011/6/27
| 広義ではRAIDもストレージ仮想化の1つだ。だが、過去数年にわたり、それよりも上位レイヤのさまざまな仮想化が、ブロックストレージやNASに実装されるようになってきた。クラウド化の進行とともに注目が高まるスケールアウト型ストレージも、ストレージ仮想化の一形態だ。本連載では、ストレージの世界で一般化する仮想化について、体系的に説明する |
1. 自動階層化が注目を集める理由
- - PR -
自動階層化という技術を聞いたことがあるだろうか?自動階層化は、複数のストレージ階層を仮想化し、その間でデータを自動的に移動させる技術のことで、ストレージ仮想化の先進的な利用法の1つである。
自動階層化は、ストレージのメジャーベンダがここ数年でこぞって製品に搭載したことで、市場で大きな注目を浴びている。今回の記事では、この新技術にはどんなユーザーメリットがあるのか、どのような種類の技術があるのかなど、自動階層化技術の現在の状況について紹介していく。
本章ではまず、自動階層化の概要と、ユーザーメリットについて解説する。ユーザーメリットを理解することで、次章の技術解説がより理解しやすくなると思う。なお、本記事では、ブロックストレージの自動階層化に絞って、技術を紹介させていただく構成としている。
■ 従来の「ストレージ階層化」の問題点
ストレージ階層化というコンセプトは昔からあるので、ご存知の読者も多いだろう。FC HDD、SATA HDDなど複数種類のメディアを使って階層を作り、データの特性に応じて格納するメディアを変えるという考え方である。たとえば、データベースのように性能を必要とするデータは高性能のメディアに、性能よりも容量コストが重要なデータは大容量のメディアにというように振り分ける。
しかし、従来のストレージ階層化には2つの大きな問題点があり、複数種類のメディアがうまく活用できていないケースが多かった。
1つ目の問題点は、ボリューム単位での振り分けによる限界である。従来のストレージ階層化は、ボリューム単位でしかデータを振り分けることができなかった。しかし多くの場合、ボリュームの中にはアクティブなデータと非アクティブなデータが混在しているため、ボリューム単位で「性能重視」か「容量コスト重視」かという白黒をつけることが非常に難しい。その結果、性能問題のリスクを減らすために、多くのボリュームを上位の階層に置かざるを得なかった。これでは、下位の階層(大容量のHDD)をうまく生かすことができず、コスト削減につながらない。
2つ目の問題点は、マニュアルで作業することによる限界である。従来のストレージ階層化では、ユーザー自身が、ツールなどを使ってデータの特性を分析し、データを移動しなければならなかった。データの特性は時間とともに変わっていくので、分析・移動を継続的に行わなければならず、運用に非常に手間が掛かる。その結果、データを異なる階層に移動する作業はあまり行われていなかった。これでは、古くなってアクセスされなくなったデータが下位の階層に移動されていかない。
■ 自動階層化なら、大容量HDDを効果的に利用できる
自動階層化を使えば、上記の2つの問題をうまく解決することができる。自動階層化では、ボリュームよりも細かい単位(英語ではsub-LUN)でデータを移動することが一般的なので、1つのボリュームの中にアクティブなデータと非アクティブなデータが混在していても、それぞれを異なるメディアに的確に振り分けることができる。また、システムが自動的にデータの分析と移動を行うので、古くなってアクセスされなくなったデータを継続的に下位の階層に移すことが容易にできる。
![]() |
| 図1 ストレージの自動階層化の概要 |
これらの特徴から生まれる最も大きなメリットは、下位の階層(大容量HDD)を従来よりはるかに効果的に利用できるという点だ。非アクティブなデータは下位の階層に自動的に移動されていくので、プライマリストレージの容量全体の60〜80%を占めるといわれている非アクティブなデータを大容量HDDに格納することができる。これによりディスク本数が大幅に減り、装置コストのほか、フロアコストや電力コストの削減が見込める。アクティブなデータは引き続き高性能のメディアに格納されているので、性能的なインパクトは非常に少ない。
アクティブなデータ量というのは通常それほど増えず、非アクティブなデータ量が主に増えていくので、多くの場合、増設は大容量HDDで対応できるようになっていく。筆者が所属する企業の実績では、自動階層化を導入した場合、81%もの顧客が増設時に大容量HDDを選択しているというデータがある。
■ SSDを生かすための自動階層化
自動階層化のもう1つのメリットは、SSDに関するものだ。HDDは長らくシステムのボトルネックとみなされており、性能面を改善するためにSSDには大きな期待が掛けられている。しかし、その導入には「価格」という大きなハードルがある。エンタープライズITで使われるような高信頼型のSSDはまだ価格が高く、ハードディスクを全てSSDでリプレースすることはコスト面で現実的ではないことが多いためだ。
そうなると、少量のSSDをストレージシステムに取り込んだ、SSDとHDDのハイブリッドシステムが現実的な選択肢になる。このハイブリッドシステムをどう動かしていくかが、ここ数年のストレージシステムの大きな課題となるだろう。
そして、このハイブリッドシステムに対する1つの回答が自動階層化である。自動階層化を使えば、アクティブなデータはSSDに、非アクティブなデータはHDDに自動的に配置されるようになるため、少量のSSDを効果的に使うハイブリッドシステムを構築することができる。
なお、少量のSSDを効果的に利用する機能を持ったアプリケーションもあるが、それはまだ一部の先進的なアプリケーションに限られている。自動階層化をサポートしたストレージを使えば、多数のアプリケーションがハイブリッドストレージの恩恵を容易に受けることができる。
1/3 |
| Index | |
| ストレージの自動階層化を理解する | |
| Page1 自動階層化が注目を集める理由 従来の「ストレージ階層化」の問題点 自動階層化なら、大容量HDDを効果的に利用できる SSDを生かすための自動階層化 |
|
| Page2 自動階層化技術を解説する 移動ユニットのサイズ ストレージ階層の選択肢 ドライブタイプによる階層化 RAIDタイプ、内外周による階層化 |
|
| Page3 データ配置のアルゴリズム データ移動のサイクル 新しいデータをどの階層に置くか スナップショットデータの扱い 設定可能なパラメータ 自動階層化の無効化 分析区間の指定 |
|
TechTargetジャパン
- CloudStack 3.0の新機能 (2012/5/17)
CloudStackは2012年2月末にメジャーバージョンアップした。管理インターフェイスなどの機能強化点を紹介する - AWSとAzure、性能と運用機能を比較する (2012/4/11)
いよいよAWSとAzureのパフォーマンスを比較。限定的な条件で行ったベンチマークなので、取り扱い注意! - CloudStackをAPIで操作する (2012/4/9)
CloudStackのAPIを使えば、アプリケーション、外部管理システム、管理サービスから、CloudStackを操作できる - 「OpenFlowの父」が語る、OpenFlowとSDNの真実 (2012/3/21)
OpenFloは誤解され、過剰に期待されているのではないか。OpenFlowを生みだした1人に、SDNやネットワーク仮想化との関係を含めて聞いた
|
|

