データウェアハウス最前線(2)

独自技術でシェアードナッシングの欠点を克服

吉村 哲樹
2010/11/26

今回から5回にわたって、主要データウェアハウスベンダ各社の取り組みと、各社が販売している製品の特徴を紹介していきます。最初に登場するのはデータウェアハウス業界では老舗といえる日本テラデータです(編集部)

全世界でおよそ1000社もの導入実績を誇る

 データウェアハウス(以下、DWH)分野に特化したベンダとして30年以上の歴史を持ち、DWH市場で長くトップシェアを占めるテラデータ。同社のDWH製品は全世界で約1000社、2500システム以上の導入実績がある。米調査会社ガートナーが発表する市場分析レポート「Magic Quadrant for Data Warehouse Database Management System」では、テラデータは1999年以来ずっと市場の先端を走るトップベンダの評価を維持している。

 同社は、アプライアンス型の製品を提供するだけでなく、DWH用データベースソフトウェアの単体販売や、DWHに付きもののデータマイニングやCRMなどのソフトウェアの販売、さらにはDWHシステムの導入を支援するコンサルティングサービスの提供まで幅広くビジネスを展開する。そして、同社の主力製品が「Teradata Platform Family」である。

 Teradata Platform Familyは、ソフトウェアとハードウェアが一体となったアプライアンス型の製品のシリーズで、以下の4シリーズがある。

「Teradata Data Mart Appliance 551」
「Teradata Extreme Data Appliance 1600」
「Teradata Data Warehouse Appliance 2580」
「Teradata Active Enterprise Data Warehouse 5600」

 最上位シリーズのTeradata Active Enterprise Data Warehouse 5600は、最大14Pbytesのストレージが搭載可能になっており、大規模なEDW(エンタープライズデータウェアハウス)を構築可能なシリーズという位置付けになっている。また、Teradata Data Mart Appliance 551は中・小規模のデータマートを構築するための製品、Teradata Extreme Data Appliance 1600は大容量データの分析に特化した製品という位置付けだ。


注 データマート:データウェアハウスに保存されたデータの中から、部門や個人の使用目的に応じて特定のデータを切り出して整理し直し、別のデータベースに格納したもの。セントラルデータウェアハウスが企業全体のデータを統合管理するものなのに対して、特定の部門やユーザーの業務ニーズに合わせて必要なデータだけを抜き出したデータウェアハウスのサブセットといえる。(出典:@IT情報マネジメント用語辞典)

 残るTeradata Data Warehouse Appliance 2580が中規模企業向けのアプライアンス製品となっており、最近のDWHアプライアンス市場の中では最もニーズが高いシリーズだ。最大で517Tbytesのディスクが搭載可能で、同社ではDWHを初めて導入・運用する企業に最適な製品だとしている。

 この製品は、さまざまな独自機能を備えている。そのベースとなっているのはテラデータがDWH専業ベンダとして、長年の取り組みと経験の中で培ってきた独自のデータベース技術だ。その特徴のいくつかを紹介しよう。

MPPシステム構成で実現するシェアードナッシング

 DWHはOLTP(オンライントランザクション処理)との比較で語られることが多い。DWHとOLTPはその用途の違いから、データベースの構造や検索処理など、いろいろな面で異質なデータベース技術が必要になる。

 しかし、DWHアプライアンスの中には、OLTP向けであるソフトウェアやハードウェアにチューニングを施してDWH向けとしたものも多い。もちろん、それでも多くの製品は十分な性能と使い勝手を実現しているのだから、OLTP向けのソフトウェアやハードウェアを利用することが問題になることはない。しかし、テラデータはDWH専業ベンダとして、完全にDWH向けと言える製品の研究開発を続けている。

 「テラデータは30年以上に渡って、ひたすらDWHに向けたデータベース技術を追求してきた。OLTPには、目もくれていない」

 こう語るのは、日本テラデータのマーケティング統括部でプロダクト・マーケティング&マネジメント部の部長を務める丹隆之氏だ。事実、同社の製品はハードウェアもソフトウェアも、DWHで使うことを前提としたアーキテクチャとなっている。例えば、独自の並列処理技術を生かしてデータベースを「シェアードナッシング」アーキテクチャとしているのもその表れの1つだ。

テラデータはひたすらDWHに集中してきたと語る丹氏

 Teradata Data Warehouse Appliance 2580は、複数のSMP(対称型マルチプロセッシング)ノードをギガビットイーサネットで相互接続してMPP(超並列プロセッシング)構成を作っている。Teradata Active Enterprise Data Warehouse 5600では、ギガビットイーサネットの代わりに、同社独自のネットワーク機構「BYNET」でノードを接続している。そして、ストレージは各ノード専用の領域に論理的に分割してあり、各ノードと個別に接続することでシェアードナッシング型アーキテクチャを構成している。

 ちなみにシェアードナッシングとは、データベースソフトウェアの処理を複数のノードに分散することにより、処理性能を向上させる仕組みの1つだ。シェアードナッシングはしばしば、「共有ディスク方式」あるいは「シェアードエヴリシング」と呼ばれる方式との比較で説明される。共有ディスク方式はその名の通り、複数のノード間で同じディスクを共有するアーキテクチャだ。あるノードで障害が発生しても、ほかのノードに処理を引き継ぎやすく、耐障害性に優れる。ただし、複数ノードのデータベースからのアクセスが競合したときのロック現象は避けられず、これが処理性能低下の原因になる。

図3

複数のSMPノードを相互接続してMPP構成を実現している

 ちなみにシェアードナッシングとは、データベースソフトウェアの処理を複数のノードに分散することにより、処理性能を向上させる仕組みの1つだ。シェアードナッシングはしばしば、「共有ディスク方式」あるいは「シェアードエヴリシング」と呼ばれる方式との比較で説明される。共有ディスク方式はその名の通り、複数のノード間で同じディスクを共有するアーキテクチャだ。あるノードで障害が発生しても、ほかのノードに処理を引き継ぎやすく、耐障害性に優れる。ただし、複数ノードのデータベースからのアクセスが競合したときのロック現象は避けられず、これが処理性能低下の原因になる。

 一方のシェアードナッシング方式では、ノードごとにアクセスできるディスク領域を完全に分離する。そのため、データベースに対するアクセス競合が発生せず、ノードを増やせば増やすほどリニアに性能が向上するとされている。ただし、あるノードで障害が発生したとき、ほかのノードは障害が発生したノードのディスク領域にアクセスできないため、共有ディスク方式と比べると耐障害性に劣るとされている。しかし丹氏は、テラデータの製品ではこうした点は問題にならないと言い切る。

 「あるノードで障害が発生しても、その処理を自動的にほかのノードに引き継げる独自の仕組みを実装している。また、障害時に備えて予備のノードをホットスタンバイさせておくこともできる。障害が発生したノードの処理をスタンバイノードに引き継がせることにより、処理性能の低下も防げる。そのほかにもシェアードナッシングにはいくつかの欠点があると一般的には言われているが、独自技術によってすべて克服している」(丹氏)

  1/2 次のページへ

Index
独自技術でシェアードナッシングの欠点を克服
→
Page 1
全世界でおよそ1000社もの導入実績を誇る
MPPシステム構成で実現するシェアードナッシング

Page 2
新旧機種の共存機能とワークロード管理機能
自動チューニング機能で管理作業を簡素化



Database Expert フォーラム 新着記事
@ITメールマガジン 新着情報やスタッフのコラムがメールで届きます(無料)

注目のテーマ

Database Expert 記事ランキング

本日月間