連載
» 2004年03月17日 00時00分 公開

初めてのSQL Server 2000:第2回 SQL Server 2000を構成するコンポーネント (3/4)

[デジタルアドバンテージ,著]

 OLAPでは、キューブ(cube)と呼ばれるしくみを使って分析を実施する。キューブは、高速かつ多機能なOLAPを可能にするデータ照会メカニズムを提供するテクノロジである。キューブにより、本来のデータベースを直接参照するよりも大幅に高速なデータ参照が可能となり、効率的かつタイムリーな分析ができるようになる。キューブはデータウェアハウスのサブセットから構築されるデータセットで、一般に多次元構造を持つ。

 例えば以下は、全国に販売店舗を持つアパレル販売会社のキューブである。このキューブでは「営業期間」「店舗ロケーション」「製品」をディメンション(dimension=「次元」の意味)としている。そしてこれら各ディメンションは、それぞれに階層的なレベルを持っている。

マルチディメンション・キューブの例
OLAPを高速に実行するために使われるのがキューブである。キューブはこのように複数のディメンションから構成され、それらが交差する部分にOLAPで注目するデータを含むメジャーが存在する。一般にディメンションは階層構造をしており、階層を下がることで、さらに詳細レベルのメジャーからの情報を取得できる。

 OLAPの元となるデータウェハウスやデータマートは、ファクト・テーブル(fact table)と呼ばれるスキーマによって定義される。ファクト・テーブルは、メジャー(major)やディメンション・テーブルと関連するファクトのキーを含むテーブルで、データウェアハウスの中心に存在している。このファクト・テーブルの列に基づく値セットがキューブのメジャーになる。データウェハウスやデータマートには、少なくとも1つのファクト・テーブルが含まれる。

 ディメンション(dimension=「次元」の意味)は、ファクト・テーブル内のデータのカテゴリである。図に示したとおり、通常は階層的なピラミッド構造になる。例えば上図では、「営業期間」を「上期」「下期」→「第1〜第4四半期」までとしたが、通常はさらに月、日、時間とレベルが設定されることになるだろう。OLAPでのデータ分析において、ディメンションのより下位の階層(より詳細レベルの階層)に下がってメジャーを分析することをドリルダウン(drilldown)と呼ぶ(例えば半期レベル「上期」「下期」から四半期レベル「第1〜第4四半期」にドリルダウンして分析するなど)。

ディメンションの例
ディメンションはデータウェアハウスを定義するファクト・テーブル内部のカテゴリである。通常はこのように複数レベルからなる階層構造をとる。

 キューブでの分析対象となる中心的な値がメジャーである。このメジャーには、分析するユーザーが最も注目する数値データ(販売量、売り上げなど)を設定する。メジャーはデータウェアハウスを定義するファクト・テーブルの列から構成されることになる。例えば前出のアパレル販売会社の例では、製品の販売数と売上金額をメジャーとしていた。

Copyright© Digital Advantage Corp. All Rights Reserved.

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。