Viper 2で学ぶXMLデータベース最新事情
Viper 2で学ぶXMLデータベース最新事情(1)

なぜ彼はLAMPを捨てXML DBに走ったのか


日本アイ・ビー・エム
中林 紀彦
2007/10/22
最新のXMLデータベース実装となるViper 2(DB2 9.5)のリリースを機に、全4回の連載記事であらためてXMLデータベースの利点を考えてみる。そこで見えてきたものとは?(編集部)


いかにしてKさんは設計変更のワナにはまったか

 これはインターネット上でサービスを提供しているある企業で働くKさんのお話です。この会社では、CGM(ユーザー生成メディア)サイトを立ち上げることになり、Kさんが全体のアーキテクチャ設計からデータベース、プログラミングまですべてを担当することになりました。しかもベータ・サービスの開始が1カ月後と迫っています。

 Kさんは早速、アーキテクチャの選定に入りました。この部分は迷うことなくLAMPを選択しました注1。これまでの経験上慣れているのと、オープンソースであるためコストもかからないのでほかに選択の余地はないように思いました。

 次に、サイトの企画者と要件の打ち合わせを持ち、データベースの設計に取り掛かりました。しかし要件が柔らかく、はっきりしない部分が多くあり、データベースの設計にすぐには取り掛かれませんでした。2日後ようやく要件が固まったということで、企画者からの要件に基づきデータベースの設計に入ることができました注2

注1:皆さんよくご存じだと思いますがLAMPとは、Linux(OS)、Apache(Webサーバ)、MySQL(データベース)、PHP/Perl/Python(スクリプト言語)の頭文字をとった造語です。LAMPは動的(ダイナミック)コンテンツを含むWebサイト構築に非常によく用いられている構成ですが、日本ではLAPPとしてデータベースについては、MySQLではなくPostgreSQLが用いられるケースもよくあります。

注2:MySQLのようなリレーショナル・データベースを設計する際には、カラム(列)の型やサイズを決める必要があるので、要件が明確に決まっていない部分があるとテーブル設計を完了できません。

 例えば、ユーザー管理のテーブルは図1のようなテーブル・スキーマになっています。

図1 ユーザー管理テーブルのスキーマ定義
(画像をクリックすると拡大します)

 このユーザー管理テーブルも含めて、20個のテーブル設計が完了したので、ようやくプログラミングに取り掛かりました。プログラミングを始めて3日目のことです。突然企画者から呼ばれて「ユーザーの属性を増やしたいので、ユーザー管理テーブルの項目を変更したい」との依頼を受けました。実は今日の企画会議で、登録ユーザーの興味のある分野をユーザー登録時に入力してもらおうと決まり、早速変更の依頼が来たのでした。しかしKさんは困りました。興味のある分野を複数登録したいということなのですが、いくつまで必要なのか、いまは決められないというのです。

 数が決まっていれば図2のように、正規形を崩して持つことが可能です。

図2 ユーザー管理テーブルの変更
新たな列「興味1」 「興味2」「興味3」を追加した。
(画像をクリックすると拡大します)

 しかしこの設計方法には落とし穴が潜んでいます。興味1〜3までと数を決めてしまったので、仮に4つまで増やしたいということになると、テーブルの設計を変更し、SQLの修正(興味1、興味2、興味3という名前をSQLに埋め込んでいるため)、プログラムの修正と非常に面倒な作業が発生してしまいます。Kさんは1時間くらい悩みましたが、スケジュールを優先させてこのままの設計で進めることにしました。

 ここで、このケースをリレーショナル・データベースの正規化に基づいて正規化すると、どうなるかを考えておきましょう。

 この場合は第2正規形を適用し、テーブルを2つに分割することになり、図3のようなサイド・テーブルができます。

図3 ユーザー管理テーブルから分割されたサイド・テーブル
(画像をクリックすると拡大します)

 このように“ユーザID”をキーにしてテーブルのJOINを行って利用する形になります。実はこの正規形を利用すると、プログラムの実装時に数々の面倒なことが起こります。

1. データの検索・表示の際のSQL

 テーブルが2つあるのでJOINが必要なのはもちろんですが、結果セットを使いやすい形で取得するためにはSQLに工夫が必要になります(ここでは詳しく触れませんので、皆さんも考えてみてください。本稿の最後にDB2を使ったときの解答があります)。普通にSQLを書くと(リスト1)、図4のように“ユーザID”と“ユーザ名”が重複して結果セットに含まれてしまい、プログラムからデータを取り出すときに少々厄介です。

SELECT USER1.ユーザID, ユーザ名, 興味 FROM USER1, USER2
WHERE USER1.ユーザID = 1
AND USER1.ユーザID = USER2.ユーザID;
リスト1 結果セットに“ユーザ名”が重複するSQL

図4 “ユーザID”と“ユーザ名”が重複して結果セットに含まれる
(画像をクリックすると拡大します)


2. データ挿入時の課題

 次に、ユーザー登録の場面を考えてみましょう。まずは、ユーザー情報の入力画面で興味の欄をいくつ表示するかという問題に直面します。ただし、今回のケースではKさんが3つと決めてしまったので、この部分については悩む必要はありません。しかし、テーブルが2つあるので、INSERT文を2回発行しなければなりませんので、プログラムの実装がその分多くなってしまいます。

3. パフォーマンスの問題

 テーブルをJOINするということは実はパフォーマンスにも影響が出ますし、テーブルが増えるということはデータベースの運用でもそれだけ仕事が増えてしまいます。

 以上のように、きちんと正規化のルールを守っても、SQLやプログラム、パフォーマンスにしわ寄せがきてしまい、全体としてはどうも良い解決策とはいえないようです。

 さてさて、Kさんの奮闘はまだまだ続きそうです。データベースの設計部分のユーザー管理テーブルだけを取り上げてもさまざまな問題が起こります。このケースは決して特殊ではなく、昨今のシステム構築のプロジェクトでは少なからずここでご紹介したいくつかの問題に悩んでいるのではないでしょうか。

  1/2

 Index
連載:Viper 2で学ぶXMLデータベース最新事情(1)
 なぜ彼はLAMPを捨てXML DBに走ったのか
Page 1
・いかにしてKさんは設計変更のワナにはまったか
  Page 2
・XMLデータベースという選択肢
・XMLデータベース(Viper 2)による実装


Viper 2で学ぶXMLデータベース最新事情


@IT Special

- PR -

TechTargetジャパン

Database Expert フォーラム 新着記事
  • 「E-R図」を理解する (2017/5/23)
     「データベーススペシャリスト試験」は同じパターンの出題が多いために、過去問題をたくさん解くことが合格の早道です。本企画では、午前/午後試験対策のための「基礎知識」を抜粋してお届けします。今回は、「E-R図の基礎」の基礎を解説します
  • 「断片化なし」「不足インデックスなし」にもかかわらず、業務処理が遅くなっていく (2017/5/22)
     本連載では、「SQL Server」で発生するトラブルを「どんな方法で」「どのように」解決していくか、正しい対処のためのノウハウを紹介します。今回は、「断片化/不足インデックスには問題がないのに、データベース処理がだんだん遅くなっていく事例とその対処方法の続編」を解説します
  • 宣言部と変数の定義 (2017/5/17)
     本連載は、「PL/SQL(Procedure Language/Structured Query Language)」を理解し、活用していくための実践講座です。初回は「PL/SQLブロックの宣言部と変数の定義」を解説します
  • 「ANSI/SPARC 3層スキーマアーキテクチャ」を理解する (2017/5/16)
     「データベーススペシャリスト試験」は同じパターンの出題が多いために、過去問題をたくさん解くことが合格の早道です。本企画では、午前/午後試験対策のための「基礎知識」を抜粋してお届けします。今回は、「ANSI/SPARC 3層スキーマアーキテクチャ」の基礎を解説します
@ITメールマガジン 新着情報やスタッフのコラムがメールで届きます(無料)
- PR -

イベントカレンダー

PickUpイベント

- PR -

アクセスランキング

もっと見る

ホワイトペーパーTechTargetジャパン

注目のテーマ

Database Expert 記事ランキング

本日月間
ソリューションFLASH