
DB基礎講座:XQueryとSQLはどう違う?
一気に分かる“XQuery”ハンズオン演習
日本アイ・ビー・エム米持幸寿
2006/7/6
データベースに搭載されるXML機能は進化の一途をたどっている。特に2006年の注目製品は、RDBでありながらネイティブXMLも扱えるハイブリッド・データベース、DB2 V9(コードネームはDB2 Viper)だろう。本稿ではDB2 V9を使ってXQueryの基本を解説する。(編集部)
| 主な内容 --Page 1--
--Page 2--
--Page 3--
|
今年(2006年)はXMLデータベース元年といわれています。すでに製品を出していた企業を含む多くのベンダが、XMLを保存するのに適したデータベース管理システム(DBMS)を発表しています。そして何よりXML専用のクエリ(問い合わせ)言語であるXQueryが昨年11月にW3C(World Wide Web Consortium)のCR(Candidate Recommendation:勧告候補)にまでこぎつけました。
本記事では、XQueryをクエリ言語の標準であるSQLと比較しながら、どのような言語なのか概説します。
XML 1.0勧告が発表されてはや8年が過ぎ去ろうとしています。筆者自身が関与した開発プロジェクトでXMLを初めて使ったのは1999年ですが、それからすでに7年が経過しました。
これまでXMLを企業システムで利用してきた際にいつもつきまとっていた課題は、XMLの保存と検索です。多くのシステムがXMLをプレーンなテキストファイルとして保存しています。そもそもXMLはテキストだけで作られているためにテキストエディタで作りやすく、扱いも楽だからでしょう。しかしテキストファイルによるXML処理にはさまざまな限界があります。
あるプロジェクトで16万件にも及ぶXMLファイルが1枚のCD-ROMに入れられて送られてきたことがあります。いくつかのディレクトリに分かれて入ってはいましたが、PCのCD-ROMドライブに載せたところ、CD-ROMを認識するのに4時間もかかりました。ファイルが多過ぎるのです。
ファイルに保存されたXMLは、その中に含まれる要素の値での検索ができません。そこで外部ファイルとしてインデックスを作ったり、検索用のデータベースを別途持ったりしていました。
リレーショナル・データベース(以下、RDB)にXMLを保存する技術は年々進化していますが、SQL(Structured Query Language)にも限界があります。そもそもSQLは表を扱うためのクエリ言語。ツリー構造のXMLには向きません。せっかくツリー構造により複雑なデータ構造を取り扱えるはずなのに、XMLを「表でも表せる」程度の構造で定義して使っている例が非常に多く見受けられます。その理由はRDBに保存しようとするからです。XMLをテキストファイルやRDBに保存するのはそろそろ限界が見えてきました。
XQueryは、XMLドキュメントを検索・抽出するために設計されたクエリ言語です。XQueryは、W3Cが策定中で、本記事執筆時点では勧告候補段階です。
- XQuery 1.0: An XML Query Language
(W3C Candidate Recommendation 8 June 2006)
旧来からデータベース構造の標準としてRDBが広く使われてきました。RDBは通常SQLで問い合わせます。SQLはリレーショナルデータを扱うクエリ言語といわれます。RDBは、表を複数組み合わせたものです。親子関係のあるデータ構造も、繰り返し(マルチオカレンス)のあるデータも、すべて表として取り扱います。
RDBにはデータが表の形式で保存されます。表はいくつかのものが関係し合い、複雑なデータ構造を表します。そして、その複雑な関係を解決するのは、SQLの構文によります。SQLは結果を、やはり表の形式で返します(図1)。
![]() |
| 図1 SQLとリレーショナルデータ |
これに対してXMLデータはツリー構造のデータです。表形式のデータは基本的にツリー形式で表すことができます。そういった意味ではツリー形式のデータ構造の方が汎用的であると考えていいでしょう。そしてXQueryは結果をXMLで返すのが基本です(図2)。基本を外れてCSVなどを返すこともできます。
![]() |
| 図2 XQueryとツリーデータ |
もしSQLとXQueryを比較するなら、
- SQL
表で保存されているものから抽出したデータを表形式で返す
- XQuery
ツリー構造で保存されているものから抽出したデータをツリー形式で返す
ということができます。
もう1つ大きな違いがあります。SQLはSELECT、INSERT、UPDATE、DELETEと、いわゆるCRUD(Create、Read、Update、Delete)の機能を定義しているのに対して、XQueryはクエリ、つまりReadしか定義していない点です。XQueryによるXMLノードの挿入、削除、変更、コピーといった機能は、XQueryの拡張仕様「XQuery Update Facility」として別途仕様策定中です。
ところで、XQueryはXSLTと比較されていることが多い言語仕様です。その理由は、XSLTで決めていることとXQueryが決めていることが非常に似通っているからです。この理由は、どちらもXMLドキュメントから別のXMLドキュメントを作り出すという「変換」の働きをするからです。
| 1/3 |
| Index | |
| DB基礎講座:XQueryとSQLはどう違う? 一気に分かる“XQuery”ハンズオン演習 |
|
| Page 1 ・はじめに ・XMLはどのように保存されるべきか ・SQLとXQueryは何が違うのか |
|
| Page 2 ・XQueryの代表的な機能 |
|
| Page 3 ・FLOWR構文を使ったXQuery演習 |
|
| DB基礎講座:XQueryとSQLはどう違う? |
ホワイトペーパー(TechTargetジャパン)
- ここまでできる! CouchDBパワーアップ作戦 (2010/3/18)
さらに一歩踏み込んで、実運用のためのノウハウを知りましょう。全文検索、ユーザー認証、負荷分散手法を解説します - 診断ツールでデータベースの健全性を保つ (2010/3/5)
DBをセキュアに保つには、日々のチェックが重要。診断ツールを運用に組み込むことが、情報漏えい対策の第一歩です - トムが説く、エンジニアがしてはならないこと (2010/3/2)
Oracleエンジンそのものをデザインする男、トム・カイト。カリスマエンジニアが説明する、陥りやすい「ぼくたちの失敗」とは - “スコット”といえばなんと答える? (2010/2/22)
ツーといえばカー、スコットといえばもちろん! そんな根っからのDB人間チェックや週末の勉強会など、2月もDB漬けでした
|
|
スキルアップ/キャリアアップ(JOB@IT)
スポンサーからのお知らせ
- - PR -
| 「いつかは壊れるサーバ」そんな故障に 迅速で安価に手軽に対応する方法とは? New! |
| 「特権ユーザー」の事件を防げ! 万能権限を持つユーザーの管理方法とは? New! |
| 仮想環境の構築とデータ保護の特効薬?! 実績と信頼性の高いパッケージで安心運用 |
| 仮想環境のバックアップもこれまでどおり 「まるごと取ってまるごと戻す」簡単運用 |
| おばかアプリ選手権、第4弾開催中!! ムダにカッコよくてくだらない作品求ム! |
| 社内ファイルサーバを“クラウド”に統合 VPN直結「クラウド型ストレージ」を紹介 |
| その数、なんと400台以上! グループ内 サーバの「統合管理」によるメリットは? |
| 美人!? まあまあ? 気になる いやし系!! PV急増で「美人時計」がとった手段とは? |
| 進化を続ける富士通ストレージETERNUS DX 製品開発者の自信を裏付けるものとは何か |
| 運用管理の課題を“2つの観点”から分析 ユーザー満足度の高い「仮想環境」とは? |
- - PR -
お勧め求人情報

**先週の人気講座ランキング**
〜CCNA編〜
| ◆ | TomcatやJBossなどAPサーバ環境に関する 情報を集約! “業務”用APサーバ大百科 New! |
| ◆ | 一気に解説! 最新のクラスタストレージ 「RAIDを超えたストレージ基準」……など New! |
| ◆ | クラウド的ユーザー体験の変化は脅威か? 仮想化技術を使いこなす運用管理術を紹介 New! |

| ◆ | 上司や部下、部署内メンバーとの情報共有 を“ガラッ”と変えるコラボツールとは? New! |
| ◆ | おばかアプリ選手権、第4弾開催中!! ムダにカッコよくてくだらない作品求ム! |
| ◆ | 社内ファイルサーバを“クラウド”に統合 VPN直結「クラウド型ストレージ」を紹介 |

| ◆ | Twitterのアカウントはなぜ突破された? メールによる新手の攻撃手法とその対策 |
| ◆ | もう仮想化のお試しフェイズは終わりだ! Hyper-V 2.0が基幹システムも仮想化 |
| ◆ | 美人!? まあまあ? 気になる いやし系!! PV急増で「美人時計」がとった手段とは? |

| ◆ | クライアント企業から求められる人材 ⇒IT技術と経営戦略を併せ持つ「戦略家」 |
| ◆ | .NET編集長が実践する「技術情報検索術」 サンプル・コードを簡単に探す“技”は? |
| ◆ | 業務効率と情報セキュリティ対策を両立! 手間なく確実に機密情報を守る方法とは? |

| ◆ | 進化を続ける富士通ストレージETERNUS DX 製品開発者の自信を裏付けるものとは何か |
| ◆ | 運用管理の課題を“2つの観点”から分析 ユーザー満足度の高い「仮想環境」とは? |

| ◆ | 【CTC事例】約30の基幹システムを統合! 膨大なバッジジョブを制御した方法は? |
| ◆ | 仮想化すればコストは削減できるか? 仮想化に必要な「3つの視点」を解説する |
| ◆ | その数、なんと400台以上! グループ内 サーバの「統合管理」によるメリットは? |








