ICDロゴ

XML (Extensible Markup Language)

【エックス・エム・エル】

最終更新日: 2001/09/12

 自己拡張が可能なマークアップ言語の1つ。標準化団体であるW3CのXMLワーキング グループ(当初は「SGML Editorial Review Board」と呼ばれていた)によって1996年に開発された。XMLでは、文書構造を決定するための規則を文書の作成者が決定できる(これが「自己拡張可能」と言われるゆえんである)。つまり、文書の構造をその作り手が自由に決定できるわけだ。この機能を利用すれば、XMLという標準仕様を用いながら、特定の構造にとらわれない自由度の高い文書を広く交換できるようになる。インターネットの普及に伴って、これを利用した電子商取引(EC)が活発化したことから、ECでやり取りする標準文書仕様として注目されることとなった。

 マークアップ言語とは、文書の構造(見出しや本文など)や表現属性(太字や斜体など)などの追加情報を一定の規則に従って文書中に記述する方式の言語仕様である。文書以外の追加情報は、一般にタグ(tag)と呼ばれる。最も著名なマークアップ言語の1つはWebで利用されるHTML(HyperText Markup Language)である。HTML形式で記述されたWebページは、HTML形式のデータを解釈可能なWebブラウザで表示することができる。HTMLという標準仕様にのっとって、文書の作成者と受信者が文書を取り扱うことで、情報を正しく伝達することができるわけだ。

 しかしHTML仕様では、文書構造と書式表現が1つのファイルに格納されており、両者の切り分けが必ずしも明確ではない。HTML仕様においても、後にスタイル シートの機能が追加され、書式に関する柔軟性が向上したが、文書構造に対してスタイルを適用することはできず、文書の構造化に対するニーズには完全には応えられなかった。

 こうしたHTMLの問題を克服し、Webページという限られた分野だけでなく、インターネット上で広く交換可能な標準文書仕様として開発されたものがXMLである。構造化文書仕様としては、すでに1986年にISOで規格化されたSGML(Standard Generalized Markup Language)が存在していたが、SGMLは極めて高機能である代わりに非常に複雑であり、広く普及するには至らなかった。XMLは、このSGMLから、インターネットやイントラネット上で情報交換するために必要な部分だけを取り出したサブセット版である。

 XMLでは、文書の型を定義する情報(DTD:Document Type Definition)を文書とは別途定義しておき、このDTDで定義された規則に従ってXML文書を解釈するようにする。具体的にこのDTDでは、XML文書中で使用されるエレメント(開始タグと終了タグの組み合わせ)や、文書中で使用可能なエンティティ(たとえば画像データなど、構造とは無関係な文書中のパーツ)などを規定する。

Copyright (C) 2000-2007 Digital Advantage Corp.

アイティメディアの提供サービス

キャリアアップ