「Semantic Web」と「メタデータ」のメタな関係

2003/3/5

ジャストシステムの野村直之氏

 「特殊な符号によって、どれが気温かをコンピュータに教える。さらに、そこで使われている『気温』という言葉のニュアンスまで、わかるようにする」。かつてWWW(World Wide Web)の生みの親ティム・バーナーズリー氏は、2000年12月13日号のNewsweek日本版で「Semantic Web」をこのように表現した。では現在、Semantic Webの研究はどこまで進んでいるのだろうか。

 XMLコンソーシアムは3月4日、「第4回 XMLコンソーシアム Days」を開催、最新動向のトピックの1つとしてSemantic Webを取り上げ「セマンティックWebの動向とメタデータ」とする発表を行った。発表を行ったジャストシステムの野村直之氏は、Semantic Webの活用のためのステップとして「メタデータ、オントロジ、知的エージェントという3つの“技術”を順番に実用化し、アプリケーションに組み込みながら活用していく」道を示した。

 そもそも、メタデータとは何か。バーナーズリー氏の言葉と合わせて考えれば、記述される情報の意味(Semantics)を指し示す。つまり、WWW上に散在するさまざまな個々の情報に意味を付与し、その情報が“なにもの”かを明確にするデータこそがメタデータである。そして、従来(今でも)情報の意味を人間が判断していた状況を、メタデータの存在によってコンピュータが理解できるようにする仕組みがSemantic Webである。

ティム・バーナーズリー氏が描くSemantic Webの構造(クリックすると拡大)

 実際的な動きは、XMLを取り巻く世界から巻き起こっている。Semantic Webでは個々のメタデータではなく、メタデータの記述形式を規定しており、W3Cが策定するResource Description Format(RDF)が、2つのリソース(情報)間の関係を定義するXML言語として標準的な位置を占めている。ただし、「かなりローレベルの規定言語であるため、情報流通の現場で活用するにはRSS(RDF Site Summary or Rich Site Summary)やPICS(Platform for Internet Content Selection)、P3P(Platform for Privacy Preferences Project)などの応用言語を上位レイヤに組み込むことで、実用化を図ろうとする。ここで言うローレベルとは、RDFがあくまでリソース間の関係を定義するだけの言語であり、例えばRDFの記述そのものを完全に信頼できるかどうかは別の問題なのである。そのために、上位レイヤとして個人のプライバシー情報伝達のための枠組みであるP3Pや有害コンテンツのフィルタリングを行うメタデータをページに付与するPICSを介することで、セキュリティを高め実用に耐える仕組みを構築しようとする。

 さらに、メタデータの構造自体を定義するレイヤとしてのオントロジを記述する言語として、最近は「Web Ontology Language(OWL)」が注目されている。OWLは、RDFやRDF-S(RDF-Schema)のリソースの位置付けの仕組みを用いてWeb上の分類体系(クラス)やその間の関係、さらにそれらの推論ルール群(定理や公理)を記述する言語である。

 オントロジ定義による知識の相互運用が可能になって初めて、その次のレイヤであるエージェント(人やデータベース)が「動き回って仕事ができるようになる」(野村氏)という。

(編集局 谷古宇浩司)

[関連リンク]
XMLコンソーシアム

[関連記事]
セマンティックWebの姿がかいま見えた「W3C Day」 (@ITNews)
開花には最低3年が必要、Webサービスの現実 (@ITNews)
「成功例が増える前にWebサービス参入を」とガートナー (@ITNews)
Webサービスは第2段階で「メッセージ交換インフラになる」 (@ITNews)
OASIS社長、「今年はebXMLの実装が進む」 (@ITNews)

情報をお寄せください:



@ITメールマガジン 新着情報やスタッフのコラムがメールで届きます(無料)