[Analysis]

次世代サーチ技術はどこへ向かうのか

2009/05/20

search.jpg

 鳴り物入りで検索サービス「WolframAlpha」の一般向けサービスが開始された。マイクロソフトもまもなく「Kumo」と呼ばれる検索サービスを、Live Search サービスのリニューアルとして公開するといわれている。

 膨大なデータの中から意味あるコンテンツを発見する検索技術は、RDBが活用され始めたころからコンピュータ活用におけるキラーテクノロジであり、時代のニーズと技術背景に応じて、さまざまな企業が手掛けてきた。「次世代のGoogle」と言われるような先進企業は今後出てくるのであろうか。

苦悩するセマンティックサーチ

 Wolfram AlphaとKumoに共通するのは、いわゆるセマンティックサーチ技術と、分散検索技術の活用である。このうち、分散検索に関しては、GoogleによってMapReduce技術の有効性が実証され、いまやインターネット規模のデータ量を対象とする検索技術としては必須のテクノロジだ。一方、Googleに対抗する後発企業が差別化のために取り組んでいる新分野がセマンティックサーチ技術ということになる。

 もともと、セマンティックサーチという言葉は、単純な符号/ワード検索以上の「意味」まで調べられるというニュアンスを持つ。XMLのように明確に定義されたメタデータが付随していないのであれば、何らかの手法で意味を抽出することになる。しかし、これがなかなか難しい。

 たとえばマイクロソフトが、昨年買収した自然言語処理に基づいたサーチ技術「Powerset」も、意図した結果が見つかる場合と見つからない場合の結果の差が大きい。同じ差はWolframAlphaでも散見される。

 セマンティックサーチでは、検索対象に意味的近さを示す“距離空間”を導入し、入力キーワードとの“近さ”を元に、検索結果を提示する。しかし、多様な言語パターンの下では、距離空間にうまくマッピングできない。実験的に考案された規則においては、現実的な言い回しの意味上の近さをなかなか表せないのだ。

 また、インターネットサービスと位置付けた場合、セマンティックサーチが目指す高品質なサーチ結果を求めるユーザーは、実はそれほど多くはない面もある。シンプルなサービスや結果が一般的には好まれるのだ。

進展するプラットフォーム化

 検索の質を上げるセマンティックサーチが足踏みしている一方で、企業向けシステムの領域においては、定型化されたRDB中心のデータに対して、非定型的データを組み合わせる目的で、システムにサーチを組み入れる事例が増加している。そうしたニーズに対応して、システムへの組み込みやすさにフォーカスしたプロダクトを提供しているのが、Lucid ImaginationAttivioといった企業だ。

 Lucid ImaginationはApache Lucene/Solr といったオープンソースの検索ソリューションの導入支援を行っている。Linuxにおけるレッドハットのような立ち位置をサーチにおいて目指しているわけである。

 これに対してAttivioはサーチに軸足を置きながらも、RDBに慣れ親しんだ開発者に対し、RDBとサーチの連携を可能にする。また、サーチ結果をトリガーにイベントを駆動する仕組みなど、サーチ上のソリューション開発プラットフォームを提供することに特化している。

 両社ともに、ベースとなるサーチエンジン自体ではなく、より顧客に近い、その上のアプリケーションやサービスを掌握する戦略であり、ベンチャーのビジネスモデルとしては安定性が高い。また、少し領域は異なるが、ソリューションの視点に立てばXMLサーバを提供するMark Logicもベンチャーのビジネスモデルとして注目に値する。

分化するサーチとビジネスモデル

 一般的ユーザーを対象にしたインターネットサービスとしてのサーチを考えた場合、重要になるのは、平均的ユーザーにとっての使いやすさだ。つまり、操作や入力が簡略であること、そして、ボリュームユーザーにとって妥当な結果を返すこととなる。

 そう考えると、複雑な自然文による入力を求めて精緻な結果を返すより、単純な入力だけでパーソナライズされた結果を返す方が望ましい。その点から、自然に蓄積されるユーザーのソーシャルネットやサーチ行動に対するコラボレーティブフィルタリングにより、負荷が少なくシンプルな入力のみによって適切な結果を返すことがより重要になるだろう。

 反面、エンタープライズ向けのサーチにおいては、複雑なクエリを駆使したり、サーチ結果にフィルターを適用したりして、ほかのシステムとの親和性を高めることが求められていくと思われる。

 おそらく、現在インターネット向けのセマンティックサーチとして位置付けられているいくつかのテクノロジは、Web2.0的な広告モデルとしては必ずしも成功せず、むしろ、エンタープライズソリューションの構成要素として活路を見いだしていくのではないかと思われる。願わくば、そうして生き残ったテクノロジが進化する形でGoogleをしのぐセマンティックサーチサービスを提供してほしいものである。ネットにもそろそろ次のスターが必要だ。

(日本ソフトウェア投資 代表取締役社長 酒井裕司)

[著者略歴]

「大学在学中よりCADアプリケーションを作成し、ロータス株式会社にて 1-2-3/Windows、ノーツなどの国際開発マネージメントを担当。その後、ベンチャー投資分野に転身し、JAFCO、イグナイトジャパンジェネラルパートナーとして国内、米国での投資活動に従事。現在は日本ソフトウェア投資代表取締役社長

情報をお寄せください:


この記事に対するご意見をお寄せください managemail@atmarkit.co.jp

アイティメディアの提供サービス

スキルアップ/キャリアアップ(JOB@IT)

- PR -

@IT Sepcial

「ITmedia マーケティング」新着記事

音声検索のランキングに影響する3つの要素――SEMrush調査
音声検索のランキングに強い影響を与えている要素についての分析です。

電通と電通デジタル、自動車販売店での試乗体験を支援する「AI試乗ソリューション」を提供
自動車販売店での試乗にAIが「同乗」。試乗に対する心理的ハードルを軽減するなどのメリ...

アジアで人気の日本のコンテンツ、マンガとアニメ以外では?――Fun Japan Communications調べ
アジア各国でも広く視聴されている日本のコンテンツ、どんなものが人気なのでしょうか。