連載
» 2006年08月10日 10時00分 公開

ものになるモノ、ならないモノ(11):国内の総合辞書検索屋への挑戦者、ウェブリオとは?

数回にわたる国内のWeb2.0企業シリーズ。第3弾の今回は、100を超える専門辞書の集合体、Weblio。100を超える専門辞書の集合体、Weblio。既存辞書を登録していくという方針は、ユーザー参加型のCGM辞書を超えられるか?(編集部)

[山崎潤一郎,@IT]
インデックス

連載目次

総合検索辞書サイト、ウェブリオオフィスの熱気

 このコラムでは何回かに分けて、Web 2.0周辺の話題をお届けしている(参照記事:Webちらし、国産RSSリーダーと人工知能化の野望API公開のずいぶん前からすでにWeb2.0でした)。@ITのようなオンラインメディアで何かを取り上げるのであれば、いままさに巣立とうとしている面白いサービスを応援したいという気持ちを持ちつつ、日々ネットをウオッチしている。

 そんな中、「バーチカル検索」「マッシュアップ」「ロングテール」といった、最近のトレンドを示す言葉がポンポンと気持ちよく当てはまる格好の取材対象を見つけた。「Weblio」は、ネット上に点在する辞書、百科事典、用語事典のたぐいを一堂に集めた総合検索辞書サイトだ。

 昨年、大学を卒業したばかりの辻村直也社長を先頭に平均年齢24.4歳の若い5人組のチーム「ウェブリオ株式会社」が運営しているサービスだが、オシャレでカワイイサイトデザインからスマートなIT企業のそれを連想して訪れた筆者の期待は、見事に裏切られた。渋谷の JR線路沿いに建つマンションのワンルームオフィスに入った途端、その部屋の熱気に気おされてしまったのだ……。

写真1:オフィスの床に並ぶサーバ 写真1:オフィスの床に並ぶサーバ

 デジタル機器が吐き出す特有の熱気と、オルガン曲の通奏低音のように地べたをはうファンの騒音が、ドアの内側の空気を外の世界とは別物にしている。いや、それだけではない。若い才能が、ほとばしる情熱を体中に収め切れずに発する熱気もいくばくかは含まれているのだろうか。

 8畳ほどのワンルームの1室には、いく台かのサーバ(台数は非公開、一部はホスティングに運用を任せている)が並べられており、ハードディスクのアクセスランプが忙しげに点滅している。その横で、ジワジワと肌を包み込むような熱気と通奏低音に包まれながら話を聞いた。

転載許可のための飛び込み営業からスタートした

 まずは、Weblioを「バーティカル検索」という面で見ていこう。というか、これはもう説明の必要はないだろう。ネット上に点在する辞書、百科事典、用語事典をここのサイトから一気に検索できるのだから、そのものズバリのサービスといえよう。

 ただ、そのためには、元ネタとなる辞書、百科事典、用語事典を、転載するために集めなければならない。「Weblio登録辞書一覧」を見たとき、まさか勝手に情報を引っ張ってきてはいないと思うけれど……、と半信半疑でいたのだが、取材を始めて開口一番その点を聞いた。

 「最初に集めた辞書は、飛び込み営業のような形で電話や訪問をして許可をもらってから、サイトに掲載した」(辻村社長)というから、IT企業といえどもリアルな世界では泥臭い営業マンさながらの動きをしていることに、ちょっと驚いた。

 ただ、昨年の9月から準備を開始してサイトを公開するまでの2006年の1月の間は、先方に見せられる実体がないわけだから「やろうとしていることが全然理解してもらえなかった」(辻村社長)という苦労もあった。

実態としてのWeblioスタート後に急増した参加辞書

 しかし、三省堂、読売新聞オンラインといったあたりは快諾してくれたそうだ。そして、1月から15種類の辞書、百科事典でサイトをスタートし、3月の30種類程度にまでなったころから、急激に参加辞書が増えてきた。

 やはり、実際にサイトがスタートして、そこにさまざまな辞書や百科事典が集まっている様子を見せると、先方の理解も早くなるわけだから、当然であろうか。また、辞書を提供する側からすると、基本的にリスクはないわけだし、若いベンチャー起業家が足を運んで、仁義を切っているのだから、むげに断るわけにもいかないだろう。

 辞書や百科事典の出所先にキッチリと許諾を得るあたりは、礼儀に厚い日本的ビジネス慣行の一例といえなくもない。というのは、「バーティカルサーチはGoogleBaseにどう対抗していくのか?」で紹介されている、米国のSimplyhired社などは、元ネタになる商売の情報が“求人情報”で辞書とは意味合いが異なるとはいえ、「グーグルも同じことをやっているから大丈夫」と、Monster.comやYahoo! Hotjobsなどの大手求人サイトだけでなく、企業の求人ページのデータをクローリングして許諾を得ないで集めているわけだから、考え方の落差を大いに感じるのだ。

 辻村社長としては、米国の例のように元ネタである辞書などを勝手に自社ビジネスに使う気はないようだ。というのは、辞書によってはその内容に関する権利関係が複雑に入り組んでいるものもあり、トラブルが発生して出鼻をくじかれたくないという思いが強い。まあ、実際問題、権利関係でクレームが付いた場合の解決処理は、非常に消耗する。

 そのようなわけで、モノによってはWeblioに掲載されるまでに、かなりの時間を必要とするものもある。例えばプロ野球12球団の情報が閲覧できる「12球団データベース」などは、各球団すべてに許諾を得に出向いたというから大変だ。ただ、そのかいあって、各球団の情報表示ページには、それぞれのロゴマークを載せることができるという、うれしい副産物もあった。ロゴマークがあるだけで、オーソライズド感が漂い信ぴょう性が増すというか、サイト内の情報に重みが出る。

情報掲載までの手間にかける想い

 さて、「マッシュアップ」という視点でWeblioを見た場合は、どうだろうか。ネットのかいわいでマッシュアップというと、グーグルマップスAPIやアマゾンのWebサービスといったものを利用したサイトが真っ先に頭に浮かぶが、実際、マッシュアップの語源となった、音楽の「Mash Up」をひも解いてみると、もっともっと幅の広い意味に解釈できる。

 Mash Upは、複数の有名アーティストのCDから気に入ったパートやフレーズなどを、デジタル楽器にサンプリングし、それをデジタル技術を駆使してリミックス(再編集)することで、新しい曲を作り出す方法をこう呼んでいる。つまり、音楽におけるMash Upの始まりは、他人が作った楽曲の一部を切り取って上手に組み合わせることで、自分のオリジナルを作ってしまおうというものだ。

 ならば、Weblioも立派なマッシュアップだ。ネットに点在する辞書や百科事典という要素を組み合わせて、さらに付加価値の高いサービスを生み出そうという試みは、グーグルマップスという当たり前のマッシュアップよりも、アンダーグラウンドなクラブで、先端DJが自分のリミックスを、誇らしげにMash Upと呼んだときの息吹を感じすがすがしい。

写真2:ウェブリオを運営する5人。左から技術の佐々木氏、辻村社長、マーケティング担当の森氏、編集の柳沼氏、営業の梶川氏 写真2:ウェブリオを運営する5人。左から技術の佐々木氏、辻村社長、マーケティング担当の森氏、編集の柳沼氏、営業の梶川氏

 Weblioで表示される内容はすべて、元ネタから引っ張ってきたものをただ機械的に表示しているのかと思っていたのだが、それは認識が間違っていた。「同じキーワードで複数の辞書内容を表示させる場合、その順番を決めたりするのは手作業による編集」(辻村社長)になるそうだ。そのために専任の編集担当がいる。

 また、同じキーワードでもまったく意味の異なるものを同じページに表示させないようにするための作業も必要になる。例えば、「Windows」で引くと、マイクロソフトのそれを指す言葉と判断されて、それに関する説明が表示される。ただ、その一方で「Windows」(邦題は「エミリーの窓」)という外国映画の情報が映画関連の用語事典の中にあり、それがマイクロソフトのWindowsと同列に表示されたのではマズイ。

 「同音異義語は、自然言語処理技術を用いて自動的に判別し、分けるようにはしているが、まだまだ精度が低いので手作業による編集が必要になっている」(辻村社長)と明かしてくれた。

1カ月に1回しかアクセスのない92%のページ

 最後にWeblioを「ロングテール」的な見地から説明したい。実は、筆者はWeblioを見た瞬間ロングテールという言葉が真っ先に思い浮かんだ。というのは、これだけ辞書が並んでいると、その中にはめったに閲覧されないキーワードもあるだろうなと思ったからだ。

 特に、掲載している辞書や百科事典が100を超えたいまは、盆栽用語集、ネイル用語辞典、香りの分子事典 などのニッチでマニアック系な用語事典も多数含まれているだけに、縦軸にアクセス数、横軸にキーワードを並べた場合、完全にロングテール型のグラフになるはずだとにらんだのだ。

 案の定「現状で100万ページの言葉が蓄積されている中、約92%は1カ月に1回しかアクセスがない。しかし、それらの蓄積がいまの月間300万ページビューを支えている。グラフにすると完全にロングテール」(辻村社長)と教えてくれた。

 Weblioのやり方はロングテール追求ビジネスの1つのお手本ではないかと思ったりもした。というのは、この手の、辞書や百科事典=コンテンツは、収集の段階で飛び込み営業や許諾を得るなどの手間やコストは発生するが、それさえクリアしてしまえば、その辞書や百科事典=商材は手離れして、後はシステムが面倒を見てくれる。つまり以後のコストは発生しないことになる。

 となると、後は努力して辞書や百科事典=商材を集め、“テール”を延々と延ばすことでひたすらアクセス数を稼ぐことができると思うのだ。辻村社長によると「いまはまだ、日本で提供されている辞書や百科事典の1割も網羅できていないと思う」というくらいなので、今後も辞書などを取り込む努力を続けていけば、テールはどんどんと伸びていくことになる。

 もちろん、アクセス数が増えると設備や回線のコストなどが上昇するであろうが、その前に、増加するアクセスを収益に変えることを急げばいいわけだ。

気になるサービス運営の行方

 そうなると、気になるのが同サービスのビジネスモデルだが、「基本的に広告収入になるだろう」(辻村社長)という。現在同社では、検索結果のページに表示されるアマゾンの関連書籍によるアフィリエイト程度しか収益がないようだが、「年内の目標である1000万ページビューを達成したら本格的に広告を取り入れることも考えている」(辻村社長)そうだ。

 また、広告だけでなく、「Weblioには、あらゆる日本の言葉が集まっているので、それを上手に利用して何かBtoBのビジネスに展開できないか」(辻村社長)という部分も模索している。

 「自分たちで駆けずり回って集めた」(辻村社長)資本金1000万円で立ち上げた同社だが、事の発端は、「会社やりたいね。何しよう? 辞書を集めてみたらどう? それは便利だね」という学生時代の喫茶店での雑談から始まったという。

 とはいえ、パソコンの前に座ったままのマッシュアップによる小手先のサービス構築に終始するのではなく、泥臭いアナログな飛び込み営業から始まるサービス運営をしている点がなぜかほほえましい。まだまだ日本にたくさんあるという未開の辞書や百科事典を、とことん集めてロングテール追求ビジネスを早々に完成させてほしいものだ。

「ものになるモノ、ならないモノ」バックナンバー

著者紹介

著者の山崎潤一郎氏は、テクノロジ系にとどまらず、株式、書評、エッセイなど広範囲なフィールドで活躍。独自の着眼点と取材を中心に構成された文章には定評がある。
「山崎潤一郎のネットで流行るものII」


Copyright© 2018 ITmedia, Inc. All Rights Reserved.

@IT Special

- PR -

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。