
ネットワークコラム:ものになるモノ、ならないモノ(11)
国内の総合辞書検索屋への挑戦者、
ウェブリオとは?
山崎潤一郎
2006/8/10
| 数回にわたる国内のWeb2.0企業シリーズ。第3弾の今回は、100を超える専門辞書の集合体、Weblio。100を超える専門辞書の集合体、Weblio。既存辞書を登録していくという方針は、ユーザー参加型のCGM辞書を超えられるか?(編集部) |
| 総合検索辞書サイト、ウェブリオオフィスの熱気 |
このコラムでは何回かに分けて、Web 2.0周辺の話題をお届けしている(参照記事:Webちらし、国産RSSリーダーと人工知能化の野望、API公開のずいぶん前からすでにWeb2.0でした)。@ITのようなオンラインメディアで何かを取り上げるのであれば、いままさに巣立とうとしている面白いサービスを応援したいという気持ちを持ちつつ、日々ネットをウオッチしている。
そんな中、「バーチカル検索」「マッシュアップ」「ロングテール」といった、最近のトレンドを示す言葉がポンポンと気持ちよく当てはまる格好の取材対象を見つけた。「Weblio」は、ネット上に点在する辞書、百科事典、用語事典のたぐいを一堂に集めた総合検索辞書サイトだ。
昨年、大学を卒業したばかりの辻村直也社長を先頭に平均年齢24.4歳の若い5人組のチーム「ウェブリオ株式会社」が運営しているサービスだが、オシャレでカワイイサイトデザインからスマートなIT企業のそれを連想して訪れた筆者の期待は、見事に裏切られた。渋谷の JR線路沿いに建つマンションのワンルームオフィスに入った途端、その部屋の熱気に気おされてしまったのだ……。
![]() |
| 写真1:オフィスの床に並ぶサーバ |
デジタル機器が吐き出す特有の熱気と、オルガン曲の通奏低音のように地べたをはうファンの騒音が、ドアの内側の空気を外の世界とは別物にしている。いや、それだけではない。若い才能が、ほとばしる情熱を体中に収め切れずに発する熱気もいくばくかは含まれているのだろうか。
8畳ほどのワンルームの1室には、いく台かのサーバ(台数は非公開、一部はホスティングに運用を任せている)が並べられており、ハードディスクのアクセスランプが忙しげに点滅している。その横で、ジワジワと肌を包み込むような熱気と通奏低音に包まれながら話を聞いた。
| 転載許可のための飛び込み営業からスタートした |
まずは、Weblioを「バーティカル検索」という面で見ていこう。というか、これはもう説明の必要はないだろう。ネット上に点在する辞書、百科事典、用語事典をここのサイトから一気に検索できるのだから、そのものズバリのサービスといえよう。
ただ、そのためには、元ネタとなる辞書、百科事典、用語事典を、転載するために集めなければならない。「Weblio登録辞書一覧」を見たとき、まさか勝手に情報を引っ張ってきてはいないと思うけれど……、と半信半疑でいたのだが、取材を始めて開口一番その点を聞いた。
「最初に集めた辞書は、飛び込み営業のような形で電話や訪問をして許可をもらってから、サイトに掲載した」(辻村社長)というから、IT企業といえどもリアルな世界では泥臭い営業マンさながらの動きをしていることに、ちょっと驚いた。
ただ、昨年の9月から準備を開始してサイトを公開するまでの2006年の1月の間は、先方に見せられる実体がないわけだから「やろうとしていることが全然理解してもらえなかった」(辻村社長)という苦労もあった。
| 実態としてのWeblioスタート後に急増した参加辞書 |
しかし、三省堂、読売新聞オンラインといったあたりは快諾してくれたそうだ。そして、1月から15種類の辞書、百科事典でサイトをスタートし、3月の30種類程度にまでなったころから、急激に参加辞書が増えてきた。
やはり、実際にサイトがスタートして、そこにさまざまな辞書や百科事典が集まっている様子を見せると、先方の理解も早くなるわけだから、当然であろうか。また、辞書を提供する側からすると、基本的にリスクはないわけだし、若いベンチャー起業家が足を運んで、仁義を切っているのだから、むげに断るわけにもいかないだろう。
辞書や百科事典の出所先にキッチリと許諾を得るあたりは、礼儀に厚い日本的ビジネス慣行の一例といえなくもない。というのは、「バーティカルサーチはGoogleBaseにどう対抗していくのか?」で紹介されている、米国のSimplyhired社などは、元ネタになる商売の情報が“求人情報”で辞書とは意味合いが異なるとはいえ、「グーグルも同じことをやっているから大丈夫」と、Monster.comやYahoo! Hotjobsなどの大手求人サイトだけでなく、企業の求人ページのデータをクローリングして許諾を得ないで集めているわけだから、考え方の落差を大いに感じるのだ。
辻村社長としては、米国の例のように元ネタである辞書などを勝手に自社ビジネスに使う気はないようだ。というのは、辞書によってはその内容に関する権利関係が複雑に入り組んでいるものもあり、トラブルが発生して出鼻をくじかれたくないという思いが強い。まあ、実際問題、権利関係でクレームが付いた場合の解決処理は、非常に消耗する。
そのようなわけで、モノによってはWeblioに掲載されるまでに、かなりの時間を必要とするものもある。例えばプロ野球12球団の情報が閲覧できる「12球団データベース」などは、各球団すべてに許諾を得に出向いたというから大変だ。ただ、そのかいあって、各球団の情報表示ページには、それぞれのロゴマークを載せることができるという、うれしい副産物もあった。ロゴマークがあるだけで、オーソライズド感が漂い信ぴょう性が増すというか、サイト内の情報に重みが出る。
| 情報掲載までの手間にかける想い |
さて、「マッシュアップ」という視点でWeblioを見た場合は、どうだろうか。ネットのかいわいでマッシュアップというと、グーグルマップスAPIやアマゾンのWebサービスといったものを利用したサイトが真っ先に頭に浮かぶが、実際、マッシュアップの語源となった、音楽の「Mash Up」をひも解いてみると、もっともっと幅の広い意味に解釈できる。
Mash Upは、複数の有名アーティストのCDから気に入ったパートやフレーズなどを、デジタル楽器にサンプリングし、それをデジタル技術を駆使してリミックス(再編集)することで、新しい曲を作り出す方法をこう呼んでいる。つまり、音楽におけるMash Upの始まりは、他人が作った楽曲の一部を切り取って上手に組み合わせることで、自分のオリジナルを作ってしまおうというものだ。
ならば、Weblioも立派なマッシュアップだ。ネットに点在する辞書や百科事典という要素を組み合わせて、さらに付加価値の高いサービスを生み出そうという試みは、グーグルマップスという当たり前のマッシュアップよりも、アンダーグラウンドなクラブで、先端DJが自分のリミックスを、誇らしげにMash Upと呼んだときの息吹を感じすがすがしい。
![]() |
| 写真2:ウェブリオを運営する5人。左から技術の佐々木氏、辻村社長、マーケティング担当の森氏、編集の柳沼氏、営業の梶川氏 |
Weblioで表示される内容はすべて、元ネタから引っ張ってきたものをただ機械的に表示しているのかと思っていたのだが、それは認識が間違っていた。「同じキーワードで複数の辞書内容を表示させる場合、その順番を決めたりするのは手作業による編集」(辻村社長)になるそうだ。そのために専任の編集担当がいる。
また、同じキーワードでもまったく意味の異なるものを同じページに表示させないようにするための作業も必要になる。例えば、「Windows」で引くと、マイクロソフトのそれを指す言葉と判断されて、それに関する説明が表示される。ただ、その一方で「Windows」(邦題は「エミリーの窓」)という外国映画の情報が映画関連の用語事典の中にあり、それがマイクロソフトのWindowsと同列に表示されたのではマズイ。
「同音異義語は、自然言語処理技術を用いて自動的に判別し、分けるようにはしているが、まだまだ精度が低いので手作業による編集が必要になっている」(辻村社長)と明かしてくれた。
| 1カ月に1回しかアクセスのない92%のページ |
最後にWeblioを「ロングテール」的な見地から説明したい。実は、筆者はWeblioを見た瞬間ロングテールという言葉が真っ先に思い浮かんだ。というのは、これだけ辞書が並んでいると、その中にはめったに閲覧されないキーワードもあるだろうなと思ったからだ。
特に、掲載している辞書や百科事典が100を超えたいまは、盆栽用語集、ネイル用語辞典、香りの分子事典 などのニッチでマニアック系な用語事典も多数含まれているだけに、縦軸にアクセス数、横軸にキーワードを並べた場合、完全にロングテール型のグラフになるはずだとにらんだのだ。
案の定「現状で100万ページの言葉が蓄積されている中、約92%は1カ月に1回しかアクセスがない。しかし、それらの蓄積がいまの月間300万ページビューを支えている。グラフにすると完全にロングテール」(辻村社長)と教えてくれた。
Weblioのやり方はロングテール追求ビジネスの1つのお手本ではないかと思ったりもした。というのは、この手の、辞書や百科事典=コンテンツは、収集の段階で飛び込み営業や許諾を得るなどの手間やコストは発生するが、それさえクリアしてしまえば、その辞書や百科事典=商材は手離れして、後はシステムが面倒を見てくれる。つまり以後のコストは発生しないことになる。
となると、後は努力して辞書や百科事典=商材を集め、“テール”を延々と延ばすことでひたすらアクセス数を稼ぐことができると思うのだ。辻村社長によると「いまはまだ、日本で提供されている辞書や百科事典の1割も網羅できていないと思う」というくらいなので、今後も辞書などを取り込む努力を続けていけば、テールはどんどんと伸びていくことになる。
もちろん、アクセス数が増えると設備や回線のコストなどが上昇するであろうが、その前に、増加するアクセスを収益に変えることを急げばいいわけだ。
| 気になるサービス運営の行方 |
そうなると、気になるのが同サービスのビジネスモデルだが、「基本的に広告収入になるだろう」(辻村社長)という。現在同社では、検索結果のページに表示されるアマゾンの関連書籍によるアフィリエイト程度しか収益がないようだが、「年内の目標である1000万ページビューを達成したら本格的に広告を取り入れることも考えている」(辻村社長)そうだ。
また、広告だけでなく、「Weblioには、あらゆる日本の言葉が集まっているので、それを上手に利用して何かBtoBのビジネスに展開できないか」(辻村社長)という部分も模索している。
「自分たちで駆けずり回って集めた」(辻村社長)資本金1000万円で立ち上げた同社だが、事の発端は、「会社やりたいね。何しよう? 辞書を集めてみたらどう? それは便利だね」という学生時代の喫茶店での雑談から始まったという。
とはいえ、パソコンの前に座ったままのマッシュアップによる小手先のサービス構築に終始するのではなく、泥臭いアナログな飛び込み営業から始まるサービス運営をしている点がなぜかほほえましい。まだまだ日本にたくさんあるという未開の辞書や百科事典を、とことん集めてロングテール追求ビジネスを早々に完成させてほしいものだ。
| 著者の山崎潤一郎氏は、テクノロジ系にとどまらず、株式、書評、エッセイなど広範囲なフィールドで活躍。独自の着眼点と取材を中心に構成された文章には定評がある。 「山崎潤一郎のネットで流行るものII」 |
ネットワークコラム:ものになるモノ、ならないモノ バックナンバー
- 第1回 社内ブログはナレッジマネジメントとして機能するか
- 第2回 1ギガ、本当に「現時点ではそんなもん不要」なのか?
- 第3回 ライブドア無線LANに疑問をぶつけてみました
- 第4回 IrDA、Bluetoothを反面教師にしたZigBeeの実力は?
- 第5回 月額1000万円が300万になる新・映像配信って?
- 第6回 一家に1つのレイヤ2ネットワークの時代はやってくるか
- 第7回 ネットの“あちら側”から迫る見えない亡霊をどうする?
- 第8回 Pマークは暗黒な大人社会の印籠以上になれるか?
- 第9回 API公開のずいぶん前からすでにWeb2.0でした
- 第10回 Webちらし、国産RSSリーダーと人工知能化の野望
- 第11回 国内の総合辞書検索屋への挑戦者、ウェブリオとは?
- 第12回 集合知の独自検索で真実を導く、Kizasi
- 第13回 マイクロフォーマット=Web2.0の真打ちとなるか?
- 第14回 電力線というありモノでLAN構築!の現在過去未来
- 第15回 FONはAP持ち寄り型のWiFiコミュニティを形成するか
- 第16回 セカンドライフと実社会の経済格差=100倍の価値は
- 第17回 次々と中小企業がネットビジネスから脱落する理由
- 第18回 プロバイダが考える安全なファイル転送のかたち
- 第19回 「はてな」を作り出す人的ネットワークの仕組みとは
- 第20回 携帯メールポータビリティは開国を迫る黒船となるか
- 第21回 マッシュアップの落とし穴。誰がために結び付けるのか
- 第22回 モバイルビジネスのオープン化はこれからが本番
- 第23回 ECネットワークは、ネット紛争の“遠山の金さん”
- 第24回 日本のインディよ! iPhoneにカワイイ系で打って出よ
- 第25回 iPhone 3Gでソフトバンクのネットワークが心配だ
- 第26回 「着うた」とiTunes Storeの直接対決はあるのか
- 第27回 モバイル「レイヤ2」の付加価値がもたらすメリットとは
- 第28回 2010年、本当にプロバイダビジネスは崩壊するのか?
- 第29回 Androidのオープン性でガラパゴスから脱出しよう
- 第30回 霞ヶ関も導入する!?クラウドの本質を理解する
- 第31回 ニッポンのiPhoneアプリヒットメーカーたちに続け!
- 第32回 WiMAXのカバー率が7割になった2010年を想像しよう
- 第33回 iPhoneSkypeとケータイ、通話に向いてるのはどっちだ
- 第34回 検索全盛の時代だから、ドメインの有用性を考えよう
- 第35回 2012年、2000万ユーザーが2カ所に集中するとき
- 第36回 iPhoneアプリに広告を挿入してガッチリもうけるのだ
- 第37回 iPhoneアプリ内課金導入でガッチリもうけるのだ
- 第38回 Androidアプリはビジネスになるのか
- 第39回 電子出版をめぐる4つの疑問
- 第40回 App Storeの運営方針は第2ステージへ
- 第41回 iPad、モバイルルータや電子書籍へのインパクトは?
- 第42回 フェムトセル無料配布で浮上した「ただ乗り」問題
- 第43回 インディ開発者よ、「ドコモマーケット」で稼ごうぜ!
- 第44回 「韓ドロイド」に見る1年後のAndroidアプリビジネス
- 第45回 エモーショナルな文字入力を可能にした「7notes」
TechTargetジャパン
- 実機では測定できない性能を測定? (2012/2/7)
システムの完成前に、達成し得る性能値や必要なサーバリソースを知るには? その解となる「性能シミュレーション技法」を解説 - 性能チューニング個所の検討 (2012/1/30)
アプリのチューニングや環境増強で、どの程度改善が見込める? 今回からは「実際に活用できる性能対策」を解説します - 遅いところを直すだけでいいのですか? (2012/1/24)
負荷が集中したときの性能ボトルネックを改善するのに、アプリケーションサーバとDB、どちらを優先すべきでしょう? - cloudfoundry.comを使ってみよう (2012/1/19)
VMwareが提供するPaaSプラットフォーム「CloudFoundry」。注目を集めるこの基盤を活用してPaaSを構築!
|
|
キャリアアップ
スポンサーからのお知らせ
- - PR -
イベントカレンダー
- - PR -


