Twitterからフィードを得て検索結果に統合

発信者の信頼度で重み付けも、グーグルのリアルタイム検索

2010/02/16

 グーグルが米国向けサービスで2009年10月に開始していた「リアルタイム検索」を、日本向けサービスでも開始した。サービスは2月12日から利用可能となっている。Twitterや更新頻度の高いニュースサイトの情報を、数秒から数分という鮮度で検索結果に含める。

 リアルタイム検索のユーザーインターフェイスは2つある。1つは通常の検索を行った後に上部に表示される「検索ツールを表示」をクリックし、左ペインにオプションを表示。ここで「アップデート」や「最新」を指定して検索対象を絞り込む方法だ。

 加えて、通常の検索を行った場合でも、その検索クエリに含まれるキーワードが“ホット”であると判定された場合には、検索結果の一部に小さなウィンドウが区切られ、ここに随時最新情報が流れ込む形でユーザーに提示される。例えば、「常磐線」と電車の路線で検索した場合、通常はWikipediaなどが上位に表示されるが、もし事故による遅延が発生していれば、リアルタイム検索の結果が上位に表示されるようになる。

realtime03.png 最新のニュースの結果が検索結果に表示されるようになった
realtime04.png オプションで「最新」を選択すると、次々に鮮度の高い情報が表示される。その多くはTwitterへの投稿だ

 2月16日に会見を開いたグーグル 製品開発本部長の徳生健太郎氏は、リアルタイム検索について、その実現のために新たに10以上の技術を開発したという。

realtime01.jpg リアルタイム検索提供に当たって新たに開発した10の技術

 例えば、投稿者のフォロワー数やRT(リツイート)率、引用されている頻度などから投稿者の信頼性を計算し、「ページランクに近いもの」(徳生氏)による重み付けを行っているという。「同じ発言でも、注目されているものもあれば、そうでないものもある」(同氏)。

 リアルタイムに結果を提供するに当たって、リアルタイムのURL解析機能も新たに実装したという。Twitterへの投稿には多くのリンクが含まれているが、こうしたリンクについてフィッシング詐欺など悪質サイトでないかどうかや、発言に関係したページ内容であるか、チェックしているという。

 リアルタイム検索の結果に多く出てくるのは、今のところTwitter投稿が中心だが、Google Buzzにも対応するほか、今後は「Amebaなう」など日本のマイクロブログサービスにも対応していきたいとしている。Twitterからは俗に“ファイアホース”(fire hose)と呼ばれるStreaming APIによるフィードを受けている。フィードの数量や契約条件については未公開だが、こうした特殊なAPIをグーグルやマイクロソフトに提供することが、Twitterの1つの収益源となっていると見られている。パブリックなWeb上をクロールするだけでは得られない効率の良さが、Streaming API利用のメリットだ。

 徳生氏によれば、グーグルが把握しているインターネット上の情報量は6年前で5EB。それが2009年半ばには281EBと60倍にも膨れ上がっているという。こうした大量の情報と、ユーザーからの検索クエリを関連付けるのは、今でも大きな技術的チャレンジであると強調した。

realtime02.jpg グーグル創業時のサーバの写真を示しながら、これまでグーグルがクロール頻度を「毎月→毎週→毎日」と縮めてきたことを説明する徳生氏

(@IT 西村賢)

情報をお寄せください:

HTML5 + UX フォーラム 新着記事
@ITメールマガジン 新着情報やスタッフのコラムがメールで届きます(無料)

キャリアアップ

- PR -

注目のテーマ

ソリューションFLASH

「ITmedia マーケティング」新着記事

SDGsの取り組みが認知されると、生活者の7割が行動を起こす――電通PR調査
SDGsの認知率は約4割。前年比15.6ポイント増と大きく伸長しています。今企業が取るべきア...

「中古品の購入・使用への抵抗感」が増加 コロナ禍の影響か――メルカリ調査
メルカリによる定点調査。利用者が増え続けるフリマアプリですが、コロナ禍の消費者心理...

「BOTANIST」を生んだI-neが上場 強いブランドの秘密とは?(無料eBook)
「BOTANIST」運営のI-neが東京証券取引所マザーズに上場。テクノロジーとマーケティング...