情報フィルタリング(じょうほうふぃるたりんぐ)情報マネジメント用語辞典

information filtering

» 2006年12月22日 00時00分 公開
[@IT情報マネジメント編集部,@IT]

 大量の情報の中から、ユーザーにとって必要な情報を取り出し、不要な情報を除外する処理を自動的に行う技術のこと。要・不要の2つに分けるほかに、情報に重要度や類似度などのメタ情報を加えて重み付けを行うものも含まれる。

 情報群から特定の情報を取り出す技術としては、情報検索(information retrieval)が古くから知られるが、これはユーザーが発するアドホックな要求(検索命令)に対してコンピュータがデータを返すというインタラクティブなモデルである。これに対して1990年代になって、大量の情報がインターネット上を行き交うようになると、ユーザーが事前に設定した要求(プロファイル)に合致する/しないによって情報を自動的に選別するモデルが提唱された。このような情報選別に用いられる技術を総称して、情報フィルタリングという。

 広義には情報の収集と排除の双方を含むが、「情報フィルタリング」という語は情報収集・推薦だけのニュアンスで使われることが少なくない。逆に単に「フィルタリング」「コンテンツフィルタリング」という場合は、有害情報や迷惑情報の遮断・排除の意味で使われることが多い。

 情報フィルタリングの分類方法や具体的な技術はさまざまだが、情報収集・推薦の技術としては、「内容に基づくフィルタリング」「協調フィルタリング」がよく知られる。また情報遮断・排除としては「レイティング」「ブラックリスト」「ホワイトリスト」「キーワード/フレーズ」という分け方で説明することが多い。

 フィルタリングは検索エンジンにとっても、ユーザーの望む情報(あるいはユーザー自身が気付いていない興味や関心)を適切に“レコメンデーション”する技術として重要だが、逆に“検閲”もできるため、そうした点で批判や議論も多い。

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ