内容に基づくフィルタリング(ないようにもとづくふぃるたりんぐ)情報システム用語事典

content-based filtering / 内容ベースフィルタリング

» 2006年12月27日 00時00分 公開
[@IT情報マネジメント編集部,@IT]

 情報フィルタリングの1つで、情報内容とユーザー要求(プロファイル)を比較・照合して、ユーザーが求める情報(文書や商品)を選別する手法のこと。認識フィルタリング(cognitive filtering)ともいう。

 情報収集(あるいは排除)を行うユーザーは、欲しい情報をプロファイルの形で定義する。単純な例では、電子メールで「未承諾広告」という文字列があるものは排除する、ECサイトで好みの分野として「ファッション」を登録することで関連情報が優先的に表示されるようにする、などである。

 非明示的な要求の場合は、過去にユーザーが利用したり、好んだ情報(商品)の内容を分析することでユーザープロファイルを生成する。これを情報(商品)内容をモデル化したコンテンツモデルと比較して、情報推奨を行う。ユーザープロファイルは情報(商品)に対する評価(閲覧や購買など)、コンテンツモデルは情報内容のキーワードやメタ情報(ジャンルなど)を点数化(重み付け)したキーワードベクトルや概念マップなどで表現され、これに基づいて類似度計算を行う。類似度は、ブール計算の場合は真偽値(0 or 1)、ベクトル空間モデルでは連続値(0〜1)となる。そして、設定した閾値以上の類似度を持つ情報が、ユーザーに提示される。

 情報(商品)選好の要素が多数ある場合、要素の組み合わせパターンが非常に多くなり、パターンごとの嗜好(しこう)予測に十分なデータを集めることが困難となる。また、あくまでのそのユーザーが過去に評価した情報を基に推薦を行うため、ユーザーの嗜好変化に追随することが難しいという弱点がある。

 その一方、内容に基づくフィルタリングは協調フィルタリングに比べて、システムを使い始めたばかりのユーザーに対しても情報提供が可能であるというメリットがある。そこで両者の長所を活かしたハイブリッド型フィルタリング(内容ベース協調フィルタリング)を使ったレコメンデーション・システムも登場している。

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ