アソシエーション・ルール(あそしえーしょん・るーる)情報システム用語事典

association rule / 相関ルール

» 2005年04月18日 00時00分 公開
[@IT情報マネジメント編集部,@IT]

 ある事象が発生すると別の事象が発生するといったような、同時性や関係性が強い事象の組み合わせ、あるいはそうした強い事象間の関係のこと。

 データベースに蓄積された大量のデータからアソシエーション・ルールを抽出する技術をアソシエーション・ルール抽出、あるいはアソシエーション分析という。マーケットバスケット分析に利用される。

 アソシエーション分析では、POSシステムなどで収集された大量データを一定のアルゴリズムに基づいて処理することで、「パンとバターの同時購入者の90%はミルクも購入する」というような結論を導き出す。こうしたアイテム(商品)の組み合わせがアソシエーション・ルールで、アソシエーション分析機能を搭載する多くのデータマイニングツールでは、

 [パン, バター]⇒[ミルク] (支持度 4%, 信頼度 90%)

というように表現される。このとき、パンとバターが条件部(antecedent:前提部とも)、ミルクが帰結部(consequent:結論部とも)と呼ばれる。条件部、帰結部ともに複数アイテムを含んでいてもよい。

 アソシエーション分析では、トランザクション件数に対する条件部と帰結部の比率から信頼度(confidence:確信度とも)と支持度(support:サポートとも)を算出し、この指標に基づいてルールの重要度を評価する(アソシエーション分析の項を参照)。

 アソシエーション・ルールの表現は明快で、極めて分かりやすく実際のアクションを起こしやすいというメリットがある。ただし、アソシエーション・ルールは「相関(アソシエーション)がある」という事実を示すだけで、その因果律を実証するものではない。

 またアソシエーション分析では、ありふれたルール、当たり前のルールが大量に導き出される。また、表現は明快でも理解不能だったり、背景を洞察できないルールが導出されることも多く、これはデータマイニング以外の手段で調査しない限り、ルールの“真の価値”は判断できない。

 こうした点からも、真の因果関係や顧客行動の背景理解のためには、小売店舗のマネージャなどがルールとして示唆された内容に基づいて仮説を立て、売り場などで実際に検証することが不可欠である。

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ