CRMの実践におけるデータマイニングの効果(第2章)マーケターのためのデータマイニング講座(1/2 ページ)

» 2001年10月10日 12時00分 公開
[村田悦子(エス・ピー・エス・エス株式会社),@IT]

 第1章では、オペレーショナルCRMとの比較において、企業戦略におけるアナリティカルCRMの役割と重要性を考察しました。次に、アナリティカルCRMの土台となるデータマイニングの定義を示し、最後に、データマイニングを成功させるために一番重要なのはビジネス知識であることを確認しました。

 第2章では、ビジネス課題の解決を主眼としたマーケティングや経営の観点から、データマイニングの効果を検証します。技術面での詳細な説明は第3章と第4章で行います。

1.ビジネスに不可欠なナレッジの“発見”と“予測”

 第1章で、一般的なデータマイニングの定義とは別に、「手持ちのデータから、再利用可能な汎用的ビジネスルールを科学的に導き出す」という、データや手法ではなくビジネスに焦点を当てたもう1つの定義を提示しました。データマイニングがビジネス問題を解決すると期待されている理由は、経営上の意思決定に欠かせないナレッジの発見と、それを基にした施策の立案に役立つからです。

 企業のナレッジは、以下の3つのカテゴリに大別されます。

  • 過去に関するナレッジ − 安定、大量、比較的正確
  • 現在に関するナレッジ − 不安定、少量、比較的不正確
  • 未来に関するナレッジ − 不確実、計量困難、仮説的

 データマイニングは、豊富で正確な過去のデータからナレッジを発見してそれを現在の状況と企業目標に照らし合わせ、未来に関する不確実性を減少させます。具体的には、発見と予測という2つの役割があり、そのどちらが欠けても、ビジネス問題解決のためにデータマイニングを利用する意義は大きく損なわれてしまいます。

 まず発見して、予測し、その結果を基にアクションを起こすことでビジネスプラクティスが改善されます。これが利益を生み出すデータマイニング活用の仕組みです。この仕組みがうまく機能するためには、担当者の業務知識とデータマイニングソフトの性能、さらに企業力が不可欠な要素となります。予測結果を基に最適なアクションをタイムリーに決定し実行するには、機動力と、マイニングプロジェクトの重要性に対する社内コンセンサスが必要だからです。

 

ナレッジの発見

 それでは、クロスセルを促進する目的でよく使われるマーケットバスケット分析を例に、発見と予測のプロセスを体験してみましょう。

 図1はSPSS社のデータマイニングソフト「Clementine」の画面です。「Clementine」では、画面下部のソースパレットの中から、必要な機能を持ったアイコンを上部のストリーム領域に順に配置して、矢印でつなぐことによりマイニングプロセスを構築していきます。こうしてできたプロセス図をストリームと呼びます。ストリームは、マイニングを行った人間の思考プロセスを模しているといえます。この意味から、ストリームは意思決定者の複雑なヒューリステッィクスを簡潔に描写したものでもあります。

図1 Clementineの画面。ほとんどすべての操作がマウスのみで行えるのが特徴[画像拡大] 図1 Clementineの画面。ほとんどすべての操作がマウスのみで行えるのが特徴[画像拡大]

 このストリームはECサイトでの購買履歴データと会員データから、商品同士の関連性を探り、そこから発見されたナレッジを基に予測を行うまでのプロセスを記述しています。データは図2のような形に整形されています。通常時系列で蓄積されている購買履歴データを、会員ごとに1行とする横並びデータに変換し、商品は大分類を用いて、それぞれ購入の有無を示す2値のフラグ(T/F)を与えてあります。さらに会員データから顧客のデモグラフィック属性(性別、年齢、所得など)が追加されています。このようなデータ処理機能は通常マイニングソフトに装備されているので、エンドユーザー自身がクライアントマシン上で行うことが可能です。

図2 データには顧客のデモグラフィック属性と購買履歴が含まれている[画像拡大] 図2 データには顧客のデモグラフィック属性と購買履歴が含まれている[画像拡大]

 ここでのビジネス課題を、「1顧客当たりの購買品目数を増やすことによる増収」としましょう。クロスセルといわれる販売手法です。

 クロスセルを効果的に行うためには、次のようなことについて調べる必要があります。

  1. 商品の併買傾向を知り、顧客ごとに追加購入を促して効果のある商品を決定する
  2. 特定の商品について勧めて効果のある顧客を選抜する

 ここでは後者の例を紹介しましょう。

 併買傾向を知るには通常アソシエーションと呼ばれる手法が用いられます。商品Aと商品Bを購入した人は同時に商品Cも購入する確率が高い、といったルールを発見するものです(図3詳細説明参照)。

図3 ClementineのGRIアルゴリズムでルールを導き出す[詳細説明] 図3 ClementineのGRIアルゴリズムでルールを導き出す[詳細説明]

 これを直感的に理解できるグラフで表したものが図4のマルチウェブグラフと呼ばれるものです。グラフ上の線の太さが、つながれている商品同士の関連の強さを示しています。CD-Rとインスタントコーヒー、ワインと菓子、PCとプリンタとDVD、という3種類の併買パターンが顕著に見て取れます。ナレッジの「発見」です

図4 Clementineのマルチウェブグラフ。太い線でつながれた商品同士はいっしょに買われる傾向にあるもの[画像拡大] 図4 Clementineのマルチウェブグラフ。太い線でつながれた商品同士はいっしょに買われる傾向にあるもの[画像拡大]

 ここで注目すべきはPCとプリンタとDVDを同時購入する顧客でしょう。高額購買者という見地から魅力度が最も高い顧客です。ではこのカテゴリーに属する顧客はどのような共通属性を持っているのでしょうか? 上記の組み合わせで購入した顧客に共通する属性を見つけ出し、同様の属性を持つほかの人に対してクロスセルを仕掛ければ、売り上げ拡大が期待できます。

 このような分析は顧客プロファイリングとして知られていますが、この目的で用いられる代表的な分析手法にディシジョンツリー分析があります。図5はSPSS社の「AnswerTree」というソフトでPCとプリンタとDVDを買った人の属性を分析した結果です(ディシジョンツリー分析は「Clementine」でも可能)。

図5 AnswerTreeによる樹木図。[詳細説明] 図5 AnswerTreeによる樹木図。[詳細説明]

 この分析により「収入の低い(1万6100ドル以下)男性」という共通の特徴が浮かび上がりました。予想外の結果だったのではないでしょうか? 顧客の収入と購入額は比例すると考えるのが自然ですので、理由を探ってみたい欲望に駆られます。ここではその欲望を抑えて結果だけを用いますが、実際にマイニングを行う際に因果関係にまでたどり着くことができれば、さらに深いナレッジの獲得につながります。

ナレッジの予測

 次のステップは「予測」です。図6は、先ほどのストリームに新しい顧客データを適用したものです。このデータには属性情報しかありません。会員登録したばかりでまだ購入経験のない顧客のデータと考えてください。

図6 新しいデータ(basket_j2.sav)を適用したストリームとデータの画面。購入経験のない顧客データであるため、購入商品や金額の項目がない[画像拡大] 図6 新しいデータ(basket_j2.sav)を適用したストリームとデータの画面。購入経験のない顧客データであるため、購入商品や金額の項目がない[画像拡大]

 これに先ほどのモデルを当てはめると図7のような予測結果が出力されます。PCとプリンタとDVDを一緒に買う可能性を示す2つの項目が新たに追加されました。買うか買わないかをT、Fの2値で表した「$C-高額デジタル系」と、その予測の信頼度を示す「$CC-高額デジタル系」です。これでターゲットが特定されました。この属性に当てはまる人に3つの商品をバンドルしたキャンペーンを行うといったアクションが有効と考えられます。

図7 最後の2列が予測結果。先ほどAnswerTreeで行ったのと同じ分析をClementineのディシジョンツリーアルゴリズム「C5.0」で行って予測した[画像拡大] 図7 最後の2列が予測結果。先ほどAnswerTreeで行ったのと同じ分析をClementineのディシジョンツリーアルゴリズム「C5.0」で行って予測した[画像拡大]

 このように、

  1. ナレッジを発見する
  2. 予測を行う
  3. 予測結果からアクションを起こす

という3つのステップでビジネスが改善されます。1と2は人間とデータマイニングソフトとの共同作業です。3はソフトの守備範囲ではありません。人間が予測結果を解釈し、業務知識と経験に基づいて最適なアクションを決定します。さらにそのアクションがタイムリーに徹底的に運用される機動力が企業に備わっていれば、データマイニングから目に見える利益を上げることが可能になるでしょう。

       1|2 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ