アットマーク・アイティ @IT@IT自分戦略研究所QA@ITイベントカレンダー+ログ

 @IT > SPSS Clementine データマイニング・ツール導入のススメ
 
@IT[FYI]

 
◆ 実践e−CRM〜Clementine導入効果に迫る
  第1回 データマイニング・ツール導入のススメ

膨大なデータの中に潜む真実を発掘し、
あらゆる企業活動の向上をサポートする
データマイニング・ツール 

SPSS Clementine

目 次
データマイニング・ツールとは
日本市場で高い出荷実績を誇るClementine
Clementineで採用されているアルゴリズム
Clementineの導入のメリット
インターネット・ビジネスにコミット

 商品の需要予測、新商品の開発、CRM(カスタマー・リレーションシップ・マネジメント)の実現 −成功のカギを握るのは、データから導かれた”ファクト”の 検証である。

 膨大なデータの山の中から、人間には見つけにくい“あるパターン”を発見してくれるツール、それがデータマイニング・ツールだ。

 日本市場で好調な出荷実績を誇るエス・ピー・エス・エス株式会社の「Clementine」を取材した。

  データマイニング・ツールとは

 例えばスーパーマーケットを営んでいるとしよう。新しく販売促進企画を立案しなければならない。来店を促進し、顧客の購買単価を上げ、顧客の満足度を高めるような何かを。当然そのために知りたくなるのは、これまでの傾向だ。

 「顧客はいままで何を売っていたときに多く来店してくれたか」「どんな顧客が何時ごろ来店しているか」「顧客は平均何時間ぐらい店内に滞留してくれているか」「顧客は毎日来店してくれているか」「顧客が常に一緒に買うものは何か」「顧客の性別や年代、居住区域と購入品との間に何か相関関係があるか」、いろいろな問いかけが次々と頭に浮かぶ。

 こうしたデータを扱うのはコンピュータの得意技だ。そして、こうした企画者をサポートしてくれるアプリケーションに、データマイニング・ツールがある。

 マイニングとは英語で「発掘」を意味する。膨大なデータの山の中から埋もれた真実を発見するという使命を、このツールは持っている。あらかじめ人間がたてた仮説を検証するのではなく、人間では見つけにくい仮説を発見するのである。

 

日本市場で高い出荷実績を誇る「Clementine」

 米国SPSS社の日本法人、エス・ピー・エス・エス株式会社の「Clementine」もそうしたデータマイニング・ツールの1つである。日本語版が発売されたのは1999年と比較的最近だが、通信業、流通業、金融業、さらにインターネット・ビジネスなどを中心に快調に出荷実績を伸ばしている。なんと売上高ではすでに本社の実績をしのいでおり、Clementineの全売上高の35%が日本市場での販売によるものだという。

 これまでデータマイニング・ツールには“役には立つが、使い方が難しい。統計や数学を学んだ専門の担当者でなければ扱えない”というイメージがあった。しかし、ClementineはGUI機能を重視し、ビジネス・ユーザーのビジュアル・プログラミングを可能にした。

 Clementineでは、“データにアクセスして、フィールドを作成し、棒グラフに展開。また、作成したフィールドで仮説モデルを作成し、精度分析を行う”といった一連のデータマイニング・フローをすべてドラッグ&ドロップ操作で行うことができる。

図1 データマイニングプロセスの各ステップを表したアイコンを使用して、
ストリーム(データが流れるプロセスのビジュアルマップ)を構築

 画面の下方部分には、機能をビジュアル化したアイコンが配置されていて、それらを、その上方部分にあるパレットに並べ、クリックしてつなげるだけなのだ。コマンド入力は必要ない。

図2 プロセスの構築は、パレット画面にアイコンをドラッグ&ドロップするだけ

 例えば、クレジットカード会社が与信リスクを顧客の性別で比較検討したいと思ったとしよう。男性と女性で何か大きな違いはあるのか。データにアクセスしてグループAとグループBに分け、フィールドを作成する。グラフにしてみると大した差はなかった。

 そうした場合には、いったんパレット上のアイコンを捨てて、今度は年代別ではどうか、職業別ではどうかといった具合に、Clementineを利用する人のアドホックな思いつきによるインタラクティブな操作が可能だ。

図3 利用者のアドホックな思いつきで容易に操作できる
Clementineのパレット画面

 こうしたスピーディな作業を可能にしているのがイン・データベース・マイニングという技術である。これはデータソースのあるデータベースに対してSQLを投げるというもの。Clementineに抽出する前に、データベース側で処理できることは処理させてしまうという発想だ。

 また、Clementineには2つのモードがあって用途に応じて使い分けられる。デフォルトはセッティング項目の少ないビジネス・ユーザー向けのモードになっているが、ある部分をもう少し詳細に見てみたいというときは、エキスパート・モードを利用することができる。

 “利用者がClementineの機能を学んでいくうえでも、この2つのモードは有効”と、エス・ピー・エス・エス株式会社 ビジネス・インテリジェンス事業部担当 上級副社長の村田悦子氏は語る。

 「まずデフォルト・モードでだいたいのアウトラインを学んでいただき、より詳しく機能を知りたくなったら、エキスパート・モードに進んでいただくというのがClementineの効率的な上達法だと思います。英語を学ぶ場合でも最初から完璧さを目指して、文法をがんがん詰め込まれては嫌になってしまいますよね。それと同じです」。つまり、利用者のステップ・アップを2つのモードで後押しするのがClementineというわけだ。

 利用者の利便性という点では、日本アイ・ビー・エム株式会社のデータマイニング・ツール Intelligent Minerと連携できることもセールス・ポイントだ。内部のデータマイニング・アルゴリズムは両製品でクロス・オーバーする部分があるのだが、Clementineの分かりやすいGUIからIntelligent Minerの機能を使いたいという顧客は多く、この提携は大きく評価されている。

 

Clementineで採用されているアルゴリズム

 Clementineで採用されているモデリング・アルゴリズムは、大きく分けて5つある。

  1. 予測および分類のためのニューラル・ネットワーク(MLP、RBFN)、ディシジョン・ツリーおよびルール帰納法(C5.0、ID3)、線型回帰
  2. クラスタおよびセグメント化のためのKohonenネットワークとKmeans法
  3. 関連性の検出のためのGRI、Apriori、Webグラフ
  4. これらのアルゴリズムを複合化することもできる
  5. すでに利用者が有しているカスタム・アルゴリズムに対してインタフェイスを提供することもできる

 こうして得られた仮説の精度は80数%から90%を誇るという。個々のアルゴリズムについて詳細に言及すると切りがないので、ここではニューラル・ネットワークとディシジョン・ツリーのみを簡単に説明しておく。

 ニューラル・ネットワークとは、人間の脳の構造をまねて作った情報処理機構のこと。これによって、人間が得意とする「パターン認識」や「連想記憶」などの処理を効率よく行うことができる。

 一方、ディシジョン・ツリーは、人間が意思決定の際に意識することなく行っている条件分岐の情報処理機構だ。その構図は逆向きの樹木図に似ており、下へ行くほど複雑な様相を呈する。

 このディシジョン・ツリーに関しては、エス・ピー・エス・エス株式会社がAnswer Treeというオプション製品を用意している。CHAID、Exhaustive CHAID、C&RT、QUESTといったアルゴリズムで、データの中に潜むセグメントやパターンを迅速に識別することができるというものだ。

 Clementine Solution Publisherというオプション製品もある。Clementineのデータマイニング・プロセスをC言語やSQLとして生成するツールだ。これによって、Clementine利用者が構築した仮説を、企業の基幹系システムや情報系システムの中で展開することが可能になる。

 さらに、出力されたCコードをJavaでコンパイルすることによって、Webアプリケーションで利用できるようになる。つまり、顧客のパーソナライゼーション、One-To-Oneマーケティングが急務となっている、エレクトロニック・コマースにも適用できるというわけだ。

 

Clementineの導入メリット

 ここまで概要を見てきたが、ではデータマイニングツールを導入すると具体的にどういう効果があるのだろう?村田氏は端的な例としてアスクルの事例を挙げる。企業で利用する文房具やOAサプライ用品などを迅速に配達することで急成長しているアスクルは、データマイニングにより販売傾向の中にあるパターンを見つけた。

 “CD-Rディスクをたくさん買ってくれる顧客は、インスタント・コーヒーも買ってくれる確率が高い”

 このパターンから、アスクルはCD-Rをたくさん利用する会社といえば、システム開発を行うIT関連企業であり、遅くまでの残業または徹夜も辞さないため、インスタント・コーヒーの消費量が多くなるという仮説を立てたのだ。

 あるシンクタンクでは、カードの不正利用のチェックにClementineを利用した。これまではあまりにもデータが膨大なためランダム・サンプリングによるチェックしか行えなかったのだが、両者の結果を比較するとClementineの導入効果は明らかだった。不正利用発見の精度が上がったうえに、年間約2000万円もの人件費削減が実現したというのである。

 ダイレクト・メールのレスポンス率を大幅に向上させたという実績もある。通常の場合、一般的なダイレクト・メールの発送によって顧客から何らかの反応が返ってくるのはほんの数%といわれている。

 ところが、Clementineで顧客の購買傾向を分析し、その顧客に合った商品についての情報を提供したところ、米国での例ではレスポンス率が2倍以上になったとのこと。これはすでに複数のケースで実証されており、顧客のパーソナライゼーションの重要性を端的に物語っている。

 Clementineを導入した有名な顧客にSofmap.comがあるが、これは次回にその導入プロセスも含めてじっくりレポートしたいと思う。

 

インターネット・ビジネスにコミット

 村田氏は“これからの期待分野はインターネット・ビジネス”と語る。

  「Webサイトにはアクセスログや顧客の属性情報などさまざまなデータがすでにきれいな状態でそろっています。詳細な分析が可能ですから、Clementineで発見できることも多い。インターネット・ビジネスを手がけられている企業を積極的に支援させていただこうと考えています」

 この春登場する新バージョンの「Clementine 6.0」では、C&RT、ロジスティック回帰・因子分析などといった統計アルゴリズムが新たに加わり、SASデータのインポート/エクスポート機能や精度分析グラフ機能なども追加される。

 企業の基幹業務分析からマーケット調査、インターネット・ビジネスのパーソナライゼーションまで、今後ますますSPSS Clementineの出番は多くなっていきそうだ。

 

Index
広告企画:実践e-CRM〜Clementine導入効果に迫る
第1回 データマイニング・ツール導入のススメ
第2回 導入事例:株式会社ソフマップ
  第3回 Clementine 6.0が登場
  第4回 ソリューションテンプレートなら「自分にもできる!」
第5回 テキスト・マイニングに活用されるClementine

 


データマイニング・ツールに関するアンケートにお答えください
抽選で5名様に1万円分の図書券をプレゼントいたします

アンケートはこちら

 
関連リンク集

NEWS

(株)ソフマップがオンラインショップサイト「Sofmap.com」のレコメンドエンジンの構築にSPSSデータマイニングツール「Clementine」を採用

(2000年11月01日)
(株)NTTダイナミックテレマがデータベースマーケティング事業のコアツールとして日本IBM/SPSSによる統合型データマイニング・ソリューションを活用したデータ分析サービスを提供


KDnuggets社の調査でClementineが急速な延びを記録。SPSS社のデータマイニングツールがKDnuggets社のホームページ上での調査でトップに


SPSS各種問い合わせ

ご購入前の製品に関するお問い合わせ

資料請求に関するお問い合わせ

無料セミナー・SPSSソリューションセミナーに関するお問い合わせ


トレーニング

SPSSトレーニング・コース

統計コース

アプリケーション・コース

Clementine初級編


</comment> <tr> <td bgcolor="#EEEEEE"><font size="2"><a href="javascript:KeepIt();"> <img src="/club/keepoint/images/ico_kpt.gif" alt="kee&lt;p&gt;oint保存" border="0" align="absmiddle" width="24" height="18">kee&lt;p&gt;ointで保存</a></font></td> </tr> <comment>

 
@ITトップ@IT Special インデックス会議室利用規約プライバシーポリシーサイトマップ