アットマーク・アイティ @IT@IT自分戦略研究所QA@ITイベントカレンダー+ログ
 @IT > “Clementine 7.1”の新機能を一挙に紹介
 
@IT[FYI] 企画、制作:アットマーク・アイティ 営業企画局
掲載内容有効期限2003年1月17日

 
“Text Mining for Clementine”を携え、
戦略的ビジネス・ツールへと変貌する、
“Clementine 7.1”の新機能を一挙に紹介

 SPSSが誇るデータマイニングツールの最新バージョン“Clementine 7.1”が、2002年12月25日にリリースされる。今回のバージョンでは、既存のClementine ユーザーからの意見や要望が反映され、すでに定評のあったユーザビリティがさらに細部にわたって改善されている。

 そして、今回の目玉ともいえるのが、“Clementine 7.1”のプラグインソフトとして出荷される、SPSS独自のテキストマイニングツール“Text Mining for Clementine”の登場だ。数値型データを主に扱う“Clementine”に加え、テキスト(文書)データを扱う“Text Mining for Clementine”の市場投入により、“Clementine”は、企業が保有するほぼすべてのデータ資産の活用を可能にする戦略的なビジネス・ツールへと進化を遂げている。

 
SPSSが提唱するITの進化過程

 今回の新バージョン、新製品をより深く理解するために、まず、SPSSが概念化している「企業におけるITの進化過程」におけるデータマイニングの位置付け・役割について簡単に説明しておきたい。

 SPSS上級副社長 村田氏によれば、企業におけるIT活用は、「Operational Systems(業務システム)」⇒「Business Intelligence(ビジネス・インテリジェンス)」⇒「Predictive Analytics(予測分析)」という進化の過程(図1)をたどるという。

図1 企業におけるIT活用の進化過程(資料提供:SPSS)

 SPSSの村田氏の説明によれば、企業のIT活用は次のように進化を繰り返すという。

SPSS 上級副社長
村田悦子氏
「一般的に、企業のIT投資は、まず、“業務のシステム化”を目的とした、ERPやCRMなどといった『Operational Systems(業務システム)』に対して行われるようです。その次にくるのが、業務システムで得られたデータをデータウェアハウスなどに取り込み、OLAPツールなどで分析して、企業活動の“現状を把握する”という『Business Intelligence(ビジネス・インテリジェンス)』です。さらに、ここから一歩進むと、『Predictive Analytics(予測分析)』という“将来を予測する”領域に到達します。ここで行う分析は、単なる予測値をはじき出すのための分析ではなく、将来をよりよいものにしていくための戦略的な方向付けとなるものです。SPSSでは、この中心的役割を果たすのが“データマイニング”であると考えています。データマイニングで得られた分析結果をもとにレコメンデーションを行えば、さらに効率のよいCRMを実践することができ、顧客満足度の向上とともに収益の向上が見込めるでしょう。また、分析結果から、今まで思いつかなかったような新たなビジネスチャンスが生まれるかもしれません」

 また、データマイニングが分析対象とする、POSデータのような「数値型データ」は、企業が保有するデータ総量のうち、約20%に過ぎず、残りの約80%は、あいまいで構造化されていない「テキスト(文書)データ」であるということだ。これらのうち、意思決定支援に利用されるのはわずか10%未満であるとの指摘もあるそうで、企業が保有するデータ資産の70%は利用されないまま放置されているという。

 ITの進化過程におけるデータマイニングの果たす役割や企業のデータ保有の実態を踏まえ、SPSSでは、今回、プラグインソフトとして“Text Mining for Clementine”の導入により、“Clementine 7.1”を、テキストマイニング機能を兼ね備えたツールへと進化させた。まさに「Predictive Analytics」の中心的な役割を果たす分析エンジンとして大きくパワーアップしたといえる。これにより、Clementineのユーザー企業は、構造化された数値データだけでなく、非構造型のテキストデータをもフルに活用することができるようになるはずである。

 
“Clementine 7.1”の新機能

 “Clementine 7.1”の新機能/特徴をポイントごとにまとめてご紹介しよう。

  • ストリーム作成時の操作性向上
  • ほかのSPSS製品・他社製品との相互連携性向上
  • レポーティング機能の向上
  • パフォーマンスの向上
  • プロジェクト管理機能の追加

ストリーム作成時の操作性向上

 “Clementine 7.1”では、さらに分析のストリーム作成時の利便性を向上させている。例えば、ノード間をつなぐ矢印などは、ノードをダブルクリックで選択・移動することで自動的に生成されるようになった。また、複数のノードを範囲指定して、切り取り&コピー&ペーストが可能になり、新規ストリームへの展開も容易に行える。そして、ノードが多く、ストリームが複雑になりすぎるのを避ける、「スーパーノード機能」も拡張され、複数のスーパーノードをさらにスーパーノード化するというように、スーパーノード化を何度でも繰り返すことが出来るようになった。つまり、どんなに複雑なストリームであっても、シンプルに表示することが可能だ。

(画面をクリックすると“Clementine 7.1”の新画面全体がご覧になれます
画面1 デザインが新しくなった“Clementine 7.1”のストリーム画面。右上半分のパレットでは、複数のストリーム、分析結果、モデルなどを管理することが可能。また、右下半分のパレットでは、“CRISP-DM”に基づいたプロジェクト管理が可能
(資料提供:SPSS)

 さらに、これまでのバージョンでは、1画面1ストリーム表示であったが、新バージョンでは、画面の右上半分にあるパレット内にタブを設け、タブの選択により、ストリーム表示画面を切り替えることができるようになっている。これで、いくつもの画面を同時に立ち上げる必要はなくなった。画面の配色パターンもいくつか用意されており、ユーザーの好みで切り替えることができる。

PMMLの採用により、他製品との相互連携性を強化

プロフェッショナル
サービスグループ
チーフスタティスティシャン
荒 和志氏

 これまでのバージョンでは、作成したモデルのアルゴリズムはC言語で出力していたが、今回からはData Mining Groupが定めるPMML(Predictive Model Markup Language)に対応している。PMMLとは、ほかのベンダーが提供する、PMML対応アプリケーションとの間で、データマイニングのモデル策定や共有を可能にすることができるXMLベースの言語だ。

 つまり、Clementineで作成したモデルを他社製品であるデータマイニングツールにエクスポートしたり、逆に、他社製品で作成されたモデルをClementineにインポートしたりすることも可能になったということだ。PMMLに対応することで、SPSS製品間に止まらない強力な相互連携性を確保したといえる。既存の分析モデルを活用したい場合には、とくに重視したい点である。

ユーザーの要望を取り入れた、レポーティング機能の充実

画面をクリックすると拡大します
画面2 新たに表示が可能になったデシジョンツリー構造図
(資料提供:SPSS)

 “Clementine 7.1”では、ユーザーからの強い要望もあり、分析後のレポート作成に役立つ機能の向上が行われた。例えば、分析結果を出力する際、グラフの配色を設定したり、三次元で表示させたり、転回させることなどが可能になった。さらに、分析結果をJPEG/HTML形式への変換し、Publish to Web機能を使って「SmartViewer Web Server」にそのまま流し込めば、「SmartViewer」を通じて閲覧することも可能になった。

 また、出力したファイルは、もちろん追加編集を行うこともできる。さらに、Clementineが装備する決定木(C5.0やC&R Tree)の分析結果は、これまでのようなテキスト形式だけでなく、構造が理解しやすい「デシジョンツリー構造図」での表示(画面2)が可能になっただけでなく、資料作成の際にはコピー&ペーストして展開することもできるという。“Clementine 7.1”は、もはや分析ツールというだけでなく、分析結果を意思決定の判断材料として加工する機能をも持ち合わせたビジネス・ツールであるともいえる。

パフォーマンスの向上:最大120%アップ

 年々増加する大容量データを迅速に処理するため、“Clementine 7.1”においても、パフォーマンスを改善するためのチューニングが繰り返されている。ベンチマークテストの結果では、“Clementine 6.5” に比べ、最大120%の処理速度向上が実現できているとのことだ。今後ますます大量かつ複雑なデータを分析する場面が想定されるだけに、処理速度向上という点でも、新バージョンへの期待がもてる。

プロジェクト管理機能の追加

 “Clementine 7.1”では、データマイニングの標準化手法「CRISP-DM」に基づき、作成した各ストリームをプロジェクト単位で管理できる機能が追加された(画面1の右側下を参照)。これにより、複数のストリームやモデル、グラフ・表などを分析工程に沿って、フォルダにまとめて管理できるようになった。例えば、金融業界の与信審査のように、与信対象者のデータ入手から、データクリーニング、分析モデルによる審査結果出力までの一定のワークフローを繰り返し行う場合に、その業務に必要なすべての分析ストリームやモデルなどを任意のフォルダに統合しておくことができるため、効率的に分析作業を進められるし、分析作業全体の管理も容易になる。

 
テキストマイニングを実現する新製品、
“Text Mining for Clementine”

 テキストマイニングの目的は、テキスト(文字)情報をビジネスで使える情報に変換することである。その分析の方向性には2つあり、1つはSPSSが「欧米型」と呼ぶ、情報検索や分類を目的とするもの、もう1つは、「日本型」と呼ぶもので、例えば、アンケートデータの自由回答などのテキスト情報と、属性データをクロスさせてより深い分析を行い、新たな知見を得ようとする方法である。

 今回、“Clementine 7.1”のプラグインソフトとして提供される“Text Mining for Clementine”は、「日本型」テキストマイニングに対応するものであり、テキスト(文書)から、コンセプト(意味をなす最小単位の言葉の集まり)を取り出してくれる。これにより、数値型データと同様に、テキストデータを統計解析、データマイニングなどの高度な分析にかけることが可能になった。ここでは、主な特徴を紹介していこう。

ツール習得やツール間連携のシステム開発が不要

 “Text Mining for Clementine”は“Clementine 7.1”のプラグインソフトとして提供されるため、導入に関しては大きなメリットが得られる。すでにClementineユーザーであれば、1から操作方法を覚える必要はない。また、“Clementine 7.1”と接続するための新たなシステム開発も、当然不要だ。短期間でテキストマイニングツールを導入し、実施したいというClementineユーザーにとっては、“Text Mining for Clementine”は最適な選択であるといえるだろう。

形態素解析において、辞書が不要

 日本語文書のテキストマイニングを実行する場合、一般的には「形態素解析」によって、文章を文節に区切るという「テキストの分かち書き」という前処理が必要となる。“Text Mining for Clementine”では、まず、「茶筅」で形態素解析し、そこで得られた結果のうち、文節とそれぞれに付随する品詞情報をもとに、品詞の組み合わせをルール化することで、特別な辞書を必要とせずに、分析対象として有効なコンセプトだけを効率的に取り出すことが可能となっている。例えば、「初級者」という語句を「茶筅」で形態素解析をすると、「初級」「者」と分解されてしまい、それぞれの語句を個々に扱った場合にはあまり意味をなさないが、「形容詞+名詞=名詞」というルール化をもとに、“Text Mining for Clementine”では「初級者」という語句をコンセプトとして取り出すことができる。

画像をクリックすると拡大します
画面3 Text Mining for Clementineの画像(資料提供:SPSS)

ドキュメント型、サーベイ型いずれも読み込み可能

 テキストデータの保存スタイルとしては、一般的には文章がそのままの状態でテキストファイルとして保存されているドキュメント型か、あるいはアンケートの集計結果のように、属性ごとにテキストデータが表形式で保存されているサーベイ型があげられる。“Text Mining for Clementine”は、いずれの形式のテキストデータであっても読み込むことが可能なので、データの保存形式にとらわれずにテキストマイニングを実行することができる。

 
“Text Mining for Clementine”を利用した分析プロセス例

 “Text Mining for Clementine”を利用した分析プロセスは次の3段階である。プラグインソフトであることから、基本的な操作手順は実にシンプルであることがお分かりいただけるであろう。

“Clementine”に実装されている「CEMI(注)」を利用して、日本語形態素解析ソフト「茶筅」、および“Text Mining for Clementine”をノードとして取り込む
「茶筅」によってテキストデータの形態素解析を行い、さらに“Text Mining for Clementine”でコンセプトを取り出す
回答者属性や販売データなどの構造データ(定量データ)とあわせ、決定木分析など、多様なマイニングを実施

(注)CEMI(Clementine External Module Interface)は、Clementineに実装されている
外部ツールの処理を一連の分析フローに取り込むためのインターフェイス
である

 
今後のテキストマイニング製品ロードマップ

 村田氏によれば、「“Text Mining for Clementine”のベースとなっている、仏LexiQuest社(SPSSが2002年2月に買収)が開発した製品群を、2003年以降、国内で順次リリースしていく予定」だという。

製品名 主な機能
LexiQuest Mine 高速な検索や関連性の発見をサポートする
LexiQuest Categorize 自動的なカテゴリ化を実現する
LexiQuest Respond メッセージ内容を分析、適した回答を選択できる
LexiQuest Guide 自然言語による検索を可能にする

 
“Clementine”の完成形は「Workbench」

 これまで“Clementine 7.1”および“Text Mining for Clementine”の新機能や特徴を紹介してきたが、村田氏いわく、「本来、“Clementine”が目指しているのは『Workbench』となることです。つまり、データマイニングを中心としたデータの予測分析といった業務のすべてを“Clementine”上から行えるということ」だという。これまでもバージョンアップのたびに、操作性やパフォーマンスの改善が図られていたが、今回はそうしたことに加え、SPSSのほかの製品群や他社製品との連携強化や「CRISP-DM」に基づくプロジェクト管理機能といった、データ分析業務に関わるさまざまなニーズを充足する共通基盤としての機能が大幅に拡充されたことからも、村田氏が語る「Workbench」という“Clementine”の目指す将来像を垣間見ることができる。

 “Clementine”は、もはや組織の片隅で分析担当者がデータを分析し、新たな知見を得るためだけのツールではなく、ビジネスのあらゆる局面で、企業資産であるデータの活用を実現するための戦略的なビジネス・ツールへと変貌しつつあるのだ。

“Clementine”の導入をご検討される方へ
・価格については、1サーバ1クライアント 540万円〜
(学術機関向けに導入をご検討の方は、別途お問い合わせください)

・“Text Mining for Clementine”は“Clementine 7.1”のプラグインソフトとなります

SPSSでは、“Clementine”をはじめ、“SPSS WebApp”
“Text Mining for Clementine”など、
SPSS製品に関する各種資料やデータマイニングに関する
各種資料をご用意いたしております。

資料をご希望の方は、SPSSのHP内
資料請求ページ」にてお申し込みください。

●資料一覧

  • CDカタログ(オートデモ、主要製品カタログほか)
  • 事例探求シリーズ
  • Survey Tips
  • SPSS Data Mining Tips
  • トレーニングコース案内
  • SPSS製品各種資料



Index
広告企画:実践e-CRM 〜 SPSS製品 導入事例探求シリーズ
 
第1回
 
 
 
第2回
NTTソルコ編
 
第3回
慶應SFC編
 
第4回
ギャガ・コミュニケーションズ編
 
第5回
住友金属システムソリューションズ編
 
第6回
アサツーディ・ケイ編
 
第7回
東京慈恵会医科大学編
“Clementine 7.1”の新機能を一挙に紹介
 

SPSS 関連リンク集
SPSSホームページ

SPSSプレスリリース

ご購入前の製品に関するお問い合わせ

資料請求に関するお問い合わせ

無料セミナー・SPSSソリューションセミナーに関するお問い合わせ

Index
広告企画:実践e-CRM〜Clementine導入効果に迫る


</comment> <tr> <td bgcolor="#EEEEEE"><font size="2"><a href="javascript:KeepIt();"> <img src="/club/keepoint/images/ico_kpt.gif" alt="kee&lt;p&gt;oint保存" border="0" align="absmiddle" width="24" height="18">kee&lt;p&gt;ointで保存</a></font></td> </tr> <comment>

 
@ITトップ@IT Special インデックス会議室利用規約プライバシーポリシーサイトマップ