ビジネスソフト ヒント×テクニック
マーケティング


自由回答データを定量的な切り口で分析するには?

ビーコミュニケーション
加藤 恭子

2006/10/17

Webなどを通じて、顧客や利用者の意見を集めることが簡単にできるようになってきた。しかし、非定型の自由回答データは非常に有意義な意見を得ることができる反面、分析するのに手間が掛かる。手軽に定量分析する方法はないだろうか?

- PR -

 Webや電子メール、ケータイの普及で、幅広くさまざまな意見を募ることが安上がりにできるようになってきました。最近ではブログSNSなどのCGMと呼ばれる口コミ系メディアも花盛りです。

 Webアンケートも広く行われていますが、アンケートの回答は「出題側の仮説に影響される」という制約があり、“意外な発見”にはなかなか結び付きません。

 一方、メールなどで寄せられる自由回答や意見・要望はそうした制約もなく、何かビジネスのヒントがありそうですが定量的な分析ができないという弱みがあります。せいぜい分析者が文章を読んで主観的に解釈するぐらいにしか活用していないのではないでしょうか? あるいは単に死蔵しているだけかもしれません。

 非定型的な自然文を解析する手法として、テキストマイニングが知られています。一般には「高価なツールがないとできないもの」と思われていますが、フリーソフトウェアとして提供されているものもいくつか存在しています。今回はそうしたツールの1つ、KH Coderを紹介したいと思います。

紹介リンク

 KH Coderは、内容分析(計量テキスト分析)やテキストマイニングのためのフリーソフトウェアで、新聞記事や質問紙調査における自由回答項目、インタビュー記録など、社会調査によって得られるさまざまな日本語テキスト型データを計量的に分析するために開発・公開されたものです。

 KH CoderはWindows、Linux、Mac OS Xで動作しますが、以下はWindows版に基づいて話を進めていきます。ダウンロードやインストールなどに関しては上記リンク先を参照していただくとして、以下はKH CoderがPCにセットアップされたところからスタートします。

マイニングデータの準備

 まず、テキストマイニングの対象となるデータの形成を行います。ここでは、サンプルデータとして、Webから入力された問い合わせデータを1行に1人分ずつ入力し、テキスト形式で保存しました。これをinquiry-t.txtとします。

 また、その回答者が大企業/中堅企業/中小企業のどれに所属しているのか、さらに管理職/一般社員なのかという属性を表形式にしたデータ(CSV形式)を用意しました。これをinquiry-v.csvとします。

 inquiry-t.txt/inquiry-v.csvは、ともに架空のサンプルデータです。実際の分析ではファイル名も任意の名前で構いません。

サンプルデータ

分析の開始

 データの整備ができたら、分析を行っていきます。KH Coderを立ち上げ、[プロジェクト]−[新規プロジェクト]を選択、分析対象ファイルにinquiry-t.txtを指定します。指定はドラッグ&ドロップでも可能です。説明(メモ)は入力しなくても構いませんが、今回は仮に「Webからの問い合わせ」と入れました。これで[OK]ボタンを押します。

画面1 KH Coderで新規ファイルを呼び出す

 次に[前処理]−[前処理の実行]を行います。「時間のかかる処理を実行しようとしています。続行してよろしいですか?」というダイアログボックスが出ますので、[OK]ボタンを押してください。今回のサンプルはデータ量が少ないので、十数秒で処理が終わります。サンプルのデータ件数は21件なので、画面の単純集計数と合っているかどうかを確認してください。

画面2 KH Coderメイン画面

 これで処理ができましたので、後はいろいろな切り口でデータを見ていくことができます。例えば、[ツール]−[抽出語]−[品詞別出現回数リスト]を選択すると、以下のようにExcelシートが開きます。このサンプルでは、「価格」という語の出現率が高いようです。

画面3 [品詞別出現回数リスト]で呼び出されたExcelのワークシート

 [ツール]−[抽出語]−[コンコーダンス]を選ぶと、その語がどのような前後関係で出現しているのかが分かります。「価格」という語は、問い合わせをされた方の「他社との価格の比較をしたい」「価格表自体を送ってほしい」という要望の中で登場する場合が多いことが見て取れます。

画面4 特定の語がどのような文脈で登場するのか、一覧できる

 次に別ファイルの外部変数を読み込んでみましょう。[ツール]−[外部変数]−[読み込み]−[CSVファイル]を選択します。そして、inquiry-v.csvを選択します。[ツール]−[文書]−[文書検索]のダイアログボックスで直接入力欄に、「<>会社規模-->中堅企業」と入力して[検索]ボタンを押すと、中堅企業からのコメントだけを抜き出して表示できます。

画面5 条件を指定して回答を検索

 ほんの触りの部分を簡単に紹介しました。KH Coderのもう少し詳しい使い方は、ソフトウェアに添付されているチュートリアルなどを参照してください。

 いままでは単に読むだけであったアンケートの自由回答やWebからの問い合わせを違った切り口で掘り下げることで、新たなビジネスチャンスに結び付く可能性が大いにあります。お客さまの声を、ぜひとも「宝の山」にしてもらいたいものです。

筆者プロフィール
加藤 恭子(かとう きょうこ)
横浜市大卒。青山学院大学院国際政治経済学研究科修士課程修了。アスキー、ソフトバンクなどを経て、ナスダック上場外資系企業のPR/マーケティングマネジャーを歴任。また雑誌などでIT系、資格系の執筆を行う(日経BP社、ダイヤモンド社、ソフトバンクパブリッシング、翔泳社など)。現在、IT系企業、ベンチャー企業のマーコム・PRコンサルティング、テクニカルライティングの仕事を行う「ビーコミュニケーション」という屋号で活動。「オルタナティブブログ」に参加しているほか、マーケティングや転職などの情報を配信する無料メールマガジン「B-zine」を配信中。
オルタナティブブログ「きょこ コーリング」
B-zine

「ビジネスソフト ヒント×テクニック」 − INDEXページへ


ホワイトペーパーTechTargetジャパン

この記事に対するご意見をお寄せください managemail@atmarkit.co.jp

キャリアアップ

- PR -
@IT Sepcial

イベントカレンダー

PickUpイベント

- PR -

アクセスランキング

もっと見る
@IT Sepcial

「ITmedia マーケティング」新着記事

「女の一生」リサーチまとめ
女性の思い描く「なりたい自分」、結婚の新常識、子育てに関して妻と夫の思惑は同じなの...

970x250のサイズで常にメディアのトップに広告を表示、ヒトクセが「Smart Canvas Billboard」を提供開始
ヒトクセは、同社のリッチメディア広告配信プラットフォーム「Smart Canvas」において、D...

「GenieeSSP」がネイティブ広告向け配信APIの提供を開始
ジーニーは、同社のインターネットメディアの広告収益最大化プラットフォーム「GenieeSSP...