Watson Analyticsのテーマは、データ分析という作業をなくすこと「夢の人工知能」ではない

IBMが2014年12月18日に提供開始したデータ分析クラウドサービス「IBM Watson Analytics」。人工知能がデータ分析に基づき、ビジネスの問題に正しい答えを出してくれるというイメージを抱くのなら、それは誤りだ。このサービスの価値は、ビジネスの現場にいる人たちが、事実上データ分析作業をしなくても、データから知見を得られることを目指している点にある

» 2014年12月24日 09時00分 公開
[三木 泉@IT]

 日本IBMは2014年12月18日、データ分析のクラウドサービス「IBM Watson Analytics」の正式提供開始を発表した。提供開始されたのは、無償版とパーソナル版(月額4158円:税別)。日本語には未対応。何らかの形で「エンタープライズ版」(とおそらく呼ばれるだろう)が提供されるはずだが、その提供時期およびサービス内容を同社は公表していない。

 Watson Analyticsのテーマは、企業や組織のあらゆる人々が、ビジネスにデータを活用できるようにするということ。この点では、「セルフサービスBIツール」などと呼ばれるものと共通だ。そうした製品との大きな違いは、「データ分析作業をやさしくする」のではなく「データ分析作業をしなくて済む」ことを目指していることにある。データ分析のノウハウを持たなくても、他の人たちがつくるダッシュボードを受動的に見るだけでなく、ある程度能動的に知見を得られるようになっている。

 日本IBMは、「ビジネスの言葉で質問を入力すれば、データ分析に基づいて答えを返してくれる」というイメージで、このサービスを説明している。だが、これは「Watson君に聞け」的な、夢の人工知能サービスではない。

文章で質問を入力することすら必要ない

 Watson Analyticsの本質は、集計、簡易的なデータ分析、視覚化の作業を、人間に代わって自動的に行う「分析作業代行ツール」だ。実は、文章で質問を入力する必要すらない。データをアップロードすれば、「このデータに関してユーザーが聞きたいと思うだろう質問」についての選択肢を、サービスが提示してくる。

 Watson Analyticsは「Explore(データの探索)」「Predict(予測)」「Assemble(ダッシュボードの作成)」の3つの機能を備える。

 アップロード済みの表計算データを選択して「Explore」を選択すると、クロス集計を自動実行し、言わばピボットテーブルの行と列の様々な組み合わせを選択肢として提示する。そのうちのいずれかを選択すると、該当するテーブルをグラフ化して表示する。下の2つの図でお分かりいただけると思うが、2クリックでデータを視覚化可能だ(これは、米国政府および関連機関のオープンデータを集めたDATA.GOVから取得したxlsx形式のデータに、筆者がクリーニングを行い、Watson Analyticsにロードしたものを使った例)。

「Explore」をクリックした後に対象データを指定するだけで、図のような選択肢が表示される。今回は下段右から2つ目の「What is the relationship between NUMBER OF ESTABLISHMENTS and EMPLOYMENTS by STATE?」をクリック
上記の操作だけで、州別の事業所数と被雇用者数がグラフで表示された

 一方、「Predict」では、データに含まれる変数間の基本的な相関分析を自動実行し、相関性を表示する。

 IBMは、Watson Analyticsが答えられるビジネスの言葉での質問の例として、「今期予算が達成できなかったのはなぜか」「自社の売り上げの主な促進要因は何か」「締結できる可能性が最も高い契約はどれか」「どうすれば自社サービスの解約率を下げられるか」などを挙げている。だが、これらは全て、売り上げ、受注/失注、解約といった要素と、データに含まれる他の変数との相関係数を示すというタスクに翻訳できる。そこで、これらの質問が入力されると、各変数の相関性を視覚化して表示する。つまり、「Watson君がビジネスの問題の答えを返す」わけではない。相関性の強いものをユーザーが優先的に選択できるようにするに過ぎない。

 とはいえ、それなりに複雑な分析にも対応している。単一の変数だけでなく、複数の変数の組み合わせとの相関性を見たい時には、簡単な手順でこれを実行できる。また、事前の分析で、ユーザーの指定した分析テーマに直結はしないが、興味深い(はずの)相関性が特定の変数間に見出された場合には、これをレコメンデーションとして表示する。

「提供しながら徐々に機能強化」

 サポートしているデータ形式は、現在のところ、無償版では.xls、xlsx、.csv形式で、さらに最大50変数/10万レコード以下の、単一のファイルを対象とした分析のみ。複数ファイルにまたがった相関分析などはできない。ただし、500MBのストレージ容量が与えられる。一方、パーソナル版ではストレージ容量が2GBに増加し、データベース接続をはじめとした、図に示されるような機能を持つとされる。だが、サービスサイトには、パーソナル版の機能に関する説明が見当たらず、機能の詳細を確認できない。なお、データの取り込み時に品質チェックを自動的に行い、パーセンテージで品質を示す。データに含まれる外れ値やデータの抜けについては、除外などを自動的に提案してくれるという触れ込みだが、無償版では確認できなかった。

無償版とパーソナル版の機能紹介。パーソナル版の機能については、具体的な情報がどこにも見当たらない

 無償版を短時間試用してみた印象でいえば、米IBMは、多くのコンシューマー向けオンラインサービスと同様、Watson Analyticsを「リーンスタートアップ」的に展開していきたいようだ。まず無償版をできるだけ広めることを目標とし、機能についてはある程度見切り発車で提供しながら、フィードバックを受けて随時改善を進めていくということのように感じられる。

図の下部にあるDataWorksが、Watson Analytics に対してのETL機能を果たすという

 こうしたツールで気になることの1つは、ETLをどうするのかということだ。日本IBMは、クラウドで提供する他のサービスとの組み合わせを推進していくと話している。図にあるように、IBMは「IBM DataWorks」というクラウド上のデータサービスを発表済みだ。このサービスを通じ、クラウド上のデータ管理サービスを経由して、データを取り込む(あるいはライブ接続する)ことになるようだ。オンプレミス向けデータ管理製品との連携も推進していく。

Copyright © ITmedia, Inc. All Rights Reserved.

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。