Special
» 2017年04月17日 07時00分 公開

「まずはOracle Cloudでお試し」も可能:「Oracle Advanced Analytics」で今すぐ「機械学習」を始める! 既存データベースをそのまま使えて“便利”で“高速”、そして“簡単” (2/3)

[PR/@IT]
PR

Oracle Databaseのオプションとして機械学習ツールを提供

 オラクルは、Oracle Database Enterprise Editionに向け、高度なBAを実現するためのオプションとしてOracle Advanced Analyticsを提供している。Oracle Advanced Analyticsには、Oracle Databaseと連携してデータマイニング処理やデータモデルの作成を行う機能を備えた「Oracle Data Mining」、統計分析ツールRの機能や多彩なアルゴリズムをOracle Database上で利用できる「Oracle R Enterprise」が含まれる。

高度なBAを実現するオプション「Oracle Advanced Analytics」

 Oracle Data Miningは、予測分析のための11種のアルゴリズムを用途別に最適化しており、データの欠損値補完や学習に用いる属性の選択といった多くの準備プロセスが自動化されている。そのため、ユーザーはOracle SQL DeveloperのGUIツール「Oracle Data Miner」を使って簡単にデータ加工やモデル生成が行える。PL/SQLとJavaのAPIが用意されており、作成したモデルをアルゴリズムに組み込んだアプリケーションを容易に作ることができる。

Oracle Data Minerの特長
In-Database Data Miningのアルゴリズム

 一方、Oracle R Enterpriseは、Oracle Database上で提供されるRの実行環境であり、R言語で記述された一部の処理が透過的にOracle Databaseの処理に変換されて実行される。Oracle Databaseに格納されたデータに対し、Rのパッケージとして公開されているさまざまなアルゴリズムを使って分析が行える点が特徴だ。

Oracle R Enterpriseのアーキテクチャ

 「また、大規模なデータ分析向けにデータベース上にアルゴリズムが実装されており、メモリ上には展開できない大きなデータセットを扱えるほか、並列処理により高速なデータ分析が可能です。パフォーマンスについては、実際に新日鉄住金ソリューションズ様がOracle R Enterpriseとオープンソース版Rの比較を行っており、データの加工、作成、評価の全プロセスを通した場合、処理時間を最大で約40分の1に短縮できるという検証結果を公表されています」(山中氏)

 Oracle Advanced Analyticsオプションに含まれるこれらの機能を利用することで、ユーザーはOracle Database上で高度なデータマイニングや機械学習を活用した予測モデルの作成などの取り組みをすぐに始められるわけである。

真の“In-Database”が実現する「便利」「高速」「簡単」な分析環境。クラウドなら従量課金でも使える

 山中氏は、Oracle DatabaseユーザーにOracle Advanced Analyticsの活用を勧める最大の理由として、「これまで各種業務アプリケーションのデータ管理に利用してきたOracle Database上でデータ分析の処理を実行できること」を挙げる。

 「高度なデータ分析を行う場合、これまでは基幹系のデータが格納されたデータベースから分析専用の環境へとデータを抽出/移行する必要がありました。それには多くの作業工数や専用環境の構築/管理コスト、他の環境へデータを移すことによるセキュリティ上のリスクなどが伴い、これらが企業のデータ分析を高度化するうえで大きな障壁となっていました。しかし、Oracle Database上に構築されているシステムでは、Oracle Advanced Analyticsにより完全に“In-Database”な分析環境を構築できるため、これらの障壁が全て取り除かれるのです」(山中氏)

データ分析の導入における課題
photo 日本オラクル クラウド・テクノロジーコンサルティング統括本部、テクニカルアーキテクト本部、DBソリューション部 シニアコンサルタントの武井美緒氏

 Oracle DatabaseとOracle Advanced AnalyticsによるIn-Databaseな環境がもたらす、さらなるメリットとして、日本オラクルの武井美緒氏(クラウド・テクノロジーコンサルティング統括本部、テクニカルアーキテクト本部、DBソリューション部シニアコンサルタント)は次の3点を挙げる。

  1. データの前処理が効率的に行える
  2. 非常に高速で高い拡張性を持つ
  3. アプリケーションへの導入が容易

Oracle Databaseで機械学習を使う3つの理由

 1つ目の「データの前処理の効率化」は、分析にかかる作業工数と時間の削減につながるものだ。

 「データの前処理工程は、分析全体の工数の約80%を占めるとも言われます。In-Databaseで分析環境を整えることにより、データのエクスポート/インポートが不要となり、作業工数と時間の双方を大幅に削減することができます。

 また、データの集計やフィルタリングを使い慣れたSQLで効率的に行えることも大きな利点です。特に機械学習を活用する際には、多様な種類のデータをモデル作成ですぐに使える環境が重要となります。必要なデータを手軽かつ自由に用意できる環境があることで、より早く、適合度の高いモデルを作れるのです」(武井氏)

In-Databaseで迅速なデータ分析

 2つ目の「高速で高い拡張性」という特徴は、特に機械学習を活用したアナリティクスの導入開始時や、モデル洗練の過程を高速化していく際に大きなメリットをもたらす。Oracle DatabaseのオプションであるOracle Database In-Memoryといった高速なデータ処理機能や、Oracle Exadata、Oracle Database Cloud Serviceなどのデータベース処理に最適化された環境を利用している場合、そのメリットはさらに高まるだろう。Oracle Advanced AnalyticsはOracle Database Cloud ServiceのHigh Performance Packageに含まれているため、従量課金で使える点も大きな利点だ。

Oracle Cloudでクイックスタートできる

 「機械学習のモデル作成では、最終的にどの程度のコンピューティングリソースが必要になるのかを事前に見積もるのが難しいという問題があります。『まずはスモールスタートで始めて徐々にデータ分析の規模を拡大していきたい』と考える場合、Oracle DatabaseのPaaSであるOracle Database Cloud Serviceを活用することで、効果を見ながら段階的にコンピューティングリソースの規模を拡大していくことができます。これにより、コストを常に最小限に抑えられるのです」(武井氏)

 3つ目の「導入が容易」という特徴は、作成したモデルをアプリケーションに組み込み、業務で活用する際に重要なポイントだという。

 「In-Databaseの分析環境であれば、モデルによる予測結果をSQLコマンドで取得して表示するアプリケーションを構築したり、実データへの適合度をユーザーがフィードバックしてモデルに反映させたりといったことが簡単に行えます。機械学習をビジネス上の成果に結び付けるうえで、これは非常に重要です」(武井氏)

 これらのメリットは、「データからモデルを作成する」「モデルをビジネスに展開し、評価する」「評価結果を基にしてモデルを洗練していく」というデータ活用のサイクルを継続的かつスピーディに回していく助けともなる。

 「今日の企業のデータベース環境を踏まえると、これらのメリットを最大限に享受するためには、分析環境が完全なIn-Databaseであることが必須となります。Oracle Advanced Analyticsは、必要なデータの取得、前処理、モデリング、展開、セキュリティ管理といった全てのプロセスをOracle Databaseの上で行えるという意味で、真のIn-Databaseアナリティクス環境だと言えるでしょう」(山中氏)

「Oracle Advanced Analytics」で機械学習をシステムへ簡単に組み込める時代になった

Copyright© 2017 ITmedia, Inc. All Rights Reserved.


提供:日本オラクル株式会社
アイティメディア営業企画/制作:@IT 編集部/掲載内容有効期限:2017年5月16日

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。