Special
» 2016年12月20日 07時00分 公開

クラウドでも、3つの技術を既存のスキルで適材適所に使う:ちょっと待って! そのHadoop、NoSQL、RDBMSの使い分けは正しいの? 最適解をオラクルのビッグデータ製品開発者に聞いた (1/3)

「HadoopやNoSQL、RDBMSの使い分けをコストだけで判断してはならない」と米オラクルでビッグデータ製品を担当するジャン・ピエール・ダイク氏は警告する。システムの性能やセキュリティの要件を見極めたうえでコストを考慮し、適材適所で使い分けるのが正解だ。[ビッグデータ][Big Data]

[PR/@IT]
PR

コストだけで使い分けを判断してはダメ まずは性能、セキュリティ要件を見極めて

photo 米オラクル ビッグデータ製品マネジメントのジャン・ピエール・ダイク氏

 企業ITの世界では、情報(データ)を保管するための技術として、長らくRDBMS(リレーショナルデータベース管理システム)が使われてきた。RDBMSは、データベースを操作する言語としてSQLをサポートする他、データの完全性や信頼性を保証するための機構が多く盛り込まれている。だが、企業が扱うデータの量が爆発的に増加し、種類も多様化した現在、RDBMSが必ずしも最適解ではないケースもある。そこで、用途によってはRDBMSを補完する選択肢として普及しつつあるのが「Hadoop」や「NoSQL」などの技術である。

 これらの技術が注目を集める理由として、特定の用途における処理能力の高さや拡張性/柔軟性の高さなどが挙げられるが、特に企業ユーザーに大きなメリットと映るのはシステムコストやバックアップコストの安さだろう。今日では機械学習などの分析のために膨大なデータを扱うことが珍しくない。そのデータを低コストで蓄積できるHadoopやNoSQLは、新たなデータの保管先として魅力的な選択肢となったわけだ。

 これに対し、「HadoopやNoSQLはコスト面で利点をもたらす場合があるものの、企業がその観点だけで技術を選ぶのは早計です」と警鐘を鳴らすのは、米オラクルでビッグデータ製品のマネジメントを担当するジャン・ピエール・ダイク氏である。

 「コストのことばかりに気を取られていたのでは、これらの新技術の真価を見失ってしまう恐れがあります。もちろん、コストは非常に大切な指標です。しかし、それを第一に考えるのではなく、そのデータベースに求められている性能はどの程度か、必要なセキュリティレベルはどのくらいかといったことも考慮したうえでコストを検討しなければ意味がありません。ソフトウェアライセンスのことばかり気にする人もいますが、適切な技術を選ばなければ、環境が複雑になったり、トラブルへの対応が煩雑になったりといった弊害が生じ、結局は全体的なコストが高く付いてしまう可能性もあるのです」(ダイク氏)

万能な技術はない それぞれの特性を見極め、適材適所で使い分けることが鍵

 ダイク氏によれば、Hadoopで使われるHDFSとNoSQL、そしてRDBMSには、それぞれ次のような利点と弱点がある。

 まずHDFSは、低コストでバッチ処理性能をスケールさせられるというメリットがあるが、クエリの処理性能はRDBMSと比べると遅く、同時処理に弱い。大きなブロックの単位でデータの書き込みが行われるため、追記型で比較的大きなサイズになることが多いログファイルの格納などに向いている。また、NoSQLはシンプルな問い合わせに対して低レイテンシで応答することが可能なため、特定の利用目的には最適だが、それ単体で複雑な分析を行うのは難しい。一方、RDBMSではこれらの課題が既に解決されており、トランザクションデータ管理や複雑な分析において最もフレキシブルに高いパフォーマンスが得られるが、場合によってはコスト負担がネックになるケースがある。

HDFS、NoSQL、RDMBSのメリット/デメリット HDFS、NoSQL、RDMBS、それぞれの特徴とメリット/デメリット

 こうした特性も踏まえて、各技術を適材適所で使い分けるのが望ましいとダイク氏は話す。

 「実際の用途や要件は、お客さまの事情によって異なります。そのため、まずは各技術がどのようなコンセプトで作られ、どのような基本設計を持つのかを理解してください。そのうえで、対象システムに最適な技術を使い分けるのです」(ダイク氏)

 今日、これらの技術の適切な使い分けを実践している業種の例としてダイク氏が挙げるのが金融サービス業だ。この業界ではさまざまな種類のデータが扱われ、法規制により簡単に過去のデータを削除できないといった制約がある。そこで、RDBMSとHadoopを併用し、例えば業務ユーザーが分析のためにデータを利用するといった場合には、HadoopからRDBMSにデータをロードして分析を実施したり、古くなったRDBMSデータのアーカイブ先としてHadoopを利用したりといったことが行われている。また、アーカイブした情報をデータラボとしてHadoop上で解析し、その結果を新たな分析の観点としてRDBMS側にフィードバックするなど、新たなデータ価値の創出を実践している企業もある。

 「つまり、Hadoopによってデータ量当たりの保管コストを下げつつ、データを利用する際にはRDBMSに移し、高いセキュリティを確保しながら複雑なデータ分析を行っているわけです。このような使い方を見ると、もはやデータの保管から分析までをスタティックに1つの技術だけで行う旧来のデータウェアハウス(DWH)の時代は終わったと感じます」(ダイク氏)

       1|2|3 次のページへ

Copyright© 2017 ITmedia, Inc. All Rights Reserved.


提供:日本オラクル株式会社
アイティメディア営業企画/制作:@IT 編集部/掲載内容有効期限:2017年1月19日

人気記事ランキング

本日月間

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。