Editor's Eye

データ分析に適した設定・構築済みのカラム型DBを低コストで提供NEC「Data Platform for Analytics」

» 2015年09月01日 10時00分 公開
[PR/@IT]

【編集長】内野の視点――「分析のスピード」を支えるDBの方式はさまざま。目的に最適な製品タイプを選ぼう

@IT編集長 内野宏信
@IT情報マネジメント時代から、「ビジネスとITの連携」をテーマに開発・運用のトレンドを多数取材。SystemDesignフォーラム担当

 ビッグデータ分析に多くの企業が取り組んでいます。昨今はセンサーからの情報を分析してサービス開発・差別化に生かすIoT(Internet of Things)も注目を集めるようになりました。こうした中で、一層強く求められているのが、日々の気付きをチャンスにつなげる分析の「スピード」と「手軽さ」です。

 ただし、効率よく分析環境を築く上では、データベースの選定が一つのカギになります。というのも、各ベンダーとも「スピード」を訴求していますが、そこには複数の実現手段があるからです。例えばハードウエアの性能向上によってスピードを担保している製品、データをメモリ上で処理することでI/Oの問題を回避しながらスピードを担保している製品などです。

 こうした中、注目されているのが「カラム型データベース」です。従来のリレーショナルデータベースが「行」でデータを管理するのに対し、カラム型データベースは「列」で管理します。この特性から、前者がトランザクション処理に向くのに対し、後者は集計・分析処理に向くとされています。また、その特性上、「データの圧縮効率が高い」「並列分散処理と相性がよくスケールアウトしやすい」という特徴も。つまり「増大するデータに対応しつつ、コストを抑えて集計・分析する環境が欲しい」といったニーズに応え得る特性を備えているのです。

 本製品で注目されるのは、そうした特性を存分に生かしつつ、簡単に扱えるよう配慮していることでしょう。また、主要な設定・構築作業を済ませた上で納品される垂直統合型製品であり、カラム型データベースの強みである「圧縮」「列配置」を最適化したデータセットとともに納品される点も見逃せません。DB選定においても、「製品のタイプ」と「自社の目的、予算、スキル」などに応じて慎重に選ぶ必要がありますが、本製品の場合、コスト、スキルに制約がある中でも、導入しやすい製品の一つといえるのではないでしょうか。


ビッグデータ活用に向け、導入コストを抑えたデータ活用基盤製品を提供


 NECは、大量のデータからの高速な検索性や、データ増大時のシステム拡張性を備え、導入コストを抑えた統合型システム「Data Platform for Analytics」を提供しています。

「Data Platform for Analytics」の特長

1.データ増大時にスケールアウトが可能な拡張性

大量データの分析のために、必要なハードウェアとソフトウェア環境を組み合わせた製品で、統合型システム「NEC Solution Platforms」のラインアップとして追加し、テラバイト級の大容量データ分析を行う用途に最適です。導入時に将来のデータ増加を見越したシステム設計・構築の必要がなく、導入コストを従来の約3分の1相当に削減(NECによる試算)することで、ビッグデータ活用へのシステム導入を容易にします。

2.従来製品と比較し桁違いの処理性能により、作業時間を短縮

従来製品より桁違いの処理性能を実現し、例えば時間単位でかかっていた売上明細データのフルスキャン処理を、秒単位まで短縮しました。データの高速処理が可能になることで、短時間で条件を変えながら繰り返し分析したりバッチ処理時間を短縮することが可能です。

「Data Platform for Analytics」のポイント

高速な処理

 超並列処理アーキテクチャー採用と、独自のI/O効率化機能の組み合わせにより、従来型のシステムと比べ、飛躍的に検索性能を改善しています。1つのクエリ処理に対し、複数ノードが独立してデータ処理することでノード数に比例した処理性能を発揮し、大量データの高速処理を実現します。

自動的に最適化

 データベース管理者向けツールDatabaseDesignerを用意しております。対話形式のシンプルな操作で、データベース物理設計を自動的に行います。指定したテーブルのデータやクエリを解析し、列の並び替え、データ圧縮方式の選択、ソート順、データ分散について、自動的に最適な定義を行います。これにより、多くのDBで必要となるインデックス設計等のチューニング作業が激減されます。

スケールアウトが可能

データサイズに合わせ、小規模な投資から利用可能。業務の活用状況に応じて、データおよび要求性能の拡大に合わせたスケールアウトによる、性能および容量の拡張が可能です。

効率化の仕組み

カラムストア型データベースの特長と、独自の技術(プロジェクション)を組合わせることで、従来のデータベースと比較して、性能が飛躍的に向上します。

カラムストアでI/O効率化

データを列単位に格納し、検索時に必要とする列だけを読み出すため、高速に検索できます。

データ圧縮でI/O効率化

データを格納時に圧縮することで、物理容量を抑制すると同時に、検索時にディスクから読み出すデータ量が少なくなることで、処理が高速になります。

プロジェクションによるI/O効率化

プロジェクションは、最適な圧縮、最適な列配置、最適なソートが事前に実施されたデータセット。検索時、検索条件に一致しないデータは読み飛ばされ、高速な絞り込みを実現します。

ラインアップ

データサイズに合わせ、小規模な投資から利用可能です。業務の活用状況に応じて、データの拡大に合わせスケールアウトの拡張が可能です。

提供:日本電気株式会社

アイティメディア営業企画/制作:@IT 編集部/掲載内容有効期限:2015年9月14日


Copyright © ITmedia, Inc. All Rights Reserved.

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。