EMCジャパン、同社のデータレイク戦略について説明Isilon新製品は1クラスタで最大50PBに対応

EMCジャパンは2015年3月18日、同社のデータレイクに関する戦略を説明、あわせてEMC IsilonスケールアウトNASシリーズの新製品「Isilon HD400」を紹介した。

» 2015年03月19日 08時00分 公開
[三木 泉@IT]

 EMCジャパンは2015年3月18日、同社のデータレイクに関する戦略を説明、あわせてEMC IsilonスケールアウトNASシリーズの新製品「Isilon HD400」を紹介した。

 EMCジャパンのITエバンジェリストCTOアンバサダー、笠原俊和氏は、EMCのデータレイクについての考え方を、魚釣りに例えて説明した。

 笠原氏によると、これまでは目的に応じ、鯉釣りや金魚すくいなど、魚の種類(すなわちデータの種類)によって、違う湖(データ保管場所・製品)で、違う道具(アクセス・処理手法)を使い、捕獲を行ってきた。しかしこれでは、社内に利用のためのデータ移動に時間が掛かり、データごとにアクセス・処理手段を用意するため出費がかさむ。また、様々な捕獲するためには、魚ごとに個別のテクニックが必要という。

 しかし最近の、多様なデータを組み合わせて分析し、新たな発見をしたいというニーズに応えるためには、魚を一つの湖で管理し、道具をまとめて用意することで、捕獲テクニックをまとめて習得できるようになるという。

一つの湖で、同一の道具で魚捕りをするのが迅速で、効率的と、笠原氏は例える

 EMCのデータレイク基盤は、特に多様な非構造化データを機動的に組み合わせ、分析するという用途に向けた、高速で巨大な格納庫を提供することが目的という。この用途での企業における使い勝手を高めるためには、様々なアクセス手段に対応している必要があるとする。

Isilonでは1PBからの新シリーズ「Isilon HD400」を投入

 EMCはSoftware Defined Storageコントローラ「EMC ViPR」を活用するなどし、事実上全ての同社ストレージ製品をデータレイク基盤の構成要素として使えるようにしていくが、非構造化データの活用を前提とすると、「EMC IsilonおよびEMC ECS(EMC Elastic Cloud Storage)が主役となる。大まかにいえば、ファイルストレージの延長線上でデータレイク、あるいはビッグデータ基盤を構築したい場合にはIsilon、オブジェクトストレージが欲しい組織にはECSを提案するという。

 EMCは同日、Isilonの新製品、「EMC Isilon HD400」を発表した。Isilonはこれまで、性能/容量比の高さの順に、S、X、NLシリーズを提供してきた。NLよりもさらに容量を重視し、「ディープアーカイブ」を重要な用途に据えた製品が、HDシリーズだという。

 HD400は、4Uサイズに354TBの名目記憶容量を搭載するボックスを1ノードとし、これを組み合わせてスケールアウトしていくファイルストレージ。Isilonは最小構成が3ノードであるため、提供される記憶容量は最低でも約1PBとなる。最大構成では、1クラスタで約50PBのデータを格納できるという。

 Isilonシリーズに関しては、あわせて新ストレージOS「OneFS 7.2」も発表した。Isilonは以前よりHDFSインターフェイスをサポートしているが、バージョンではHDFS 2.3および2.4に対応する。Hadoopディストリビューションとしては、Pivotal,Clouderaに続きHortonworksをサポートした。Ambari、Oozie、Sentry、Hueとの動作保証も行っているという。一方で、OpenStack Swiftにも対応するという。

Copyright © ITmedia, Inc. All Rights Reserved.

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。