Hadoop、NoSQLのサポートを強化した「Talend v5.3」Amazon Redshiftにも対応

Talend v5.3は、MapReduceのネイティブコードを生成できるようになった。これにより、Talendのジョブを並列分散処理に対応させることできる。

» 2013年05月23日 19時06分 公開
[藤本和彦,@IT]

 Talendの日本法人は2013年5月23日、ワールドワイドで5月7日に発表されたオープンソースのデータ統合・連携プラットフォーム最新版「Talend v5.3」に関する記者説明会を開催した。最新版では、Apache HadoopやNoSQLデータベースに対するサポートを強化している。

 Talendとは、データ統合、データ品質、マスタデータ管理(MDM)、エンタープライズサービスバス(ESB)、ビッグデータ向け製品群からなるデータ統合・連携プラットフォーム。オープンソースの無償版と、管理機能などが加わった有償の商用サブスクリプション版がある。

2013年4月25日付けでTalend日本法人の代表取締役に就任した有延敬三氏

 Talend v5.3では、すでに対応済みのApache Hadoop、Cloudera CDH、MapR、GreenPlumの各Hadoopディストリビューションに加えて、新たにAmazon Elastic MapReduceをサポートする。また、ユーザーはMapReduceのネイティブコードを生成できるようになった。JavaコードかMapReduceコードかを選択可能で、Talendのジョブを並列分散処理に対応させることできる。

 加えて、Pig言語によるビジュアルマッピング処理機能が加わった。HDFS内のHive/HCatalogテーブルやファイルのルックアップが可能で、データの抽出や変換といったデータフローをグラフィカルに構築できる。Pig Latin言語の開発者であれば、GUI環境を用いてデータ処理のためのジョブを短期間で開発・テストし、レビューを実施することができるという。

 NoSQLデータベースのサポートも強化された。Cassandra、MongoDB、Hbase、Google BigQueryなどのNoSQLデータベースに加えて、Couchbase、CouchDB、Neo4Jに対応する。NoSQLデータベースと他のデータストアおよびシステム間でデータを移動し、同期を取ることができるようになる。クラウドDWHサービスのAmazon Redshiftにも対応する。

 Eclipseベースのデータ変換ツールに特化するOakland Softwareのテクノロジを新たに組み込むことで、XMLデータやJava、EDIデータ、X12、COBOLデータの変換処理も可能になった。

 Talend v5.3の無償版はすでに提供を開始しており、商用サブスクリプション版は2013年6月末から提供を開始する予定。

Copyright © ITmedia, Inc. All Rights Reserved.

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。