特集
» 2013年10月07日 18時00分 公開

OSや言語ではなくデータベースを極めたい:グリー技術者が聞いた、fluentdの新機能とTreasure Data古橋氏の野心 (2/3)

[五味明子,フリーランスライター]

エンタープライズにも支持されるfluentdが人気な3つの理由

森田 Windowsへの対応も、その表れなんでしょうが、fluentdはリリース当初に比べ、だんだんユーザー層に広がりが出てきた感じがします。

古橋 それは、確かに実感します。もともとfluentdはグリーのようなソーシャルコンテンツを開発、提供する企業やアドテク業界で広告のインプレッションログを取ったりモデル構築を行う用途で使われることが多かったんですが、そうした需要に加え、エンタープライズでの利用が徐々に増えてきています。

 今後の機能強化においてもエンタープライズのニーズを考慮した部分が増えていくでしょうね。エラーストリームの導入も、その1つといえるかもしれません。また、米国などではTreasure Data Platformの一機能としてfluentdを使いたい、という声も多く聞こえるようになってきました。

森田 fluentdがWebサービス企業だけではなくエンタープライズまでに支持されるようになった理由は、どこにあると思われますか。

【1】プラガブル

古橋 最初にも触れましたが、やはり「プラガブル」という点が一番大きいと思います。いったんfluentdを介してログを収集するようにしておけば、後はプラグインでどのようにも変更/拡張できます。

 例えば、回収したログの出力先を社内サーバからAmazon S3に変更したいという場合でもプラグインを1つ設定するだけでOKです。面倒な手間は一切必要ありません。

【2】JSON

古橋 後は、データ解析するのに最適な状態にログを構造化できるということでしょうか。僕は「データ変換はアプリケーションに近いところで行うべき」という考えなので、ストリーミングデータをアプリケーションから直接、構造化された形で流すことにこだわりました。

 具体的にいうと、ログをテキストではなく「JSON」で扱えるようにしたので、構文解析(パース)する必要がないんですね。非構造化データであるテキストのパースはけっこう大変な作業なので、実際にデータ解析する時間をムダにしないためにも、構造化された状態でログを扱えるのは大きなメリットではないかと。

【3】容易なインストール

森田 導入が簡単なのも良いですよね。トレジャーデータのサイトで配布されているfluentdはDebian(deb)やRed Hat(rpm)などに対応した主要なパッケージが用意されていて、さらに、fluentd本体から主要なプラグイン、Rubyに至るまで全部入っているので、簡単にインストールできますし。そうした1つ1つのポイントがユーザー層の拡大につながっているように思えます。

古橋 fluentdは単体ではあまり価値がないソフトウェアなんです(笑)。いってみれば、何かと何かをつなぐことで、新たな価値を生み出すような存在にしたいと思って作ったソフトウェアなので、そこが評価されてユーザーが増えているなら、うれしいですね。ゼロから新しく価値を生み出すのが僕の得意技なので。

オープンソースに企業のバックアップは欠かせない

森田 fluentdはオープンソースで開発されていますが、このスタイルは今後も続けていかれるつもりでしょうか。

古橋 オープンソースソフトウェアといってもいろいろな開発スタイルがあると思うんですが、fluentdの場合、僕が所属するトレジャーデータが全面的にバックアップしています。現在は、この開発スタイル「企業がバックについているけど、開発はオープンに行う」という手法が一番合っていると思います。機能強化などの議論はTwitterやメーリングリストといったオープンな形式で活発に行っていますし、僕がfluentdの開発に関わることはトレジャーデータの業務として認められています。

森田 オープンソースをうたいながら開発はクローズドスタイルというソフトウェアもけっこうありますからね。

古橋 そういうふうにはしたくなかったんです。fluentdでは、コミッタ的な存在は僕と中川(トレジャーデータの中川真宏氏)がメインで、後は社外に10人くらいいる感じですが、先ほどもいったように開発に関する議論は、すべてオープンにしています。

 企業がオープンソースのバックに付くことをいろいろいう人もいますが、僕はどんなに良いソフトウェアであっても、やはり企業のバックアップがなければ普及は難しいと思うんです。どんなに良いソフトウェアでも使ってもらえなければ価値はない。これはfluentdの前に「MessagePack」というソフトウェアを作った後、「MessagePackは、ひょっとしてこのまま死んでいくのかな……」と不安になった経験からいえることです。

 トレジャーデータがそういったバックアップをすべて代わってくれたことは、MessagePackやfluentdの普及にとって非常に大きかったですね。

森田 大学や研究所ではなく、企業がオープンソースのバックに付くことが重要だと。

古橋 そうです。ソフトウェアは実用の世界でできるだけ多くの人に使ってもらってこそ磨かれていくものですから、企業によるバックアップは欠かせない要素だといえます。

タンポポの遺伝子解析からスタートしたエンジニア人生

森田 お話を聞いているとエンジニアとしての強いこだわりを感じるわけですが、ここで“エンジニア・古橋貞之”のバックグラウンドについて聞かせてください。そもそもプログラミングの世界に足を踏み入れたのは、いつからなんでしょうか。

古橋 高校時代の部活動がきっかけです。通っていた高校がスーパーサイエンスハイスクール(SSH:文科省が指定する科学や理数教育を重点的に行う高校)に指定されていて、プログラミング系の部活動にも、そこそこの予算が割り当てられていたような環境でした。

森田 高校の部活動でのプログラミングというと、ゲーム開発とか?

古橋 いえ、違います。最初にやったのは、タンポポの種子をひたすら収集して、遺伝子解析を行い、ヒートマップを作成するというものでした。名古屋大学や岡崎分子科学研究所などと連携して、データ解析を行ったりしていましたね。

 あと、僕は大学はAO入試で入ったんですが、そのときの面接では当時開発していたネットワークブートのシステムについてプレゼンしました。当時、「KNOPPIX」というLinuxディストリビューションがCD-ROMからブートできるというので人気があったんですが、それを拡張してネットワークブートを可能にして、ゆくゆくは分散ストレージに発展させたい、みたいなことを話したと記憶しています。

森田 かなりマニアックですね(笑)。そういう活動の内容って、周囲には理解されました?

古橋 高校生のための科学イベントみたいな大会がいくつかあったんですが、その審査員には僕の発表はまったく理解されませんでした(笑)。でも、さすがにAO入試の面接官は内容のほとんどを理解してくれたので、うれしかったですね。大学では分散システムの研究を主に行ってきました。fluentdも大学時代から開発を始めています。

Copyright © ITmedia, Inc. All Rights Reserved.

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。