オンライン・デフラグやリサイズも
次世代ファイルシステム「Btrfs」はSSD最適化にも注力
2009/10/23
Linux向けの次世代ファイルシステムとして注目されている「Btrfs」(バター・エフエス)。東京・秋葉原で開催中のThe Linux Symposium 2009で10月23日、Btrfsプロジェクトの創始者で開発をリードするクリス・メイソン氏が、Btrfsで実現する機能や現状について紹介した。
Btrfs開発者で米オラクルに在籍するクリス・メイソン(Chris Mason)氏Btrfsは2007年にオラクルが発表した新しいファイルシステムだ。2009年1月にカーネルに取り込まれていて、すでにディスク上のフォーマットはフィックスされていることから、アーリアダプター層などには「すでに十分に使えるレベル」(メイソン氏)になっているという。Btrfsはオラクルが開発していると思われがちだが、IBMやインテルからもコードの貢献があり、例えば次期バージョンに含まれるRAID 5/6/60にはインテルが取り組んでいるという。また、SSDへの最適化も進めており、マウント時に非回転デバイスを認識すると自動的にSSDとしてマウントする。今後SSDの重要性が増すことが見込まれるため、Btrfsでもチューニングに注力していくという。
Btrfsは、主流のext3/ext4など既存ファイルシステムとの互換性はない(ext3/4からのコンバートは可能)。Btrfsは、名称の元になっているB-Tree構造を採用する点でReiserFSに似ていると言われる。すべてのメタデータを1つのB-Treeに収めるため探索が速いことが特徴という。特に一定時間内に行われた変更に高速にアクセス可能で、バックアップ時の効率が良いという。
コピー・オン・ライトによる軽量なスナップショット作成、チェックサム機能、複数デバイスを1つのストレージプールとして扱い、ディスク上のオブジェクト単位でストライピングやミラーリングで分散させることができる機能など、Btrfsはサン・マイクロシステムズのZFSと同世代のモダンなファイルシステムだ。ただ、メイソン氏によればBtrfsとZFSとは根本的に実装が異なり、機能的にも、例えば使用中のデバイスをストレージシステムから取り除くような機能はBtrfsにしかないという違いがあるという。
オブジェクト単位でRAID0(ストライピング)、RAID1(ミラーリング)を指定し、複数デバイスに分散できるこれまでLinuxでもLVM(Logical Volume Manager)を使えばコピー・オン・ライトによるスナップショット作成は可能だったが、実装の違いにより、例えば400MBのファイルを20回連続して作成するケースではLVMで558秒かかるところ、Btrfsでは1.6秒で済む例があるという。ファイルのクローンも同様に軽量なため、仮想マシンのイメージやデータベースファイルのクローンを、フルスナップショットを作成することなく作れるのもメリットだという。
オンラインのデフラグで起動高速化も
Btrfsではディスク上のデータ配置変更が容易なため、オンラインでボリュームのリサイズやデバイスの除去、デフラグが可能という特徴がある。メイソン氏はミラーリングのデモンストレーションで、一方のデータを破壊してそれをオンラインのまま簡単に修復できる様子や、4GBのボリュームを900MBに縮めてから再び元のサイズに戻すデモンストレーションをシステムを停止することなく行ってみせた。
オンラインのデフラグが可能であることの応用を示すデモンストレーションとしてメイソン氏は、Moblinの起動シーケンストレースパッチを使ってファイルを再配置。OS起動時のI/Oを最適化する様子を、直感的なアニメーションを用いて説明した。
起動時に発生するファイルの読み出しでは、フラグメンテーションがあるために、頻繁にヘッドのシークが発生する。以下の動画では、まず最初に理想的なシーケンシャルなブロック読み出しの様子、次に完全に断片化した通常の状態を説明している。3つ目の流れ星がときどき流れるようなアニメーションが、Btrfsを使ってデフラグした場合のディスクアクセスの様子を示していて、ときどき連続読み出しが起こっている様が見て取れる。
これによってカーネルの初期化とGNOMEの起動、Firefoxの起動までに要する時間が12秒から6秒に短縮。平均のデータ転送レートが5.53MB/秒から12.37MB/秒に改善されたという。「まだ改善の余地はあるが、デフラグは効果がある」(メイソン氏)
デフラグ前後の起動時間の違い。緑がデフラグ後関連記事
情報をお寄せください:
- natテーブルを利用したLinuxルータの作成・2 (2010/3/11)
IPパケットのディスティネーションアドレスを書き換える「DNAT」を使って、透過型プロキシを構築します - 一歩進んだ監視のカスタマイズ (2010/3/3)
スクリプトの実行結果などを取得できるユーザーパラメータを用いて、自分のニーズにぴったり合った監視を実現 - OSSライセンス順守の第一歩 (2010/2/18)
企業として、OSSライセンス違反を犯さないためには、どのような手順が必要か、いくつかアドバイスします - 無視できないフラグメンテーション問題への解答は? (2010/2/10)
今回は、メモリコンパクション、そしてメモリバリアを発行するシステムコールという2つのパッチについて深く紹介します
|
|
スポンサーからのお知らせ
- - PR -
| 「いつかは壊れるサーバ」そんな故障に 迅速で安価に手軽に対応する方法とは? New! |
| 「特権ユーザー」の事件を防げ! 万能権限を持つユーザーの管理方法とは? New! |
| 仮想環境の構築とデータ保護の特効薬?! 実績と信頼性の高いパッケージで安心運用 |
| 仮想環境のバックアップもこれまでどおり 「まるごと取ってまるごと戻す」簡単運用 |
| おばかアプリ選手権、第4弾開催中!! ムダにカッコよくてくだらない作品求ム! |
| 社内ファイルサーバを“クラウド”に統合 VPN直結「クラウド型ストレージ」を紹介 |
| その数、なんと400台以上! グループ内 サーバの「統合管理」によるメリットは? |
| 美人!? まあまあ? 気になる いやし系!! PV急増で「美人時計」がとった手段とは? |
| 進化を続ける富士通ストレージETERNUS DX 製品開発者の自信を裏付けるものとは何か |
| 運用管理の課題を“2つの観点”から分析 ユーザー満足度の高い「仮想環境」とは? |
- - PR -
お勧め求人情報

**先週の人気講座ランキング**
〜CCNA編〜
| ◆ | TomcatやJBossなどAPサーバ環境に関する 情報を集約! “業務”用APサーバ大百科 New! |
| ◆ | 一気に解説! 最新のクラスタストレージ 「RAIDを超えたストレージ基準」……など New! |
| ◆ | クラウド的ユーザー体験の変化は脅威か? 仮想化技術を使いこなす運用管理術を紹介 New! |

| ◆ | 上司や部下、部署内メンバーとの情報共有 を“ガラッ”と変えるコラボツールとは? New! |
| ◆ | おばかアプリ選手権、第4弾開催中!! ムダにカッコよくてくだらない作品求ム! |
| ◆ | 社内ファイルサーバを“クラウド”に統合 VPN直結「クラウド型ストレージ」を紹介 |

| ◆ | Twitterのアカウントはなぜ突破された? メールによる新手の攻撃手法とその対策 |
| ◆ | もう仮想化のお試しフェイズは終わりだ! Hyper-V 2.0が基幹システムも仮想化 |
| ◆ | 美人!? まあまあ? 気になる いやし系!! PV急増で「美人時計」がとった手段とは? |

| ◆ | クライアント企業から求められる人材 ⇒IT技術と経営戦略を併せ持つ「戦略家」 |
| ◆ | .NET編集長が実践する「技術情報検索術」 サンプル・コードを簡単に探す“技”は? |
| ◆ | 業務効率と情報セキュリティ対策を両立! 手間なく確実に機密情報を守る方法とは? |

| ◆ | 進化を続ける富士通ストレージETERNUS DX 製品開発者の自信を裏付けるものとは何か |
| ◆ | 運用管理の課題を“2つの観点”から分析 ユーザー満足度の高い「仮想環境」とは? |

| ◆ | 【CTC事例】約30の基幹システムを統合! 膨大なバッジジョブを制御した方法は? |
| ◆ | 仮想化すればコストは削減できるか? 仮想化に必要な「3つの視点」を解説する |
| ◆ | その数、なんと400台以上! グループ内 サーバの「統合管理」によるメリットは? |






