【3/18〜】Amazon、VMwareが語る『クラウドの未来』 スラッシュドット    はてなブックマーク  Yahoo!ブックマークに登録  印刷


第6回 使うほどに良さが分かる正規表現

最初は訳が分からないが、慣れると大変重宝する。ある意味UNIXの象徴ともいえるのが「正規表現」だ。正規表現をすべて究める必要はないが、知っていると便利なことが多い。

関野史朗
2001/12/4

正規表現ってナニモノ?

 正規表現というと何やら難しそうですが、要するに文字列を指定する方法です。Windowsではファイル名を指定するとき、複数の文字と一致する「*」、任意の1文字と一致する「?」が使えます。例えば、「拡張子がwavのファイル」だったら「*.wav」とするわけです。Windowsでは、この「*」や「?」を「ワイルドカード」と呼んでいます。これを強化したものが正規表現だと考えればいいでしょう。ただし、柔軟な指定が可能な分だけ複雑になっています。

 正規表現を覚えるとどんなときに便利なのか、簡単な例を挙げてみましょう。例えば、きれいに整形されてインデントの付いたテキストファイルをHTML化したいとしましょう。そのまま<PRE>タグを使うのも手ですが、やはりちゃんとしたHTMLにするには行頭の空白を削除したうえで単語の途中で改行しないようにする必要があります(たいていのWebブラウザは改行を空白として扱います。単語の途中に空白が入っていると、見た目がよろしくありません)。しかし、段落によってインデント数は違うし、行の途中に空白があるかもしれません。これでは、単純に空白を全部削除するわけにはいきません。しかし正規表現なら、「行の先頭から続く空白」という指定ができるので、これをヌル文字で置き換えれば目的が達成できるわけです。多くのWindowsアプリケーションに実装されている単純な置換コマンドではとてもこうはいきません。

コラム 正規表現とgrepとed
 私が正規表現というものに初めてお目にかかったのはgrepコマンドの引数としてでしたが、大本はedあたりのようです。そもそも正規表現は英語で「Regular Expression」と表記し、grepはg/Regular Expression/pというedのコマンドを省略したものですから。

 この正規表現は、カーネルの機能ではありません。一応、POSIX 1003.2でBasic Regular ExpressionとExtended Regular Expressionが定義されています。しかし、実際には文字列を扱うのに便利なことからvi、Emacs、sed、awk、Perl、Rubyといった個々のプログラムがそれぞれに実装しているというのが実情です。ライブラリも複数存在しています。Windowsでも秀丸エディタなど、正規表現をサポートしているプログラムがあります。この辺を含めて、プログラムによって細かいところが微妙に違ってきます。これはもうオンラインマニュアルやヘルプを参照しつつ、慣れるしかありません。今回は広く普及している部分を基本に、プログラムによって違う場合には注釈を入れて紹介します。

 
1/2

Index
Windowsユーザーに教えるLinuxの常識
正規表現ってナニモノ?
  初歩的なパターン指定
ちょっとした応用編

連載 Windowsユーザーに教える Linuxの常識


 Linux Squareフォーラム Linux/システム学習関連記事
連載:Windowsユーザーに教えるLinuxの常識(全12回)
Windowsのセオリーが通用しないLinux。Linux初心者向けに、LinuxというOSの考え方/常識をゼロから伝授!
連載:LFSで作って学ぶLinuxの仕組み(全4回)
管理者(root)は、何をしなければならないのか? 管理に際して検討すべきことは? 管理のための技術とは? など、駆け出し管理者のための考え方や方法論を検討する
連載:Linux管理者への道(全8回)
「Linux From Scratch」というシンプルなLinuxをインストール&環境構築する作業を通して、LinuxがOSとして機能するための仕組みや設定を見直そう
Linux Squareフォーラム全記事インデックス

MONOist組み込み開発フォーラムの中から、Linux関連記事を紹介します

ホワイトペーパーTechTargetジャパン

Linux Square フォーラム 新着記事

@ITメールマガジン 新着情報やスタッフのコラムがメールで届きます(無料)

RSSフィード

スキルアップ/キャリアアップ(JOB@IT)



- PR -
- PR -

お勧め求人情報

キャリアアップ 〜JOB@IT
@IT Special -PR-
  TomcatやJBossなどAPサーバ環境に関する
情報を集約! “業務”用APサーバ大百科

New!
  一気に解説! 最新のクラスタストレージ
「RAIDを超えたストレージ基準」……など

New!
  クラウド的ユーザー体験の変化は脅威か?
仮想化技術を使いこなす運用管理術を紹介

New!

  上司や部下、部署内メンバーとの情報共有
を“ガラッ”と変えるコラボツールとは?

New!
  おばかアプリ選手権、第4弾開催中!!
ムダにカッコよくてくだらない作品求ム!

  社内ファイルサーバを“クラウド”に統合
VPN直結「クラウド型ストレージ」を紹介

  Twitterのアカウントはなぜ突破された?
メールによる新手の攻撃手法とその対策

  もう仮想化のお試しフェイズは終わりだ!
Hyper-V 2.0が基幹システムも仮想化

  美人!? まあまあ? 気になる いやし系!!
PV急増で「美人時計」がとった手段とは?

  クライアント企業から求められる人材
⇒IT技術と経営戦略を併せ持つ「戦略家」

  .NET編集長が実践する「技術情報検索術」
サンプル・コードを簡単に探す“技”は?

  業務効率と情報セキュリティ対策を両立!
手間なく確実に機密情報を守る方法とは?

  進化を続ける富士通ストレージETERNUS DX
製品開発者の自信を裏付けるものとは何か

  運用管理の課題を“2つの観点”から分析
ユーザー満足度の高い「仮想環境」とは?

  【CTC事例】約30の基幹システムを統合!
膨大なバッジジョブを制御した方法は?

  仮想化すればコストは削減できるか?
仮想化に必要な「3つの視点」を解説する

  その数、なんと400台以上! グループ内
サーバの「統合管理」によるメリットは?