[運用]

POPFileで構築する迷惑メール・フィルタ(前編)
―― POPFileを導入して迷惑メールを分類する ――

1.迷惑メールとその対策

デジタルアドバンテージ 打越 浩幸
2008/06/23


 いまや電子メールはビジネスやコミュニケーションに欠かせないサービスであり、その重要性はいうまでもないであろう。だが電子メールの普及とともに深刻になってきたのが、いわゆる「迷惑メール」や「スパム・メール」などと呼ばれる、当事者が望まないのに無差別に勝手に送りつけられてくるメールである(以下「迷惑メール」と総称する)。

 迷惑メールの送信者は、さまざまな方法で収集したメール・アドレスや、自動的に合成して作成したメール・アドレスに対し、大量の宣伝や勧誘、詐欺などのメールを送りつけている。ほとんどの受信者はそれを無視したり、廃棄したりするが、間違ってメール中のリンクをクリックしたり、よく分からずにクリックしたりすると、不正なサイトへの誘導や、ウイルスの感染などが起こる。

 迷惑メールは誰がどのようにして送信しているのか、(送信元に頼めば)送るのを止めてもらえるのではないか、などと考える方もいるかもしれないが、いうまでもなく、そのような考えはまったく意味がない。現在のインターネットのシステムでは、(プロバイダと契約して)メール・アドレスを取得すれば、遅かれ早かれ、いずれ迷惑メールはやってくるものと覚悟しなければならないだろう。自分でブログなどを開設してメール・アドレスを明示的に公開した場合はもちろんのこと、インターネットのショッピング・サイトやオークションなどを利用しただけでも、その会社からメール・アドレス情報が漏えいするというのは大げさではない。だからユーザーにできる唯一の防衛策は、迷惑メールがいくらこようとも、黙って破棄する、だけである。つい返信したりすると、有効なメール・アドレスであることが判明し、ますます多くの迷惑メールを呼び込むことになる。

 とはいえ、迷惑メールだけを正確に抽出して排除することは簡単ではない。一般的に迷惑メールはメール・アドレス情報などを詐称しているため、To:やFrom:などの情報だけで迷惑メールを判定することはできない。迷惑メールであるかどうかは、メール本文の内容を読んで判断する必要がある。とはいえ、ユーザーがいちいちそのような操作を行うのでは意味がない。

 現在利用されているメール・アプリケーションでは、このような迷惑メールを分類し、自動的に排除する機能を持っているものある。またプロバイダによっては、迷惑メールを自動的に分類、排除してから、ユーザーに配信するサービスを用意していることもある。これらの機能では、収集された多くの迷惑メールから本文の特徴を抽出し(一般的には、迷惑メール特有の単語が多く使われているかどうかを判定する)、それに合致するものを迷惑メールと判断している。

 例えば以下は、Windows Vistaの標準メール・アプリケーションである「Windowsメール」における迷惑メールの自動分類機能である(同様の機能はOutlook 2003やOutlook 2007にも含まれている)。メールを受信後、その内容を判定して、迷惑メールであると判断されると、[受信トレイ]ではなく、[迷惑メール]というフォルダへ自動的に分類してくれる。

迷惑メール対策機能を持つメール・クライアントの例
これはWindows Vistaの「Windows メール」アプリケーションにおける迷惑メール・フィルタの例。Outlook 2003やOutlook 2007もほぼ同様の機能を持つ。オプションを設定することにより、「あるアルゴリズム」によって迷惑メールと判定されると、「受信トレイ」ではなく「迷惑メール」というフォルダへ自動的に振り分けられる。ただしこの判定は完全ではなく、いくらか間違いが起こる。そのため、迷惑メール・フォルダの内容を無条件で削除せず、本当に必要なメールでないかどうかをよく確認してから削除する必要がある。
迷惑メール・フォルダ。迷惑メールであると判定されると、メールはこのフォルダへ入れられる。ただし場合によっては、通常のメールも迷惑メールと判定されることがあるので、このフォルダの内容を無条件に削除してはいけない。
迷惑メールの判定レベル:低。明らかに迷惑メールであると判定されたもののみを迷惑メール・フォルダへ移動する。迷惑メールの検出率が低くなりやすいとされている。
迷惑メールの判定レベル:高。迷惑メールの可能性が高いものすべてを迷惑メール・フォルダへ移動する。迷惑メールの検出率は高いが、ミスする可能性も高い。

 受信したメールが迷惑メールであるか、それとも通常のメールであるかは、その内容によって自動的に判断される。判定のためのアルゴリズムやデータベースは随時更新され(Windows VistaのWindowメールやOutlookの場合は、「迷惑メール フィルタの更新」という更新プログラムでときどきアップデートされる)、最新の迷惑メールに対応できるようにしている。

 だがこの判定メカニズムは(誰にとっても)完全といえるものではなく、ときどき誤判定が起こる。つまり、本来は迷惑メールなのに通常のメールと判断されたり、逆に、通常の仕事のメールなのに迷惑メールと判断されたりしてしまうことがある。

 例えば上のWindowsメールの場合、筆者の環境で試したところ、「迷惑メール判定レベル:低」では、「受信メール:861通、迷惑メール:1473通」となったが、実際に手動で判定した結果は、「受信メール:487通、迷惑メール:1847通」であった(分類ミス:378通=約16.2%)。また「迷惑メール判定レベル:高」では、「受信メール:538通、迷惑メール:1780通」となったが、実際に手動で判定した結果は、「受信メール:500通、迷惑メール:1818通」であった(分類ミス:78通=約3.4%)。いずれのレベルでも、迷惑メールを通常メールとして分類しているし、逆に通常メールを迷惑メールとして分類しているので、完全性は期待できない。


 INDEX
  [運用]POPFileで構築する迷惑メール・フィルタ
  POPFileを導入して迷惑メールを分類する(前編)
  1.迷惑メールとその対策
    2.迷惑メールの分類をサポートするPOPFile
    3.POPFileのインストール(1)―入手と機能の選択
    4.POPFileのインストール(2)―初期バケツの作成
    5.POPFileのインストール(3)―メール・アカウントの設定
    6.POPFileの管理画面
 
  POPFileのトレーニングとメーラの設定(後編)
    1.POPFileのトレーニング(1)
    2.POPFileのトレーニング(2)
    3.メーラによるメールの分類
    4.設定のカスタマイズと使いこなし

 運用

@IT Special

- PR -

TechTargetジャパン

Windows Server Insider フォーラム 新着記事
  • Windows 10のUIをWindows 7風にする (2017/6/28)
     Windows 10に移行したものの、UIに慣れない。そんな場合は、Windows 10のUIを慣れたWindows 7に合わせよう。設定やユーティリティーでどこまで近づけられるのか?
  • 第552話 怖い話 (2017/6/27)
     なにぃ、会社のトイレにお化けが出るって? あー、バカバカしい。ホラー映画の観過ぎじゃないの、まったく……
  • Azure SQL DBのインデックスやキャッシュを制御する (2017/6/26)
     Azure SQL Databaseのインデックスやプロシージャキャッシュを制御するには、そのためのT-SQLを直接実行する。知っておくと便利なT-SQLを紹介する
  • DNSのリゾルバ/キャッシュ/フォワーダ機能 (2017/6/23)
     今回は、DNSサーバのクライアント側であるリゾルバやキャッシュの機能について見ていく。リゾルバは、コンテンツDNSサーバに繰り返し問い合わせて名前解決を図る
@ITメールマガジン 新着情報やスタッフのコラムがメールで届きます(無料)
- PR -

イベントカレンダー

PickUpイベント

- PR -

アクセスランキング

もっと見る

ホワイトペーパーTechTargetジャパン

注目のテーマ

Windows Server Insider 記事ランキング

本日 月間
ソリューションFLASH