[運用]
POPFileのトレーニングとメーラの設定(後編)

2.POPFileのトレーニング(2)

デジタルアドバンテージ 打越 浩幸
2008/07/10


 それでは、次はトレーニング作業を行ってみよう。POPFileの管理画面を開き([スタート]メニューから開くか、システム・トレイのPOPFileアイコンをクリックして起動する)、[履歴]タブを選択する(デフォルトではこのタブが選択されているはずである)。すると次のような画面が表示される。

POPFileによる受信したメールの確認
POPFile経由でメールを受信すると、このように[履歴]タブに受信したメールの情報がすべて残っているはずである。デフォルトでは1ページ当たり20件で、最大で過去2日分まで表示される(それを過ぎるとトレーニングの対象にはできない)。これらのメールを使ってPOPFileのフィルタをトレーニングする。
このタブを選択する。
メールの受信日付(メール・ヘッダ中に記録されている時刻情報)。
メールの送信者(From:)。迷惑メールの場合は詐称されていることが多いので、これを基にして迷惑メールであるかどうかを判断することはできない。
メールのあて先(To:)。迷惑メールの場合は詐称されていることが多いので、これを基にして迷惑メールであるかどうかを判断することはできない。
メールの件名。この部分をクリックすると、各メールの詳しい内容を表示させることができる。
分類先のバケツ。未トレーニング状態では、すべてデフォルトのUnclassifiedバケツへ分類されている。
非常に多くのメールがある場合は、これを使って絞り込むことができる。
バケツなどで分類する場合に使用する。
検索条件をリセットして、全メールを表示させる場合に使用する。
デフォルトでは1ページ当たり20件しか表示されない。複数ページある場合は、この部分でページを切り替える。

 この画面には、受信したメールが時間順(一番上が一番新しい)に並んでいる。トレーニングされていない初期状態では、メールはすべて「unclassified」というバケツに分類されているはずであるが、それは、右端にある[分類]というフィールド()で確認できる。

 これらのメールの内容をユーザーが自分自身の目で見て確認し、適切なバケツへ振り分けたり、間違った分類のバケツから正しいバケツへ移動させたりすることをトレーニングという。具体的には、各メールの右側にあるドロップダウン・リストで、分類先のバケツを指定し、[再分類]ボタンをクリックする。

 次の画面を見ていただきたい。いくつかのメールをその目的に応じてドロップダウン・リストから選んでいるところである。すべての分類が終了したら、[再分類]というボタンをクリックすればよい。

メールの再分類(トレーニング)
各メールの右側にあるドロップダウン・リストで適切なバケツを選択する。
現在の分類先のバケツ。初期状態ではすべてunclassifiedとなっている。ある程度トレーニングが進むと、ほかのバケツ名になっているはずである。
ここにはバケツの一覧が表示されるので、適切なものを選択する。メール・アドレスや件名だけで内容が分かりづらい場合は、メーラ側で確認するか、件名部分をクリックして、メールの本文を詳しく調べる。
すべてのunclassifiedメールや間違ったバケツのメールに対して、手動で変更する。
選択がすべて完了したら、この[再分類]ボタンをクリックすると、メールが分類される。
すべてのページ(メール)について、この作業を行うこと。

 すべてのメールについて正しいバケツの指定が済んだら、[再分類]というボタンをクリックする。これのよりトレーニングが行われる。例えばspamに分類されたメールに含まれる単語はspamバケツと強く関連付けられ、今後同様のメールはspamバケツへ分類される確率が非常に高くなる。単語は英語や日本語に限らない。何語で書かれたメールであっても、ユーザーがそれをspamバケツへと分類すれば、POPFileは以後そのメールに含まれる単語をspamバケツと関連付けるようになっている。そのため、どのような言語で書かれたメールであっても、迷惑メールとして認識するようになっている。

 再分類が完了すると、結果は次のようになっているはずである。

トレーニングした結果
再分類後の画面。
再分類した先のバケツ名。
手動で再分類した場合は、このように「再分類されました」と表示される。
再分類操作をキャンセルして、元のバケツ(この例ならunclassifiedバケツ)へ戻したければ、これをクリックする。
特定のメールだけを削除したければ、このチェック・ボックスをオンにして、をクリックする。
選択したメールだけを削除する。
このページ中のメールを全部削除したければ、これをクリックする。1ページ分のトレーニング作業が終われば、これをクリックして次へ進むとよい。
履歴に残っている全メールを削除する場合はこれをクリックする。いったん削除すると、再分類できなくなる。

 以上で1ページ分(デフォルトでは20件分表示されている)のトレーニング処理の完了である。この作業をすべてのメールについて行う。先ほど、一度にトレーニングするのは数十通にした方がよいといったのはこのためである。例えばまず20通だけ分類して、また次の20通を処理するというふうに繰り返していけば、早い段階でトレーニングが完了し、後の方では再分類する必要性が少なくなる(迷惑メールは同じような文面や単語を使ったものが多いため)。最初に一度に100通も読み込んでしまうと、100通分トレーニングしなければならず、面倒である。

 1ページ分を終了するごとに、[このページを削除]ボタンをクリックして、次へ進むとよいだろう。

 トレーニングが進むと、だんだんと正しく分類されるメールが増えていくことが分かるだろう。そしてメールの受信結果は次のようになる。件名の部分に注目していただきたい。

トレーニングが進んだ後のメールの受信結果
トレーニングが進むにつれ、メールが正しく分類され、このように件名にバケツ名が付加されるようになる。見ての通り、迷惑メールが非常に多い。
件名の一覧。
先頭に「[spam] 」と付いているのはspamバケツに分類されたメール。
先頭に「[info] 」と付いているのはinfoバケツに分類されたメール。
件名の先頭に何もないのは、workバケツかunclassifiedバケツに分類されたメール。
このメールは本来ならばinfoバケツに分類したいが、間違ってspamバケツに分類されている。このような場合は手動で再分類させる。何通か同じようなメールを再分類すれば、すぐに正しいバケツに分類されるようになる。

 上の例では、いくつかのメールがspamやinfoバケツに分類されているが、そうでないメール(件名が変更されていないメール)もある。これは、workに分類されたメールか、unclassifiedのまま未分類となっているメールである。この2つは件名だけでは区別が付かない。そのため、必要なら先ほどのバケツの管理画面で、unclassifiedバケツの[件名の変更]チェック・ボックスをオンにするとよいだろう。そうすれば、件名が「[unclassified] 次回会議のお知らせ」などとなって、分類が失敗していることがすぐに分かるようになる。ただし最初からこのチェック・ボックスをオンにしていると、[unclassified]という件名のメールばかりになってしまうので、初期トレーニングが完了するまでは、オフにしておく方がよいだろう(最初に示した管理画面では、このような理由でオフにする例を紹介している)。

日常的なトレーニング作業

 以上が基本的なトレーニングの方法であるが、いつまでトレーニングすればよいかという基準は特にない。数百通も処理すれば、ユーザーによる再分類の必要性はほとんどなくなるだろうから、それまでは間違ったバケツに分類されていないか確認しながら、注意深く使えばよい。分類が間違っていたり、unclassifiedなメールが見つかったりしたら、管理画面を開いて、再分類処理を行う。

 ただし何が何でも、全メールを厳密に再分類しなければならない、というものでもない。時には間違いや、unclassifiedのメールもあるだろうが、多少間違っていても、そのうち(ほかの迷惑メールから)学習して分類精度が上がることもあるので、放置しておいてもよいだろう。また、非常に分類が紛らわしいものや、困難なメールも無理に分類しなくてもよいだろう。例えばあるスパム・メールを何かの資料として誰かに転送(フォワード)した場合、それは迷惑メールなのか、それとも仕事のメールなのかは判断が分かれるだろう。強制的にspamバケツに再分類すると、その送信者のメール・アドレスもspamバケツに関連付けられてしまう可能性が高くなる。

 また、むやみに多数のバケツを作成すると、目的が似通ったバケツ間で分類を間違える可能性が高くなる。POPFileで迷惑メールを排除した後は、メーラの持つメール・ルールなどで対応する方が間違える可能性が少なくなる。


 INDEX
  [運用]POPFileで構築する迷惑メール・フィルタ
  POPFileを導入して迷惑メールを分類する(前編)
    1.迷惑メールとその対策
    2.迷惑メールの分類をサポートするPOPFile
    3.POPFileのインストール(1)―入手と機能の選択
    4.POPFileのインストール(2)―初期バケツの作成
    5.POPFileのインストール(3)―メール・アカウントの設定
    6.POPFileの管理画面
 
  POPFileのトレーニングとメーラの設定(後編)
    1.POPFileのトレーニング(1)
  2.POPFileのトレーニング(2)
    3.メーラによるメールの分類
    4.設定のカスタマイズと使いこなし

 運用


Windows Server Insider フォーラム 新着記事
@ITメールマガジン 新着情報やスタッフのコラムがメールで届きます(無料)

注目のテーマ

Windows Server Insider 記事ランキング

本日 月間