POPFileの学習

12月 27th, 2003 by tune Leave a reply »

POPFileはメールの振り分けを行うソフトで、ベイズ統計を用いて賢く分類してくれます。がそのためには最初に学習が必要で、学習のさせ方によって性能が多少変わってきます。

とりあえずPOPFileの入手&インストール&簡単な使い方は以下のサイトからどうぞ。

http://popfile.sourceforge.net/manual/jp/manual.html

使いながら学習していけばいいんですが、そうそうSPAMメールが来ない人もいるので、Webからダウンロードしてきて学習させましょう。

http://tlec.linux.or.jp/docs/spamassassin.html

からtar.gzでまとめられたSPAMメールがとってこれるのでダウンロードして解凍、ファイルがいっぱいできるので適当なツールを使ってひとつのファイルにまとめましょう(spam.txtとか)。
ファイル連結には以下のツールをどうぞ。

http://rd.vector.co.jp/soft/win95/writing/se098211.html

または
>|
cat * > spam.txt
|< でもOKだと思います。

spam.txtが得られたらPOPFileをいったん停止、コマンドプロンプトを起動してPOPFileがインストールされたディレクトリに移動、以下のコマンドを実行
>|
% perl insert.pl spam spam.txt
|<

POPFileを起動し、単語数が増えていればOK。

Advertisement

Comments are closed.

Additional comments powered by BackType