POPFileにSPAMばかり学習させすぎて、通常のメールもSPAMと判定されるようになってしまったので保存してある全てのメールを学習させました。
Beckyを使っているので、保存フォルダの全てのメールファイルを1つのテキストファイル(personal.txt)にまとめて
>>
perl insert.pl personal personal.txt
<<
でOK。4年分のメールの総量は90MB、学習に一晩かかりました。
POPFileにSPAMばかり学習させすぎて、通常のメールもSPAMと判定されるようになってしまったので保存してある全てのメールを学習させました。
Beckyを使っているので、保存フォルダの全てのメールファイルを1つのテキストファイル(personal.txt)にまとめて
>>
perl insert.pl personal personal.txt
<<
でOK。4年分のメールの総量は90MB、学習に一晩かかりました。
CDをコピーしようとWinCDRを起動したら仮想ドライブしか選択できなくなっていて、ドライブを認識しなくなってしまった。何が悪いのか分からず、とりあえずWinCDRを削除。少し前にインストールしたCD Manipuratorを使ってみたところimgの作成はできるがドライブが書き込みに対応しておらずそこで終了。EACで書き込もうとしたらまたもドライブを認識せず。
とりあえずWinCDRを再インストールしたらドライブを認識するようになったのでCDをそれでコピー。EACでもドライブを認識するようになったが今度は手動TOCのメニューが消えていることに気づく。ツタヤでCDを3枚も借りてしまったので気合で何とかしようとがんばったがやっぱりTOCがおかしい・・・
結局古いバージョンのEACをインストールしたら元通り、最新バージョン(0.95 prebeta4)はよくないようだ。
Linux MLに流れてきた日本語SPAMのtar.gzファイルをPOPFileに勉強させる。
-http://www.flcl.org/~yoh/problem/jpspam03jul_04jan.tar.gz
>>
ダウンロードして解凍、ファイルがいっぱいできるので適当なツールを使ってひとつのファイルにまとめる(spam.txtとか)。
ファイル連結には以下のツール。
http://rd.vector.co.jp/soft/win95/writing/se098211.html
または
cat * > spam.txt
でもOK。
spam.txtが得られたらPOPFileをいったん停止、コマンドプロンプトを起動してPOPFileがインストールされたディレクトリに移動、以下のコマンドを実行
% perl insert.pl spam spam.txt
POPFileを起動し、単語数が増えていればOK。
<<
これまでコピー&ペイントにペースト、BMPで保存してImageMagickで変換を行っていたが、文字も画像として埋め込まれてしまうので解像度変換を行うとあまりに汚い。
きちんと文字を埋め込んでEPSに変換するための方法をメモ。
AdobeのPostScript対応プリンタドライバを使えばよいが、Acrobat Reader 6ものもの(Adobe PDF Printerだったかな?)ではうまく動かない模様。
WMF2EPSを使うことで解決、きれいに変換ができるようになりました。
http://www.yuba.is.uec.ac.jp/~tanabe/tips/ppt2eps.html
なお、ExcelやPowerPointでコピーした場合はEnhanced Meta Fileという形式らしい。
http://www.asahi-net.or.jp/~HA3T-NKMR/vcl2-8.htm
POPFileはメールの振り分けを行うソフトで、ベイズ統計を用いて賢く分類してくれます。がそのためには最初に学習が必要で、学習のさせ方によって性能が多少変わってきます。
とりあえずPOPFileの入手&インストール&簡単な使い方は以下のサイトからどうぞ。
http://popfile.sourceforge.net/manual/jp/manual.html
使いながら学習していけばいいんですが、そうそうSPAMメールが来ない人もいるので、Webからダウンロードしてきて学習させましょう。
http://tlec.linux.or.jp/docs/spamassassin.html
からtar.gzでまとめられたSPAMメールがとってこれるのでダウンロードして解凍、ファイルがいっぱいできるので適当なツールを使ってひとつのファイルにまとめましょう(spam.txtとか)。
ファイル連結には以下のツールをどうぞ。
http://rd.vector.co.jp/soft/win95/writing/se098211.html
または
>|
cat * > spam.txt
|< でもOKだと思います。
spam.txtが得られたらPOPFileをいったん停止、コマンドプロンプトを起動してPOPFileがインストールされたディレクトリに移動、以下のコマンドを実行
>|
% perl insert.pl spam spam.txt
|<
POPFileを起動し、単語数が増えていればOK。
私はファイル交換ソフトを一切触ったことがありません。
-WinMX
-Winny
-Kazaa
-Freenet
-etc…
27日、Winnyで違法なファイル交換をしていた2人が逮捕されたというニュース。これからどうなることやら、利用者じゃないけど行方に注目しています。
-http://headlines.yahoo.co.jp/hl?a=20031128-00000090-mai-soci
今日知ったんですがWinMXの後ろの二文字のアルファベットをひとつ単語に置き換えると
-M->N
-X->Y
となりWinnyになるんですね。へぇ。
さらに補足トリビア。NとYをさらに1文字づつ進めて
-N->O
-Y->Z
となり、Winozというソフトもすでにあるそうです。次はこれが普及するのかな?
-http://endimion.s19.xrea.com/index2.html
あっしは自他共に認めるフリーソフト大好き人間ですが、ダウンロードサイトで1つ気になる点があります。
ダウンロードのカウントは本当にあってるのか?
大手サイト Vector も 窓の杜 も今週のダウンロードランキング一位はLhasa v0.17しかももう何十週も連続して上に来ています。 ダウンロードってそんなに毎回するもんじゃないし、しかもよく見るとランキングには圧縮・解凍系のソフトがずらり。一人2種類もあれば十分なのに謎現象。今もLhasa使ってる人見たことないのですが・・・
この謎を解いてくれる優秀な名探偵君モトム