[linux-support] bayes factor
Marco Steinacher
mailinglists at websource.ch
Mon Dec 13 14:19:59 CET 2004
Hallo Markus
> Und noch eine Spamassassin-Frage:
> Bei der Verwendung der bayesianischen Filter liegt der Spam-Wert, den ein Mail
> mittels bayes addiert bekommen kann, zwischen 0 und 1 (jedenfalls scheint mir
> das so: Mails, auf die zwar die normalen SA-Filter nicht matchen, die aber
> schon mehrfach dem Bayes-Filter als spam beigebracht wurden, haben den
> Eintrag "bayes=1.0000" im Header).
Ich denke das ist die vom Bayes-Filter berechnete Wahrscheinlichkeit,
dass das Mail Spam ist. 1.0000 ist der Maximalwert (100% Spam).
Dies sagt aber noch nichts über die Punkte aus, die das Mail dafür
bekommt. Spamassassin 3.0 vergibt defaultmässig folgende Scores:
score BAYES_00 0 0 -1.665 -2.599
score BAYES_05 0 0 -0.925 -0.413
score BAYES_20 0 0 -0.730 -1.951
score BAYES_40 0 0 -0.276 -1.096
score BAYES_50 0 0 1.567 0.001
score BAYES_60 0 0 3.515 0.372
score BAYES_80 0 0 3.608 2.087
score BAYES_95 0 0 3.514 2.063
score BAYES_99 0 0 4.070 1.88
describe BAYES_00 Bayesian spam probability is 0 to 1%
describe BAYES_05 Bayesian spam probability is 1 to 5%
describe BAYES_20 Bayesian spam probability is 5 to 20%
describe BAYES_40 Bayesian spam probability is 20 to 40%
describe BAYES_50 Bayesian spam probability is 40 to 60%
describe BAYES_60 Bayesian spam probability is 60 to 80%
describe BAYES_80 Bayesian spam probability is 80 to 95%
describe BAYES_95 Bayesian spam probability is 95 to 99%
describe BAYES_99 Bayesian spam probability is 99 to 100%
Die Punkte in der hintersten Spalte sind die Punkte wenn die
Netzwerk-Test auch aktiviert sind, die Punkte in der dritte Spalte
werden verwendet, falls die Netzwerk-Tests deaktiviert sind.
> Das reicht aber nicht aus, wenn das Mail sonst nicht matcht.
> Weiss jemand, wie ich den "Bayes Factor" erhöhen kann?
In deinem Fall (1.0000 = 100%) vergibt SA defaultmässig also 1.88 (bzw.
4.070) Punkte. Falls dir das zuwenig ist, kannst du die Bewertung im
Konfigurationsfile überschreiben. Dazu fügst du z.B. einfach die
folgende Zeile in /etc/mail/spamassassin/local.cf (Globale Config) bzw.
~/.spamassassin/user_prefs (Benutzer Config) ein:
score BAYES_99 0 0 7.00 7.00
Dann werden die Mails mit 99-100% Bayes-Wahrscheinlichkeit mit 7 Punkten
bewertet. (Was meiner Meinung nach allerdings zu hoch ist.)
HTH
Marco
--
WebSource Internet Services - www.websource.ch
Kontakt/PGP-Keys: www.websource.ch/kontakt
PGP: 0x0B431D6B - 0BCA FD08 2859 FF1A 4B42 29BD DD91 3A67 0B43 1D6B
Do NOT use this address: aabfalle at websource.ch
More information about the Linux-support
mailing list