Bayes'sche Bewertung |
Scrollen Zurück Oberste Ebene Weiter Mehr |
Der Konfigurationsdialog Bayes ist nicht verfügbar, falls MDaemon den MDaemon-Spam-Daemon (MDSpamD) eines anderen MDaemon-Servers für den Spam-Filter verwendet. Alle Bayes’schen Lernvorgänge werden dann auf dem anderen Server durchgeführt. Weitere Informationen enthält der Abschnitt Spam-Daemon. |
Der Spam-Filter unterstützt das Bayes’sche Lernverfahren, ein statistisches Verfahren, das wahlweise zur Analyse von Spam- und normalen Nachrichten eingesetzt werden kann, um die Treffsicherheit des Spam-Filters mit der Zeit zu erhöhen. Der Benutzer kann zwei Verzeichnisse angeben, eines für bekannte Spam- und eines für bekannte normale Nachrichten, die beide jeweils um Mitternacht verarbeitet werden. Alle Nachrichten in den Verzeichnissen werden analysiert und indiziert. Neue Nachrichten können mit den hieraus gewonnenen Erkenntnissen statistisch verglichen werden, um festzustellen, ob es sich um Spam handelt. Anhand der Ergebnisse des Bayes’schen Verfahrens kann der Spam-Filter dann die Bewertungen der Nachrichten anpassen.
Der Spam-Filter wendet die Ergebnisse des Bayes’schen Lernverfahrens erst an, wenn mindestens die Anzahl an Spam- und normalen Nachrichten analysiert wurde, die im Konfigurationsdialog Bayes'scher automatischer Lernvorgang festgelegt sind. Dies ist erforderlich, weil der Spam-Filter sonst keine ausreichende statistische Datenbasis hat, um Vergleiche nach dem Bayes’schen Verfahren durchzuführen. Hat das System diese Nachrichten analysiert, so hat es eine ausreichende Datenbasis geschaffen, um die gewonnenen Ergebnisse in die Spam-Bewertung eingehender Nachrichten einfließen zu lassen. Das Bayes’sche Lernverfahren kann jedoch auch dann fortgesetzt werden, und durch die fortlaufende Analyse immer neuer Nachrichten wird die Einordnung nach dem Bayes’schen Verfahren mit der Zeit immer zuverlässiger. |
Bayes'sche Bewertung
Bayes'sche Bewertung aktivieren
Diese Option bewirkt, dass die Ergebnisse des Bayes’schen Lernverfahrens in die Bewertung der eingehenden Nachrichten eingehen.
Bayes'sches Lernverfahren jeden Tag um Mitternacht ausführen
Ist diese Option aktiv, so analysiert der Spam-Filter jeden Tag um Mitternacht alle Nachrichten in den Ordnern für Spam und normale Nachrichten, die weiter unten beschrieben sind. Nach der Analyse werden die Nachrichten gelöscht. Soll das Bayes’sche Lernverfahren in einem abweichenden Intervall ausgeführt werden, so muss diese Option deaktiviert werden. Das Intervall kann dann über die Option Bayes’sches Lernverfahren einmal alle [xx] Stunden ausführen konfiguriert werden. Soll hingegen das Bayes’sche Lernverfahren überhaupt nicht ausgeführt werden, so müssen diese Option abgeschaltet und in der folgenden Option der Wert 0 eingetragen sein.
Bayes'sches Lernverfahren einmal alle [xx] Stunden ausführen (0=nie)
Soll das Bayes’sche Lernverfahren in einem anderen Intervall als jeden Tag um Mitternacht ausgeführt werden, so muss die Option oben deaktiviert werden. Danach muss in dem Eingabefeld zu dieser Option das Intervall in Stunden eingetragen werden. Nach Ablauf der hier in Stunden angegebenen Zeit analysiert der Spam-Filter alle Nachrichten in den Ordnern für Spam und normale Nachrichten, die weiter unten beschrieben sind. Nach der Analyse werden die Nachrichten gelöscht. Soll hingegen das Bayes’sche Lernverfahren überhaupt nicht ausgeführt werden, so müssen die Option oben abgeschaltet und in dieser Option der Wert 0 eingetragen sein.
Falls die Nachrichten nach der Analyse nicht aus den Verzeichnissen gelöscht werden sollen, kann dies durch Kopieren der Datei LEARN.BAT nach MYLEARN.BAT im Verzeichnis \MDaemon\App\ und anschließende Bearbeitung der Datei MYLEARN.BAT erreicht werden; dabei müssen nur die beiden Zeilen gegen Ende der Datei gelöscht werden, die mit "if exist" beginnen. So lange eine Datei MYLEARN.BAT vorhanden ist, ignoriert MDaemon die Datei LEARN.BAT. Wegen weiterer Informationen hierzu, vgl. die Textdatei SA-Learn.txt in dem Verzeichnis \MDaemon\SpamAssassin\. Weitere Informationen zur Heuristik bei der Erkennung von Spam und zum Bayes’schen Lernverfahren sind erhältlich unter: |
Nachrichten vom Lernverfahren ausschließen, deren Größe über [xx] Byte liegt (0=keine Begrenzung)
Mit dieser Option kann definiert werden, wie groß die Nachrichten höchstens sein dürfen, damit sie vom Bayes’schen Lernverfahren noch umfasst sind. Nachrichten, deren Größe den hier angegebenen Wert überschreitet, werden nicht analysiert. Sollen Nachrichten unabhängig von ihrer Größe analysiert werden, muss hier der Wert 0 eingetragen werden.
Lernen
Ein Klick auf diesen Knopf führt mit den beiden angegebenen Ordnern sofort eine Bayes’sche Analyse durch, die sonst nur in den oben ausgewählten Intervallen stattfinden würde.
Weiterleitungsadressen für Spam und Ham aktivieren
Diese Option stellt den Benutzern Adressen zur Verfügung, an die sie Spam- und normale Nachrichten (letztere werden auch als "Ham" bezeichnet) weiterleiten können. Das Bayes’sche Lernverfahren verarbeitet auch solche weitergeleiteten Nachrichten und bindet sie in den Lernvorgang ein. MDaemon stellt per Vorgabe die Adressen "SpamLearn@<Domäne>" und "HamLearn@<Domäne>" zur Verfügung. Nachrichten an diese Adressen werden nur verarbeitet, wenn sie in einer SMTP-Verbindung übertragen werden, die über den SMTP-Befehl AUTH echtheitsbestätigt wurde. MDaemon setzt außerdem voraus, dass die Nachrichten an die genannten Adressen als Dateianlagen des Typs "message/rfc822" weitergeleitet werden. Andere Nachrichtentypen verarbeitet MDaemon nicht.
Die Zieladressen, die MDaemon verwendet, können durch Einfügen der folgenden Einträge in die Datei CFilter.INI angepasst werden:
[SpamFilter]
SpamLearnAddress=MySpamLearnAddress@
HamLearnAddress=MyNonSpamLearnAddress@
Beachte: Beide Einträge müssen auf das at-Zeichen "@" enden.
Erstellen
Ein Klick auf dieses Steuerelement bewirkt, dass MDaemon automatisch die öffentlichen IMAP-Ordner für Spam und normale Nachrichten ("Ham") anlegt und sich selbst so konfiguriert, dass diese Ordner genutzt werden. Im Einzelnen werden folgende Ordner angelegt:
\Bayesian Learning.IMAP\ |
Haupt-IMAP-Ordner. |
\Bayesian Learning.IMAP\Spam.IMAP\ |
Ordner für falsche negative Treffer, also Nachrichten, deren Spam-Bewertung zu niedrig war, und die nicht als Spam erkannt und gekennzeichnet wurden. |
\Bayesian Learning.IMAP\Non-Spam.IMAP\ |
Ordner für falsche positive Treffer, also normale Nachrichten, die fälschlich zu hoch bewertet und als Spam erkannt und gekennzeichnet wurden. |
Die Berechtigungen für diese Ordner werden grundsätzlich so eingerichtet, dass nur lokale Benutzer lokaler Domänen auf sie zugreifen können, und dass ihre Rechte außerdem auf das Durchsuchen und Erstellen ("Lookup" und "Insert") beschränkt sind. Der Postmaster erhält die Rechte Durchsuchen, Lesen, Erstellen und Löschen ("Lookup", "Read", "Insert" und "Delete").
Pfad zum Ordner mit bekanntem Spam (falsche Negative):
Dieses Verzeichnis, das für das Bayes’sche Lernverfahren benutzt wird, muss Nachrichten enthalten, von denen bekannt ist, dass es sich bei ihnen um Spam handelt. Andere Nachrichten dürfen nicht in dieses Verzeichnis kopiert werden. Die Nachrichten sollen auch nicht automatisch in dieses Verzeichnis verschoben werden, es sei denn durch die Funktionen Bayes'scher automatischer Lernvorgang und Spam-Honeypots, da in anderen Fällen die Gefahr zu groß ist, dass Nachrichten fälschlich in das Verzeichnis geraten. Würden normale Nachrichten, die nicht Spam sind, in dem Verzeichnis für Spam gefunden und analysiert, so würde dies die Verlässlichkeit des Ergebnisse aus dem Bayes’schen Lernverfahren verringern.
Pfad zum Ordner mit bekannten normalen Nachrichten (falsche Positive):
In dieses Verzeichnis, das ebenfalls für das Bayes’sche Lernverfahren verwendet wird, müssen Nachrichten kopiert werden, von denen es einwandfrei klar ist, dass es sich nicht um Spam handelt. Es sollen keinesfalls Nachrichten in dieses Verzeichnis kopiert werden, von denen nicht sicher feststeht, dass es sich nicht um Spam handelt. Auch diese Nachrichten sollten wegen der Fehleranfälligkeit nicht automatisch in das Verzeichnis kopiert werden, es sei denn durch die Funktion Bayes'scher automatischer Lernvorgang, da sonst die Gefahr zu groß ist, dass Nachrichten fälschlich in das Verzeichnis geraten. Würden Spam-Nachrichten in dem Verzeichnis für bekannte normale Nachrichten gefunden und analysiert, so würde dies die Verlässlichkeit des Ergebnisse aus dem Bayes’schen Lernverfahren verringern.
Öffentlicher Ordner
Mithilfe dieser Steuerelemente lassen sich bestehende öffentliche Ordner als Quellverzeichnisse für das Bayes’sche Lernverfahren definieren. Die Benutzer können dann sehr einfach Nachrichten, bei denen sie erkennen, dass sie fälschlich als Spam erkannt oder nicht erkannt wurden, in das zugehörige Verzeichnis kopieren und so dem Lernverfahren zuführen. Je mehr Benutzer Zugriff auf diese Ordner erhalten, desto höher ist aber auch das Risiko, dass eine Nachricht, die aus Versehen in den falschen Ordner kopiert wurde, die Treffsicherheit verringert.
Wird einer dieser öffentlicher Ordner über einen Mailclient, den Windows-Explorer oder auf andere Weise umbenannt, so muss der betroffene Eintrag in diesem Menü von Hand angepasst werden. Der Spam-Filter kann sonst nicht erkennen, dass er einen anderen Ordner verwenden soll, und verwendet weiterhin den alten, nicht mehr gültigen Ordner. |
Siehe auch: