Skip to content

Bayes Spamschutz im Blog

Das Serendipity Bayes Plugin, das Kommentar- und Trackback Spam aus dem Blog entfernen kann, ist schon etwas älter. Schon 2009 berichteten Dirk, Robert und Matthias darüber.

Das Bayes AntiSpam Plugin hat den Vorteil, das es ohne Zugriff auf einen externen Server auskommt. Das normale AntiSpam Plugin benutzt am besten die Akismet Datenbank, wodurch allerdings Kommentar Daten an einen fremden Service übermittelt werden. Bayes bleibt komplett lokal, wodurch man einige kritische Datenschutz Probleme behoben hat. Somit stand das Bayes Plugin schon länger auf meiner Todo Liste der in diesem Blog zu installierenden Plugins.

Im Zusammenhang mit meinen Änderungen an der XML-RPC Schnittstelle installierte ich nun vor gut einer Woche das Bayes. Der Grund war, dass das Bayes "lernt" was Spam ist, wenn man einen Kommentar manuell als Spam markiert. Der mobile WordPress Clients, den ich bei meinen Tests für die XML-RPCSchnittstelle benutze, kann Kommentare explizit als Spam kennzeichnen. Das passt also prima zusammen. Ich habe in das XML-RPC Plugin entsprechende Events eingebaut, die von AntiSpam Plugins gefangen und ausgewertet werden können. Für das Bayes habe ich das mal exemplarisch eingebaut und mich mit onli wegen dieser (und anderer) Änderungen am Bayes in Verbindung gesetzt.

Onli war gerade selber wieder daran, am Plugin Erweiterungen einzubiden, somit packte er meine Änderungen hinzu und veröffentlichte eine weitere Version des Plugins. Leider ist in der Version die Bearbeitung der XMLRPC Events noch auskommentiert, weil wir besprechen mussten, wie genau das gehen soll. Das ist erledigt, eine weitere von mir angepasste Version liegt bei ihm zum Review, somit sollte diese Änderung auch bald nach Spartacus gehen.

Das dazu passende XML-RPC Plugin ist bei mir noch im Betatest, aber wir scheinen nun kurz vor dem Release zu sein. :-)

Bayes im Einsatz

Zum Bayes selber: Es läuft wie gesagt nun schon seit einiger Zeit in meinem Blog. Es war in dieser Zeit extrem erfolgreich und hat sehr zuverlässig Spam entfernt, ohne einen einzigen falschen Alarm auszugeben. Ich habe derzeit noch Akismet dahinter geschaltet für  den Fall, dass dem Bayes mal ein Spam durch die Finger gleitet. Das ist erst 2 Mal passiert bei locker über 100 erfolgreich gefischten Spam Kommentaren. Es ist also so erfolgreich, dass ich die Captchas im Kommentar Bereich heraus nehmen konnte und mich bald endlich von Akismet verabschieden kann.

Am besten funktioniert es, wenn man vorher ein wenig Spam sammelt und das Bayes nach der Installation an den Blogkommentaren lernen lässt. Zusätzlich kann man auch die Datenbanken anderer Blogs importieren, wodurch es sofort eine sehr gute Grundlage für Spam Erkennung hat. Bei mir lief es allerdings sofort sehr gut, nachdem es die Kommentare in meinem Blog gelernt hatte, die ich wie gesagt vorher mit reichlich Spam belassen hatte. Ich kann nur jedem empfehlen, es mal zu installieren und auszuprobieren!

 

Trackbacks

Grischa

Grischa am : Projekt: Serendipity mobil benutzen - Vorerst fertig

"Projekt: Serendipity mobil benutzen - Vorerst fertig" vollständig lesen
Die Betatests am XML-RPC Plugin für Serendipity sind durch. Noch einmal ein großes Dankeschön an Robert und Franz, die mit viel Engagement systematisch Clients getestet haben! Ebenso an Jan, der zwischendurch den WP iOS Client debugged hat

Kommentare

Ansicht der Kommentare: Linear | Verschachtelt

Dirk Deimeke

Dirk Deimeke am :

Beim Importieren fremder Daten unbedingt darauf achten, dass der andere die gleiche Sprache im Blog verwendet.

Mein Blog ist deutsch und nahezu jeder englischsprachige Kommentar wird als Spam gewertet, das ist für ein englischsprachiges Blog fatal.

Ebenfalls wichtig ist, regelmässig den Bayes-Papierkorb anzuschauen.

Grischa

Grischa am :

Sehr guter Hinweis!

Und: Oh je. Dein Kommentar unter den Bayes Artikel war nun ausgerechnet der erste, der vom Bayes falsch als Spam heraus gefiltert wurde. :-O

Glücklicher Weise gibt es aber ja den Papierkorb, aus dem ich den Kommentar wieder heraus holen konnte (wobei das Plugin gleich automatisch lernt, dass das kein Spam sein soll).

EDIT: Nö, das mit dem automatischen Lernen scheint nicht der Fall zu sein. Er war noch auf 92%. Habe das jetzt manuell nachgeholt.

Dirk Deimeke

Dirk Deimeke am :

Und ich habe keine Benachrichtigung über Deinen Kommentar bekommen ... Bayes ist grossartig, aber an ein paar Feinheiten müsste noch gefeilt werden.

Grischa

Grischa am :

@Dirk Oh, interessant! Dann wird da irgendwie die Subscribed Verbindung nicht wieder hergestellt .. Falls onli das nicht bereits macht, schaue ich mal rein, woran das liegt ..

onl

onl am :

nein, da bin ich gerade nicht dran. Meinst du, das liegt am bayes-plugin?

onli

onli am :

Ich habe deine Änderungen eingebaut und commitet. Die xmlrpc-hooks sollten nun drin sein.

Grischa

Grischa am :

Klasse, vielen Dank! :-)

Grischa

Grischa am :

Da bin ich mir nicht sicher. Evtl führt s9y schlicht nicht die Subscription aus, wenn ein Plugin Spam meldet, was ja auch durchaus Sinn machen würde..

onli

onli am :

Stimmt, so ist es.

narrenfrei

narrenfrei am :

Sollte man bei Verwendung vom Bayes-Plugin eigentlich das Standardplugin serendipity_event_spamblock deaktivieren?

onli

onli am :

Nein, sollte ist zuviel. Man könnte es versuchen, aber Funktionen wie der IP-Block sind auch parallel zu Bayes noch praktisch.

Grischa

Grischa am :

Ich habe es noch eingeschaltet und zwar hinter dem Bayes. Auf diese Weise kann das Bayes "in Ruhe lernen" und Akismet fischt dann noch weg, was das Bayes nicht erkannt hat. Das schöne dabei ist, dass Akismet dann immerhin nur noch in diesen sehr seltenen Fällen aufgerufen wird.

Dirk Deimeke

Dirk Deimeke am :

Ich halte Akismet für überflüssig, da mir Bayes jeden Spam rausfischt.

Grischa

Grischa am :

Bei mir leider nur "nahe zu". So ca. einmal die Woche kommt ein Kommentar bei mir noch durch, der dann eben von Akismet gefischt wird.

Ich habe allerdings keine externen Daten hier eingelernt und habe es auch noch nicht so lange, somit muss mein Bayes wohl noch ein wenig lernen.

Dirk Deimeke

Dirk Deimeke am :

Echt? Für einen Spam in der Woche lässt Du einen datenschutzrechtlich bedenklichen Dienst mitlaufen? Das halte ich für übertrieben ...

Grischa

Grischa am :

Hmm.. Da ist was dran.. Vielleicht sollte ich mich wirklich mal trauen, das normale AntiSpam Plugin raus zu nehmen.

Vor allem, weil ich ja inzwischen auch mobil über neue Kommentare informiert werde und so schnell mal eben auf nicht gefilterten SPAM reagieren kann.

Okay. Ich schalte es jetzt aus! :-D

Dirk Deimeke

Dirk Deimeke am :

Schön!

Wenn Du jetzt noch die Zeitsperre rausnimmst, in die ich immer falle, wenn ich versuche zwei Kommentare bei Dir zu hinterlassen, ist es perfekt.

Nur Mut! Ich betreibe das schon seit Erscheinen des Bayes-Plugins so.

Grischa

Grischa am :

Ich habe da eine Zeitsperre? :-O

Da muss ich mal meine Konfiguration ansehen..

Später: Ah, das ist auch eine Schutzfunktion des normalen AntiSpam Plugins, das ich inzwischen deaktiviert habe. Sollte also keine mehr vorhanden sein.

Dirk Deimeke

Dirk Deimeke am :

Ja, das macht Sinn (so mache ich es auch). Das gibt den Kommentaren einen noch schlechteren Wert als sie ohnehin schon haben.

Grischa

Grischa Auf Twitter lesen: am :

Dann mache ich das also richtig, danke.

Ich hatte Sorge, dass das evtl. das Gleichgewicht etwas aus den Tritt bringt und so evtl. durch Relevanzverschiebung neuer Spam schwerer zu erkennen ist (neue Spam Worte werden vielleicht nicht so schnell relevant im Vergleich zu alten).

Grischa schrieb auch: CommentSpice: Salz für den Kommentarbereich

Dirk Deimeke

Dirk Deimeke am :

Ich schaue mehrmals am Tag in den Papierkorb und habe mittlerweile ein Gefühl dafür.

Am Anfang war die Grenze für automatisches Löschen (ohne Papierkorb) bei mir bei 98%, mittlerweile ist sie auf 95% runter. Das klappt sehr gut.

Kommentar schreiben

Die angegebene E-Mail-Adresse wird nicht dargestellt, sondern nur für eventuelle Benachrichtigungen verwendet.
Dieses Blog erlaubt Dir, Audio Kommentare über audioboo.fm hinzuzufügen. Erstelle einen neuen Boo und gib hier den Link auf die Seite Deines Boos ein.
record
Wenn Du Deinen Twitter Namen eingibst wird Deine Timeline in Deinem Kommentar verlinkt.
Bewirb einen Deiner letzten Artikel
Dieses Blog erlaubt Dir mit Deinem Kommentar einen Deiner letzten Artikel zu bewerben. Bitte gib Deine Blog URL als Homepage ein, dann wird eine Auswahl erscheinen, in der Du einen Artikel auswählen kannst. (Javascript erforderlich)
(Bedingung: 1 Kommentare geschrieben)
Standard-Text Smilies wie :-) und ;-) werden zu Bildern konvertiert.
tweetbackcheck