Wie ihr Kommentar-Spam loswerdet

Montag, 29. September 2008

Vielleicht habt ihr gerade zum ersten Mal ein Forum in eure Site eingebaut oder die Kommentarfunktion eures Blogs aktiviert. Ihr gebt euch Mühe, ein oder zwei Posts zu schreiben, klickt auf "Senden" und freut euch mit angehaltenem Atem auf die ersten Kommentare.

Diese lassen dann auch nicht lange auf sich warten. Vielleicht bekommt ihr eine nette Nachricht eines Blogger-Kollegen, ein wichtiges Update eines Mitglieds eurer MMORPG-Gilde oder eine Erinnerung von Tante Millie an das Abendessen am Donnerstag. Aber dann kommt vielleicht etwas anderes - etwas... beunruhigendes. Werbung für Angebote, die zu gut klingen, um wahr zu sein, ein bizarrer Schwall unzusammenhängender Worte und eindeutige Bilder, die Tante Millie besser nicht sehen sollte. Alles Zeichen dafür, dass ihr von einer Lawine nervenden Kommentar-Spams überrollt wurdet.

Kommentar-Spam ist in jeder Beziehung schlecht: Für euch, weil es euch zusätzliche Arbeit beschert. Für eure User, die eigentlich nützliche Informationen auf eurer Site finden wollen anstatt seltsamer Links und unzusammenhängendem Content. Schließlich schadet es auch dem Web insgesamt, da durch den Kommentar-Spam viele Leute davon abgehalten werden, ihre Site für user-generierten Content zu öffnen oder sich selbst an den Unterhaltungen in bereits bestehenden Foren zu beteiligen.

Was könnt ihr als Webmaster also dagegen tun?

Die folgende Liste sollte euch schon mal weiterhelfen (Hinweis: Die Liste soll nur als Ausgangspunkt dienen und erhebt keinen Anspruch auf Vollständigkeit). Es gibt so viele verschiedene Blog-, Forum- und Message-Board-Systeme, dass wir unmöglich für alle Systeme detaillierte Anweisungen geben können - wir haben die einzelnen Punkte deshalb so formuliert, dass die Konzepte auf die meisten Systeme zutreffen sollten.

Stellt sicher, dass die Kommentare von Menschenhand verfasst sind
  • Nutzt ein CAPTCHA . Bei CAPTCHAs werden User dazu aufgefordert, eine leicht verschleierte Zeichenfolge zu entziffern und das Resultat in ein Textfeld einzugeben, um damit zu demonstrieren, dass es sich um echte Menschen handelt und nicht um ein automatisiertes Skript. Falls euer Blog- oder Forum-System standardmäßig keine CAPTCHAS anbietet, könnt ihr ggf. ein entsprechendes Plug-in verwenden, wie z. B. Recaptcha , ein Projekt, das auch beim Digitalisierern alter Bücher eingesetzt wird. CAPTCHAs sind kein Allheilmittel, aber sie machen den Spammern das Leben bereits ein klein wenig schwerer. Hier könnt ihr mehr über die verschiedenen Arten von CAPTCHAs erfahren , bedenkt dabei aber, dass bereits ein simples CAPTCHA bereits recht effektiv sein kann.

  • Blockiert verdächtige Verhaltensweisen. Bei vielen Foren könnt ihr ein Zeitlimit setzen (für wiederholte Postings des gleichen Nutzers) und es gibt zahlreiche Plug-ins, die vor exzessivem Traffic von identischen IPs schützen und zahlreiche andere Verhaltensweisen, die charakteristisch für automatisierte Skripte sind, erkennen helfen.
Verwendet eine automatische Filterung
  • Eindeutig unerwünschte Kommentare könnt ihr häufig blockieren, indem ihr bestimmte Worte einer sogenannten "Blacklist" hinzufügt. Da viele Spammer häufig einzelne Worte in ihren Kommentaren verschleiern, ist diese Filterung nicht immer eine zuverlässige Lösung - sie kann jedoch bei plumpen Spamversuchen recht nützlich sein.

  • Verwendet die bereits eingebauten Anti-Spam-Funktionen eures Systems oder setzt entsprechende Plug-ins ein. Spammer verwenden in der Regel automatisierte Tools beim Angriff auf eure Site - warum also nicht auch automatisierte Tools zur eigenen Verteidigung nutzen? Umfangreiche Lösungen wie z. B. Akismet, das Plug-ins für viele Blogs und Forum-Systeme anbietet , oder z. B. die zu Akismet kompatible Open-Source-Lösung TypePad AntiSpam sind leicht zu installieren und nehmen euch dann die meiste Arbeit ab.

  • Probiert, falls vorhanden, Bayessche Filter-Funktionen aus. Dabei müsst ihr euer System "trainieren", den Spam zu erkennen, was einen gewissen Aufwand bedeutet. Diese Technik hat sich aber vor allem beim E-Mail-Spam als sehr erfolgreich erwiesen .
Seid bei euren Voreinstellungen etwas strenger
  • Setzt Links, denen ihr nicht vertraut, auf "nofollow" . Viele Systeme bieten eine Einstellmöglichkeit, um das class="external-link"-Attribut bei Kommentar-Links zu setzen, oder machen dies bereits standardmäßig. Dies kann bereits vor einigen Arten von Spam schützen, sollte jedoch nicht eure einzige Maßnahme bleiben.

  • Denkt darüber nach, für das Posten von Kommentaren die Erstellung eines Nutzer-Kontos auf eurer Site vorauszusetzen. Dies erfordert zwar zusätzliche Schritte von euren Besuchern und könnte vor allem Gelegenheitsbesucher davon abhalten, Kommentare zu hinterlassen. Gleichzeitig wird so aber auch das Signal-Rausch-Verhältnis erhöht. ;)

  • Ändert eure Einstellungen dahingehend, dass Kommentare erst von euch "freigeschaltet" werden müssen, bevor sie auf der Site erscheinen. Dies eignet sich besonders dann, wenn ihr einen hohen Standard bei den Kommentaren gewährleisten wollt, nicht allzu viele Kommentare erwartet oder nur eine kleine private Site betreibt. Ihr könnt beispielsweise Angestellten/Kollegen oder vertrauten Nutzern erlauben, die eigenen Posts freizuschalten und den Arbeitsaufwand auf diese Weise etwas aufteilen.

  • Bestimmte Arten von Kommentaren könnt ihr ggf. ganz deaktivieren. Beispielsweise könnte es sinnvoll sein, die Kommentarfunktion für sehr alte Posts zu deaktivieren, falls es unwahrscheinlich ist, dass dort noch organische Kommentare erscheinen werden. Bei Blogs bietet es sich häufig an, die Trackbacks oder Pingbacks zu deaktivieren - dies sind zwar coole Features, bilden jedoch gleichzeitig ein Einfallstor für automatisch generierten Spam.
Haltet eure Site auf dem neusten Stand
  • Nehmt euch die Zeit, um eure Software auf dem neusten Stand zu halten und haltet besonders nach wichtigen Sicherheits-Updates Ausschau. Spammer machen sich gern Sicherheitslücken in älteren Versionen von Blogs, Message-Boards und anderen CMS zu nutze. Zusätzliche hilfreiche Maßnahmen könnt ihr auch unserer Sicherheits-Checkliste für Webmaster entnehmen.
Es ist an euch, zwischen den angesprochenen Möglichkeiten die richtige Balance zu finden, je nachdem, welche Blog- oder Message-Board-Software ihr verwendet, wer eure hauptsächlichen Nutzer sind und je nach eurem persönlichen Grad an Erfahrung im Umgang mit Kommentar-Spam. Es stellt ein großes Risiko dar, gänzlich unvorbereitet eine Site für Kommentare zu öffnen - egal ob es sich nur um einen kleinen privaten Blog oder um eine Site mit tausenden von Usern handelt. Sollte euer Forum aber dennoch einmal durch tausende von Spam-Posts überflutet worden sein und gar nicht mehr in der Google-Suche auftauchen, dann solltet ihr zunächst den ganzen Schrott entfernen und einige der hier beschriebenen Maßnahmen treffen, um in Zukunft dagegen gewappnet zu sein. Anschließend könnt ihr ggf. einen Antrag auf erneute Überprüfung einreichen.

Aus Erfahrung als langjähriger Blogger und Web-Developer kann ich euch sagen, dass sich dieser kleine Aufwand im Vorfeld auf jeden Fall bezahlt macht und euch im Nachhinein eine Menge Arbeit erspart. Ich bin neu im Webmaster Central Team und komme ursprünglich aus Cleveland. Ich finde es spannend, Webmaster-Kollegen zu helfen und bin sehr an Fragen der Usability und Search Quality interessiert (worüber ich auch ein wenig akademische Forschung betrieben habe). Wir freuen uns auf eure Tipps zur Vermeidung von Forum- und Kommentar-Spam - hinterlasst doch einfach einen Kommentar. ;) Wie immer könnt ihr natürlich auch wieder eure Fragen in unserem Forum für Webmaster diskutieren.

Keeping comment spam off your site and away from users (English version)

Post von Jason Morrison, Search Quality Team (Übersetzung von Sven, Search Quality)