Over verdwijnende Comments, Null-Void-Vacui en spam

Eens in de zoveel tijd duik ik mijn comment-systeem in en maak daar alles eens goed schoon (hmm, die gewoonte zou ik in mijn keuken ook eens moeten toepassen :)). Wat schetste mijn verbazing: mijn spamfilter was een beetje te streng geweest en had vrolijk jullie schrijfsels als spam aangemerkt. en paar, althan.

Dus Mieg, <a href="http://www.cybernetic-broadcasting.net/home/">Ru-D, <a href="http://willy.boerland.com/myblog/">Bert en Anoniem: bij dezen mijn excuses. Even in het kort het hoe en wat:Waarom zouden die lui inshemelsnaam een weblogje als het deze willen <a href="http://en.wikipedia.org/wiki/Comment_spam">bespammen? Nu eenvoudig: <href="http://nl.wikipedia.org/wiki/PageRank">Google ranking en exposure. Google werkt, heel grof, als volgt: Hoe meer links er naar pagina webschuur.com wijzen, hoe hoger google deze in haar resultaten weergeeft. En als je grootgrossier in "inches" bent, dan wil je uiteraard hoog in google staan, denk ik, ik ben niet zo thuis in de inch-markt.

Dus wat doen ze? Ze zoeken kleinere sites, of grotere sites, waar men "open & bloot" tekst kan toevoegen. Een soort van illegale posterplakcampagne zeg maar. Daar laten ze vervolgens een robot op los, die in een paar minuten tijd een paarduizend comments plaatst op die site. Mt de hoop dat google deze oppikt en hun site, waarheen ze linken, lekker hoog in de resultaten zet. Kunnen zij weer vrolijk ph@rm-acy tje spelen.

Dus wat doe ik?Ik heb een heleboel opties om dit tegen te gaan. De meest voor de hand liggende, is om gewoon comments uit te zetten. Dat zou jammer zijn. Ik vindt feedback leuk. Verder zou ik comments alleen voor ingelogden kunnen toestaan. Maar dat is bijna hetzelfde. Ik bedoel: jij gaat toch ook niet je registreren om "Ja! Dat vindt ik nou ook zo cool aan die clip" te typen?Nu, de volgende optie is om comments niet zomaar metten te plaatsen. Ze in een queue te zetten en ze eens in de zoveel tijd uit te zoeken. Ook dit is geen echt goede optie. 10.000 comments zijn in een uurtje geplaatst. Als je dus iedere week een paarhonderd pagina's met lijsten moet doorspitten om die 5 goede comments er uit e halen heb je het al snel gezien. Dan is er nog die al-bekende tiep-dit-rare-plaatje-over methode. Die werkt. Redelijk goed. Maar zoals het gezegde gaat: 'alles door een computer gemaakt, kan door een computer worden gekraakt'. Je moet al van heel goede huize komen (en héél rare plaatjes maken) wil je hun robots foppen. En boevendien is het heel ontoegankelijk. je werpt immers niet enkel een barriere voor bots op, maar voor al je bezoekers.

Als laatste heb je de spamfilters. Deze gebruik ik. Zelflerende filters, gecombineerd met een zogenaamde SURBL (een online lijst met bekende spammers). Dit werkt normaalgesproken erg goed. Totdat die filter eventjes in de war raakt. Spammers zijn namelijk de hele dag bezig om manieren te vinden om door de filters heen te breken (over een kutbaan gesproken). Daardoor moet de filter de hele tijd blijven bijleren en kan zich op een bepaald moment eens vergissen. Dan moet ik heb dus even spanken, waarna die filter weer eventjes extra goed zijn best doet. Oh, en een laatste leuke is het tegenwerken van de spammers door actief et linken naar Viagra. Maar dan niet die viagra die zij graag willen.

Dit artikel verscheen op bler.webschuur.com. En is overgezet naar dit blog

in

Over de auteur: Bèr Kessels is een ervaren webdeveloper met een grote passie voor techniek en Open Source. Een gouden combinatie om de techniek goed en efficiënt toe te passen. Volg @berkes op Twitter. Of lees meer over Bèr.

blog comments powered by Disqus