Eduardo Arcos ha escrito una revisión de Akismet, la publicitada herramienta anti-spam deMatthew Mullenweg que fue lanzada hace solo pocos dÃas — lo que sigue es una ampliación del comentario que dejé allÃ.
Quizás es aventurado saltar hacia conclusiones tan rápidamente, pero en mi caso me sucedió algo similar con WP-Blacklist, un clon del Blacklist para Movable Type pero para WordPress: el uso de listas negras actualizadas en tiempo real (Realtime Blacklist o RBL) causaba el rechazo de prácticamente todos los comentarios (digamos, el 99.9% de ellos, hubieron uno o dos que pasaron) sin importar si eran o no spam. Claro, detuvo el spam, pero también los comentarios.
La forma de actuar de los plugins basados en listas negras es fundamentalmente el siguiente: cuando ingresa un comentario, se registra su comentario y se compara con una lista de palabras, direcciones IP, URLs y correos electrónicos que han sido encontrados en el spam. Como una manera de aumentar el poder de discriminación de este tipo de plugins, estas listas no se limitan a palabras o datos especÃficos, sino que también pueden usar expresiones regulares, es decir, cadenas de texto que usan caracteres especiales en lugares donde pueden ir una o más variaciones de una palabra (por ejemplo, algo como [a-zA-Z] para representar todas las palabras formadas por letras de la “a” a la “z”, mayúsculas y/o minúsculas).
Por lo tanto, luego de revisar que el plugin estuviera bien instalado y las opciones bien fijadas, pensé que debÃa existir algún factor que hiciera que los comentarios válidos fueran marcados como spam: el único factor que podÃa explicar esto era el idioma. Es decir, en las definiciones de las expresiones regulares que en inglés pueden identificarse como spam, al parecer se incluyen muchas palabras muy comunes en español, lo que hace que este tipo de medidas para frenar el spam sean simplemente inútiles para los usuarios de habla hispana. Desconozco lo que pasará con otras lenguas, pero es probable que también existan problemas.
La solución pasa entonces por buscar un plugin que no dependiera de listas negras, y en ese entonces di con Hashcash otro plugin para WordPress que básicamente lo que hacÃa era reemplazar el formulario de contacto por uno generado con JavaScript y que incluÃa valores aleatorios que eran chequeados antes de aceptar un comentario. Funcionaba bastante bien, pero tenÃa el detalle de que si alguien tenÃa JavaScript desactivado no podÃa comentar; o sea, no era transparente al usuario sino solo a algunos usuarios mientras que a otros simplemente no les permitÃa comentar —y esta cantidad no debe ser nada despreciable, pues NoScript, un plugin para Firefox que sirve para bloquear JavaScript aparece mientras escribo este post como el segundo más popular.
Por lo tanto, tenÃa que buscar algo que funcionara para todos, y lo encontré: actualmente estoy usando Bad Behavior, que por su forma de actuar es tanto “insensible al idioma” como “transparente al usuario”: en vez de analizar el comentario en sÃ, lo que hace es analizar las peticiones que hacen los clientes para navegar por la página en la que se puede comentar —cada vez que tu navegador web va a descargar una página, envÃa una cantidad de información indicando qué es lo que quiere (la petición). Una vez que el plugin cuenta con esta información, la compara con peticiones “verdaderas”, es decir, las que producirÃa cualquier usuario con su navegador, lo que deja fuera la mayor cantidad de spam, puesto que para que éste sea rentable se necesita tener miles de referencias, las que serÃan económicamente inviables de hacer por personas. Claro, siempre hay algunos que pasan (en lo personal, me habrán llegado una docena en más de tres meses de funcionamiento) pero la cantidad es mÃnima.


[...] Odio el spam, y no soy el único. Recientemente leà como Romina se quejaba del correo no deseado. Eduardo Arcos nos cuenta que Akismet (el nuevo engendro de Matt Mullenweg, creador de Wp) no estaba cumpliendo con todas las expectativas que generó y Felipe LavÃn replica que una posible razón de por qué no funcionan herramientas como Akismet es el idioma. Todos contra el spam. Todos tratando de eliminarlo. Yo, desde acá, humildemente apoyo la moción. Lamentablemente (y casi nos están acostumbrando), se han convertido prácticamente en un mal necesario para cualquiera que quiera tener una bitácora ( ustedes no, chicos blogger) o un simple correo electrónico. Lo curioso de esta desagradable práctica marketinera es que no funciona. Asà como los gifs animados o los pop-up’s emergentes son deshechados casi por instinto por los usuarios, la misma suerte corre cualquier cosa que huela a spam. Resulta ilógico que todavÃa existan empresas que basen sus estrategias de venta en acosar al cliente. Desde acá les digo: no sirve. Pero lo que parece razonable para un ciudadano de pie, no necesariamente le parece razonable al orate que debe tomar las desiciones importantes. Es obvio que algunas empresas seguirán ocupando la lógica del spam. En ese escenario, lo que resulta más provechoso es saber si existe algún marco legal que nos protega adecuadamente, o cómo podemos protegernos nosotros. [...]
[...] Otras razones son que he hallado que algunos de mis comentarios son bastante extensos como para ser un post en sà mismos, pero no tan articulados para serlo, por lo que quedan en un espacio intermedio… habÃa hecho una especie de precalentamiento con Español: el idioma del Spam y WordPress, DreamHost y tiempo de CPU, ambos posts fueron en su origen comentarios que fueron ampliados para ser publicados en esta bitácora. Ahora el proceso será más directo: publicar solamente el comentario y el enlace al post donde fue hecho… idealmente, si a alguien le interesa el comentario o querrÃa leer otro punto de vista, visita el artÃculo original. Me ahorro trabajo y tiempo, y ojalá pueda contribuir con nuevos visitantes a otros weblogs. [...]