Spam en comentarios de un blog – cómo reconocer y detectar las nuevas técnicas
El spam en los comentarios es un problema que va aumentando con el tiempo. Han surgido nuevas técnicas que lo hacen cada vez más complicado detectarlo.
No hace todavía 1 año desde que publiqué un post para darse cuenta cuando te estaban colando spam en tu campo de comentarios. Las técnicas entonces eran en la gran mayoría de los casos fácilmente reconocibles.
Derechos de foto de Fotolia
La gran mayoría de los spammers realizaban los comentarios en ingles y japonés. Ahora este lado de los blogs está teniendo una fase de expansión importante con comentarios basura en alemán, francés, portugués, español e italiano. Sobre todo los últimos aparecen con cada vez más fuerza en los comentarios spam de mi blog. Igual la mafia italiana ha descubierto un nuevo nicho de negocio que les está dando rentabilidad… 😉
Contenidos
Un cálculo sobre la rentabilidad del spam
Para el usuario medio puede ser totalmente incomprensible que a través del spam se puede llegar a ganar mucho dinero. Es una actividad totalmente ilegal que está penalizada con varios años de cárcel según la gravedad del caso. A pesar de ello sigue habiendo muchas personas que corren el riesgo porque los potenciales ingresos pueden ser importantes.
En un estudio universitario realizado se calculó un ratio de conversión del 0.000008%. En 26 días habían conseguido 28 ventas enviando más de 350 millones de mails. Cada venta les aportaba 100 dólares de beneficio. Según las estimaciones de los científicos el sistema se podía escalar para enviar hasta 70 veces más mails en el mismo plazo de tiempo. Si te interesa el estudio completo de la Universidad de Berkeley, te lo puedes descargar aquí.
El problema del spam en blogs para el blogger
El spam en los comentarios de los blogs funciona un poco diferente que el envío de correos. El resultado debe ser muy parecido porque si no hubiera una mínima rentabilidad detrás nadie correría el riesgo de hacerlo.
- Los filtros de spam no funcionan al 100%: igual ya sabes que los plugins que puedes utilizar en blogs de WordPress u otro tipo de filtros que se aplican en otras plataformas nunca aportan una solución al 100%. Si quieres controlar el tema del spam no queda otra que hacer un control manual. En ningún caso deberías dejar los comentarios sin moderación para evitar que salga spam en el blog causando una mala imagen a tus lectores.
- Se identifican comentarios spam que no lo son: lo peor de todo es que en muchas ocasiones caen comentarios reales en la carpeta de spam. Para no perderlos tengo que revisar cada 24-48 horas los 300 comentarios para sacar las 2-3 aportaciones reales de lectores. En ocasiones incluso me han llegado a escribir algunos usuarios porque en estos casos no suele haber un feedback normal y parece más bien un error que otra cosa.
- Spam aprobado abre la puerta a más spam: si en algún momento apruebas un comentario spam porque te parece real tienes un pequeño problema si tu plataforma de blogging es WordPress. Por defecto se suelen aprobar automáticamente todos los siguientes mensajes de aquellos que ya hayan pasado el filtro manual. Tiene fácil solución porque puedes decirle a tu blog que todos los comentarios requieren siempre moderación antes de aparecer en el blog.
Técnicas recientes para hacer el spam más efectivo
No seré el único que habrá notado una cierta evolución en las técnicas de spam en blogs. No es únicamente una mayor variedad de idiomas sino también una mejora de las técnicas que lo hacen difícil para un principiante detectar las diferencias entre un comentario real y uno que en realidad es spam. En ocasiones ya he caído en la trampa de los nuevos spammers.
1. Comentarios adaptados al post: algunos comentarios spam cogen automáticamente el título del post para que parezca más auténtico. Pueden tener p.ej. la estructura siguiente. “Sobre ‘[título del post]’ puedo decir que…” Aparte del título el resto del comentario es totalmente genérico para que encaje con la gran mayoría de temáticas. Como regla general deberías investigar todas las aportaciones que no contengan el nombre de una persona sino palabras clave como p.ej. “agencia de viajes” o “electricista Valencia”.
2. Traducciones automáticas del inglés: me acuerdo de un tal “Brian” que me dejó un comentario bastante largo pero con fallos importantes gramaticales que incluso me dolían a mí como “alemañol” que también tiene algunos de vez en cuando. Me puse a corregir cada uno de ellos porque me parecía un tío simpático sin conocerlo. Poco después encontré un comentario de una tal “Deborah” que curiosamente había escrito exactamente lo mismo que Brian (fallos gramaticales incluidos). En este caso se trataba de traducciones automatizadas del inglés que daban la sensación de ser reales en el sentido que los había redactado un extranjero.
3. Frases sueltas que encajan para cualquier post: sobre todo cuando son halagos el blogger se deja engañar fácilmente. Incluso queremos que ese comentario spam sea real porque no gusta cuando nos dicen que estamos haciendo bien. El último de este estilo fue en mi caso “me encanta tu estilo, te acabas de ganar una nueva lectora en tu RSS”. Igual incluso te suena o ya lo has aprobado. Los spammers juegan aquí con nuestra gran debilidad que es el ego de los bloggers. No te dejes engañar y analiza cada aportación. En este caso también viene bien tener una guía para tu blog a lo que puedes acceder siempre que tengas dudas de cómo moderar un comentario en tu blog.
Es cada vez más complicado hacer una moderación adecuada de los comentarios. Antes era relativamente fácil dado que el 99,9% del spam salía sobre todo en inglés y japonés por lo que era fácil de detectar. El spam en español era puntual y bajo en volumen porque no se automatizaba hasta hace 1 año. Hay que estar más atento ahora.
¿Cuáles son tus consejos para identificar a los spammers en los comentarios de un blog?
Hola Carlos, pues de momento en mi blog de coaching, no hay spam…jajaja… pero lo habrá. Ya lo sufro en el de viajes/fotos y ahi, son todos en ingles o japones. Claro q lo mismo me han colado uno en castellano y no me he dado cuenta… jajaja.
Voy a tener q echar un ojo a los comentarios q tengo aprobados.
un abrazo y te veo en tu curso y taller.
No puedo ver bien, este blog en mi iPhone. ¿Soy yo o le pasa a todo el mundo? xD
¿Por qué no metes un control de seguridad? Podrías incluir un sencillo captcha (no de esos indescifrables), ver las direcciones IP de los que ponen spam y ponerlos en lista negra (no sé si existe plugin para eso), comprobaciones automáticas del correo (dudo que alguien tenga el correo 499dkekf@algo.com), ver si la web que citan está siquiera en español, etc.
Sobretodo deberían ser cosas que no molesten a las personas que comentamos de verdad.
Creo que los spammers evolucionan al mismo nivel que los blogueros y ya sabemos identificar en cuestión de segundos lo que es spam o no. El problema viene cuando tu blog crece y crece, no tienes un buen filtro puesto y te pasas un buen rato al día eliminando comentarios. Yo tengo un buen captcha puesto y aún así tengo que elimintar unos cuantos mensajes al día. En fin, es algo con lo que hay que convivir.
Yo utilizo wordpress y tengo un plugin que para poner un comentario debes realizar una operación matemática. De momento va bien y además sirve como “brain training” 😉
Opino como Antonio. Si tienes muchos comentarios se complica todo.
Yo prefiero moderarlos antes ya que ahora hay poco tráfico.
El mayor problema como se señala es que por muy bueno que sea el filtro anti-spam se pierden comentarios buenos. Pero si no pones el flitro te arriesgas a recibir 500 comentarios basura diarios que tienes que revisar, y aunque es una tarea rutinaria, se convierte en una pérdida de tiempo indecente.
Como señalan por ahí arriba, lo mejor es opner un filtro previo mediante algún sistema de captcha, pero con cuidado, ya uqe hay algunos que son tan “seguros” que provocan que comentaristas legítimos se desesperen y decidan no comentar.
El utilizar el sistema de wordpress.com con una lista negra, puede ser una ayuda, aunque no una solución, porque el tiempo necesario para separar, los auténticos, de los falsos, nadie te la quita.
En CODECTION implantamos en nuestros clientes la solución creada por la propia Automattic (la empresa que dirige el desarrollo del proyecto WordPress), Akismet, y los resultados no pueden ser mejores.
Es una plataforma basada en un plugin que se instala, se paga (o no dependiendo del tipo de blog) por una “key” y este plugin cada comentario lo envía a los servidores de Akismet que filtran el spam mediante técnicas de Inteligencia Artificial (bayesianas principalmente tengo entendido).
La plataforma “aprende”, así que los falsos positivos (no spam marcado como spam) o falsos negativos (spam marcado como legítimo), cuando los marcas como incorrectos, aprende qué está mal y así poco a poco las tasas de acierto mejoran aún más.
Tenemos clientes con cientos de comentarios a la semana, y hay semanas que me cuentan que ya no tienen que rectificar nada (y son redes de blogs mantenidas por muchos periodistas).
Hay que tender a la automatización y evitar las tareas rutinarias como esta. También hay que huir de los captchas, las operaciones matemáticas, etc. que “fastidian” un poco al usuario comentarista, así que, tenemos que ofrecerle facilidades para escribir comentarios y a nosotros quitarnos problemas para gestionarlos.
Se me olvidaba, ahora que he visto “en moderación”, aparte de dar facilidades (sin captchas y otros procesos similares) y quitarnos a nosotros trabajo de moderar, es mucho más cómodo cuando los usuarios ven su comentario en portada y pueden crear debate.
La gente de blogs.km77.com, clientes nuestros, gracias a esto han conseguido tener debates muy intensos entre los lectores, con varias respuestas al minuto y es un valor añadido muy grande.
La solución efectiva del SPAM debe estar afuera de WordPress, a nivel de DNS.
http://blog.mercadder.com/2012/03/17/cloudflare-el-salvador-de-wordpress/
Gracias por tan exelente articulo, de los comentarios ens pam llege hasta aca por que aveces mis blogs revisen esos bot’s y estare implementando el captha.
Creo que no puede existir algo más triste que un blog sin comentarios y sin el debate de los lectores. Por ello me resisto a ponerle frenos a los lectores. Los filtros, registros y complejos sistema de captchas desmotivan a los lectores a participar.
Tenemos que convivir desgraciadamente con el spam y dedicarle un tiempo a depurarlo. En la vida también perdemos el tiempo cerrando nuestro coche, la caja fuerte, las puertas de casas… es lado oscuro siempre existirá.
Saludos,
@franCoescribe
A mi Alkismet de WordPress me funciona bastante bien, dirñia que muy bien.
“Akismet has protected your site from 23.511 spam comments already”
No puedo asegurar que entre esos 25000 no se haya colado uno que no lo era, de hecho, he rescatado un par de ellos que no lo era, (o a mino me lo parecieron), y es posible que algo se me haya pasado, pues muchas veces borro los spam muy deprisa, por lo que puede que haya “matado” algun comentario sano.
Pero creo que el funcionamiento es realmente bueno, pues de lo que estoy seguro, pues eso los leo y generalmente respondo, es que se le escapan muy pocos falsos positivos,
Claro está que siempre hay algún comentario, que te deja pensando si es SPAM o no lo es. Por poner un ejemplo de este mismo blog: un comentario que dice
.”No puedo ver bien, este blog en mi iPhone. ¿Soy yo o le pasa a todo el mundo? xD” Puede ser SPAM, (yo creo honestamernte que en este caso no lo es), o si, porque si de forma manual y selectiva, escribes ese texto en doce post diferentes diarios, al cabo de un es puedes conseguir 360 links a tu blog, cosa, que no nos engañemos, nunca viene mal.
Mi solucion a este problema es sentarme con el gorro de lector, si el comentario, sea SPAN o no, no molesta a los demas lectores, para mi no es SPAN, aunque no aporrte en exceso al diálogo, si molesta, es SPAN aun que no lo sea.. .
Plugines son inútiles y la mayoria son spam, del autor del mismo. Askimet, ahora que empezó a recolectar spammers por su cuenta en lugar de hacerlo con honeypot, podría ayudar. Pero insisto que la solución efectiva es Cloudflare.
Llevo unas semanas recibiendo spam en mi blog, comentarios cada vez más trabajados que llegan a parecer reales. Pero si te fijas en la construcción de las frases, las faltas de ortografía y el nombre del autor, te das cuenta de que son falsos.
Yo utilizo el plugin Akismet que continuamente está actualizándose. Pero, por supuesto, hago una revisión manual.
Chao
@sarraezfer
Felicidades, me gusta este post (aunque suene a comentario automatizado jajaja) una de las tecnicas anti-spam que estoy por implementar en mi blog personal es quitar las allowed tags form, ya que estos programas automatizados dedicados hacer spam, rastrean estas etiquetas html.
Escuche comentarios de personas que eliminaron este fragmento de codigo del tema en wordpress y el spam se ha reducido a un 90%, OJO eleminar el codigo, muchos elijen el esconderlos con CSS pero el codigo sigue estando, es por ello que el software sigue rastreando y mandando comentarios de spam…
Saludos comunidad
Marketero911
Muy bueno el post, la verdad es que es un verdadero problema el tema del spam, yo he tenido que tomar medidas en mi blog porque recibía sobre unos 60 comentarios de Spam diarios y tener que estar revisando que es y que no es, es una perdida de tiempo que puedes dedicar a cosas más importantes.
Un saludo
Hola Carlos, yo lo hago todo manual. Por la naturaleza de mi blog, sólo permito comentarios en las entradas con menos de 10 días de antigüedad, lo que me reduce mucho el trabajo a la hora de moderar.
Por otro lado, los comentarios no están sujetos a aprobación y no tengo ningún plugin porque no quiero correr el riesgo de que comentarios reales se consideren spam, pero si tengo filtros con palabras o extractos de ellas que hacen que queden pendientes de moderación (www. por ejemplo) así todos los que lleven enlace se moderan, y otros van directamente a la carpeta spam, como los que llevan palabras de tipo viagra, cialis, drugs, etc.
A mi así me va bien y en un blog con varios miles de visitas apenas modero 20 o 30 comentarios diarios.
Saludos.
Por dicha razon desactive mis comentarios en blogger. gracias carlos por la info tambien le sirve a uno para no cometer spam.
Hola, Carlos,
He llegado a tu post, por búsqueda en Google. Me dejaron hace unos días un comentario al que puse marca para responder, porque realmente me apetecía hacerlo. Atacaba al cuerpo del post, tenía sentido, está bien escrito… Pero evidentemente, lleva links de spam a venta de hardware en páginas de Europa del Este.
Creo que te interesará echarle un vistazo, es el último comentario del post que te adjunto (aún no he respondido, y sigo sin saber si responder, o eliminarlo 😉
¿Se podría estar contratando vía “turk machine” o similar, spam con comentarios “originales”?
https://www.marketingguerrilla.es/spam-en-comentarios-de-un-blog-como-reconocer-y-detectar-las-nuevas-tecnicas/
Gracias por tu comentario Fernando, sin duda sería una manera efectiva de realizar spam en comentarios algo más reales. Creo que no has puesto el enlace correcto… 😉
Saludos!
Cierto! Ahí va el bueno 😉
http://abladias.blogspot.com.es/2012/03/la-manifestacion-de-los-emprendedores.html?m=1
Buenos dias
Te comento mi caso
Resulta q mi blog es con blogger, blogger me bloquea todos los mensajes spam. Todos me llegan en ingles y anonimos.
Todos los cmentarios me llegan a mi email y es un engorro recibir como me ha pasado esta mañana al despertar que tenia 61 emails d comentarios spam.
Una d mis lectoras me dijo q kitara el catcha ya q es un engorro y como comentan poco no kiero q desaparezcan los pocos comentarios q tengo.
La cosa es q anoche borre todos los spam del blog y hoy me levanto con 61 d golpe. Mi pregunta es q si estos spam influyen en q mi ranking en google baje o q me perjudique d otra manera.
X ahora stos mensajes nose han publicado. Van.directos a spam.
Muchas gracias
Cris
Hola Cris,
si publicas comentarios spam esto te puede afectar de manera negativa porque da la imagen que el blog está descuidado a Google. Simplemente configura tu blog para que tengas que aprobarlos antes de publicación. Lo de quitar el captcha ha sido una buena decisión porque es cierto que frena mucho la participación de los lectores.
Saludos!
Hola Carlos,
yo recomiendo AKISMET, aunque como bien dices en tu artículo, de vez en cuando hay que hacer un barrido de lo que marca como SPAM por si hay algún comentario que no lo sea…
Sí que daría un tip, que es que cuando veas un comentario de los muy genéricos, del tipo: “Excelente post, me ha encantado”, lo dejes, eliminando el enlace. Esto, claro está, siempre y cuando no sean demasiado numerosos, más que nada porque al hacer “lo correcto” (marcar el SPAM como tal), estamos ayudando a que ese mismo SPAM no se propague.
Os dejo un post que he escrito, muy minucioso, en el que explico qué es el SPAM (de comentarios) los distintos tipos que hay, para qué realmente los pone la gente y cómo evitarlos.
Espero que os sea útil
http://coach2coach.es/comentarios-spam-en-mi-blog-como-evitarlos/
Abrazo!
Esther
Gracias por el artículo, siempre es interesante saber como proteger nuestro blog.
En mi caso, y desde mi más absoluto desconocimiento, usaba Akismet desde el principio, porque venia pre-instalado al descargar las herramientas de WordPress desde mi proveedor web, que no es otro que Webempresa.
Así que me doy con un canto en los dientes.
Saludos y sigue así.
He estado recibiendo correos en ingles, aunque muy pero muy pocos, si ven mi pagina en español, se supone que los comentarios deben ser en español, aunque aun no tengo nada porque apenas estoy comenzando con mi web jaja.
¿Pero por lo que dice Carazo? el akismet es bueno, muy bueno, porque si bien tiene tantas descargar, se supone que ese plugin tiene mas experiencia porque esta aprendiendo de todos los comentarios spam y no spam de tantos usuarios que lo usan y así supongo wordpress lo filtra muy bien. No se ustedes, pero tal vez sea akismet un buen plugin, aunque no lo he usado porque aun no tengo recursos para comprarlo. Ahí sus opiniones, gracias.
Para no complicarlo mucho, te dire que los comentarios de SPAM son, fundamentalmente, intentos de otras webs de poner un enlace hacia ellas en tu blog, para que los motores de busqueda las califiquen mejor y su PageRank aumente (para tu informacion, el PageRank es algo asi como la calificacion que Google da a tu web en dependencia del numero de webs que apuntan hacia ella).