A estas alturas, probablemente ya haya visto los anuncios sobre la actualización principal de marzo de 2024. Esta importante actualización se implementará durante todo el mes y tiene como objetivo reducir el contenido “inútil” en un 40%.
Curiosamente, Google también actualizó sus políticas de spam para señalar algunos tipos nuevos de spam a los que se dirige.
Profundicemos en qué cambió exactamente en las políticas de spam de Google y qué significan estos cambios para el futuro del SEO.
¿Qué ha cambiado en las políticas de spam?
Google ha introducido dos nuevas secciones en sus políticas de spam: “abuso de dominio caducado” y “abuso de reputación del sitio”.
También revisó una sección existente anteriormente llamada “contenido spam generado automáticamente”, ahora llamada “abuso de contenido escalado”.
Lo que aprecio de estas actualizaciones es que todas vienen con ejemplos del mundo real dentro de las políticas de spam, y no es difícil determinar de qué situaciones provienen estos cambios.
Estos tres temas son bastante jugosos, así que analicemos cada uno con más detalle.
Abuso de dominio caducado
Google ha añadido el “abuso de dominio caducado” como nuevo tipo de spam al que se dirige. Algunas personas pueden conocer esta táctica como okupación de dominios.
Google lo define como:
Donde se compra y reutiliza un nombre de dominio caducado principalmente para manipular las clasificaciones de búsqueda al alojar contenido que proporciona poco o ningún valor a los usuarios.
Google negó anteriormente que comprar dominios caducados tenga alguna ventaja. Pero no es así, o el buscador no tomaría más medidas para combatirlo.
Entonces, ¿cómo manipuló la gente los resultados de búsqueda comprando dominios caducados?
Un método consiste en comprar un dominio caducado en un nicho relacionado con vínculos de retroceso valiosos para acelerar el proceso de creación de autoridad. Las personas que hagan esto redirigirán las páginas del dominio caducado a las páginas relevantes del sitio para el que están intentando crear autoridad.
Algunos comprarán un dominio caducado y continuarán construyendo el sitio, aprovechando la autoridad que otros han creado para él. No hay nada inherentemente malo en esto.
Google parece preocupado por penalizar a los sitios que utilizan tácticas de spam para generar autoridad, como generar contenido de inteligencia artificial a escala o vender enlaces o publicaciones de invitados.
Una búsqueda rápida en Google para [buy expired domains] en Reddit revela que esta es una práctica más común de lo que la gente cree.
Google proporciona algunos ejemplos de abuso de dominios caducados:
- Contenido afiliado en un sitio utilizado anteriormente por una agencia gubernamental.
- Productos médicos comerciales que se venden en un sitio utilizado anteriormente por una organización benéfica médica sin fines de lucro.
- Contenido relacionado con casinos en el antiguo sitio de una escuela primaria.
Estos son ejemplos atroces y no pude encontrar el escenario del mundo real para ninguno de ellos. Si conoces alguno, no dudes en dejarlo en los comentarios.
Un problema que puedo recordar es el caso The Hairpin, que tuvo un momento viral a principios de este año gracias a las Confesiones de un capo del Clickbait con IA de Wired.
The Hairpin fue un sitio web independiente dirigido por mujeres que alguna vez fue querido. Dejó de publicarse en 2018 y el dominio expiró en 2023.
Lo compró rápidamente un DJ serbio llamado Nebojsa Vujinovic, quien luego transformó el sitio en una granja de contenido generado por IA.
Parte del contenido original permanece con un nuevo formato, pero los nombres de los autores fueron reemplazados por nombres masculinos sin presencia en línea.
Es un ejemplo bastante obvio de abuso de dominio caducado, y Vujinovic incluso admitió ante Wired que compró el dominio por su autoridad y reputación.
Afortunadamente, el sitio web de The Hairpin fue desindexado recientemente; Que su contenido original RIP.
Abuso de reputación del sitio
El otro tipo de spam agregado a las políticas de spam de Google es el abuso de la reputación del sitio, también llamado a veces SEO parásito o pSEO.
Google lo define como:
Cuando se publican páginas de terceros con poca o ninguna supervisión o participación de primera parte, cuando el propósito es manipular las clasificaciones de búsqueda aprovechando las señales de clasificación del sitio de primera.
De particular interés, especifica que esto incluye:
Páginas patrocinadas, publicitarias, de socios o de terceros que normalmente son independientes del propósito principal de un sitio anfitrión o se producen sin una estrecha supervisión o participación del sitio anfitrión y que brindan poco o ningún valor a los usuarios.
Google continúa proporcionando algunos ejemplos. Mi favorito personal:
Un sitio de deportes que aloja una página escrita por un tercero sobre “reseñas de suplementos de entrenamiento”, donde el personal editorial del sitio de deportes tuvo poca o ninguna participación en el contenido y el objetivo principal de alojar la página es manipular las clasificaciones de búsqueda.
Es probable que esto sea una respuesta al escándalo de IA de Sports Illustrated que se volvió viral en noviembre de 2023. Futurism descubrió que había reseñas de productos generadas por IA escritas en Sports Illustrated con autores falsos.
Destacó estas críticas sin sentido que decían cosas como: “Puede ser un poco complicado entrar en el voleibol, especialmente sin una pelota real para practicar”.
The Arena Group (la empresa propietaria de los derechos de publicación de Sports Illustrated en ese momento) emitió una declaración que los artículos fueron creados por un socio llamado AdVon, que realiza reseñas de productos de comercio electrónico en varias de sus propiedades web, y que no sabía que AdVon estaba utilizando contenido generado por IA.
La actualización de la política de spam de Google esencialmente señala esto como un abuso de reputación del sitio. Arena Group y otros grandes editores que participan en tales prácticas deben poner fin a estas asociaciones o desindexar estas páginas, o serán penalizados.
Además, la falta de supervisión o participación en la estrategia de contenido del socio es irrelevante si está en su dominio.
Otro ejemplo que dio Google y que provocó una discusión en la comunidad de SEO es:
Un sitio de noticias que aloja cupones proporcionados por un tercero con poca o ninguna supervisión o participación por parte del sitio de alojamiento, y donde el objetivo principal es manipular las clasificaciones de búsqueda.
USA Today de Gannett tiene una red de cupones sorprendentemente sólida alojada en un subdominio. Sospecho que no es el único, pero puede que sea el más grande.
Será interesante ver qué hace en respuesta a que lo llamen. Claramente, Google está tratando de lograr que los editores de noticias se mantengan en su carril porque es difícil argumentar que los cupones no aportan ningún valor a los usuarios.
Las sanciones por abuso de reputación del sitio de Google no entrarán en vigor hasta mayo de 2024, por lo que los editores tienen tiempo para ponerse en orden y ajustar sus estrategias. Tienen que decidir si desindexan las páginas que podrían violar esta política, ponen fin a las asociaciones o (supongo) se arriesgan y siguen adelante.
En las políticas de spam, Google enlaza a una página que explica cómo desindexar contenido.
Abuso de contenido escalado
La última área de cambio en las políticas de spam de Google es cambiar el nombre del “contenido spam generado automáticamente” a “abuso de contenido escalado” y ampliar su definición con ejemplos.
En una versión anterior de las políticas de spam de enero de 2024, Google define “contenido spam generado automáticamente” como:
Contenido que se ha generado mediante programación sin producir nada original ni agregar valor suficiente; en cambio, se generó con el propósito de manipular las clasificaciones de búsqueda y no de ayudar a los usuarios.
Hoy, Google ha cambiado el nombre de esto a “abuso de contenido escalado” y lo define como:
Cuando se generan muchas páginas con el propósito principal de manipular las clasificaciones de búsqueda y no de ayudar a los usuarios. Esta práctica abusiva generalmente se centra en la creación de grandes cantidades de contenido no original que proporciona poco o ningún valor a los usuarios, sin importar cómo se cree.
La definición anterior apunta específicamente al contenido programático, mientras que esta nueva definición dice que no importa cómo se genera el contenido.
Lo que importa es que el contenido no sea original y no agregue valor, independientemente de cómo se haya creado: programáticamente, generado por IA o creado por humanos de baja calidad.
La versión anterior también contiene seis ejemplos, todos los cuales comienzan con “texto”, lo que indica que se dirigen a palabras de la página. En esta nueva versión, los formatos no se mencionan en absoluto.
La implicación es que el abuso de contenido a escala también podría involucrar una gama más amplia de formatos como imágenes o videos.
En la definición de abuso de contenido escalada, Google proporciona estos cinco ejemplos:
- Usar herramientas de IA generativa u otras herramientas similares para generar muchas páginas sin agregar valor para los usuarios.
- Eliminación de feeds, resultados de búsqueda u otro contenido para generar muchas páginas (incluso mediante transformaciones automáticas como sinonimización, traducción u otras técnicas de ofuscación), donde se proporciona poco valor a los usuarios.
- Unir o combinar contenido de diferentes páginas web sin agregar valor.
- Crear múltiples sitios con la intención de ocultar la naturaleza escalada del contenido.
- Crear muchas páginas donde el contenido tiene poco o ningún sentido para el lector pero contiene palabras clave de búsqueda.
Un ejemplo: en agosto de 2023, Time expuso una clínica de atención de urgencia llamada Nao Medical, que inundó Internet con publicaciones sin sentido generadas por IA sobre temas como lo que sucede cuando los unicornios consumen ketamina o una afección médica llamada “árbol del herpes de Derek Jeter”.
Estas páginas ya no están activas y aparentemente han sido eliminadas de Internet Archive.
Conclusión
De todo lo que hay en esta actualización principal de marzo de 2024, tengo mucha curiosidad por saber qué se incluye en el abuso de contenido escalado.
Muchas grandes marcas están utilizando plantillas programáticas para crear contenido en sus páginas transaccionales de mayor valor. Tomemos como ejemplo cualquier sitio web de mercado de venta de entradas.
La siguiente página para boletos para Colorado Rapids tiene todo el contenido apropiado para comprar boletos.
Pero más abajo en la página, hay contenido programático de menor calidad, presumiblemente para intentar clasificar para palabras clave más relacionadas.
Entonces, ¿una página como esta se vería perjudicada aunque sea una página transaccional y este contenido programático no sea el foco?
Obviamente, varios editores de contenido han ampliado su estrategia de contenido utilizando un gran equipo de escritores independientes que publican artículos diarios para clasificarlos en Google News y Top Stories.
La calidad de este contenido varía considerablemente, pero la mayor parte resulta bastante repetitiva. ¿Eso será penalizado? No parece probable.
El tiempo dirá qué sucede, pero definitivamente estoy listo para ver algunos cambios.
Más recursos:
Imagen de portada: YoloStock/Shutterstock