Noticias

Google actualiza la documentación del rastreador para corregir un error tipográfico


Google ha corregido un error tipográfico en la documentación de su rastreador que, sin darse cuenta, identificó erróneamente a uno de sus rastreadores.

En general, este es un problema menor, pero es un problema importante para los SEO y los editores que dependen de la documentación para establecer reglas de firewall.

No anotar los datos correctos podría provocar que un sitio web bloquee sin darse cuenta un rastreador legítimo de Google.

Herramienta de inspección de Google

El error tipográfico está en la sección de la documentación sobre la herramienta de inspección de Google.

Este es un rastreador importante que se envía a un sitio web en respuesta a dos indicaciones.

1. Funcionalidad de inspección de URL en Search Console
Cuando un usuario quiere comprobar en la consola de búsqueda si una página web está indexada o solicitar la indexación, el sistema de Google responde con el rastreador de la herramienta de inspección de Google.

La herramienta de inspección de URL ofrece la siguiente funcionalidad:

  • Ver el estado de una URL en el índice de Google
  • Inspeccionar una URL activa
  • Solicitar indexación para una URL
  • Ver una versión renderizada de la página
  • Ver recursos cargados, resultados de JavaScript y otra información
  • Solucionar problemas de una página faltante
  • Conozca su página canónica

2. Prueba de resultados enriquecidos

Esta es una prueba para verificar la validez de los datos estructurados y ver si califican para resultados de búsqueda mejorados, también conocidos como resultados enriquecidos.

El uso de esta prueba activará un rastreador específico para buscar la página web y analizar los datos estructurados.

Por qué el error tipográfico del agente de usuario del rastreador es problemático

Esto puede convertirse en un problema problemático para los sitios web que están detrás de un muro de pago pero que incluyen en la lista blanca robots específicos, como el agente de usuario Google-InspectionTool.

La identificación inadecuada del agente de usuario también puede ser problemática si el CMS necesita bloquear el rastreador con robots.txt o una meta directiva de robots para evitar que Google descubra páginas que no debería estar mirando.

Algunos sistemas de gestión de contenido de foros eliminan enlaces a partes del sitio, como la página de registro de usuarios, los perfiles de usuario y la función de búsqueda, para evitar que los robots indexen esas páginas.

Error tipográfico en el agente de usuario difícil de detectar

El problema involucraba un error tipográfico difícil de detectar en la descripción del agente de usuario.

¿Ves si puedes notar la diferencia?

Captura de pantalla del antes y después de la documentación del agente de usuario de Google-InspectionTool

Esta es la respuesta:

Versión original:

Mozilla/5.0 (compatible; Google-InspectionTool/1.0)

Nueva versión:

Mozilla/5.0 (compatible; Google-InspectionTool/1.0;)

Asegúrese de actualizar los robots.txt relevantes, las directivas de meta robots o el código CMS si usted o un cliente incluyen los rastreadores de Google en la lista blanca o los bloquean en ciertas páginas web.

Compare la versión original (en Internet Archive Wayback Machine) con la versión actualizada aquí.

Es un pequeño detalle pero puede marcar una gran diferencia.

Imagen destacada de Shutterstock/Nicoleta Ionescu

hola@juanrecio.com

Author

hola@juanrecio.com

¡Utiliza la tecnología y la inteligencia artificial en tus proyectos! ¿Quieres saber cómo?