Google actualizó recientemente la documentación de su agente de usuario de rastreador web extendido de Google, reflejando cambios en el nombre del producto y aclarando el impacto en la búsqueda, lo que puede ser una preocupación para quienes optan por bloquear el rastreador. La documentación actualizada ofrece una guía más clara sobre cómo controlar el acceso al contenido para su uso en el entrenamiento de modelos de IA.
Agente de usuario extendido de Google
Presentado el 28 de septiembre de 2023, Google Extended ofrece a los editores web un agente de usuario que se puede utilizar para controlar cómo se rastrean sus sitios. Los editores pueden permitir o no permitir el agente de usuario extendido de Google utilizando el Protocolo de exclusión de robots, lo que les brinda una forma de optar por no eliminar su contenido e incluirlo en conjuntos de datos de entrenamiento de IA.
Google describe Google-Extended como un “token de producto independiente”, pero esa es una terminología no estándar sobre cómo los editores entienden el concepto de agentes de usuario.
El anuncio original describía el nuevo agente de usuario:
“Hoy anunciamos Google-Extended, un nuevo control que los editores web pueden usar para administrar si sus sitios ayudan a mejorar las API generativas de Bard y Vertex AI, incluidas las generaciones futuras de modelos que impulsan esos productos.
Al utilizar Google Extended para controlar el acceso al contenido de un sitio, el administrador de un sitio web puede elegir si desea ayudar a que estos modelos de IA sean más precisos y capaces con el tiempo”.
El bloqueo de Google-Extended se realiza con el Agente de Usuario “Google-Extended”:
User-agent: Google-Extended Disallow: /
Registro de cambios de Google
Google mantiene un registro de cambios de actualizaciones importantes realizadas para la orientación y comunicación con los editores web y la comunidad de marketing de búsqueda. El registro de cambios de las páginas de desarrolladores de Google anunció un cambio en la documentación extendida de Google.
La revisión se produce después del cambio de nombre de Bard a Gemini Apps, especificando que la indexación de Google-Extended ahora contribuye a las API generativas de Gemini Apps y Vertex AI. La nueva redacción asegura a los editores que esto no afecta la Búsqueda de Google, abordando posibles preocupaciones sobre las posibles implicaciones de optar por no participar en la recopilación de datos de IA extendida de Google.
¿Qué cambió?
El registro de cambios de Google aclara que el rastreo extendido de Google es exclusivo de Gemini Apps y no tiene ningún impacto en la Búsqueda de Google.
El registro de cambios aconseja:
“Se actualizó la descripción del token de producto extendido de Google.
Qué: Con el cambio de nombre de Bard a Gemini Apps, aclaramos que Gemini Apps se ve afectado por Google-Extended y, según los comentarios de los editores, especificamos que Google-Extended no afecta la Búsqueda de Google”.
La guía actualizada ya no utiliza la marca Bard y la cambia a Gemini. Y se añadió la siguiente frase:
“Google-Extended no afecta la inclusión o clasificación de un sitio en la Búsqueda de Google”.
Lea la descripción general actualizada del rastreador de Google:
Descripción general de los rastreadores y buscadores de Google (agentes de usuario)
Imagen destacada de Shutterstock/Ribkhan