John Mueller de Google respondió si eliminar páginas de un sitio grande ayuda a resolver el problema de las páginas que Google descubre pero no rastrea. John ofreció ideas generales sobre cómo resolver este problema.
Descubierto: actualmente no indexado
Search Console, un servicio proporcionado por Google que comunica problemas y comentarios relacionados con la búsqueda.
El estado de indexación es una parte importante de la consola de búsqueda porque le dice a un editor qué parte de un sitio está indexado y es elegible para la clasificación.
El estado de indexación de las páginas web se encuentra en el Informe de indexación de páginas de la consola de búsqueda.
Un informe de que Google descubrió una página pero no la indexó suele ser una señal de que se debe abordar un problema.
Existen múltiples razones por las que Google puede descubrir una página pero se niega a indexarla, aunque la documentación oficial de Google solo enumera una razón.
“Descubierto: actualmente no indexado
Google encontró la página, pero aún no la rastreó.Por lo general, Google quería rastrear la URL, pero se esperaba que esto sobrecargara el sitio; por lo tanto, Google reprogramó el rastreo.
Esta es la razón por la cual la fecha del último rastreo está vacía en el informe”.
John Mueller de Google ofrece más razones de por qué una página sería descubierta pero no indexada.
¿Desindexar páginas no indexadas para mejorar la indexación en todo el sitio?
Existe la idea de que eliminar ciertas páginas ayudará a Google a rastrear el resto del sitio dándole menos páginas para rastrear.
Existe la percepción de que Google tiene una capacidad de rastreo limitada (presupuesto de rastreo) asignada a cada sitio.
Los Googler han dicho repetidamente que no existe un presupuesto de rastreo en la forma en que los SEO lo perciben.
Google tiene una serie de consideraciones sobre cuántas páginas rastrear, incluida la capacidad del servidor del sitio web para manejar un rastreo extenso.
Una razón subyacente por la que Google es exigente con respecto a cuánto rastrea es que Google no tiene suficiente capacidad para almacenar cada página web en Internet.
Es por eso que Google tiende a indexar páginas que tienen algún valor (si el servidor puede manejarlo) y no indexa otras páginas.
Para obtener más información sobre el presupuesto de rastreo, lea: Google comparte información sobre el presupuesto de rastreo
Esta es la pregunta que se hizo:
“¿La desindexación y la agregación de 8 millones de productos usados en 2 millones de páginas de productos indexables únicas ayudaría a mejorar la rastreabilidad y la indexabilidad (problema descubierto, actualmente no indexado)?”
John Mueller de Google primero reconoció que no era posible abordar el problema específico de la persona y luego ofreció recomendaciones generales.
Él respondió:
“Es imposible decirlo.
Recomendaría revisar la guía del presupuesto de rastreo del sitio grande en nuestra documentación.
Para sitios grandes, a veces rastrear más está limitado por la forma en que su sitio web puede manejar más rastreo.
Sin embargo, en la mayoría de los casos, se trata más de la calidad general del sitio web.
¿Está mejorando significativamente la calidad general de su sitio web al pasar de 8 millones de páginas a 2 millones de páginas?
A menos que se concentre en mejorar la calidad real, es fácil pasar mucho tiempo reduciendo la cantidad de páginas indexables, pero sin mejorar el sitio web, y eso no mejoraría las cosas para la búsqueda”.
Mueller ofrece dos razones para el problema descubierto no indexado
John Mueller de Google ofreció dos razones por las que Google podría descubrir una página pero negarse a indexarla.
- Capacidad del servidor
- Calidad general del sitio web
1. Capacidad del servidor
Mueller dijo que la capacidad de Google para rastrear e indexar páginas web puede estar “limitada por la forma en que su sitio web puede manejar más rastreo”.
Cuanto más grande es un sitio web, más bots se necesitan para rastrear un sitio web. Para agravar el problema, Google no es el único bot que rastrea un sitio grande.
Hay otros bots legítimos, por ejemplo de Microsoft y Apple, que también intentan rastrear el sitio. Además, hay muchos otros bots, algunos legítimos y otros relacionados con la piratería y el raspado de datos.
Eso significa que para un sitio grande, especialmente en las horas de la noche, puede haber miles de bots que utilizan los recursos del servidor del sitio web para rastrear un sitio web grande.
Por eso, una de las primeras preguntas que le hago a un editor con problemas de indexación es el estado de su servidor.
En general, un sitio web con millones de páginas, o incluso cientos de miles de páginas, necesitará un servidor dedicado o un alojamiento en la nube (porque los servidores en la nube ofrecen recursos escalables como ancho de banda, GPU y RAM).
A veces, un entorno de alojamiento puede necesitar más memoria asignada a un proceso, como el límite de memoria de PHP, para ayudar al servidor a hacer frente al alto tráfico y evitar 500 mensajes de respuesta de error.
La solución de problemas de los servidores implica analizar un registro de errores del servidor.
2. Calidad general del sitio web
Esta es una razón interesante para no indexar suficientes páginas. La calidad general del sitio es como una puntuación o una determinación que Google asigna a un sitio web.
Partes de un sitio web pueden afectar la calidad general del sitio
John Mueller ha dicho que una sección de un sitio web puede afectar la determinación general de la calidad del sitio.
Müller dijo:
“…para algunas cosas, nos fijamos en la calidad del sitio en general.
Y cuando observamos la calidad del sitio en general, si tiene partes significativas que son de menor calidad, no nos importa por qué serían de menor calidad.
…si vemos que hay partes significativas que son de menor calidad, entonces podríamos pensar que, en general, este sitio web no es tan fantástico como pensábamos”.
Definición de calidad del sitio
John Mueller de Google ofreció una definición de la calidad del sitio en otro video de Office Hours:
“Cuando se trata de la calidad del contenido, no nos referimos solo al texto de sus artículos.
Es realmente la calidad de su sitio web en general.
Y eso incluye todo, desde el diseño hasta el diseño.
Por ejemplo, cómo presentas las cosas en tus páginas, cómo integras las imágenes, cómo trabajas con velocidad, todos esos factores entran en juego allí”.
Cuánto tiempo lleva determinar la calidad general del sitio
Otro hecho acerca de cómo Google determina la calidad del sitio es cuánto tiempo le toma a Google determinar la calidad del sitio, puede tomar meses.
Müller dijo:
“Nos lleva mucho tiempo entender cómo encaja un sitio web con respecto al resto de Internet.
…Y eso es algo que fácilmente puede llevar, no sé, un par de meses, medio año, a veces incluso más de medio año…»
Optimización de un sitio para rastrear e indexar
Optimizar un sitio completo o una sección de un sitio es una forma general de alto nivel de ver el problema. A menudo se trata de optimizar páginas individuales a escala.
Particularmente para sitios de comercio electrónico con miles de millones de productos, la optimización puede tomar varias formas.
Cosas a tener en cuenta:
Menú principal
Asegúrese de que el menú principal esté optimizado para llevar a los usuarios a las secciones importantes del sitio que interesan a la mayoría de los usuarios. El menú principal también puede vincular a las páginas más populares.
Enlace a secciones y páginas populares
Las páginas y secciones más populares también se pueden vincular desde una sección destacada de la página de inicio.
Esto ayuda a los usuarios a acceder a las páginas y secciones que más les interesan, pero también le indica a Google que se trata de páginas importantes que deben indexarse.
Mejorar las páginas de contenido reducido
El contenido ligero son básicamente páginas con poco contenido útil o páginas que en su mayoría son duplicados de otras páginas (contenido con plantilla).
No basta con llenar las páginas con palabras. Las palabras y oraciones deben tener significado y relevancia para los visitantes del sitio.
Para los productos, pueden ser medidas, peso, colores disponibles, sugerencias de otros productos para combinar, marcas con las que los productos funcionan mejor, enlaces a manuales, preguntas frecuentes, calificaciones y otra información que los usuarios encontrarán valiosa.
Resolviendo Rastreado No Indexado para Más Ventas en Línea
En una tienda física parece que basta con poner los productos en los estantes.
Pero la realidad es que a menudo se necesitan vendedores bien informados para hacer que esos productos vuelen de esos estantes.
Una página web puede desempeñar el papel de un vendedor experto que puede comunicar a Google por qué la página debe indexarse y ayudar a los clientes a elegir esos productos.
Mire el horario de oficina de SEO de Google en el minuto 13:41: