Noticias

PageRank de Google explicado para principiantes en SEO


Celebre las fiestas con algunos de los mejores artículos de SEJ de 2023.

Nuestra serie Festive Flashback se llevará a cabo del 21 de diciembre al 5 de enero y presentará lecturas diarias sobre eventos importantes, fundamentos, estrategias viables y opiniones de líderes intelectuales.

2023 ha sido bastante agitado en la industria del SEO y nuestros colaboradores produjeron algunos artículos destacados para mantener el ritmo y reflejar estos cambios.

Póngase al día con las mejores lecturas de 2023 para tener mucho en qué reflexionar a medida que avanza hacia 2024.


PageRank alguna vez estuvo en el centro de las búsquedas y fue lo que convirtió a Google en el imperio que es hoy.

Incluso si cree que la búsqueda ha pasado del PageRank, no se puede negar que durante mucho tiempo ha sido un concepto omnipresente en la industria.

Todo profesional de SEO debería tener una buena comprensión de lo que era el PageRank y de lo que sigue siendo hoy en día.

En este artículo, cubriremos:

  • ¿Qué es el PageRank?
  • La historia de cómo evolucionó el PageRank.
  • Cómo PageRank revolucionó la búsqueda.
  • PageRank de la barra de herramientas frente a PageRank.
  • Cómo funciona el PageRank.
  • Cómo fluye el PageRank entre páginas.
  • ¿Se sigue utilizando el PageRank?

Vamos a sumergirnos.

¿Qué es el PageRank?

Creado por los fundadores de Google, Larry Page y Sergey Brin, PageRank es un algoritmo basado en las fortalezas relativas combinadas de todos los hipervínculos en Internet.

La mayoría de la gente sostiene que el nombre se basó en el apellido de Larry Page, mientras que otros sugieren que “Página” se refiere a una página web. Es probable que ambas posiciones sean ciertas y la superposición probablemente fue intencional.

Cuando Page y Brin estaban en la Universidad de Stanford, escribieron un artículo titulado: El PageRank Citation Ranking: poner orden en la Web.

Publicado en enero de 1999, el artículo demuestra un algoritmo relativamente simple para evaluar la solidez de las páginas web.

patente de pagerank: páginas semillaImagen de patents.google.com, abril de 2023patente de pagerank: páginas semilla

El artículo se convirtió en una patente en Estados Unidos (pero no en Europa, donde las fórmulas matemáticas no son patentables).

principio a fin del proceso de pagerankImagen de patents.google.com, abril de 2023principio a fin del proceso de pagerank

La Universidad de Stanford posee la patente y se la ha cedido a Google. Actualmente, la patente expirará en 2027.

proceso pantent de pagerankImagen de patents.google.com, abril de 2023proceso pantent de pagerank

La historia de cómo evolucionó el PageRank

Durante su estancia en Stanford a finales de la década de 1990, tanto Brin como Page buscaban métodos de recuperación de información.

En ese momento, usar enlaces para determinar qué tan “importante” era cada página en relación con otra era una forma revolucionaria de ordenar las páginas. Era computacionalmente difícil pero de ninguna manera imposible.

La idea rápidamente se convirtió en Google, que en ese momento era un pececillo en el mundo de las búsquedas.

Había tanta confianza institucional en el enfoque de Google por parte de algunas partes que la empresa lanzó inicialmente su motor de búsqueda sin capacidad de obtener ingresos.

Y mientras Google (conocido en ese momento como “BackRub”) era el motor de búsqueda, PageRank era el algoritmo que utilizaba para clasificar las páginas en las páginas de resultados del motor de búsqueda (SERP).

El baile de Google

Uno de los desafíos de PageRank era que las matemáticas, aunque simples, debían procesarse de forma iterativa. El cálculo se ejecuta varias veces, en cada página y en cada enlace de Internet. En el cambio de milenio, esta matemática tardaba varios días en procesarse.

Las SERP de Google subieron y bajaron durante ese tiempo. Estos cambios eran a menudo erráticos, ya que se calculaban nuevos PageRanks para cada página.

Esto se conocía como el “Danza de Google” y notoriamente detenía a los profesionales de SEO de la época cada vez que Google comenzaba su actualización mensual.

(Más tarde, Google Dance se convirtió en el nombre de una fiesta anual que Google organizaba para expertos en SEO en su sede de Mountain View).

Semillas de confianza

Una versión posterior de PageRank introdujo la idea de una “semilla confiable” configurada para iniciar el algoritmo en lugar de darle a cada página de Internet el mismo valor inicial.

Surfista razonable

Otra versión del modelo introdujo la idea de un “surfista razonable”.

Este modelo sugiere que el PageRank de una página podría no compartirse de manera uniforme con las páginas a las que enlaza, pero podría ponderar el valor relativo de cada enlace en función de la probabilidad de que un usuario haga clic en él.

La retirada del PageRank

Inicialmente se creía que el algoritmo de Google era “antispam” internamente, ya que la importancia de una página estaba dictada no sólo por su contenido sino también por una especie de “sistema de votación” generado por enlaces a la página.

Sin embargo, la confianza de Google no duró.

El PageRank comenzó a volverse problemático a medida que crecía la industria de los vínculos de retroceso. Así que Google lo retiró de la vista del público, pero siguió confiando en él para sus algoritmos de clasificación.

La barra de herramientas de PageRank se retiró en 2016 y, finalmente, se restringió todo el acceso público a PageRank. Pero en ese momento, Majestic (una herramienta de SEO), en particular, había podido correlacionar bastante bien sus propios cálculos con PageRank.

Google pasó muchos años alentando a los profesionales de SEO a no manipular enlaces a través de su documentación de “Pautas de Google” y mediante el asesoramiento de su equipo de spam, encabezado por Matt Cutts, hasta enero de 2017.

Los algoritmos de Google también cambiaron durante este tiempo.

La empresa dependía menos de PageRank y, tras la compra de MetaWeb y su propietario Knowledge Graph (llamado “Freebase” en 2014), Google comenzó a indexar la información del mundo de diferentes maneras.

PageRank de la barra de herramientas vs. Rango de página

Inicialmente, Google estaba tan orgulloso de su algoritmo que estaba feliz de compartir públicamente el resultado de su cálculo con cualquiera que quisiera verlo.

La representación más notable fue una extensión de barra de herramientas para navegadores como Firefox, que mostró una puntuación entre 0 y 10 para cada página de Internet.

En verdad, PageRank tiene una gama mucho más amplia de puntuaciones, pero 0-10 brindó a los profesionales y consumidores de SEO una forma instantánea de evaluar la importancia de cualquier página en Internet.

La barra de herramientas PageRank hizo que el algoritmo fuera extremadamente visible, lo que también trajo complicaciones. En particular, significó que estaba claro que los enlaces eran la forma más fácil de “engañar” a Google.

Cuantos más enlaces (o, más exactamente, cuanto mejor sea el enlace), mejor clasificación podría tener una página en las SERP de Google para cualquier palabra clave específica.

Esto significó que se formó un mercado secundario, comprando y vendiendo enlaces valorados en el PageRank de la URL donde se vendió el enlace.

Este problema se agravó cuando Yahoo lanzó una herramienta gratuita llamada Yahoo Search Explorer, que permitía a cualquiera comenzar a buscar enlaces a cualquier página determinada.

Más tarde, dos herramientas (Moz y Majestic) aprovecharon la opción gratuita creando sus propios índices en Internet y evaluando enlaces por separado.

Cómo PageRank revolucionó la búsqueda

Otros motores de búsqueda dependían en gran medida del análisis del contenido de cada página individualmente. Estos métodos tenían poco para identificar la diferencia entre una página influyente y una escrita simplemente con texto aleatorio (o manipulador).

Esto significaba que los métodos de recuperación de otros motores de búsqueda eran extremadamente fáciles de manipular para los profesionales de SEO.

El algoritmo PageRank de Google, entonces, fue revolucionario.

Combinado con un concepto relativamente simple de “nGrams” para ayudar a establecer la relevancia, Google encontró una fórmula ganadora.

Pronto superó a los principales titulares de la época, como AltaVista e Inktomi (que impulsaban MSN, entre otros).

Al operar a nivel de página, Google también encontró una solución mucho más escalable que el enfoque basado en “directorios” adoptado por Yahoo y más tarde por DMOZ, aunque DMOZ (también llamado Open Directory Project) pudo proporcionar inicialmente a Google una solución de código abierto. directorio propio.

Cómo funciona el PageRank

La fórmula del PageRank se presenta en varias formas, pero se puede explicar en unas pocas frases.

Inicialmente, a cada página de Internet se le asigna una puntuación de PageRank estimada. Este podría ser cualquier número. Históricamente, el PageRank se presentaba al público como una puntuación entre 0 y 10, pero en la práctica las estimaciones no tienen por qué empezar en este rango.

Luego, el PageRank de esa página se divide por la cantidad de enlaces que salen de la página, lo que da como resultado una fracción más pequeña.

Luego, el PageRank se distribuye a las páginas vinculadas y se hace lo mismo con todas las demás páginas de Internet.

Luego, para la siguiente iteración del algoritmo, la nueva estimación de PageRank para cada página es la suma de todas las fracciones de páginas que enlazan con cada página determinada.

La fórmula también contiene un “factor de amortiguación”, que se describió como la posibilidad de que una persona que navega por la web deje de navegar por completo.

Antes de que comience cada iteración posterior del algoritmo, el nuevo PageRank propuesto se reduce mediante el factor de amortiguación.

Esta metodología se repite hasta que las puntuaciones de PageRank alcanzan un equilibrio establecido. Los números resultantes generalmente se transpusieron a un rango más reconocible de 0 a 10 por conveniencia.

Una forma de representar esto matemáticamente es:

Fórmula de ranking de páginaImagen del autor, abril de 2023.Fórmula de ranking de página

Dónde:

  • PR = PageRank en la siguiente iteración del algoritmo.
  • d = factor de amortiguación.
  • j = el número de página en Internet (si cada página tuviera un número único).
  • n=número total de páginas en Internet.
  • i = la iteración del algoritmo (inicialmente establecida en 0).

La fórmula también se puede expresar en forma matricial.

Problemas e iteraciones de la fórmula.

La fórmula tiene algunos desafíos.

Si una página no enlaza con ninguna otra página, entonces la fórmula no alcanzará el equilibrio.

En este caso, por tanto, el PageRank se distribuiría entre todas las páginas de Internet. De esta manera, incluso una página sin enlaces entrantes podría obtener alguno PageRank, pero no se acumularía lo suficiente como para ser significativo.

Otro desafío menos documentado es que las páginas más nuevas, aunque potencialmente más importantes que las páginas más antiguas, tendrán un PageRank más bajo. Esto significa que, con el tiempo, el contenido antiguo puede tener un PageRank desproporcionadamente alto.

El tiempo que una página ha estado activa no se tiene en cuenta en el algoritmo.

Cómo fluye el PageRank entre páginas

Si una página comienza con un valor de 5 y tiene 10 enlaces, entonces cada página a la que enlaza recibe un PageRank de 0,5 (menos el factor de amortiguación).

De esta manera, el PageRank fluye por Internet entre iteraciones.

A medida que aparecen nuevas páginas en Internet, comienzan con sólo una pequeña cantidad de PageRank. Pero a medida que otras páginas comienzan a vincularse a estas páginas, su PageRank aumenta con el tiempo.

¿Se sigue utilizando el PageRank?

Aunque el acceso público al PageRank se eliminó en 2016, se cree que la puntuación todavía está disponible para los ingenieros de búsqueda de Google.

Una filtración de los factores utilizados por Yandex mostró que el PageRank seguía siendo un factor que podía utilizar.

Los ingenieros de Google han sugerido que la forma original de PageRank fue reemplazada por una nueva aproximación que requiere menos potencia de procesamiento para su cálculo. Si bien la fórmula es menos importante en la forma en que Google clasifica las páginas, sigue siendo una constante para cada página web.

E independientemente de qué otros algoritmos Google pueda optar por utilizar, es probable que el PageRank siga integrado en muchos de los sistemas del gigante de las búsquedas hasta el día de hoy.

Dixon explica cómo funciona PageRank con más detalle en este vídeo:



Patentes y artículos originales para una lectura más detallada:

Más recursos:


Imagen de portada: VectorMine/Shutterstock

hola@juanrecio.com

Author

hola@juanrecio.com

¡Utiliza la tecnología y la inteligencia artificial en tus proyectos! ¿Quieres saber cómo?