El Algoritmo PageRank: Fundamentos y Relevancia en la Actualidad


¿Que es el Page Rank?

El PageRank es un algoritmo desarrollado en 1996 por Google. Su objetivo era evaluar la importancia relativa de las páginas web según su estructura de enlaces, creando así un sistema de clasificación más eficiente que los motores de búsqueda de la época.

Aunque el PageRank ya no se actualiza públicamente y su impacto ha disminuido con el tiempo, entenderlo conceptualmente sigue siendo crucial para comprender la evolución de los algoritmos de los buscadores y la forma en que los profesionales del SEO abordan el posicionamiento web.

Imagen que muestra a un grupo de personas intercambiando favores y realizando pases, algunos de ellos VIP, simbolizando la idea de PageRank y los intercambios de enlaces en un contexto de relaciones mutuamente beneficiosas.

Intentando entender el PageRank

Imagina que el PageRank es como un «juego de la cadena de favores» en una gran ciudad. En esta ciudad, todas las personas (páginas web) tienen un deseo de que sus historias (contenidos) sean conocidas por la mayor cantidad de gente posible.

Para hacer que su historia sea conocida, una persona puede pasar un «pase» (un enlace) a otra persona, recomendando su historia. Pero no todas las recomendaciones son iguales: si un líder de la ciudad (una página web con mucha autoridad) te pasa un pase VIP, ¡tu historia se hará mucho más famosa! Sin embargo, si alguien que apenas es conocido en la ciudad te pasa un pase normalito, su poder de recomendación no será tan fuerte.

Además, en este juego de la cadena de favores, no todas las personas pueden dar pases VIP a todos, ya que algunas tienen más amigos (enlaces salientes) que otras. Entonces, si una persona con muchos amigos recomienda tu historia, tu «relevancia» aumenta mucho más.

Con el tiempo, el juego se vuelve más sofisticado: además de los pases VIP, las personas también evalúan la calidad de las historias y si realmente les interesan antes de seguir pasando los pases. Así que, aunque el sistema de los pases VIP sigue siendo importante, ahora hay muchos más factores en juego, como cuán interesante es la historia y cuántas personas la disfrutan.

Al final, el objetivo es claro: si quieres que tu historia se haga famosa en la ciudad, lo mejor es que las personas importantes te recomienden y que tu historia sea lo suficientemente buena para que se siga pasando de mano en mano.

Fundamentos técnicos del PageRank

El PageRank se basa en la premisa de que un enlace de una página A a una página B puede considerarse como un «voto de confianza» hacia B. Sin embargo, no todos los enlaces tienen el mismo peso, ya que la autoridad de la página emisora influye en el valor del voto. Matemáticamente, el PageRank de una página PPP se calcula como:PR(P)=(1−d)+d∑i=1nPR(Pi)L(Pi)PR(P) = (1 – d) + d \sum_{i=1}^{n} \frac{PR(P_i)}{L(P_i)}PR(P)=(1−d)+di=1∑n​L(Pi​)PR(Pi​)​

Donde:

  • PR(P)PR(P)PR(P) es el PageRank de la página evaluada.
  • ddd es un factor de amortiguación (generalmente fijado en 0.85), que refleja la probabilidad de que un usuario siga navegando en lugar de iniciar una nueva búsqueda.
  • PiP_iPi​ representa las páginas que enlazan a PPP.
  • L(Pi)L(P_i)L(Pi​) es el número de enlaces salientes de la página PiP_iPi​.

Este modelo iterativo distribuye el valor del PageRank por toda la web, creando una jerarquía según la conectividad de los sitios.

El concepto se inspiró en la forma en que las investigaciones científicas funcionan: un artículo académico gana relevancia según el número de citas que recibe de otros trabajos relevantes. En la web, los enlaces funcionan de manera similar, sirviendo como «citas» que indican la relevancia de una página.

Ejemplos prácticos del PageRank

Vamos a desarrollar un ejemplo básico usando la fórmula matemática del PageRank para ilustrar cómo se calcula. Utilizaremos un conjunto de páginas web simples y aplicaremos los conceptos paso a paso.

Fórmula de PageRank

La fórmula básica del PageRank es:

PR(P) = (1 – d) + d ∑i=1n (PR(Pi) / L(Pi))

Donde:

  • PR(P): es el PageRank de la página (P) que estamos evaluando.
  • d: es el factor de amortiguación, generalmente establecido en 0.85.
  • Pi: son las páginas que enlazan a la página (P).
  • L(Pi): es el número de enlaces salientes de la página (Pi), es decir, cuántos enlaces tiene la página (Pi) a otras páginas.

Ahora, para entenderlo mejor, vamos a construir un ejemplo simple con 3 páginas: A, B y C.

Suposiciones del Ejemplo

  • La página A enlaza a B y C.
  • La página B enlaza solo a C.
  • La página C no enlaza a nadie.

Inicialización de PageRank

Supongamos que todos empiezan con un valor de PageRank inicial de 1. Es decir, tenemos:

  • PR(A) = 1
  • PR(B) = 1
  • PR(C) = 1

El factor de amortiguación d lo vamos a fijar en 0.85, que es el valor comúnmente utilizado.

Cálculo Paso a Paso

Vamos a calcular el PageRank para cada página, utilizando la fórmula de PageRank.

1. Cálculo de PR(A)

  • PR(A) depende de las páginas que enlazan a A, pero en este caso, ninguna página enlaza a A, por lo que no tiene contribuciones directas. Entonces, para A, la fórmula sería:

[
PR(A) = (1 – 0.85) + 0.85 \times (0) = 0.15
]

2. Cálculo de PR(B)

  • PR(B) depende de las páginas que enlazan a B, en este caso A. La página A tiene 2 enlaces salientes (uno a B y otro a C), por lo que el valor de cada enlace de A hacia B es (\frac{PR(A)}{L(A)} = \frac{1}{2} = 0.5).

[
PR(B) = (1 – 0.85) + 0.85 \times 0.5 = 0.15 + 0.425 = 0.575
]

3. Cálculo de PR(C)

  • PR(C) depende de las páginas que enlazan a C, es decir, A y B.
  • A tiene 2 enlaces salientes (uno a B y otro a C), así que el valor de su enlace a C es (\frac{PR(A)}{L(A)} = \frac{1}{2} = 0.5).
  • B tiene 1 enlace saliente (solo enlaza a C), por lo que el valor de su enlace a C es (\frac{PR(B)}{L(B)} = \frac{1}{1} = 1.0).

Por lo tanto, el PageRank de C es la suma de estas contribuciones:

[
PR(C) = (1 – 0.85) + 0.85 \times (0.5 + 1.0) = 0.15 + 0.85 \times 1.5 = 0.15 + 1.275 = 1.425
]

Resumen de los Cálculos Iniciales

  1. PR(A) = 0.15
  2. PR(B) = 0.575
  3. PR(C) = 1.425

Iteración del Cálculo de PageRank

El proceso de cálculo de PageRank se hace de manera iterativa, es decir, calculamos los PageRank iniciales y luego los volvemos a calcular con los nuevos valores, repitiendo el proceso hasta que los valores de PageRank de todas las páginas se estabilicen (no cambien mucho entre una iteración y la siguiente).

En este caso, al hacer una o dos iteraciones adicionales, los valores se estabilizarán y darán una idea de la relevancia de cada página. En este ejemplo básico, ya podemos ver que la página C tiene el mayor PageRank debido a los enlaces de A y B, mientras que A tiene el menor porque no recibe enlaces de otras páginas.

Conclusión

Este proceso muestra cómo el algoritmo PageRank distribuye el valor de los enlaces por toda la web y cómo una página con más enlaces de otras páginas importantes obtiene un mayor valor (PageRank). Las iteraciones continúan hasta que los valores se estabilizan, y Google utiliza este tipo de algoritmo para determinar la relevancia de las páginas web en sus resultados de búsqueda.

Una vez que Google ha calculado el PageRank de todas las páginas web, utiliza esos valores como una de las muchas señales para determinar la relevancia y el orden de las páginas web en sus resultados de búsqueda (lo que llamamos el ranking de las páginas). Aunque PageRank es importante, Google también utiliza muchos otros factores en su algoritmo de clasificación (como contenido, relevancia, usabilidad, etc.), pero PageRank sigue siendo uno de los elementos clave.

¿Cómo usa Google el PageRank para la indexación?

1-Determina la Autoridad de una Página:

  • PageRank ayuda a Google a determinar la «autoridad» de una página. Las páginas con un alto PageRank son consideradas más relevantes, influyentes o confiables, ya que tienen muchos enlaces de otras páginas importantes.
  • Si una página tiene un PageRank alto, Google la ve como una página confiable que debería mostrarse más arriba en los resultados de búsqueda para consultas relevantes.

2.-Clasificación en los Resultados de Búsqueda:

  • PageRank influye en el orden de clasificación (ranking) de los resultados de búsqueda de Google. Cuando un usuario realiza una búsqueda, Google tiene que elegir qué páginas mostrar en primer lugar. Las páginas con un alto PageRank suelen aparecer más arriba en los resultados, porque se consideran más relevantes y confiables.
  • Páginas de alto PageRank generalmente se posicionan mejor, especialmente cuando el contenido de la página es relevante para la consulta del usuario.

3-Relación con los Enlaces Entrantes (Backlinks):

  • PageRank es en gran parte un reflejo de la cantidad y calidad de los enlaces entrantes a una página. Google considera que si una página es enlazada por otras páginas relevantes, estas le están «dando un voto de confianza».
  • Cuando una página importante (con alto PageRank) enlaza a otra página, esta página también recibe parte del PageRank de la página que la enlaza. Así, las páginas con muchos enlaces de calidad se benefician de un mayor PageRank, lo que las hace más probables de aparecer en los primeros lugares de los resultados de búsqueda.

4-Distribución del PageRank (Link Juice):

  • Link Juice es un término coloquial que se refiere al flujo de PageRank que pasa de una página a otra a través de los enlaces.
  • Google distribuye el PageRank entre todas las páginas enlazadas de un sitio web. Si una página tiene muchos enlaces internos o externos, el PageRank se reparte entre todas ellas, lo que significa que cada enlace individual recibe una fracción del valor total del PageRank de la página.
  • Páginas con muchos enlaces salientes pueden transferir menos valor a cada página que enlazan, mientras que una página con menos enlaces salientes puede pasar más Link Juice a cada enlace.

¿Qué factores adicionales utiliza Google junto con PageRank?

Aunque PageRank es un factor importante, no es el único que Google usa para clasificar las páginas. Existen miles de factores que Google toma en cuenta al determinar qué páginas mostrar en los resultados de búsqueda. Algunos de los factores adicionales más importantes incluyen:

Estos factores son prácticamente la totalidad de los temas en nuestro tutorial para aprender a posicionar una web.

¿Qué pasa con el PageRank hoy en día?

Es importante señalar que Google no utiliza solo PageRank para determinar la clasificación de las páginas hoy en día. En los primeros días de Google, el PageRank era un factor dominante, pero con el tiempo el algoritmo de Google ha evolucionado y ahora utiliza muchos otros factores. PageRank sigue siendo uno de los más importantes, pero su influencia ha disminuido en comparación con otros aspectos de la optimización de motores de búsqueda (SEO).

Resumen del uso de PageRank en la indexación de Google:

  1. PageRank ayuda a Google a determinar la autoridad de una página web, lo que influye en su posicionamiento en los resultados de búsqueda.
  2. Una página con un alto PageRank generalmente tiene más posibilidades de estar mejor posicionada.
  3. Google combina el PageRank con otros factores como la relevancia del contenido, la experiencia de usuario, la optimización móvil, y la velocidad de carga para determinar el ranking final de una página.
  4. PageRank también juega un papel importante en la distribución de valor a través de los enlaces, tanto internos como externos.

En resumen, PageRank sigue siendo un componente fundamental en cómo Google clasifica las páginas, pero es solo una parte de un sistema de clasificación mucho más complejo y multifacético que tiene en cuenta muchos otros factores para garantizar que los usuarios obtengan los resultados de búsqueda más útiles y relevantes.