Aunque en cierto sentido podemos ver a Google como un “gran ojo” (no sólo por las imágenes que nos ofrecen Google Maps y Google Earth, sino también porque parece “ver” todo lo que se escribe en la red), lo cierto es que el funcionamiento de su aplicación base, el buscador, se parece más al de un inmenso cerebro.
Los detalles del proceso que permiten a Google ofrecer tan buenos resultados en las búsquedas no son públicos; además, según Google indica, dicho proceso se actualiza continuamente. Sin embargo, sí se conoce que la parte fundamental de ese proceso es el algoritmo PageRank, que asigna un valor numérico a las páginas publicadas en Internet; las páginas con mayor PageRank aparecen en los primeros lugares en los resultados de búsqueda aunque, como ya hemos dicho, existen otros muchos factores “no públicos” para calcular esos resultados (por ejemplo, la frecuencia de aparición de los términos buscados en la página). Sin entrar en sus detalles, lo que resulta interesante es que el algoritmo de cálculo del PageRank funciona de modo similar a como lo hacen las neuronas en el cerebro. Veamos por qué.
PageRank o el prestigio de las páginas
Cada página indexada por Google tiene un PageRank que va de 0 a 10. Este valor sigue una escala logarítmica (es decir, hay mucha menor diferencia entre 3 y 4 que entre 4 y 5), y se calcula en función del número de enlaces desde otras páginas hacia ella; crear un enlace hacia otra página supone votar a favor de ella.
Pero al contrario que en una democracia, no todos los votos tienen el mismo valor: un enlace desde una página con un PageRank alto tiene mayor valor que un enlace desde una página con PageRank bajo. De algún modo, el PageRank indica el prestigio de la página; se obtiene mayor prestigio consiguiendo referencias desde otras páginas con prestigio alto (de hecho, un algoritmo similar fue propuesto para valorar el prestigio de artículos científicos).
Pero el prestigio también se reparte: un enlace desde una página que enlaza a otras muchas páginas tiene menos valor que desde una página con el mismo PageRank, pero con menos enlaces totales.
¿En qué se parece todo esto a un cerebro?
El cerebro como una red de neuronas
Haciendo una gran simplificación, el sistema nervioso central y, en concreto, el cerebro, puede verse como una red de muchísimas células, conocidas como neuronas, interconectadas entre ellas. Cada neurona está formada por un núcleo (o soma) del que parten diferentes ramificaciones nerviosas llamadas dendritas; surge además una larga fibra nerviosa llamada axón que también se ramifica al final.
Las dendritas de una neurona se ponen en contacto con las terminaciones del axón de otras en la zona que se conoce como sinapsis; en realidad no entran en contacto directo, sino que se encuentran a muy poca distancia.
Las señales electroquímicas viajan en las neuronas desde el núcleo, a lo largo del axón, hasta sus ramificaciones donde provocan la emisión en la sinapsis unas sustancias conocidas como neurotransmisores que son detectados por las dendritas de las neuronas cercanas.
Cada neurona recibe pues, a través de sus dendritas, diferentes estímulos, de diferente intensidad, provenientes de otras neuronas; unos son excitatorios y “animan” a la neurona a propagar la señal; otros son inhibitorios y “desaniman” a la neurona. Al final, unos y otros impulsos son sumados y, únicamente si el resultado supera cierto límite, la neurona se “dispara”, la señal viaja a lo largo del axón, y se propaga a las neuronas vecinas.
PageRank y neuronas
La asociación es inmediata: cada página web podría ser vista como una neurona y su PageRank como el valor de activación; los enlaces entrantes, las conexiones de otras neuronas a través de las dendritas; y los enlaces salientes, las conexiones a través del extremo del axón. Así, el cálculo del PageRank (del nivel de activación de la neurona) es función de los enlaces entrantes (los impulsos recibidos por otras neuronas) que, a su vez, es transmitido a las páginas enlazadas (los impulsos enviados a otras neuronas). Es más; no todas las páginas tienen el mismo peso en el cálculo del PageRank, al igual que no todos los impulsos recibidos por las neuronas tienen el mismo nivel de activación.
En ambos casos la información del sistema no reside en sus elementos, sino en las conexiones entre ellos. Y, lo que es más importante, las conexiones no son fijas: los enlaces entre páginas cambian y también lo hacen las conexiones entre neuronas (de hecho, algunas teorías afirman que precisamente en esos cambios residen la memoria o el aprendizaje).
¿Hasta dónde es válida la metáfora?
Como todas las metáforas, llevar esta todavía más lejos puede resultar interesante o hacer que deje de tener sentido. Veamos algunos puntos en los que difieren ambos sistemas, y qué sentido tendrían al aplicarse al PageRank (no podemos hacerlo en sentido contrario ya que ¡todavía no podemos modificar cómo funcionan las neuronas!):
- El nivel de activación de las neuronas es del tipo “todo o nada”, mientras que el PageRank es un valor numérico de 0 a 10; en este caso, imitar el funcionamiento de las neuronas sería hacer menos flexible el cálculo del PageRank.
- El algoritmo original de cálculo del PageRank no incluye enlaces que aporten valor negativo, que serían el equivalente a los impulsos inhibitorios; sin embargo, sí es conocido que Google penaliza las granjas de enlaces (link farms), que son páginas que se crean únicamente con el propósito de incrementar artificialmente el PageRank. De todas formas, considerar este tipo de enlaces con valor negativo sería peligroso, ya que un sitio penalizado de ese modo podría fácilmente perjudicar a otros, simplemente enlazándolos.
- Las activaciones entre neuronas se realizan continuamente (“en tiempo real”), mientra que el cálculo del PageRank es realizado por Google aproximadamente una vez al mes, en lo que se conoce como “Google Dance”. Se trata aquí de un problema obviamente técnico: sería enorme la cantidad de recursos necesarios para que Google realizara ese cálculo cada vez que se realiza una búsqueda.
- Relacionado con el punto anterior, la información está realmente distribuida en las neuronas, mientras que el valor del PageRank está centralizado en los servidores de Google (aunque se calcule a partir de los enlaces de la red). Idealmente, cada servidor podría almacenar el PageRank de sus páginas para optimizar los procesos de búsqueda; pero resulta difícil confiar en que todos serían tan capaces (y honestos) como para almacenar correctamente ese valor.
Para finalizar
Imitar el funcionamiento de las neuronas en un entorno informático es algo que se hace desde hace muchos años, especialmente en el ámbito de la Inteligencia Artificial conocido como redes neuronales. Este artículo no pretende llegar al nivel de detalle formal de dichas redes, sino que pretende ser únicamente una reflexión sobre dos sistemas similares, que puede ayudar a entenderlos mejor.
No deja de ser curioso cómo la selección natural (que ha creado el cerebro como órgano) y la “selección cultural” (que ha colocado a Google como buscador predominante en Internet) han llegado a soluciones con tantas similitudes. ¿Podrían llevarse las similitudes más allá?
Pingback: autobombo.es
Pingback: jordisan.net :: ¿Se pasa Google de listo con el idioma? « Blog (artículos)
Pingback: METAeuFORiAS
Pongan un esquema mas concreto y util.
This is the third time I’ve been to your website. Thanks for providing more information.