La historia de dos jóvenes doctorandos en Ciencias de la Computación por la Universidad de Stanford que emprenden un proyecto para mejorar la búsqueda de información a partir de una gran cantidad de datos y acaban por controlar uno de los mayores emporios de Internet, con ramificaciones en las industrias de la publicidad, del software y del hardware, se ha convertido en una de las más paradigmáticas del sueño americano. Tanto que la memoria colectiva ha borrado cualquier rastro de épocas pasadas y, al igual que muchos usuarios equiparan la palabra PC con el término Windows, los hay que identifican “buscador” con “Google”. O los que no pueden recordar su vida antes del gigante de la G.
Sin embargo sólo han pasado trece años y medio desde su fundación. Antes de que a Larry Page y Sergey Brin se les diese por fabricar un motor que originalmente se llamaba BackRub, ya existían otras herramientas para bucear entre los insondables misterios de la red. Uno de sus principales rivales en la actualidad, Yahoo!, vio la luz a mediados de los 90 como una colección de enlaces bajo el nombre de Jerry’s Guide to the World Wide Web y al año ya estaba cotizando en bolsa. En un principio la empresa externalizaba su servicio a otros proveedores, pero con el tiempo sus creadores se dieron cuenta del valor de las búsquedas y se lanzaron a la compra frenética de firmas como Inktomi o Overture. Esta última venía con premio porque tenía como filiales a Fast, AllTheWeb y AltaVista.
De todas ellas AltaVista es quizás la herramienta más conocida. Fue la primera en permitir consultas en lenguaje natural, integrar elementos multimedia, soportar diferentes idiomas Babel Fish mediante, ofrecer consejos y comprobar “inlinks”, entre otras técnicas revolucionarias. Gozaba de un ancho de banda casi ilimitado para la época (1995) y llegó a obtener más patentes de búsqueda que ninguna otra empresa de Internet (unas 60). Su tráfico aumentaba constantemente, pasando de 300.000 visitas diarias a más de 80 millones a… estrellarse con el reventón de las “puntocom”.
Su decadencia fue aprovechada en un “impasse” por HotBot. Basado en la tecnología de Inktomi, este motor se jactaba de poseer una base de datos más actualizada y de posibilitar el refinamiento de las búsquedas en función de resultados anteriores. Coetáneos a ambos son Infoseek, Lycos, Excite y LookSmart. El primero no sentó grandes precedentes antes de ser absorbido por Disney, excepto por vender anuncios partiendo de un modelo CPM y dejar que los webmasters enviasen sus páginas al index en tiempo real. También convenció a la malograda Netscape para promocionarse como su buscador por defecto.
El segundo, que todavía existe, incluía el concepto de proximidad entre palabras y en un par de años consiguió indexar la friolera de 60 millones de documentos partiendo de sus primeras veinte frases. El tercero es fruto del proyecto Architext y destaca por idear un algoritmo que devolvía resultados aunque la palabra tecleada no estuviese contenida en el sitio, siempre y cuando guardase alguna relación de sinonimia. Además, era capaz de alinear páginas dinámicas para diferentes sistemas operativos. Y el cuarto construyó su modelo de negocio entorno al MSN de Microsoft, lo que lo dejó al borde del precipicio cuando los de Redmond decidieron desarrollar su propia tecnología de búsqueda.
Wandex, primer buscador de la web
Más tarde fueron despuntando propuestas como Ask Jeeves, rebautizada a posteriori como Ask.com, que hacía coincidir las respuestas con la intervención de editores humanos. O EINet Galaxy, Internet Public Library y Northern Light, por poner tres ejemplos, en el grupo de las clasificaciones temáticas. Pero todo esto fue mucho después de la aparición online del World Wide Web Wanderer.
Este robot programado en Perl por los chicos del Instituto Tecnológico de Massachusetts fue puesto a prueba por primera vez en 1993 con el propósito de medir el alcance de la red y dio lugar al padre de todos los buscadores: el índice Wandex. Sobre las mismas fechas iniciaron su actividad Aliweb (de Archie Like Indexing on the Web), especializado en rastrear metatags, y WebCrawler, primer motor de búsqueda de texto completo. Otras arañas básicas fueron Jumpstation y World Wide Web Worm, que indexaban título, URL y cabecera de las páginas sin aplicar ningún algoritmo, así como el repositorio RBSE.
¿Y antes? Con anterioridad al advenimiento de la web y las andanzas de Tim Berners-Lee ya se habían desarrollado formas de localizar información relevante en el maremágnum de servidores que poblaban Internet. Entre ellos sobresalen tres métodos con reminiscencias de cómic. Archie se dedicaba a identificar ficheros específicos en sitios FTP anónimos, originariamente con líneas de comandos UNIX, mientras que Jughead y Veronica fueron implementados para actualizar bases de datos y realizar consultas mediante el protocolo Gopher.
No hay comentarios:
Publicar un comentario