Fuente:
Publico.
Google ofrece una página de ayuda en la que explica que "un motor de búsqueda no es un ser humano, es un programa que hacer concordar las palabras que le das con páginas en la Web. Utiliza las palabras que crees que tienen más posibilidades de aparecer en la página". Lo mismo ocurre con Yahoo o Bing. Estas recomendaciones están establecidas por el modo en que trabajan los buscadores clásicos. Estos programas no entienden los textos, sino que simplemente almacenan la información recogida, indexan sus palabras clave y asignan una puntuación cada uno a su manera para establecer una relevancia a la hora de mostrar los resultados. Es la persona que busca quien debe pensar qué términos pueden estar en la página de resultados que desea. Como dice Eduardo Basterrechea, de El Molino de Ideas, "Google es buenísimo, porque da muchos resultados, pero el usuario pone el 90% del esfuerzo. Lo más difícil es saber qué preguntar".
Parte de las carencias pretenden solventarse con la web semántica, concebida por Tim Berners-Lee, inventor de la World Wide Web, como un conjunto de tecnologías que permitirían marcar la información para que, además de ser leída normalmente por un ser humano,
pueda ser procesada por una máquina. Esto se lleva a cabo mediante la inclusión de etiquetas que dotarían al texto de sentido para que un programa pueda comprender, aunque de forma limitada, qué está procesando; son metadatos, datos sobre los datos.
Diego Berrueta y Luis Polo, coordinadores de la Unidad de Tecnologías Semánticas en la Fundación CTIC, explican que en cierta forma, los usuarios
siempre tienen los metadatos en la cabeza cuando hacen búsquedas, y muchas veces los manifiestan. "Por ejemplo, cuando alguien busca
fotos de París está indicando un metadato, la localización", aclaran. "Una de las claves de cualquier mejora que se introduzca en las búsquedas es que sea transparente y fácil de usar; un buscador avanzado pero demasiado complejo se enfrentará al rechazo de los usuarios", añaden. Quizá precisamente por eso "no existe ninguno equivalente a los buscadores conocidos por la mayoría de usuarios". "Lo que hay son aplicaciones web que utilizan paradigmas de interacción que difieren mucho del buscador convencional. Por ejemplo, Sigma es un buscador que agrega información semántica procedente de diversas fuentes (Wikipedia, BBC, bases de datos gubernamentales) y la utiliza para generar un informe consolidado", señalan estos expertos.
Sin que el usuario lo note
Las tecnologías semánticas, no obstante, están "permeando en otro tipo de aplicaciones", dicen Berrueta y Polo, que detallan un ejemplo: el Ayuntamiento de Zaragoza dispone de una aplicación que permite a los turistas confeccionar una ruta personalizada en función de sus intereses. Esta aplicación está disponible en la web municipal, y utiliza ampliamente las tecnologías de la web semántica, aunque de forma totalmente transparente para el usuario.
Más allá de esto, están los buscadores que
emplean el procesamiento del lenguaje natural. Su objetivo es conseguir una máquina que sea capaz de recoger el significado de los textos igual que hace un ser humano. Existen buscadores que procesan la pregunta del usuario, como Wolfram Alpha, que a la cadena de texto "
Who is the president of the United States?" ("¿Quién es el presidente de EEUU?"), es capaz de responder "Barack Obama". El idioma de la búsqueda ha de ser el inglés o una simple lista de términos ("
president United States", obligatoriamente en ese orden), o no será capaz de entender la pregunta. Además, la base de datos que utiliza este buscador para ofrecer su respuesta no crece sin intervención humana: el sistema no aprende por sí mismo. La propuesta Ishmov es la de superar esa barrera de aprendizaje automático.
Algunas empresas, como las españolas Isoco o Bitext, desarrollan este tipo de buscadores para su instalación en entornos empresariales. De cara a la utilización masiva, aparte de Wolfram Alpha, existen ejemplos como Powerset (adquirido por Microsoft en 2008), que procesa el contenido de la Wikipedia, pero los resultados todavía están lejos de lo que se puede conseguir con Google.