Buscar

2011/02/21

¿Puede una máquina resumir un texto?

No son los primeros en intentarlo. Hace un par de años, Stephen Wolfram quiso revolucionar la búsqueda de información en la red con tecnología dinámica y computación semántica. Lanzó Wolfram Alpha, que ofrece datos concretos en lugar de páginas que contienen palabras clave. Es capaz, por ejemplo, de indicar exactamente cuántos habitantes tiene Barcelona, incluso cuando se formula la pregunta en catalán o español. Pero es difícil hacerle sombra a Google.
En Topicmarks, también apuestan por las posibilidades de la tecnología semántica y el análisis textual, aunque el producto que han desarrollado va por otros derroteros. De hecho, están tan convencidos de que éste es un buen momento para lanzar aplicaciones de tecnología semántica que han conseguido una nueva ronda de financiación de 500.000 dólares en Silicon Valley.
Su punto de partida: ¿Por qué leerse un montón de páginas cuando algo puede resumirse en 10 líneas? Su propuesta: una aplicación que entiende textos de todo tipo y extrae de ellos una decena de hechos clave que presenta también en forma de resumen ejecutivo, es decir, un servicio con posibilidades de conseguir fans y clientes en un momento en el que casi todo parece poder reducirse a 140 caracteres.
Su funcionamiento es sencillo. Basta con conectarse a la página de Topicmarks, registrarse (gratuitamente), subir un documento (en inglés) en formato .doc, .PDF o HTML o pegar la URL del texto a resumir en la casilla indicada.  En sólo unos segundos, Topicmarks ofrece lo que la compañía llama knode, o sinopsis inteligente, que incluye el peso del documento en Kb, el tiempo de lectura que se ahorra el usuario, el recuento de frases y palabras que contiene, una nube de tags y un pequeño resumen que, al parecer, está lo suficientemente bien escrito como para que lo copien los estudiantes.
O eso cuenta Ronald Siebelink, CEO de Topicmarks, que dice haber recibido quejas de varios profesores en este sentido. Los ejemplos que tiene en la web le dan la razón. Las pruebas realizadas por esta periodista con varios textos (en inglés) se lo discuten. Hay escritos que la máquina no procesa. Con otros, los resultados no son perfectos, aunque es cierto que las frases tienen sentido.
Siebelink cuenta en varias publicaciones que la actual versión de la aplicación, que también tiene plug-in para Firefox, es producto de más de cuatro años de investigación en inteligencia artificial y que su objetivo a largo plazo es conseguir que su tecnología de resumen esté disponible en “todos los dispositivos en los que se pueda leer información digital.”
De momento, para este año, se conforma con conseguir mejorar la web e integrarse en servicios de almacenamiento de documentos online como Dropbox o Scribd. Después, dice, habrá que atacar otros idiomas, los feeds RSS y los Social Media. Porque Twitter también se puede resumir...

La Vanguardia

No hay comentarios: