En los años noventa empezaron a popularizarse programas que, con algo de paciencia, permitían dictar al ordenador un texto. Este tipo de soluciones necesitaban un tiempo de ensayo con su cliente para tomarle las medidas vocales. Ahora, en los teléfonos móviles hay asistentes virtuales, más o menos imperfectos, que empiezan a permitir el viejo sueño de hablarle a las máquinas. Pero la industria informática de la voz y el lenguaje hace años que trabaja.
El análisis digital de la voz abre el camino a muchas aplicaciones, por ejemplo, desde el control biométrico de un acceso a través de la huella vocal de la persona a la subtitulación de filmes, la ayuda en la atención de los call centers, aplicación en entornos de enseñanza digital para mejorar la curva aprendizaje … Una empresa española que trabaja en este terreno es Verbio. Sus sistemas de análisis de la locución permiten no solo saber qué dice una persona si no, también, como lo dice, si está enfadada, alegre…Antonio Terradas, uno de sus actuales propietarios, subraya que la tecnología del habla tiene mala fama porque su aplicación en sistemas poco desarrollados y deficientes hace que algo que ha de facilitar la vida…la complique. Esta tecnología, explica, trabaja con modelos acústicos y de lenguaje. Los primeros analizan la emisión del fonema, la entonación, a través de qué medio se habla (micrófono, teléfono). Los modelos lingüísticos, basados en estadísticas, calculan la posibilidad, por ejemplo, de que una palabra vaya precedida habitualmente por otra, variantes dialectales….
Verbio, fundada en 1999 por catedráticos de la UPC, ha ido investigando en este terreno. La gran dificultad es que una vez llegas a un determinado porcentaje de fiabilidad, mejorarlo resulta muy difícil. “Y superar estos umbrales es imprescindible en muchas aplicaciones que no son meramente lúdicas. La subtitulación automática en un vídeo de YouTube es buena, con un 80% de acierto. El internauta ya está satisfecho. Pero este 80% es insuficiente cuando esta técnica se usa en la administración. El nivel de acierto que se exige supera el 95%”. La voz de cada persona es única y puede servir para emitir la fe de vida de millones de ciudadanos de una comunidad. De ahí la escasa tolerancia al fallo.
Los programas Verbio de síntesis de voz y reconocimiento del habla se emplean en servicios y centros de atención al cliente de muchas compañías, en automatización de procesos industriales o logísticos, en entornos domóticos o en productos de ayuda a la discapacidad. Algunos clientes las emplean para analizar las llamadas telefónicas que han tenido éxito comercial y las que no para ajustar sus mensajes y conductas mercantiles. Con sede central en España ahora su objetivo son los países latinoamericanos -abriendo oficinas en Brasil, Argentina, Chile y Colombia- incluyendo nuevos acentos e idiomas.
Otro tipo de empresas se centran no ya en la voz sino en la semántica y la inteligencia artificial, otro concepto anticipadamente muy explotado y que el ciudadano esperaba que llegara de manera más rápida. Isoco, por ejemplo ,investiga en la web semántica, un concepto cuyo enunciado parece nebuloso si no se ven los resultados. En eso trabaja Isoco. “La web semántica es aquella en la que se estandariza la forma de codificar la información, etiquetándola, de manera que se facilite su acceso e interpretación por parte de máquinas. En la web se generan enormes cantidades de contenidos y el reto es que las máquinas sepan ordenarlos, extraerlos y analizarlos para generar conocimiento ”, comentan Sergi Mesquida y Elena Castells, de la citada compañía.
Isoco ofrece, un caso, su propio asistente virtual, Sherpa, para la atención al usuario final a través de la web de la compañía cliente. “El usuario hace preguntas en un lenguaje natural y Sherpa debe responder de igual forma, guiando y ayudando al usuario a encontrar lo que necesita. El sistema ha de interactuar de forma empática como un dependiente amable”. Naveganza es un buscador interno para empresas que interpreta el lenguaje natural, aplica criterios de conocimiento (semántica) y no solamente sintácticos lo que aumenta su fiabilidad y la extracción del conocimiento que alberga la corporación, a veces diseminado, perdido
Isoco participa en varios programas de investigación internacionales promovidos por la Unión europea o el consorcio W3C para empujar la evolución de la web hacia un espacio inteligente capaz de realizar tareas y no únicamente almacenar datos. Con la universidad de Cambridge y Yahoo trabajan en el proyecto Parlance que permitirá una interacción amigable entre el usuario y su teléfono móvil a través del reconocimiento de la voz.
No hay comentarios:
Publicar un comentario