Los torneos de robots, como el All Japan Robot-Sumo Tournament, son un espectáculo destinado principalmente a los aficionados de esta rama de la ingeniería. Pero lo que en un principio puede parecer un simple entretenimiento, en el que dos máquinas construidas por el hombre pelean entre ellas por empujarse fuera de un área circular, puede encontrar aplicaciones prácticas dentro del terreno de la investigación en el momento en el que los robots compiten entre ellos de forma autónoma en un entorno más similar al que puede encontrarse un ser vivo. Es la llamada "robótica evolutiva".
En un trabajo publicado hace unos días en la revista PNAS, se explica el desarrollo de un experimento con robots ideado para estudiar cómo la información se comparte entre organismos semejantes, y cómo esa información se encuentra a merced de la presión que ejerce el ambiente dentro del engranaje de la evolución. Los autores del estudio son miembros del Laboratorio de Sistemas Inteligentes de la Escuela Politécnica Federal de Lausana y el Departamento de Ecología y Evolución de la Facultad de Biología y Medicina de la Universidad de Lausana. Como comenta Sara Mitri, autora principal del trabajo, "la robótica evolutiva puede ser útil al explorar cualquier problema en el que se sospecha que las propiedades mecanicistas del entorno pueden influenciar los resultados de los hallazgos".
El experimento consistió en un recinto cuadrado con dos fuentes de luz roja situadas sobre esquinas opuestas, una etiquetada como "comida" y otra como "veneno", distinguibles entre ellas por el color de un círculo de papel colocado bajo cada una. En el recinto se introdujo una población de 10 robots equipados con un sencillo sistema motor, un emisor de luz azul y detectores de luz azul y roja, así como unos sensores en la parte inferior que les permitía saber si estaban situados sobre el veneno o la comida.
En busca del más apto
Los robots, cuya programación consistió en una red neuronal que utilizaba como entradas los valores de los distintos sensores, eran libres de moverse por cualquier parte del terreno. Aquellos que se situaban durante más tiempo sobre la comida eran considerados como más aptos en un sencillo proceso de selección artificial, y se generaba su descendencia, cruzando los parámetros de su red neuronal (ver apoyo). El hecho de que no todos los individuos pudiesen estar alrededor de la comida al mismo tiempo hizo que tuviesen que competir entre ellos para conseguir recursos. No se produce un aprendizaje, sino una evolución: en las sucesivas generaciones se puede observar cómo el comportamiento fue cambiando, dependiendo del entorno.
En una primera ronda, en la que los robots emitían luz azul de forma aleatoria (esto es, no controlaban cuándo emitían y cuándo no), el resultado fue una atracción hacia la luz azul tras la novena generación (la ronda consistió en 500 generaciones). Es decir: hizo falta poco tiempo para que los robots evolucionasen hacia un estado que aprovechaba la información emitida por sus semejantes en su búsqueda de la comida.
En un segundo experimento se programó a los robots para que también pudiesen controlar sus luces azules. Durante los compases iniciales de esta segunda ronda la evolución de cada generación parecía similar a la prueba anterior, pero a partir de la generación 16 los robots comenzaban a apagar sus luces en las inmediaciones de la comida. Al llegar a las 500 generaciones previstas, había más luz en las inmediaciones del veneno que en las junto a la comida: la selección les había empujado a no avisar de su posición cuando ésta era ventajosa. Además, la luz azul ya no les atraía de la forma en la que lo hacía antes: efectivamente, ahora un resplandor azulado no era indicativo de la ubicación del alimento y, por tanto, no contenía tanta información como anteriormente.
Estos patrones de emisión y recepción de información son similares a los que pueden encontrarse en el mundo animal. Aunque, efectivamente, la técnica puede ser útil a la hora de estudiar comportamientos que serían muy difíciles de observar en la naturaleza, conviene añadir una nota de cautela. "Es importante tener cuidado al extrapolar los resultados de estos estudios a organismos vivos. Creo que el experimento puede servir de inspiración para estudios de conducta con organismos reales y como predicción de cómo funciona la dinámica evolutiva. Sin embargo", añade Mitri, "debe recordarse que estos resultados pueden ser específicos de nuestro sistema y no deberían ser aplicados a otros entornos sin más experimentación".
Por el momento, en este estudio, la selección ocurre a nivel de individuo. Otro miembro del Laboratorio de Sistemas Inteligentes, Steffen Wischmann, está actualmente trabajando en la interacción entre distintas especies de robots y estudia cómo la varían las estrategias comunicativas en un entorno competitivo.
¿Cómo funciona una red neuronal?
Las redes neuronales, entendidas desde el punto de vista artificial, son sistemas que emulan el funcionamiento del sistema biológico análogo: cada nodo de la red (lo que sería una neurona) asigna un un valor numérico a cada uno de sus estímulos de entrada, generando, a su vez, un valor de salida. A base de conectar esos nodos, se termina formando una red que produce un valor de decisión en función de sus entradas. En el experimento publicado en PNAS, los parámetros de entrada de la red eran los diversos sensores de cada robot; la salida, el movimiento resultante. Los valores numéricos de cada nodo de cada uno de los robots son los que controlan el comportamiento y, en última instancia, los que se mezclan para generar los valores de la red de la descendencia, que tendrá un comportamiento similar al de los robots progenitores.