Revolución en el Gaming: La IA Generalista Transforma los Mundos Virtuales en Campos de Prueba Inteligentes
El Agente Multi-Mundo Instruible y Escalable (SIMA) es una IA que ejecuta tareas en múltiples videojuegos siguiendo instrucciones en lenguaje natural, mostrando adaptabilidad y potencial para aplicaciones prácticas.
CIENTÍFICOS/PERIODISTICOS
Franco Mansilla
3/18/20244 min leer
La investigación sobre el Agente Multi-Mundo Instruible y Escalable (SIMA) ha marcado un hito en la evolución de la inteligencia artificial (IA). Este agente de IA generalista, capaz de seguir instrucciones en lenguaje natural, ha demostrado su versatilidad en diversos escenarios de videojuegos, sentando un precedente en la interacción digital avanzada.
Los videojuegos se han consolidado como un campo de pruebas esencial para los sistemas de IA, ofreciendo entornos ricos y dinámicos que simulan la complejidad del mundo real. La trayectoria de Google DeepMind en este ámbito, desde su trabajo con juegos de Atari hasta el sistema AlphaStar que juega StarCraft II a nivel de gran maestro humano, refleja el avance sostenido en la integración de la IA en el entretenimiento interactivo.
Nuevo hito anunciado
La transición de DeepMind hacia el desarrollo de un agente de juego de IA instruible y generalista representa un cambio significativo en su enfoque estratégico.
En un informe técnico reciente, se introdujo SIMA, diseñado para operar en entornos virtuales 3D. La colaboración con desarrolladores de juegos permitió el entrenamiento de SIMA en una variedad de videojuegos, evidenciando su capacidad para comprender y actuar en múltiples mundos de juego, siguiendo instrucciones en lenguaje natural de manera similar a un ser humano.
Esta investigación no solo busca lograr altas puntuaciones en juegos sino también demostrar que aprender a seguir instrucciones en variados entornos de juegos podría facilitar el desarrollo de agentes de IA útiles en diferentes contextos. Este avance indica cómo las capacidades avanzadas de la IA pueden traducirse en acciones prácticas a través de interfaces lingüísticas, proyectando el potencial de los videojuegos como entornos experimentales para comprender y mejorar la funcionalidad de los sistemas de IA.


Aprendizaje de videojuegos
La colaboración con ocho estudios de juegos posibilitó el entrenamiento y la evaluación de SIMA en nueve videojuegos distintos, incluyendo títulos como "No Man's Sky" y "Teardown". Cada juego en el repertorio de SIMA revela un nuevo mundo interactivo, con habilidades que van desde la navegación básica hasta tareas complejas como la minería de recursos o la navegación espacial.
Los entornos de investigación utilizados, como el Laboratorio de Construcción desarrollado con Unity, desafían a SIMA en tareas de manipulación de objetos y comprensión física, ampliando su capacidad de aprendizaje y adaptación.






SIMA: un agente de IA versátil
SIMA se distingue por su habilidad para percibir y entender diversos entornos, ejecutando acciones dirigidas a cumplir metas específicas. Su arquitectura combina modelos de visión preentrenados con un modelo principal que gestiona la memoria y genera acciones de teclado y ratón, sin necesidad de acceder al código fuente del juego o APIs especializadas. La interfaz intuitiva de SIMA, basada en imágenes visuales e instrucciones en lenguaje natural, refleja la interacción humana con los entornos virtuales.
Generalización a través de juegos y más
Los resultados indican que SIMA, entrenado en un conjunto de juegos, supera a los agentes especializados en juegos individuales. Esta capacidad de generalización, incluso en juegos no vistos previamente, subraya la flexibilidad de SIMA y su potencial para adaptarse a nuevos entornos de juego.


Se evaluó la capacidad de SIMA para seguir instrucciones y completar casi 1500 tareas únicas en el juego, utilizando en parte jueces humanos. Como punto de referencia, se utilizó el rendimiento de los agentes SIMA especializados en el entorno, los cuales fueron entrenados y evaluados específicamente para seguir instrucciones dentro de un entorno único. Este rendimiento se comparó con el de tres tipos de agentes SIMA generalistas, cada uno de los cuales fue entrenado en múltiples entornos.
Avanzando en la investigación de agentes de IA:
Los logros de SIMA abren la puerta a una nueva era de agentes de IA generalistas y lingüísticamente capacitados. Este campo de investigación incipiente promete extender las capacidades de SIMA a entornos de entrenamiento más amplios y modelos más avanzados, mejorando su interpretación y ejecución de instrucciones de alto nivel.
Este esfuerzo de investigación aspira a desarrollar sistemas de IA más generales que puedan entender y ejecutar una amplia gama de tareas de manera segura y útil, tanto en entornos virtuales como en el mundo real.