El modelo de inteligencia artificial desarrollado por la rama de investigación y desarrollo de IA de Google está diseñado para ayudar a los robots a realizar tareas complejas sin depender de su conexión a la nube, así como dotarlos con una sorprendente capacidad de adaptación a contextos desconocidos.
Google DeepMind está llevando la potencia de la inteligencia artificial de Gemini al mundo físico con el lanzamiento de Gemini Robotics On-Device, una nueva versión optimizada de su modelo de visión, lenguaje y acción o VLA, que puede ejecutarse directamente en dispositivos robóticos sin necesidad de conexión a internet, a través del cual la compañía pretende revolucionar el sector e impulsar una nueva generación de robots más capaces, autónomos e inteligentes.
¿Qué vuelve a Gemini Robotics On-Device de Google DeepMind tan especial?
De acuerdo con un comunicado oficial de la rama de investigación de IA de Google, el nuevo modelo anunciado este martes 24 de junio, está diseñado para funcionar con recursos computacionales limitados, pero conservando una gran capacidad de generalización de tareas, lo que significa que puede adaptarse rápidamente a nuevas instrucciones y entornos, incluso si nunca ha interactuado con ellos previamente.
Según DeepMind, el mayor diferenciador de su nuevo modelo recae en su capacidad de operar completamente de forma local, lo que significa que no requiere del procesamiento en la nube para funcionar, algo que tradicionalmente generaba retardos en la toma de decisiones robóticas. Al operar de forma autónoma, el robot puede responder casi en tiempo real, lo que es esencial en tareas que requieren alta precisión o implican riesgos.
Adicionalmente, esta capacidad incrementa significativamente la autonomía de los robots y al mismo tiempo los vuelve más fiables en entornos con conectividad limitada o con altos requerimientos de seguridad y privacidad, tales como hospitales y plantas industriales.
En DeepMind están sorprendidos con el rendimiento de su nuevo modelo de IA
Para poner a prueba las capacidades del su último modelo VLA, Google DeepMind realizó múltiples ensayos con diversos tipos de robots, incluyendo el robot de dos brazos Franka FR3 y el humanoide Apollo de Apptronik.
Gracias a Gemini Robotics On-Device estos dispositivos lograron realizar de forma totalmente autónoma tareas delicadas que históricamente han representado un reto para la robótica, como abrir el cierre de una lonchera, doblar ropa o montar piezas industriales con alta precisión.
Según Carolina Parada, directora senior y jefa de robótica en Google DeepMind, las capacidades de su modelo de IA sorprendieron incluso a los propios ingenieros de la compañía por su gran solidez. “Cuando jugamos con los robots, pudimos notar que son sorprendentemente capaces de comprender un entorno y contexto totalmente nuevo en cuestión de segundos”, señaló Parada al respecto.

“Hemos creado un modelo ideal para impulsar aplicaciones robóticas con baja conectividad o necesidades específicas de seguridad”, añadió la directiva de Google DeepMind.
Gemini Robotics On-Device llega con su propio SDK incluido
Además de la presentación de Gemini Robotics On-Device, DeepMind está lanzando un nuevo kit de desarrollo de software o SDK por sus siglas en inglés, diseñado para permitir a los desarrolladores ajustar y adaptar el modelo a sus necesidades específicas.
De acuerdo con el comunicado de Google DeepMind, a través del nuevo SDK con tan solo entre 50 y 100 demostraciones, los ingenieros pueden entrenar a sus propios robots para que aprendan nuevas tareas, lo que a su vez reduce significativamente tanto el tiempo como los recursos necesarios para su entrenamiento en comparación con otros métodos tradicionales de robótica.
Otro de los grandes beneficios del nuevo SDK es que además incluye acceso al simulador de física MuJoCo, lo que les permitirá a los desarrolladores experimentar y probar las capacidades de Gemini Robotics On-Device en entornos virtuales antes de aplicarlas en el mundo real.
¿Qué sigue para Gemini Robotics On-Device?
Por ahora, el nuevo modelo de IA para el mundo físico de Google DeepMind y su SDK están disponibles únicamente para un grupo de desarrolladores que fueron seleccionados por la compañía. Con esta estrategia la firma de IA busca recopilar retroalimentación en torno a su nuevo modelo de IA, que les ayude a seguir perfeccionándolo antes de lanzarlo oficialmente al mercado.
Finalmente, Parada subrayó que Gemini Robotics On-Device no solo es una muestra del progreso técnico de Google DeepMind, sino una invitación abierta para invitar a los desarrolladores a innovar en el campo de la robótica inteligente. “Estamos muy entusiasmados por ver todo lo que la comunidad robótica logrará hacer con nuestras nuevas herramientas”, concluyó la ejecutiva de Google DeepMind.