Mediante la implementación de modelos avanzados de lenguaje Google está haciendo que a través de simples textos los robots generen sus propios códigos y aprendan a realizar nuevas tareas de forma rápida y sencilla.
En el evento de IA de Google realizado en la ciudad de Nueva York por la mañana del martes 2 de noviembre de 2022, el gigante tecnológico presentó importantes avances en su departamento de robótica, destacando un nuevo sistema que dota a los robots con la capacidad de escribir efectivamente su propio código para programarse a sí mismos y aprender a realizar nuevas funciones sin la necesidad de un desarrollador o programador humano.
Google explicó que la última generación de modelos de lenguaje avanzado, como PaLM, fueron fundamentales para lograr este avance, ya que son capaces de realizar razonamientos complejos y a su vez han sido entrenados con millones de líneas de código. Debido a su capacidad de comprender instrucciones en lenguaje natural, los modelos son altamente competentes para no solo crear códigos genéricos sino programaciones específicas, capaces de controlar las acciones de un robot.
CaP convierte a los robots en programadores de códigos
Para lograr que las máquinas crearan sus propios códigos Google desarrolló Code as Policies o CaP, un sistema de formulación centrado en programas generados por modelos de lenguaje que se ejecutan en sistemas físicos o robots.
Con CaP, Google propone el uso de modelos de lenguaje para generar códigos de robótica directamente mediante indicaciones escritas. Al proporcionar varias instrucciones formateadas como comentarios junto a un código correspondiente a través del aprendizaje en contexto, los modelos de lenguaje pueden comprender las instrucciones y generar de forma autónoma un nuevo código que les permite sintetizar funciones y crear bucles de retroalimentación para impulsar la ejecución y el aprendizaje de nuevos comportamientos de las máquinas en poco tiempo.
En términos generales, la compañía describe a CaP como “un enfoque alternativo al uso del machine learning para entrenar robots”. En lugar de utilizar miles de datos y códigos para aprender a realizar tareas, busca la generalización a través de la modularidad y aprovecha en tiempo real los beneficios de los sistemas de código abierto y los datos disponibles en internet para generar sus propios códigos y aprender a hacer nuevas acciones.
“CaP amplía nuestro trabajo anterior, PaLM-SayCan, al permitir que los modelos de lenguaje completen tareas robóticas que son aun más complejas al incluir la expresión completa del código Python de propósito general” mencionó Andy Zeng, científico investigador de robótica en Google en un comunicado.
Google demuestra las capacidades avanzadas de su nuevo sistema
La compañía puso a prueba el sistema con un brazo robótico del departamento de Everyday Robots y lograron hacer que la máquina aprendiera a realizar tareas que requerían de la comprensión de dimensiones espaciales, así como identificar objetos y distinguir colores, tamaños y formas e incluso de dibujar, todo esto basándose en textos que la maquina se encargó de transformar en códigos.
Las distintas pruebas de la compañía demostraron que la implementación de CaP condujo a una mejor generalización y un mayor rendimiento en las tareas realizadas en comparación con el aprendizaje directo de un robot mediante el machine learning tradicional. Lo anterior se debe a que CaP permite que un solo sistema realice una variedad de tareas robóticas complejas y variadas sin capacitación específica.
Por otro lado, el nuevo sistema, se basa en bibliotecas de codificación y API desarrollados por terceros para generar el mejor código adecuado para el escenario específico. Limitando a los robots a ciertas tareas, ya que los CaP tienen dificultades para interpretar instrucciones que son más complejas o abstractas, sin embargo, la compañía aseguró que ya trabajan en ello para ampliar la capacidad de los robots.
Finalmente, Google anunció que ya publicó en el sitio web del proyecto el código necesario para que los desarrolladores reproduzcan las pruebas en sus propias máquinas, dando un gran paso para la automatización al ayudar a las personas inexpertas en programación a trabajar con robots.