La nueva tecnología de PaLM-SayCan dota a los robots con la capacidad de analizar situaciones y responder a ellas, sin la necesidad de decirle comandos específicos.
La empresa matriz de Google, Alphabet, está combinando dos de sus proyectos de investigación más ambiciosos, la robótica y los modelos de comprensión de lenguaje humano impulsados por inteligencia artificial, para crear un robot ayudante que pueda interpretar mejores comandos implícitos en la forma natural de expresarse de las personas.
“Los modelos de lenguaje pueden ayudar a los robots a entender tareas complejas y abstractas que requieren razonamiento y percepción del mundo, haciendo que nuestra interacción con ellos sea más natural, mientras tanto, la robótica puede proporcionarle una plataforma en el mundo real a estos modelos de lenguaje”mencionó Karol Kaufman, científico del departamento de investigación de Google.
Desde el 2019, Alphabet comenzó a trabajar en robots domésticos que pueden realizar tareas simples como limpiar superficies y traer objetos. Sin embargo, únicamente responden a ordenes o comandos simples y directos como “tráeme un refresco” o “limpia la mesa”. El nuevo proyecto de Everyday Robots pretende crear robots con una comprensión mejorada del lenguaje y la capacidad de entender mejor a los humanos y sus necesidades.
El nuevo sistema de los robots ayudantes de Google
El PaLM es un modelo de lenguaje avanzado escalable de Google presente en distintas inteligencias avanzadas de Google como GLaM, Gopher, Megatron-Turing NLG, y LaMDA. Ahora, Alphabet ha implementado este sistema en su robot ayudante, para dotarlo con la capacidad de analizar a profundidad el lenguaje natural de los humanos y así comprender mejor la intención y lo que está implícito detrás de un comando.
El gigante tecnológico afirma que gracias al sistema PaLM, los robots ya no solamente responderán a órdenes directas, sino que pueden analizar el lenguaje para interpretar instrucciones o tareas implícitas de acuerdo al contexto. Los usuarios pueden decir cosas como “Se me cayó mi bebida, ¿puedes ayudar?” y el robot filtra esa información mediante una lista interna de posibles acciones y la interpreta cómo “tráeme el trapo de la cocina”.
Google ha denominado al nuevo sistema combinado de sus robots PaLM-SayCan. El nombre hace alusión a los distintos modelos y habilidades que posee el robot, como el sistema de comprensión del lenguaje a través de la palabra “Say” que es dile en español y “Can”, que significa puede y se refiere a la capacidad de sugerir su propia utilización y filtrar instrucciones a través de posibles acciones.
Ponen a prueba su efectividad
Para probar la eficacia del PaLM-SayCan en sus robots, Google realizó pruebas con una larga lista de instrucciones no específicas. Las máquinas pudieron planificar respuestas correctas a las necesidades del usuario el 84% de las veces y ejecutarlas con éxito el 74%. Una tasa de éxito bastante sólida. Sin embargo, la compañía no reveló la lista de comandos utilizados en la prueba, por lo que no esta claro que tan ambiguas eran las instrucciones.
Google mencionó que los robots ayudantes aún no están listos para comercializarse, pues la tecnología está en desarrollo. Sin embargo, ya están siendo utilizados en las oficinas y áreas de descanso de Google, donde ayudan a los empleados llevándoles desde útiles para su trabajo hasta refrescos, comida o cualquier cosa que necesiten.
El anuncio de la creación del nuevo sistema PaLM-SayCan, llega tan solo una semana después de que Amazon comprará iRobot para ampliar su gama de robótica y Xaomi presentará su nuevo prototipo de robot humanoide. Lo que indica una fuerte tendencia en el desarrollo de robots destinados a facilitar la vida de las personas. En el corto plazo surgirán nuevos avances de la tecnología que nos permitan interactuar con los humanos de forma más natural y aunque queda mucho por hace por ahora, definitivamente los modelos avanzados de lenguaje son un gran paso.