La startup asegura que su nuevo modelo de Visión-Lenguaje-Acción les permite a los robots humanoides procesar información visual y comprender el lenguaje natural de las personas para ejecutar acciones con una precisión sin precedentes en la industria de la robótica.
Figure, una startup de Silicon Valley, afirma que ha dado un paso trascendental para la evolución de la robótica a través del desarrollo de Helix, un nuevo modelo de Visión-Lenguaje-Acción (VLA) diseñado para dotar a los robots humanoides con capacidades para manipular objetos sin precedentes, lo que según la compañía podría redefinir la interacción entre humanos y máquinas en entornos cotidianos, así como acelerar la llegada de los robots de uso general a la sociedad.
Helix: Un hito en la robótica
A través de una publicación en su blog, Figure explica que a diferencia de los sistemas tradicionales que requieren entrenamiento específico para cada acción que realizan, Helix unifica la percepción de los robots humanoides con su capacidad de aprendizaje y comprensión del lenguaje, lo que les permite ejecutar acciones complejas e incluso manipular objetos desconocidos mediante indicaciones en lenguaje natural, sin la necesidad de programación extensa o cientos de horas de entrenamiento.
“Alcanzar este nivel de autonomía y comprensión del contexto en los robots, representa el avance más significativo que hemos logrado en la historia de la compañía”, declaró al respecto el fundador de Figure, Brett Adcock. “Acercándonos a nuestra visión de crear robots de uso general capaces de asistir en diversas tareas diarias sin programación previa”, añadió.
La startup californiana subraya que lo anterior fue posible gracias a su arquitectura dual única. Helix cuenta con un sistema interno (S2) que se encarga de comprender el contexto y el lenguaje, mientras que otro (S1), actúa como “política visomotora”, lo que significa que convierte la información registrada por el robot humanoide en acciones en tiempo real. Además, emplea una sola red neuronal para aprender diversos comportamientos, eliminando la necesidad de ajustes específicos para cada tarea.
Helix de Figure vs otros sistemas operativos para robots humanoides

Figure se jacta de que Helix es el primer modelo VLA que cuenta con la capacidad de controlar toda la parte superior del cuerpo de un robot humanoide, incluyendo sus movimientos de cabeza, torso, brazos y dedos con alta velocidad y precisión, brindándoles a los androides una mayor versatilidad y utilidad en escenarios reales.
Además de lo anterior, según Figure, también es el primer sistema operativo en el campo de la robótica que puede operar simultáneamente en dos robots humanoides, lo que permite la colaboración de máquinas en tareas de manipulación compartidas. La startup confía en que esta funcionalidad allanará el camino para la automatización avanzada y generalizada en distintos entornos, desde el hogar hasta la industria.
Otra característica clave de Helix es que de acuerdo con la información detallada por Figure, puede operar con GPUs de bajo consumo, lo que podría facilitar su implementación comercial, así como su integración en robots destinados a entornos domésticos y empresariales.
Figure presume las capacidades avanzadas de Helix
Para demostrar las capacidades avanzadas de Helix, Figure compartió un video en el que dos de sus robots humanoides aparecen ejecutando diversas tareas domésticas de forma autónoma.
En una de las pruebas los robots de Figure que se encontraban en una cocina y recibieron la instrucción de guardar donde correspondía una serie de alimentos que se encontraban dentro de una bolsa colocada delante de ellos.
A los robots humanoides les tomó solo unos segundos analizar tanto su entorno, como el contenido del interior de la bolsa. Posteriormente abrieron un refrigerador y comenzaron a organizar los alimentos de forma totalmente autónoma. Incluso colocaron una manzana en un recipiente especial, demostrando una gran capacidad para la identificación de objetos.
A través de su nuevo modelo VLA, Figure pretende establecer un nuevo estándar en la industria de los robots humanoides. Si el enfoque en la generalización de tareas, la interacción en lenguaje natural y la colaboración entre robots de Helix cumple con las expectativas de sus creadores, sin duda podría marcar la pauta para una nueva era en la que las máquinas puedan adaptarse rápidamente a entornos cambiantes sin entrenamiento previo allanando el camino para la llegada de los robots humanoides de uso general a la sociedad.