El nuevo modelo de IA de Anthropic puede controlar una computadora para ejecutar toda clase de tareas que requieren decenas o incluso cientos de pasos, utilizando múltiples aplicaciones de software, tal como lo haría una persona.
Anthropic, la startup de inteligencia artificial respaldada por gigantes tecnológicos como Google y Amazon, ha dejado claro que no pretende quedarse atrás en la cada vez más competida carrera de la inteligencia artificial, por lo que este martes 22 de octubre presentó Claude 3.5 Sonnet y Claude 3.5 Haiku.
Con estos dos nuevos modelos de IA generativa la compañía no solo promete mejorar la generación de código y la precisión en tareas complejas, sino que también ofrece nuevas funciones sumamente más avanzadas que las de sus predecesores, incluyendo la capacidad de controlar una computadora de la misma forma en que lo haría un ser humano.
¿Cómo hace el nuevo modelo de IA de Anthropic para controlar una computadora?
Sin duda el elemento más innovador y llamativo que diferencia al nuevo Claude 3.5 Sonnet del resto de los modelos de inteligencia artificial en el mercado es su capacidad de manipular una computadora, característica que se encuentra actualmente en fase beta abierta.
Mediante una API, el modelo puede observar, comprender e interpretar lo que se está proyectándose en una pantalla, para en función de dicha información mover el cursor, hacer clic en botones y escribir texto, lo que le permite navegar por el internet en tiempo real y ejecutar toda clase de tareas a través de cualquier aplicación de software.
Todo esto lo hace posible gracias a un sistema de captura de pantalla que le permite medir con precisión la posición de los elementos en el monitor y actuar en consecuencia, imitando las acciones humanas.
Anthropic presume que esta capacidad convierte a Claude en uno de los primeros modelos de IA que puede controlar las aplicaciones de escritorio, lo que abre la puerta a la automatización de tareas complejas que hasta ahora requerían de una alta intervención manual.
¿Qué vuelve tan especial al nuevo modelo de IA de Anthropic?
Por otro lado, Claude 3.5 Sonnet no es solo un modelo con nuevas habilidades de automatización, también ofrece importantes mejoras en el rendimiento respecto a sus versiones anteriores. De acuerdo con las pruebas internas de Anthropic, ha incrementado su eficacia en tareas de codificación, obteniendo mejores resultados que otros sistemas de IA generativa destacados en el mercado, incluyendo los distintos modelos alcanzados de lenguaje de OpenAI.
De hecho, la firma de inteligencia artificial asegura que este modelo tiene un enfoque más completo para la resolución de problemas y puede manejar de forma totalmente autónoma tareas que requieren decenas o incluso cientos de pasos.
Por otro lado, la compañía respaldada por Amazon también se jactó de que GitLab y otras empresas que han probado el modelo destacan que Claude 3.5 Sonnet “mejora significativamente la precisión en tareas de codificación sin sacrificar velocidad”. Además, subrayó que empresas como Replit y Canva han explorado sus capacidades para la automatización de procesos internos de diseño y evaluación de aplicaciones.
También llega Claude 3.5 Haiku: más potencia a un menor precio
Por otro lado, aunado al lanzamiento de Claude 3.5 Sonnet, Anthropic presentó Claude 3.5 Haiku, un modelo diseñado para ofrecer un rendimiento sólido a un precio más bajo. Sin embargo, pese a que es descrito por la compañía como la opción más económica dentro de su oferta de IA, el nuevo Haiku logra igualar e incluso superar el rendimiento de otros modelos más completos, particularmente en tareas de codificación.
Según la empresa, esto lo convierte en “una alternativa accesible para startups y desarrolladores que buscan soluciones eficientes y económicas sin comprometer la calidad de su trabajo”. El modelo Claude 3.5 Haiku estará disponible a finales de octubre, inicialmente con la capacidad de interpretar texto y más adelante con entrada de imágenes, lo que “amplía su versatilidad en diferentes entornos”.
Los críticos de la industria tecnológica interpretan el lanzamiento de la nueva función de “Uso de computadora” como una clara apuesta de Anthropic por hacer frente a los incipientes “agentes autónomos de IA” que recientemente han lanzado compañías como Microsoft y Salesforce, debido a que al igual que los nuevos modelos de Claude, estos sirven para automatizar tareas de software con la mínima intervención humana posible.
Por otro lado, cabe destacar que a pesar de su potencial revolucionario, Anthropic admite que estas capacidades aún están en fase experimental, por lo que advirtió que en su estado actual, todavía presenta ciertas limitaciones y errores, especialmente en acciones más complejas como el desplazamiento de pantalla o el zoom.
Con el objetivo de mejorar su precisión en los próximos meses, la compañía planea abrir estas funciones a un público más amplio para recibir retroalimentación y comentarios que les ayuden a perfeccionar esta innovadora función que le permite apoderarse de la computadora.