La compañía ubicada en Silicon Valley ha desarrollado una nueva tecnología con la que promete revolucionar el desarrollo de la IA, reduciendo significativamente la cantidad de energía, dinero y tiempo que requiere un modelo para ser entrenado y ejecutado.
La startup de computación basada en inteligencia artificial, Recogni, está llamando poderosamente la atención en la industria tecnológica tras presentar un nuevo chip de IA llamado Pareto, el cual es impulsado por un innovador método informático que podría revolucionar la eficiencia de los sistemas de IA generativa al permitir que los chips utilizados para entrenar y ejecutar modelos impulsados por esta tecnología sean más pequeños, rápidos y al mismo tiempo menos costosos de operar.
“Con Pareto creamos un sistema numérico que les permitirá a las empresas desarrollar y entrenar sus propios modelos de IA de forma más rápida y económica, mientras reducen tanto sus gastos operativos como energéticos”, comentó el cofundador y vicepresidente de Recogni, Gilles Backhus, respecto a su nueva tecnología.
¿Cómo funciona Pareto, el nuevo chip de IA de Recogni?
A través de un comunicado, la compañía respaldada por importantes socios como BMW y Bosch, así como la firma de capital de riesgo Mayfield, explicó que su nuevo sistema patentado se basa en un enfoque logarítmico que supera el rendimiento de los métodos actuales para la inferencia y ejecución de grandes modelos de IA, lo que potencialmente puede ayudar a acelerar el desarrollo de nuevas y más completas soluciones de inteligencia artificial.
Para dimensionar el avance de Recogni, es importante comprender que hoy en día, la gran mayoría de los modelos de IA más avanzados como GPT-4 de OpenAI y Gemini de Google, necesitan realizar miles de operaciones matemáticas que consumen un alto nivel de energía y en ocasiones requieren de largos periodos para generar respuestas en chatbots como ChatGPT.
Mientras tanto, Pareto aborda estos desafíos convirtiendo de manera efectiva las multiplicaciones en sumas, lo que reduce significativamente el consumo de energía, así como la latencia, el tamaño y el tiempo de ejecución de los chips de IA sin comprometer su capacidad en lo absoluto.
Los resultados avalan la eficacia de Pareto
La startup ubicada en Silicon Valley realizó múltiples pruebas exhaustivas entrenando a varios modelos de IA generativa, incluyendo Llama3-70B de Meta y Stable Diffusion XL de Stability, en las cuales Pareto logró una precisión relativa de más del 99.9 % en comparación con el modelo de referencia
Además de lo anterior, Recogni se jacta de que Pareto tiene la misma capacidad que un chip de IA de formato FP16, pero con un menor consumo de energía que los FP8, lo que permite a los desarrolladores implementar modelos entrenados de manera rápida y eficiente, eliminando la necesidad de procesos de reentrenamiento que consumen mucho tiempo.
“El sistema de numeración logarítmica de Pareto tiene un porcentaje de error más bajo y mayor rendimiento que los métodos utilizados por los modelos de inteligencia artificial existentes”, declaró al respecto Marc Bolitho, director ejecutivo de Recogni. “Esto lo convierte en la mejor opción para el diseño moderno de semiconductores de IA”, añadió.
Finalmente, la compañía adelantó que en los próximos meses anunciará una importante asociación con un socio estratégico que les ayudará a poner a la infraestructura de Pareto al alcance de todos, sin embargo, no mencionó de qué organización se trata.