La compañía liderada por Sam Altman presentó un nuevo modelo con la capacidad de razonar “de manera similar a un ser humano”, ya que se toma el tiempo de realizar un proceso de análisis profundo antes de arrojar sus respuestas.
Una vez más OpenAI ha tomado por sorpresa a la industria de la tecnología con el inesperado lanzamiento de una nueva familia de modelos de inteligencia artificial llamada o1, con la capacidad de razonar “de manera similar a un ser humano”.
La firma de IA liderada por Sam Altman presume que esto le permite resolver problemas complejos de matemáticas, programación, codificación y ciencias, entre otras disciplinas, con una precisión significativamente mayor a la de sus antecesores.
¿Qué vuelve especial al nuevo modelo de IA o1 de OpenAI?
A través de un comunicado OpenAI explicó que los modelos o1 evitan algunos de los problemas de razonamiento más comunes que afectan a los modelos de IA generativa en el mercado, gracias a que pueden verificar los datos que incluirán en sus respuestas antes de arrojarlas, dedicando más tiempo a revisar todas las diversas alternativas.
“Lo que hace que o1 se sienta cualitativamente superior a otros modelos de IA generativa es su capacidad de “pensar” antes de responder a las consultas”, escribió OpenAI en su blog.
Por su parte, Noam Brown, científico investigador de OpenAI, explicó el jueves por la mañana mediante una serie de publicaciones en X que o1 fue entrenado con algoritmos de aprendizaje por refuerzo, lo que le “enseña al sistema a razonar profundamente a través de una cadena privada de pensamiento antes de responder.”
Brown además destacó que OpenAI utilizó un nuevo algoritmo de optimización, así como un conjunto de datos de entrenamiento más completo que contenían “datos de razonamiento” y literatura científica específicamente relacionada a este mismo tema.
o1 vs GPT4o y los humanos
Para comparar la capacidad de razonamiento de o1 con la de GPT-4o, OpenAI puso a prueba la familia de modelos de IA en un conjunto de exámenes para humanos, así como evaluaciones de referencia para modelos avanzados de lenguaje.
“Encontramos que o1 supera significativamente a GPT-4o en la gran mayoría de estas tareas que requieren mucho razonamiento”, declaró al respecto la compañía.
OpenAI afirma que en el examen de clasificación para la Olimpiada Internacional de Matemáticas llamado AIME, o1 resolvió correctamente el 83% de los problemas, un porcentaje por encima del promedio que lo ubica entre las mejores 500 calificaciones de los Estados Unidos.
Adicionalmente, el nuevo modelo de IA de OpenAI, también fue sometido a la prueba GPQA Diamond, un difícil examen que pone a prueba la experiencia en química, física y biología. Para comparar la capacidad de los modelos con la de los humanos, la firma de IA reclutó a expertos con doctorado para que también respondieran a la prueba.
“Descubrimos que o1 superó el desempeño de algunos expertos, convirtiéndose en el primer modelo en hacerlo”, presumió OpenAI en su comunicado. “Estos resultados no implican que o1 sea más capaz que una persona con doctorado, solo que el modelo es más competente en la solución de algunos problemas que se esperaría que alguien de su nivel resuelva”, añadió.
OpenAI admite que o1 puede llegar a ser más lento que otros modelos para resolver algunas preguntas, pero es esto lo que le permite mejorar considerablemente su precisión.
Cómo acceder al nuevo o1 de OpenAI
Dos de las cuatro versiones que conforman la familia de modelos de IA, o1, ya están disponibles a través de la API de OpenAI. Se trata de o1-preview y o1-mini, un modelo más pequeño y otro enfocado mayormente en la generación de código.
Para poder acceder a las capacidades avanzadas de o1, los usuarios deben de estar suscritos a ChatGPT Plus o Team. Mientras tanto, los usuarios empresariales y educativos podrán utilizarlo de manera gratuita a principios de la próxima semana.
Cabe destacar que o1 no solo es más potente, sino también es significativamente más caro que sus antecesores. En la API, o1-preview cuesta $15 dólares por cada millón de tokens de entrada y $60 dólares por cada millón de tokens de salida. Eso es tres veces el costo en comparación de las entradas de GPT-4o y cuatro veces el costo por respuesta.