El gigante de la tecnología no planea quedarse atrás en la carrera por el desarrollo de la inteligencia artificial y lo demuestra con el lanzamiento Gemini, el cual afirman que es el modelo de IA más potente que se ha desarrollado en la historia.
Google esta marcando un hito en la industria tecnológica con el lanzamiento de su tan esperado nuevo modelo de inteligencia artificial, Gemini, el cual la misma compañía describe como el sistema de IA más avanzado y capaz que han desarrollado hasta el momento.
Demis Hassabis, director ejecutivo y cofundador de Google DeepMind, reveló que además de ser el modelo de IA más potente que han creado, Gemini también es el más flexible y adaptable, es decir que está diseñado para ejecutarse de manera eficiente en dispositivos de todos tamaños, desde componentes avanzados en centros de datos hasta dispositivos móviles.
De hecho, el nuevo modelo avanzado de lenguaje llega al mercado en tres distintas modalidades: Gemini Ultra, la versión más grande entrenada para ejecutar tareas altamente complejas; Gemini Pro, que se adapta a una amplia gama de infraestructuras de IA y Gemini Nano, que puede utilizarse para potencializar diversas aplicaciones de los dispositivos móviles y smartphones.
“Sus capacidades de vanguardia mejorarán significativamente la forma en que tanto nuestros clientes empresariales como los desarrolladores aprovechan, construyen y escalan sus productos y servicios con IA, al mismo tiempo que nos permite potenciar nuestra oferta tecnológica”, declaró Hassabis al respecto.
Diferente al resto: Nativamente multimodal
Hassabis, afirma que lo que le da a Gemini una ventaja con respecto al resto de los modelos existentes en el mercado es que desde un inicio fue diseñado para ser totalmente multimodal, lo que significa que puede analizar, comprender, operar y mezclar diferentes tipos de datos sin problemas, incluyendo información en texto, código, audio, imagen y video.
“Nuestro nuevo enfoque de entrenamiento para la comprensión multimodal de datos de forma masiva le permite a Gemini utilizar su capacidad avanzada de razonamiento para pensar meticulosamente antes de responder a preguntas difíciles”, comentó el CEO de Google DeepMind sobre las ventajas de su nuevo sistema inteligente. “Esto ayuda a Gemini a comprender perfectamente todo tipo de entradas desde cero, mucho mejor que los modelos multimodales existentes”. agregó Hassabis.
Tras realizar diversas pruebas académicas en el último año con el fin de evaluar el desempeño de su nueva familia Gemini, Google se jacta de que Gemini Ultra, su versión más completa, es el primer modelo comercial que supera a los humanos en razonamiento masivo de lenguajes multitarea.
Lo anterior se debe principalmente a que fue entrenado con conocimiento de 57 diferentes materias, incluyendo física, historia, derecho, medicina y ética, entre otras para ofrecer respuestas más completas.
Con una puntuación del 90% en la prueba de referencia MMLU, un estándar para medir el conocimiento adquirido por un modelo durante su entrenamiento, Gemini Ultra tuvo un mejor desempeño en 30 de las 32 pruebas de referencia académicas utilizadas para la investigación y el desarrollo de los modelos avanzados de lenguaje.
Por si fuera poco, Google afirma que Gemini Pro, que ni siquiera es la versión más potente, demostró ser mucho más capaz para algunas tareas como resumir contenido, realizar problemas matemáticos, generar ideas y escribir texto que GPT-3.5, tras superarlo en seis de las pruebas académicas.
Para demostrar las nuevas capacidades multimodales de Gemini, Google compartió una captura de pantalla en la que se le solicitó al modelo que analizara y revisara una tarea de matemáticas de un estudiante de prepa mediante una foto, a lo que Gemini respondió marcando con verde las respuestas correctas y señalando con un círculo rojo los errores.
Google pretende potencializar su oferta tecnológica mediante la IA de Gemini
Google reveló que por ahora únicamente otorgara a sus clientes de Google Cloud acceso anticipado a su nuevo modelo para que lo utilicen en sus propias aplicaciones. Posteriormente, a partir del 13 de diciembre, los desarrolladores y socios empresariales de Google podrán aprovechar Gemini Pro a través de una nueva API que estará disponible en las plataformas de Google AI Studio y Google Cloud Vertex AI.
Mientras tanto, Google aprovechará para potencializar algunos de sus productos existentes como el chatbot Bard y la función de búsqueda avanzada, Search Generative Experience, que utiliza IA para responder a las consultas del buscador de Google en lenguaje natural. Además, la compañía agregó que en los próximos meses Gemini se integrará a Google Ads, Google Chrome y la Duet AI con el fin de mejorar sus capacidades.