A medida que la inteligencia artificial generativa avanza de forma acelerada, impulsando la llegada de cada vez más chatbots al mercado, ChatGPT continúa evolucionando en busca de marcar la diferencia y mantenerse en la cima.
Con el objetivo de seguir innovando para ofrecer un mejor servicio y diferenciarse de sus competidores, OpenAI anunció una serie de actualizaciones para ChatGPT que permiten a las personas interactuar con el chatbot de forma más natural, no solo escribiendo indicaciones en un cuadro de texto, sino diciéndolas en voz alta o incluso compartiéndole una imagen para que la interprete.
Adicionalmente, la compañía reveló otra nueva función que dota al modelo avanzado de lenguaje con la capacidad de navegar por internet para generar respuestas más precisas basadas en datos actualizados, lo que representa un gran avance para ChatGPT, considerando que anteriormente se basaba únicamente en información anterior a septiembre del 2021.
Ahora las personas pueden hablar con ChatGPT de OpenAI
El chat por voz funciona de forma similar a Siri o Alexa: los usuarios hacen clic en un botón, dicen su pregunta o indicación, ChatGPT la convierte en texto, lo analiza y genera una respuesta, la cual mediante IA generativa convierte nuevamente a voz para contestarla en formato de audio.
OpenAI afirmó que la nueva función está impulsada por su modelo de conversión de texto a voz llamado Whisper, capaz de generar voces sintéticas a partir de un escrito y una muestra de voz de unos pocos segundos. Spotify ya está aprovechando el poder de esta tecnología para traducir podcasts manteniendo las voces de los creadores originales.
Para habilitar las funciones de voz, los usuarios deben dirigirse al menú de configuración dentro de la aplicación, hacer clic en el ícono de nuevas funciones y activar las conversaciones de voz. En esa misma pestaña tendrán la oportunidad de seleccionar la voz que desean para su ChatGPT de entre cinco opciones que OpenAI desarrolló en colaboración con actores de voz, para ofrecer una experiencia lo más humana posible.
Usuarios podrán aprender más sobre el mundo mediante imágenes
La capacidad de interpretar imágenes es impulsada por la tecnología de GPT-4, la cual aplica sus habilidades de razonamiento lingüístico a una amplia gama de imágenes, como fotografías, capturas de pantalla y documentos que contienen fotos, basándose en los más de 1.75 billones de parámetros de la versión más avanzada del modelo de lenguaje avanzado.
Con esta nueva función ChatGPT busca ayudar a las personas a obtener información valiosa de lo que ven. Los usuarios pueden subir fotos en la plataforma de OpenAI y obtener respuestas basadas en el contenido visual. De esta forma ChatGPT puede, desde realizar descripciones y responder preguntas específicas sobre objetos que aparecen en imágenes, hasta brindar asesoramiento basado en estas.
Por ejemplo, un usuario puede compartir una foto de su refrigerador abierto y ChatGPT puede enlistar los alimentos que se muestran en la imagen e incluso sugerir distintos platillos basados en estos, incluyendo su receta.
Por si fuera poco, los usuarios pueden solicitar información sobre un objeto en particular al circular una parte específica de la imagen con la herramienta de dibujo de la aplicación.
Las nuevas actualizaciones estarán disponibles para todos los usuarios que pagan por ChatGPT Plus o ChatGPT Enterprise durante las próximas dos semanas. Sin embargo, OpenAI señaló que en un futuro planean abrirlas a los usuarios a nivel general, aunque no dio una fecha.
Por otro lado, inicialmente la función de voz solo podrá utilizarse por medio de la aplicación móvil del chatbot para iPhone, iPad y dispositivos Android, mientras que la interpretación de imágenes estará disponible en todas las plataformas.
El anuncio de las innovaciones de ChatGPT se produce el mismo día en el que Amazon oficializó una asociación con la firma de inteligencia artificial Anthropic, mediante una inversión de $4 mil millones de dólares, lo que refleja que la carrera por el desarrollo de la IA entre los principales gigantes tecnológicos del mundo continúa candente.