A medida que la carrera por el desarrollo de la inteligencia artificial se intensifica, Microsoft anuncia una nueva función para su chatbot de IA que permite a las personas buscar información acerca de cierto tema utilizando una imagen.
En busca de seguir avanzando firmemente en la cada vez más competida carrera de la inteligencia artificial, Microsoft anunció el martes 18 de julio de 2023 una nueva función para su Bing Chat AI llamada búsqueda visual, la cual permite que los usuarios obtengan información de algún tema o lugar a través de imágenes que tomen o carguen a la aplicación su chatbot de IA.
“Bing puede comprender el contexto de una imagen, interpretarla y responder preguntas al respecto”, escribió Microsoft en un comunicado. “Ya sea que viajes a una nueva ciudad de vacaciones y preguntes sobre la historia o arquitectura de un edificio en particular o estés en casa tratando de encontrar ideas para tu almuerzo basadas en lo que tienes en tu refrigerador, con la nueva capacidad de Bing Chat podrás aprovechar la IA y el conocimiento de la web para obtener respuestas.”
¿Cómo funcionan las búsquedas visuales en Bing Chat AI de Microsoft?
La nueva función de búsqueda visual de Bing Chat está diseñada para ayudar a los usuarios a encontrar rápidamente información sobre todo lo que ven. Por ejemplo, un usuario puede fotografiar un libro sobre el que está interesado en obtener más información y utilizar la imagen para buscar reseñas, comparaciones de precios y dónde comprarlo, entre otros detalles relevantes.
La herramienta de búsqueda visual de Bing utiliza algoritmos de machine learning, visión artificial junto con la base de datos de OpenAI, misma que impulsa a ChatGPT, para analizar a profundidad las imágenes, identificar los objetos que aparecen en estas, su composición y otros atributos visuales con el fin de arrojar resultados de búsqueda relacionados a las fotografías.

Otro beneficio del sistema de búsqueda visual es que además de que es sumamente útil para encontrar información, también puede aprovecharse para traducir imágenes a texto. Esto significa que los usuarios pueden usar la herramienta para tomarle foto a algún letrero, escrito, contrato, documento o más y Chat Bing AI se encargará de escribir el contenido, incluso tiene la capacidad de pasarlo a otro idioma si así se le ordena.
La aplicación móvil Bing Chat para dispositivos iOS y Android ya ofrece la capacidad de búsqueda visual, para comenzar a utilizarla, los usuarios solo deben presionar el ícono de la cámara en la pantalla de chat para acceder a la función, tomar una foto y comenzar su búsqueda. Mientras tanto para versión de escritorio, se deben cargar imágenes previamente tomadas o descargadas, debido a que la plataforma no permite el uso de la webcam.
La competencia por el desarrollo de la IA se pone más intensa
Todo indica que la decisión de Microsoft de lanzar su buscador visual para Bing Chat fue impulsada por el reciente debut de una nueva función de búsqueda de imágenes que desarrolló Google para Bard, su chatbot de IA. Con Google Lens, los usuarios pueden solicitar información de Bard sobre una imagen que han subido, pedirle que genere un pie de foto o simplemente recibir comentarios de esta, de forma similar a Chat Bing AI.
Por otro lado, la nueva actualización del chatbot de MIcrosoft se produce en un punto álgido de la carrera innovadora de la inteligencia artificial, justo cuando la competencia entre los líderes como Google, Open AI, Meta y Anthropic se intensifica.
En su esfuerzo por desarrollar y poseer la IA generativa más avanzada de todas, en los últimos meses los gigantes tecnológicos han estado y seguirán lanzando nuevas funciones en muy poco tiempo, con el objetivo de mantenerse al día no solo con sus competidores en el sector, sino también con las necesidades del mercado para marcar la pauta de la industria. Es por eso que, a través de su buscador visual, Chat Bing AI pretende diferenciarse del resto de los chatbots que se basan completamente en texto.