Un grupo de investigadores en Osaka, diseñaron la primera inteligencia artificial que puede reconstruir imágenes de alta calidad y precisión a través de información biológica.
¿Alguna vez te has preguntado qué pasaría si pudiéramos ver lo que pensamos? Suena como algo sacado de una historia de ciencia ficción, sin embargo, un grupo de científicos japoneses desarrollaron con éxito un nuevo sistema de inteligencia artificial con la capacidad de extraer imágenes, recuerdos e incluso sueños del cerebro humano a través de escáneres cerebrales para recrearlas en alta definición.
El equipo de investigadores de la Escuela de Biociencias de la Universidad de Osaka en Japón, descubrió que se pueden reconstruir imágenes de alta precisión a partir de la actividad cerebral de los humanos utilizando Stable Diffussion, el motor de inteligencia artificial generativa más potente que existe en la actualidad.
Un hito histórico para la humanidad
En la publicación científica “Reconstrucción de imágenes de alta resolución con modelos de difusión latente a partir de la actividad cerebral humana”, los investigadores mencionan que es la primera vez que se logra proporcionar una interpretación cuantitativa de un modelo desde una perspectiva biológica.
Por otro lado, aclararon que si bien es cierto que estudios previos ya habían logrado producir reconstrucciones de imágenes en alta resolución, solo había sido posible generarlas después de entrenar a la IA y ajustar los modelos generativos directamente con datos de una resonancia magnética funcional o RMF, lo que era sumamente complicado debido a que no hay muchas muestras en neurociencia con las cuáles trabajar.
Mientras tanto, en su más reciente investigación realizada en Asia, los científicos aseguran que no necesitaron entrenar su modelo de IA generativa con muestras de RMF para recrear imágenes, sino que utilizaron una técnica alternativa aprovechando la gran potencia y capacidad de los modelos de difusión, que jamás había sido empleada para la reconstrucción de imágenes visuales.
¿Cómo hace la inteligencia artificial para crear imágenes basadas en actividad cerebral?
Stable Diffusion funciona de la misma forma que cualquier generador de imágenes basado en texto: un usuario ingresa una palabra o frase que el modelo transforma en una imagen. Esto es posible gracias a que la IA ha sido programada con millones de imágenes existentes y sus correspondientes textos. Después, mediante su capacidad de machine learning aprenden a identificar patrones que relaciona entre sí para generar arte digital.
Los investigadores de Osaka llevaron este funcionamiento más allá, enseñando a un modelo a vincular datos de las imágenes de una Resonancia Magnética Funcional o RMF con ciertos objetos. Además, entrenaron a un segundo modelo de IA para vincular la actividad cerebral en los datos de la RMF con descripciones en texto de las imágenes que miraron los participantes del estudio.
Juntos, estos dos modelos permitieron que Stable Diffusion convirtiera los datos de la RMF en imitaciones precisas de imágenes que no formaban parte del conjunto de datos de entrenamiento de la IA.
Posteriormente, los investigadores utilizaron las imágenes por resonancia magnética funcional de cuatro participantes que habían observado 10,000 fotografías diferentes de personas, paisajes y objetos como parte de un estudio anterior no relacionado.
Según los científicos, el primer modelo logró recrear la perspectiva y el diseño que el participante había visto, pero las imágenes generadas eran algo borrosas o abstractas. pero en cuanto utilizaron el segundo modelo, este pudo reconocer qué objeto que cada persona estaba mirando basándose en las descripciones en texto de las imágenes de entrenamiento.
Un ejemplo de cómo funciona es que al recibir los resultados de una RMF que se parecía a un comando registrado como “persona mirando un avión” crearía un avión en alta resolución manteniendo la perspectiva del primer modelo.
La IA fue capaz de generar imágenes de objetos como un oso de peluche, una torre de reloj y un avión después de que los participantes vieron imágenes similares. Según los investigadores la tecnología logró aproximadamente un 80% de precisión.
Finalmente, los científicos señalan que su estudio no solo es una demostración de la increíble capacidad de la inteligencia artificial generativa, sino también una manera de comprender mejor el complejo funcionamiento de los procesos internos de los modelos de difusión inteligentes, los cuales a pesar de estar aun en pañales ya han impulsado sucesos históricos como este.