En medio del boom de las aplicaciones de inteligencia artificial generativa Google no se quiere quedar atrás y revela su nuevo modelo para crear piezas musicales a partir de texto.
Este fin de semana Google presentó un nuevo sistema de inteligencia artificial generativa llamado MusicLM, el cual es capaz de crear música de cualquier género con una alta resolución a partir de indicaciones escritas. Sin embargo, el gigante de la tecnología señaló que no tiene planes inmediatos de habilitarlo públicamente, debido a los potenciales riesgos legales de esta tecnología.
Si bien es cierto que MusicLM no es el primer sistema generativo de IA para hacer canciones ya que existen herramientas como Jukebox de OpenAI, Riffusion, Dance Diffusion e incluso AudioML del mismo Google, el nuevo modelo del gigante de la tecnología es el único con la capacidad de crear canciones particularmente complejas en composición de larga duración y alta fidelidad en el sonido.
“Nuestros experimentos muestran que MusicLM supera a los sistemas anteriores tanto en calidad de audio como en adherencia a la descripción del texto” mencionó Google al respecto mediante el comunicado en el que presentó los avances de su nueva inteligencia artificial generativa de música. Además, la compañía publicó un artículo de divulgación para compartir los detalles del proceso de investigación y desarrollo de su nueva tecnología.
¿Qué puede hacer la nueva inteligencia artificial generativa músical de Google?
MusicLM lleva a cabo el proceso de generación de música como una tarea condicional de modelado jerárquico entre secuencias para crear piezas musicales a 24 kHz que pueden alcanzar una duración de hasta cinco minutos, algo jamás antes logrado en este campo.
El sistema fue entrenado mediante un conjunto de datos equivalentes a 280,000 horas de música clasificadas con descripciones en texto que lo ayudaron a aprender acerca de los distintos instrumentos, sonidos, patrones, ritmos y géneros musicales entre muchos otros conocimientos necesarios para generar canciones coherentes de una alta resolución condicionadas por descripciones específicas y complejas.
Por otro lado, la capacidad de MusicLM, no solo le permite crear nuevos contenidos musicales con base en textos, sino que también puede basarse en la melodía de canciones existentes para manipularlas y transformarlas en versiones silbadas, tarareadas, instrumentales o incluso hacer un cover en otro género, de acuerdo con las indicaciones ingresadas en texto.
Otra de las ventajas de MusicLM sobre otras herramientas generativas es que puede tomar varias descripciones escritas en una misma indicación, divididas por segundos, para crear una especie de secuencia o narrativa auditiva que puede durar varios minutos.
Los creadores del sistema confían en que esta función podrá ayudar al mundo del entretenimiento, ya que esta clase de canciones pueden ser perfectamente adecuadas para utilizarse como banda sonora o música de fondo en cortometrajes.
Por si fuera poco, MusicLM también puede ser instruido a través de una combinación de imágenes y texto. El usuario puede cargar una obra de arte junto a una descripción complementaria y la IA se encarga de crear una canción relacionada. Además, el sistema puede crear piezas inspiradas en lugares, épocas o situaciones, como por ejemplo generar “música motivadora para hacer ejercicio”.
Sin fecha de lanzamiento debido a implicaciones legales
A pesar del gran potencial que ha demostrado esta tecnología en las pruebas, los investigadores de Google han revelado que no piensan lanzar su nuevo sistema al mercado debido a los desafíos éticos que plantea un sistema como MusicLM, que tiene la tendencia a incorporar material protegido por derechos de autor.
De hecho, mediante un experimento los científicos de Google descubrieron que alrededor del 1% de la música generada por el sistema se reprodujo directamente a partir de canciones con las que fue entrenado. Un porcentaje lo suficientemente alto para detener a la compañía de habilitar el uso de su nueva inteligencia artificial.
“Reconocemos el riesgo de posible apropiación indebida de contenido creativo asociado con este tipo de aplicaciones”, escribieron los coautores del artículo y agregaron. “Es por eso que seguiremos trabajando para abordar los riesgos asociados a la generación de música impulsada por inteligencia artificial antes de habilitar esta tecnología”.