Generar música a partir de texto utilizando Google MusicLM

'Generate music from text using Google MusicLM.'

Presentamos el último avance en el modelo de música de IA de Google.

El desarrollo de la IA se ha vuelto más grande que nunca, especialmente en el campo de la IA Generativa. Desde generar texto similar a una conversación con personas hasta generar imágenes a partir de texto, todo esto ahora es posible.

Ese avance también llega al campo de la generación de música, como lo demuestra Google, que lanzó un modelo de generación de música llamado MusicLM. Este modelo fue lanzado en enero de 2023, y las personas han estado probando sus capacidades desde entonces. Entonces, ¿qué es MusicLM en detalle y cómo puedes probarlo? Vamos a discutirlo.

Google MusicLM

MusicLM fue presentado por primera vez en el artículo de Agostinelli et al. (2023), donde el grupo de investigación explicó MusicLM como un modelo para generar música de alta fidelidad a partir de una descripción textual. El modelo se construye principalmente sobre AudioLM, y los experimentos mostraron que el modelo podía producir varios minutos de música de alta calidad a 24 kHz, manteniendo al mismo tiempo la descripción del texto.

Además, la investigación produce un conjunto de datos público de texto a música llamado musiccaps, para cualquier persona que desee desarrollar un modelo similar o ampliar la investigación. Los datos son seleccionados y curados manualmente por músicos profesionales.

Además, MusicLM ha sido desarrollado siguiendo prácticas responsables de desarrollo de modelos para personas que temen la posible apropiación indebida de contenido creativo debido a la generación de música. Al expandir el trabajo de Carlini et al. (2022), el token generado por MusicLM es significativamente diferente a los datos de entrenamiento.

Probando MusicLM

Si quieres explorar una muestra de los resultados de MusicLM, el grupo de investigación de Google ha proporcionado un sitio web sencillo para que podamos ver qué tan capaz es MusicLM. Por ejemplo, puedes explorar las muestras de audio generadas a partir del título del texto en el sitio web.

Otro ejemplo es mi muestra favorita, la generación de música en modo historia, donde diferentes estilos de música se pueden integrar en uno solo utilizando varios títulos de texto.

También es posible generar música basada en el título de una pintura, capturando posiblemente el estado de ánimo de la imagen.

El resultado suena increíble, pero ¿cómo podemos probar el modelo? Afortunadamente, Google ha aceptado el registro para probar MusicLM desde mayo de 2023 en el AI Test Kitchen. Ve al sitio web y regístrate con tu cuenta de Google.

Después del registro, tendríamos que esperar nuestro turno para probar MusicLM. Así que mantén tus ojos en tu correo electrónico.

Eso es todo por ahora; espero que puedas tener tu turno pronto para probar el emocionante MusicLM.

Conclusión

MusicLM es un modelo del grupo de investigación de Google para generar música a partir de un texto. El modelo puede proporcionar varios minutos de música de alta calidad mientras sigue las instrucciones del texto. Podemos probar MusicLM registrándonos en el AI Test Kitchen. Sin embargo, podemos visitar el sitio web de investigación de Google si solo estamos interesados en el resultado de muestra. Cornellius Yudha Wijaya es un asistente de gestión de ciencia de datos y escritor de datos. Mientras trabaja a tiempo completo en Allianz Indonesia, le encanta compartir consejos de Python y datos a través de redes sociales y medios de escritura.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

El Lado Oscuro de la IA - ¿Cómo pueden ayudar los creadores?!

No pasa un solo día en estos tiempos sin que nos enteremos de algo sorprendente que haya hecho una herramienta de IA....

Inteligencia Artificial

Super Carga tus Sistemas de ML en 4 Sencillos Pasos

¡Bienvenido a la montaña rusa de la optimización de ML! En esta publicación te guiaré a través de mi proceso para opt...

Inteligencia Artificial

Conoce a Ego-Exo4D Un conjunto de datos y una suite de referencia esenciales para apoyar la investigación sobre aprendizaje de video y percepción multimodal.

Hoy en día, la inteligencia artificial encuentra su aplicación en casi todos los campos imaginables. Definitivamente ...

Investigación

Una forma más efectiva de entrenar máquinas para situaciones inciertas del mundo real.

Los investigadores desarrollaron un algoritmo que decide cuándo una máquina estudiante debe seguir a su profesor y cu...

Inteligencia Artificial

Herramientas de Inpainting basadas en IA para Arte

La imagen inpainting de inteligencia artificial es un enfoque de visión por computadora para restaurar imágenes que h...

Aprendizaje Automático

Salesforce presenta XGen-7B Un nuevo 7B LLM entrenado en secuencias de hasta 8K de longitud para 1.5T Tokens.

Con los recientes avances tecnológicos en inteligencia artificial, los Modelos de Lenguaje Grande, o LLMs en resumen,...