Gemini estrena Lyria 3 para crear música sin saber producir

Lyria Header Image
La nueva función de creación musical de Google permite generar pistas de audio personalizadas a partir de un simple prompt, una imagen o un documento, sin conocimientos técnicos

Tras el despliegue de imagen y vídeo, la app de Gemini da un nuevo salto con Lyria 3, un modelo capaz de crear pistas musicales de alta calidad a partir de unas pocas instrucciones. En cuestión de 30 segundos, el usuario puede obtener un track pegadizo y divertido acompañado de una portada generada automáticamente. Todo ello, sin necesidad de saber producir música ni manejar herramientas complejas. La gran novedad es su capacidad multimodal: basta con subir una foto o un documento para que Gemini analice el contexto y componga letra y melodía personalizadas. El objetivo no es competir con los estudios profesionales, sino ofrecer una forma rápida y única de expresión cotidiana, desde una alarma de despertador hasta una felicitación de cumpleaños. Lyria 3 llega hoy en fase beta en web y se desplegará en la app móvil de Gemini en los próximos días para usuarios de todo el mundo.

De la idea al track en solo 30 segundos

El punto de partida de Lyria 3 es sencillo: “Describe una idea a partir de un prompt, o sube una foto y deja que Gemini haga su magia”. A partir de esa instrucción, el modelo genera una pista musical de 30 segundos, diseñada para ser pegadiza y divertida. La propuesta rompe con la lógica tradicional de la producción musical, que exige herramientas específicas y curvas de aprendizaje prolongadas.

Aquí, en cambio, el usuario solo necesita formular una descripción coherente de lo que quiere escuchar. En segundos, obtiene un audio listo para usarse como tono, jingle, banda sonora breve o fondo para redes sociales. Junto al track, Lyria 3 entrega además una portada personalizada, generada con Nano Banana, que complementa la experiencia con un elemento visual.

La consecuencia es clara: cualquiera puede convertir una idea abstracta —una situación, un estado de ánimo, una anécdota— en una pequeña pieza musical lista para compartirse, sin pasar por editores, secuenciadores ni librerías de sonidos.

Control total de estilo, voz y ritmo sin saber producir

Aunque está pensada para usuarios sin formación musical, Lyria 3 no renuncia al control creativo. El modelo permite ajustar el estilo, la voz y el ritmo (BPM) de cada pista sin necesidad de manejar conceptos técnicos avanzados. A través del prompt, el usuario puede definir si quiere un tema de pop, rock, techno, jazz o cualquier otro género, así como matices híbridos mezclando influencias.

El sistema interpreta estas indicaciones y las traduce en una composición coherente: una balada romántica, un jingle ligero o un tema más enérgico. El énfasis está en la personalización: la misma idea puede convertirse en múltiples pistas distintas simplemente cambiando el tono, la velocidad o la instrumentación indicada en el texto.

De este modo, Lyria 3 ofrece una aproximación accesible a decisiones que, en un entorno profesional, implican ajustar pistas, plugins y parámetros. Aquí todo se concentra en una descripción bien redactada, lo que rebaja la barrera de entrada y anima a experimentar sin miedo a la complejidad técnica.

Lyria Header Image

‘De archivo a track’: cuando una foto se convierte en canción

La principal novedad de Lyria 3 es su capacidad multimodal. Con la función “De archivo a track”, Gemini puede analizar una foto o un documento y, a partir de ese contexto, componer automáticamente una letra y una melodía personalizadas en apenas 30 segundos.

Esto abre la puerta a usos muy concretos: convertir la imagen de un viaje en una pequeña canción que lo resuma, transformar un texto de felicitación en una balada musical o darle voz a un documento de agradecimiento. El usuario no necesita explicar cada detalle en el prompt; basta con subir el archivo y añadir unas pocas instrucciones sobre el tono y el estilo deseados.

Este hecho revela cómo la combinación de IA y contexto visual o textual permite pasar de un contenido estático a una experiencia sonora. El archivo deja de ser solo un recuerdo o un texto plano para convertirse en el guion de una pista musical breve, pensada para compartirse o acompañar otros contenidos digitales.

Compartir, descargar y jugar con la música generada

Una vez generada la pista, Lyria 3 ofrece varias opciones para integrarla en la rutina digital del usuario. El audio puede descargarse directamente o compartirse mediante un enlace en cuestión de segundos. No se requieren pasos intermedios ni exportaciones complejas: el flujo está orientado a que el resultado salga rápidamente del entorno de Gemini y llegue allí donde el usuario lo necesita.

El objetivo declarado no es producir una obra maestra musical, sino “ofrecer una forma única de expresarse”. Esa lógica se refleja en los casos de uso propuestos: crear una alarma de despertador distinta, una melodía cómica para recordar una deuda pendiente o un pequeño tema para acompañar un vídeo en redes.

La consecuencia es evidente: la música generativa deja de ser un experimento aislado y se integra en los gestos cotidianos de comunicación. Cada track de 30 segundos se convierte en una herramienta más para enviar mensajes, felicitar, recordar o simplemente hacer sonreír a alguien con un audio personalizado.

Lanzamiento en beta y acceso desde Gemini

Lyria 3 se lanza hoy en fase beta en web y llegará a la aplicación móvil de Gemini durante los próximos días, con disponibilidad para usuarios a nivel mundial. El acceso se articula a través de la propia interfaz de Gemini: basta con seleccionar la opción «Crear música» en el menú de herramientas o visitar la dirección gemini.google.com/music.

Este despliegue escalonado permite empezar a probar la función desde el navegador, mientras la app móvil se actualiza en paralelo. El formato beta apunta a un periodo en el que la herramienta irá puliéndose con el uso real, sin perder de vista que ya ofrece un conjunto completo de capacidades en su primera versión pública.

El diagnóstico es inequívoco: la creación musical se integra como una función más dentro del asistente de IA, al mismo nivel que la generación de texto, imagen o vídeo. La experiencia se unifica en una misma aplicación, reduciendo fricción y concentrando todas las opciones creativas en un solo espacio.

Ideas para el día a día: de alarmas a felicitaciones

La nota de presentación incluye una serie de casos de uso pensados para ilustrar cómo Lyria 3 puede encajar en el día a día. Uno de los ejemplos es la creación de nuevas alarmas de despertador, adaptadas al gusto del usuario: desde un tono suave para empezar la mañana hasta un tema más cómico para arrancar con energía.

También se mencionan baladas románticas o pistas con tono humorístico, por ejemplo para recordar a alguien que aún debe dinero de una cena reciente. En el ámbito más personal, Lyria 3 se plantea como herramienta para felicitaciones de cumpleaños, pequeñas cortinillas para podcasts o acompañamientos musicales para contenido en redes sociales.

Otro uso relevante son las “rutinas cantadas” orientadas a los más pequeños: crear pistas que animen a lavarse los dientes o entrar en la bañera, personalizando incluso la letra con su nombre. A Gemini se le puede pedir la letra, lo que permite ajustar el mensaje al máximo. En todos los casos, los 30 segundos de audio funcionan como un formato breve, directo y fácil de integrar en cualquier momento cotidiano.

Cómo escribir prompts que suenen bien

La propia comunicación de Lyria 3 incluye una guía de prompt para ayudar al usuario a sacar partido a la herramienta. La recomendación es estructurar la petición indicando, en una sola descripción coherente, varios elementos clave:

  • El tipo de track que se quiere (banda sonora, jingle, instrumental, tono de llamada, etc.).

  • El estilo o género principal (pop, rock, techno, jazz…) y, opcionalmente, un segundo género para aportar un matiz híbrido.

  • La situación o uso al que va destinado (cumpleaños, motivación, agradecimiento, alarma, contenido en redes…).

  • La emoción principal que la música debe transmitir —alegría, tristeza, épico, relajante, etc.—.

  • La instrumentación base (guitarras, sintetizadores, percusión latina, sonidos concretos).

  • Una breve estructura: por ejemplo, intro suave, subida, clímax y final corto.

La indicación final es clara: “Redacta el prompt siempre en una sola descripción coherente”. Cuanto más precisa sea la petición, más alineado estará el resultado con lo que el usuario tiene en mente, sin necesidad de tocar ni un solo control de mezcla.