Nos guste o no, la IA no va a ninguna parte. Desde que ChatGPT irrumpió en escena en 2022, la IA se ha convertido en una parte cada vez más importante de nuestra vida cotidiana, y la música no es una excepción.
Aunque la producción musical asistida por IA existe desde hace tiempo con servicios como eMastered, los generadores de voz por IA son relativamente nuevos. Cada día aparecen más, por lo que puede resultar desalentador averiguar cuál creará la voz perfecta para tus canciones.
Y aquí en eMastered nos gusta ser útiles, así que hemos elaborado esta lista de los 5 mejores plugins de IA vocal disponibles ahora mismo.
¿Preparados? ¡Venga!
¿Qué son los plugins vocales de IA?
A los efectos de este artículo, consideramos plugins vocales AI a cualquier software, plugin o basado en la nube, que cree o manipule grabaciones vocales.
Algunos generan ellos mismos las pistas vocales. Otros utilizarán programas informáticos de cambio de voz para ajustar la identidad vocal de una grabación.
¿Son legales las voces AI?
En cuanto a los aspectos legales que rodean a las voces de la IA, estamos literalmente en el salvaje oeste. Esta confusión tiene su origen en el material con el que se entrena la tecnología de IA y en si los artistas cuyas voces han entrado en el modelo de entrenamiento han dado su consentimiento para dicho uso.
La conclusión es que si utilizas la IA para imitar la voz de un famoso y la pones a disposición del público, podrías meterte en un buen lío.
Es mejor que mantengas esos divertidos temas de Ed Sheeran entre tú y tus amigos.
Los 5 mejores plugins de AI Voice
Elf Tech
Página web
En pocas palabras
Elf.Tech es un generador de voz de IA que sólo tiene un modelo de voz: Grimes.
Lanzado en 2023, el software de código abierto se diseñó para poner la deliciosa voz de Grimes a disposición de creadores y músicos para que la utilizaran en su propia música.
Como muchos de los plugins que aparecen en este artículo, el principio es sencillo: sube una interpretación vocal (ya sea tu propia voz o la de alguien que te haya dado permiso) y te la devolverán transformada en la característica voz de Grimes.
No hay mucho control sobre cómo manipular la voz, pero ¿por qué querrías meterte con Grimes?
Es limitante, sí. Pero lo bueno de este sitio es que tienes permiso total de la cantante para publicar tu canción comercialmente, a cambio del 50% de los derechos de la grabación original.
Esto significa, presumiblemente, que te quedas con el 100% de la parte del autor, aunque creo que todavía hay algunos problemas cuando se trata de publicar en servicios de streaming que su equipo legal está resolviendo. Sin embargo, si te gusta la música sincronizada, estás de suerte.
Precios
El uso de Elf Tech es totalmente gratuito. El inconveniente es que, una vez creada la cuenta, no hay forma (obvia) de cerrarla o eliminarla.
Otras características
El sitio Elf.Tech también ofrece un servicio de distribución y acceso a los stems de Miss Anthropocene para remezclarlos.
Uberduck
Página web
En pocas palabras
¿Recuerdas la canción falsa de Drake de hace un par de años? Dio lugar a un montón de canciones similares que utilizaban modelos de voz de IA para imitar a otros artistas.
Un sitio web que hizo posible todo esto fue Uberduck, una aplicación de texto a voz que también permitía a los usuarios crear voces de rap utilizando voces de IA que sonaban como tu artista favorito: Kanye West, Drake y muchos más estaban entre las voces personalizadas disponibles para usar.
Sin embargo, la diversión duró poco, ya que los artistas se opusieron, con razón, a que se utilizaran sus voces exclusivas sin permiso.
Sin embargo, Uberduck sigue vivo, y puedes utilizar su opción "rap" para generar voces habladas para tus proyectos creativos.
Tienes la opción de usar un ritmo ya hecho (no es bueno), crear la voz acapella, o subir un nuevo ritmo para rapear (sólo versión de pago).
Introduce tu letra personalizada (o utiliza el generador de letras por IA de Uberduck basado en tus indicaciones), y a continuación se te pedirá que elijas a tu rapero.
Sólo hay 4 opciones para elegir; un hombre y una mujer en inglés y español.
No hay opción de alterar las voces, y aunque el resultado quizá no sea un material de primera fila, desde luego es mejor que cualquier intento que yo pudiera hacer. Desde luego, es lo suficientemente bueno como para ver cómo se desarrolla el ritmo en contexto con una línea vocal.
Precios
Aunque Uberduck tiene una opción de prueba gratuita, para utilizarlo de verdad necesitarás una suscripción. Estas van desde los 4 dólares al mes por una licencia no comercial (ideal para maquetar pistas con las que puedan trabajar raperos de verdad) hasta los 60 dólares por el paquete Pro completo.
El paquete intermedio "Creador" cuesta 10 dólares al mes y es ideal para los creadores de contenidos que necesitan una nueva voz para su material.
Otras características
Uberduck también ofrece generación de texto a voz e imágenes, una aplicación de cambio de voz y una opción de clonación de voz con la que puedes crear una voz original a partir de un único clip de audio.
Sonidos del eclipse
Página web
En pocas palabras
Con sede en EE.UU., Eclipse Sounds ofrece 4 bases de datos de voces AI que, según afirman, proporcionan voces de calidad de estudio de grabación para tu pista. El inconveniente es que sólo pueden utilizarse en la DAW Synthesizer V.
Cada modelo de IA se entrena a partir de la voz de un artista real y cubre todos los rangos vocales, desde bajo a mezzosoprano. Cada voz viene con un rango de tono y tempo como directrices para trabajar, y cuenta con diferentes "modos" - léase: timbres - que puedes mezclar y combinar para adaptarse al estilo y género de tus canciones.
Al no poseer un Synthesizer V no he podido comprobar cómo funcionan los packs, pero sé que puedes hacer que canten cualquier letra que desees (incluso para la voz de tenor, cantando en un idioma diferente), y que las interpretaciones pueden editarse como lo harías con cualquier parte MIDI en un editor estilo piano roll.
Según las demos de su sitio web, los resultados son sorprendentemente eficaces. Es difícil saber si esto se traduciría en la voz perfecta para tu proyecto. Pero en términos de crear una pista temporal para enviar a tu cantante del mundo real para trabajar, los cantantes de Eclipse podrían ser un cambio de juego.
Los artistas utilizados para entrenar los modelos de voz de la IA cobran por adelantado por sus datos vocales y reciben derechos por cada complemento vendido. También pueden elegir entre compartir su identidad real o mantenerla en privado. Así que hay algo de ética en las prácticas de IA.
Todas las voces de IA disponibles a través de Eclipse son libres de derechos de autor, y sólo necesitan acreditarse como su Avatar en un lanzamiento comercial.
Como con la mayoría de los paquetes de muestras, no puedes revender nada de lo producido por estos modelos, ni utilizarlo para entrenar otros modelos de IA.
Precios
Cada modelo de voz de Eclipse cuesta 90 dólares, con descuentos por compras al por mayor. De nuevo, ten en cuenta que sólo funcionan con la DAW Synthesizer V.
Otras características
Zip. Nada. Ni una salchicha.
Audimee
Página web:
La verdad
Audimee parece haber captado la atención tanto de creadores profesionales como de aficionados. La página de inicio de la empresa cuenta con Nicky Romero, Goodboys y Hugel entre sus usuarios.
Las demos de la página de inicio hablan por sí solas, con una sólida representación de muchos géneros. Sí, ¡incluso los fans de Nickelback pueden hacer música con vocalistas virtuales de rock!
Para convertir tu propia voz en una de las muchas voces libres de derechos disponibles en el sitio, sólo tienes que subir una toma vocal limpia o grabar directamente en el sitio.
Si no eres un gran cantante, tienes la opción de autoajustar rápidamente tu interpretación o utilizar un editor de tono integrado para hacerlo manualmente.
A partir de ellas, puedes elegir la voz que mejor se adapte a tu estilo. Algunas de estas voces son totalmente gratuitas, otras requieren una suscripción. En mi opinión, hay una amplia gama de estilos vocales y todos suenan bastante convincentes, aunque les falte un cierto je ne sais quoi. Así es AI...
Precios
El plan gratuito te permite acceder a 14 voces de IA, generar 15 minutos de audio al mes, pero sin derechos de uso comercial. Los niveles de suscripción tienen precios razonables de 12, 25 y 49 dólares al mes, y los niveles superiores ofrecen otras voces y más horas de conversión al mes.
Otras características
El sitio Audimee también ofrece a los usuarios la posibilidad de entrenar un modelo de inteligencia artificial a partir de su propia voz, aislar voces de una mezcla (cuidado con esto: si lo usas para entrenar un modelo de voz estarás en terreno pedregoso) y publicar covers de acapellas cada semana para usarlos en tus propias remezclas.
Lalals
Página web
En pocas palabras
Lalals no me convence al 100% por a) las posibles violaciones éticas al ofrecer imitaciones de sonidos, y b) las otras funciones que ofrece. Más adelante hablaremos de ello.
Sin embargo, las demos de las pistas vocales de IA que se escuchan en la página de aterrizaje son convincentes, aunque un poco sacarinas.
El usuario puede filtrar por categoría (cantante, rapero, famoso o político), idioma, sexo y si la voz de la IA representa a una persona real o está tomada de su colección de voces únicas.
Cuando estés listo para utilizar el cambiador de voz, sólo tienes que arrastrar un archivo de audio, grabarte a ti mismo o introducir un enlace de YouTube.
No hay opción de transformar la voz de ninguna manera, aparte de un tono básico hacia arriba o hacia abajo, para convertir una voz femenina en masculina, o viceversa. Basta con hacer clic en convertir y el cambiador de voz hará el resto por ti.
La versión gratuita es increíblemente lenta. El procesamiento de alta velocidad está disponible en los planes de pago, así que tal vez sólo estoy siendo quisquilloso aquí. Pero sigo esperando que Justin Timberlake cante Livin' On a Prayer...
Una vez procesadas, puedes descargar las pistas vocales resultantes en formato MP3 o WAV de alta calidad, según tu nivel de suscripción.
Precios
Con Lalals puedes probar gratis, con un límite de 15 minutos generados al mes sólo para uso personal, y una renderización de baja calidad.
Los niveles de pago incluyen Basic (12 $), Pro (24 $) y Studio (99 $), que incluyen más minutos de uso del cambiador de voz, más voces y una licencia comercial.
Otras características
Además de las funciones de cambio de voz, las suscripciones de pago de Lalals incluyen la opción de clonar una voz. Puedes crear tantas voces propias como te permita tu plan de suscripción y utilizarlas para cambiar la voz o para introducir un texto.
La otra oferta es poder crear música con IA. Bleurgh. No lo hagas; limítate a producir música tú mismo.
Otros plugins de IA vocal
Si ninguno de los sitios de cambio de voz anteriores te convence, comprueba si alguno de estos sitios despierta tu creatividad:
Consideraciones al utilizar voces de IA para la producción musical
El auge de la inteligencia artificial cambia las reglas del juego de la producción musical.
Como productor musical, el uso de voces de IA, o de un cambiador de voz de IA, te permite crear la voz perfecta para tu canción. Es una herramienta increíble para el creador de contenidos que sabe cantar pero no es un vocalista profesional, ya que le permite crear pistas vocales que coincidan con el tono de su contenido.
Los productores musicales que colaboran con otros artistas y necesitan pistas vocales guía para trabajar también pueden hacer uso de estas aplicaciones libres de derechos para impulsar su creatividad.
También son muy útiles para hacer música por diversión.
Pero a pesar de su utilidad a la hora de producir música, las pistas vocales de IA vienen con cierto bagaje.
Para empezar, a pesar de la calidad que se puede obtener de algunos de los generadores de voz mencionados anteriormente, las voces resultantes nunca igualarán la fuerza o la emoción de un ser humano real cantando con todo el peso de su experiencia emocional detrás.
Los recursos son otro factor. La IA consume mucha energía, sobre todo para las generaciones complejas, como el habla y el canto.
Por último, están las consideraciones éticas y legales sobre los datos con los que se han entrenado las voces. Las aplicaciones pueden afirmar que están libres de derechos de autor, pero eso no siempre significa que puedas distribuir la canción resultante sin contratiempos.
En mi opinión, los generadores de voz por IA son una herramienta útil para los productores musicales, pero deben utilizarse con cuidado y nunca como sustitutos de un músico real. Pero eso es sólo mi opinión.
Decidas lo que decidas, ¡adelante, haz música!