Che ci piaccia o no, l'intelligenza artificiale non va da nessuna parte. Da quando ChatGPT è esploso sulla scena nel 2022, l'IA è diventata una parte sempre più importante della nostra vita quotidiana, e la musica non fa eccezione.
Mentre la produzione musicale assistita dall'intelligenza artificiale esiste da un po' di tempo con servizi come eMastered, i generatori di voce AI sono relativamente nuovi. Con un numero sempre maggiore di generatori di voce che spuntano ogni giorno, può essere scoraggiante capire quale creerà la voce perfetta per le vostre canzoni.
A noi di eMastered piace essere d'aiuto, quindi abbiamo messo insieme questo elenco dei 5 migliori plugin di IA vocale disponibili al momento.
Pronti? Andiamo!
Cosa sono i plugin vocali AI?
Ai fini di questo articolo, consideriamo plugin vocali AI qualsiasi software, plugin o basato su cloud, che crea o manipola registrazioni vocali.
Alcuni generano da soli le tracce vocali. Altri utilizzano software per il cambio di voce per regolare l'identità vocale di una registrazione.
Le voci AI sono legali?
In termini di legalità che circonda le voci dell'IA, è letteralmente il selvaggio west là fuori. La confusione deriva dal materiale su cui la tecnologia AI viene addestrata e dal fatto che gli artisti le cui voci sono state inserite nel modello di addestramento abbiano acconsentito a tale uso.
Il punto è che se si utilizza l'intelligenza artificiale per imitare la voce di una celebrità e la si mette a disposizione del pubblico, ci si potrebbe trovare in guai seri.
È meglio che le tracce divertenti di Ed Sheeran rimangano tra te e i tuoi amici.
I 5 migliori plugin per la voce AI
Tecnologia degli elfi
Sito web
I dati più bassi
Elf.Tech è un generatore di voce AI che ha un solo modello di voce: Grimes.
Lanciato nel 2023, il software open-source è stato progettato per mettere la voce di Grimes a disposizione di creatori e musicisti per utilizzarla nella loro musica.
Come molti dei plugin elencati in questo articolo, il principio è semplice: caricate una performance vocale (la vostra voce o quella di qualcuno che ha dato il suo permesso) e vi verrà restituita trasformata nella voce caratteristica di Grimes.
Non c'è molto controllo sul modo in cui si può manipolare la voce, ma d'altronde perché mai si dovrebbe voler scherzare con Grimes?
È limitante, certo. Ma il bello di questo sito è che avete il pieno permesso della cantante di pubblicare la vostra canzone a livello commerciale, in cambio del 50% dei diritti d'autore della registrazione.
Questo presumibilmente significa che si può trattenere il 100% della quota dell'autore, anche se credo che ci siano ancora dei problemi per quanto riguarda la pubblicazione sui servizi di streaming che il suo team legale sta risolvendo. Se vi piace la musica sincronizzata, comunque, siete a posto.
Prezzi
Elf Tech è completamente gratuito. L'aspetto negativo è che una volta creato un account non c'è un modo (ovvio) per uscire o cancellare il proprio account.
Altre caratteristiche
Il sito Elf.Tech offre anche un servizio di distribuzione e l'accesso alle tracce di Miss Anthropocene per il remix.
Uberduck
Sito web
I dati più bassi
Ricordate la finta canzone di Drake di un paio di anni fa? Ha generato una serie di brani simili che utilizzavano modelli vocali AI per imitare altri artisti.
Un sito web che ha reso possibile tutto questo è stato Uberduck, un'applicazione di sintesi vocale che permetteva anche agli utenti di creare voci rap utilizzando voci AI che assomigliavano ai vostri artisti preferiti: Kanye West, Drake e molti altri erano tra le voci personalizzate disponibili per l'uso.
Il divertimento è durato poco, tuttavia, perché gli artisti si sono giustamente opposti all'uso della loro voce senza autorizzazione.
Uberduck è ancora vivo, tuttavia, e potete usare la sua opzione "rap" per generare voci parlate per i vostri progetti creativi.
Si può scegliere di utilizzare un beat già pronto (non va bene), di creare la voce acapella o di caricare un nuovo beat su cui rappare (solo nella versione a pagamento).
Inserite il vostro testo personalizzato (o utilizzate il generatore di testi AI di Uberduck in base alle vostre richieste) e vi verrà chiesto di scegliere il vostro rapper.
Ci sono solo 4 opzioni tra cui scegliere: un maschio e una femmina, sia in inglese che in spagnolo.
Non c'è la possibilità di alterare le voci e, anche se il risultato non è forse materiale da classifica, è certamente migliore di qualsiasi tentativo che potrei fare. Sicuramente è sufficiente per vedere come si forma il ritmo nel contesto di una linea vocale.
Prezzi
Sebbene esista un'opzione di prova gratuita su Uberduck, per poterlo utilizzare davvero è necessario sottoscrivere un abbonamento. Questi partono da 4 dollari al mese per una licenza non commerciale (ideale per creare tracce da cui far lavorare i veri rapper) fino a 60 dollari per il pacchetto Pro completo.
Il pacchetto intermedio "Creator" costa 10 dollari al mese ed è ideale per i creatori di contenuti che hanno bisogno di una nuova voce per il loro materiale.
Altre caratteristiche
Uberduck offre anche la generazione di testi e immagini, un'applicazione per il cambio di voce e un'opzione di clonazione vocale che consente di creare una voce originale a partire da un singolo clip audio.
Suoni dell'eclissi
Sito web
I dati più bassi
Con sede negli Stati Uniti, Eclipse Sounds offre 4 database di voci AI che pretendono di fornire voci di qualità da studio di registrazione per i vostri brani. L'aspetto negativo è che possono essere utilizzati solo con la DAW Synthesizer V.
Ogni modello di intelligenza artificiale è stato addestrato a partire dalla voce di un artista reale e copre tutte le gamme vocali, dal basso al mezzo soprano. Ogni voce è corredata da un'intonazione e da una gamma di tempi entro i quali lavorare, e presenta diverse "modalità" (leggi: timbri ) che si possono mescolare e abbinare per adattarsi allo stile e al genere delle vostre canzoni.
Non possedendo Synthesizer V non ho potuto verificare il funzionamento dei pacchetti, ma so che è possibile fargli cantare qualsiasi testo si desideri (anche per la voce del tenore, cantando in una lingua diversa) e che le esecuzioni possono essere modificate come si farebbe con qualsiasi parte MIDI in un editor stile piano roll.
In base alle dimostrazioni sul loro sito web, i risultati sono sorprendentemente efficaci. È difficile dire se questo si traduca nella voce perfetta per il vostro progetto. Ma in termini di creazione di una traccia provvisoria da inviare al cantante del mondo reale per lavorare, i cantanti di Eclipse potrebbero cambiare le carte in tavola.
Gli artisti utilizzati per addestrare i modelli vocali dell'intelligenza artificiale vengono pagati in anticipo per i loro dati vocali e ricevono royalties su ogni plugin venduto. Possono anche scegliere se condividere la loro vera identità o se mantenerla privata. Si tratta quindi di una pratica etica dell'IA.
Tutte le voci dell'intelligenza artificiale disponibili tramite Eclipse sono libere da diritti d'autore e devono solo essere accreditate come Avatar in una versione commerciale.
Come per la maggior parte dei pacchetti di campioni, non è possibile rivendere nulla di quanto prodotto da questi modelli, né utilizzarli per addestrare altri modelli AI.
Prezzi
Ogni modello di voce di Eclipse viene spedito a 90 dollari, con sconti per acquisti in blocco. Anche in questo caso, si noti che funzionano solo all'interno della DAW Synthesizer V .
Altre caratteristiche
Zip. Nada. Non una salsiccia.
Audimee
Sito web:
Il dettaglio
Audimee sembra aver catturato l'attenzione di creatori professionisti e dilettanti. La pagina di atterraggio dell'azienda vanta tra i suoi utenti Nicky Romero, Goodboys e Hugel.
I demo sulla pagina di destinazione parlano da soli, con una solida rappresentazione di molti generi mainstream. Sì, anche i fan dei Nickelback possono fare musica con vocalist rock virtuali!
Per convertire la propria voce in una delle tante voci royalty free disponibili sul sito è sufficiente caricare una ripresa vocale pulita o registrare direttamente sul sito.
Se non si è dei grandi cantanti, si può scegliere di autotonizzare rapidamente la propria performance o di utilizzare un editor di intonazione integrato per farlo manualmente.
Da queste si sceglie la voce che più si addice alla propria atmosfera. Alcune di queste voci sono completamente gratuite, altre richiedono un abbonamento. Per quanto mi riguarda, c'è un'ampia gamma di stili vocali e tutti risultano piuttosto convincenti, anche se mancano di un certo je ne sais quoi. Questo è AI per voi...
Prezzi
Il piano gratuito consente di accedere a 14 voci AI, di generare 15 minuti di audio al mese, ma senza diritti di utilizzo commerciale. I livelli di abbonamento hanno prezzi ragionevoli: 12, 25 e 49 dollari al mese, con i livelli più alti che offrono altre voci e più ore di conversione al mese.
Altre caratteristiche
Il sito Audimee offre inoltre agli utenti la possibilità di addestrare un modello di intelligenza artificiale sulla propria voce, di isolare le voci da un mix (attenzione: se lo si usa per addestrare un modello vocale, ci si troverà su un terreno difficile) e di pubblicare ogni settimana delle cover di acapella da utilizzare nei propri remix.
Lalals
Sito web
I dati più bassi
Non sono convinto al 100% di Lalals, a causa di a) possibili violazioni etiche nell'offerta di suoni simili, e b) delle altre funzioni che offre. Per saperne di più, si veda più avanti.
Tuttavia, le demo delle tracce vocali dell'intelligenza artificiale che si possono ascoltare sulla landing page sono convincenti, anche se un po' saccenti.
L'utente può filtrare in base alla categoria (cantante, rapper, celebrità o politico), alla lingua, al genere e se la voce dell'intelligenza artificiale è destinata a rappresentare una persona reale o è presa dalla sua collezione di voci uniche.
Quando si è pronti a usare il cambiavoce, è sufficiente trascinare un file audio, registrare se stessi o inserire un link di YouTube.
Non c'è alcuna opzione per trasformare la voce in alcun modo, a parte un'intonazione di base verso l'alto o verso il basso, per convertire una voce femminile in una maschile o viceversa. Basta cliccare su converti e il cambiavoce farà il resto.
Il livello gratuito è incredibilmente lento. L'elaborazione ad alta velocità è disponibile nei piani a pagamento, quindi forse sono solo pignolo. Ma sto ancora aspettando che Justin Timberlake canti Livin' On a Prayer...
Una volta elaborate, è possibile scaricare le tracce vocali risultanti in formato MP3 o WAV di alta qualità, a seconda del livello di abbonamento.
Prezzi
Con Lalals si può provare gratuitamente, con un limite di 15 minuti generati al mese solo per uso personale e con un rendering di bassa qualità.
I livelli a pagamento comprendono Basic (12 dollari), Pro (24 dollari) e Studio (99 dollari), che includono tutti più minuti di utilizzo del cambiavoce, più voci e una licenza commerciale.
Altre caratteristiche
Oltre alla possibilità di cambiare voce, gli abbonamenti a pagamento di Lalals includono l'opzione di clonare una voce. È possibile creare un numero di voci personali pari a quello consentito dal proprio piano di abbonamento, che possono essere utilizzate per il cambio di voce o per l'immissione di testo.
L'altra offerta è la possibilità di creare musica con l'intelligenza artificiale. Bleurgh. Non fatelo; limitatevi a produrre musica da soli.
Altri Plugin di intelligenza vocale in lizza
Se nessuno dei siti di voice changer di cui sopra è di vostro gradimento, provate a vedere se qualcuno di questi siti accende la vostra creatività:
Considerazioni sull'uso delle voci AI per la produzione musicale
L'ascesa dell'intelligenza artificiale cambia le carte in tavola per la produzione musicale.
In qualità di produttore musicale, l'utilizzo di voci AI o di un AI voice changer consente di creare la voce perfetta per il brano. Si tratta di uno strumento incredibile per i creatori di contenuti che sanno cantare ma non sono dei vocalist professionisti, in quanto consente loro di creare tracce vocali che si adattano al tono dei loro contenuti.
Anche i produttori musicali che collaborano con altri artisti e hanno bisogno di tracce vocali guida per lavorare possono utilizzare queste app royalty free per dare impulso alla loro creatività.
Sono anche utilissimi per fare musica per puro divertimento.
Ma nonostante la loro utilità nella produzione di musica, le tracce vocali dell'IA comportano un certo bagaglio.
Per cominciare, nonostante la qualità che si può ottenere da alcuni dei generatori vocali sopra elencati, le voci risultanti non potranno mai eguagliare la potenza o l'emozione di un essere umano reale che canta con tutto il peso della sua esperienza emotiva alle spalle.
Le risorse sono un altro fattore. L'intelligenza artificiale è incredibilmente affamata di energia, con una maggiore quantità di energia utilizzata per le generazioni di intelligenza artificiale complesse come il parlato e il canto.
Infine, ci sono le considerazioni etiche e legali relative ai dati su cui sono state formate le voci. Le applicazioni possono dichiarare di essere esenti da diritti d'autore, ma questo non significa sempre che sarete liberi di distribuire la canzone risultante senza subire ripercussioni.
A mio avviso, i generatori di voce AI sono uno strumento utile per i produttori musicali, ma dovrebbero essere usati con cautela e mai come sostituto di un vero musicista. Ma questi sono solo i miei due centesimi.
Comunque decidiate di farlo, andate avanti e fate musica!