Wokale AI: 5 najlepszych wokalnych wtyczek AI w 2024 roku

Wokale AI: 5 najlepszych wokalnych wtyczek AI w 2024 roku Wokale AI: 5 najlepszych wokalnych wtyczek AI w 2024 roku

Czy nam się to podoba, czy nie, sztuczna inteligencja nigdzie się nie wybiera. Odkąd ChatGPT po raz pierwszy pojawił się na scenie w 2022 roku, sztuczna inteligencja staje się coraz większą częścią naszego codziennego życia, a muzyka nie jest wyjątkiem.

Podczas gdy produkcja muzyczna wspomagana przez AI istnieje już od jakiegoś czasu dzięki usługom takim jak eMastered, generatory głosu AI są stosunkowo nowe. Ponieważ każdego dnia pojawia się ich coraz więcej, ustalenie, który z nich stworzy idealny głos do twoich piosenek, może być zniechęcające.

W eMastered lubimy być pomocni, dlatego przygotowaliśmy listę 5 najlepszych dostępnych obecnie wtyczek wokalnych AI.

Gotowy? Zaczynamy!

Czym są wtyczki wokalne AI?

Na potrzeby tego artykułu za wtyczki wokalne AI uznajemy dowolne oprogramowanie, wtyczki lub oparte na chmurze, które tworzy lub manipuluje nagraniami wokalnymi.

Niektóre z nich same generują ścieżki wokalne. Inni używają oprogramowania do zmiany głosu, aby dostosować tożsamość wokalną nagrania.

Czy głosy AI są legalne?

Jeśli chodzi o kwestie prawne związane z głosami AI, jest to dosłownie dziki zachód. Zamieszanie to wynika z materiału, na którym szkolona jest technologia AI, oraz tego, czy artyści, których głosy zostały wykorzystane w modelu szkoleniowym, wyrazili zgodę na takie wykorzystanie.

Najważniejsze jest to, że jeśli użyjesz sztucznej inteligencji do naśladowania głosu celebryty i udostępnisz go publicznie, możesz znaleźć się w gorącej wodzie.

Najlepiej zachowaj te zabawne utwory Eda Sheerana między sobą a kolegami.

5 najlepszych wtyczek głosowych AI

Elf Tech

Strona internetowa

https://elf.tech/

Podsumowanie

Elf.Tech to generator głosów AI, który ma tylko jeden model głosu: Grimes.

Uruchomione w 2023 roku oprogramowanie open-source zostało zaprojektowane w celu udostępnienia soczystego głosu Grimes twórcom i muzykom do wykorzystania we własnej muzyce.

Podobnie jak w przypadku wielu wtyczek wymienionych w tym artykule, zasada jest prosta: prześlij występ wokalny (własny głos lub kogoś, kto wyraził na to zgodę), a otrzymasz go z powrotem przekształconego w charakterystyczny głos Grimes.

Nie ma zbyt dużej kontroli nad tym, jak można manipulować głosem, ale z drugiej strony, dlaczego miałbyś chcieć zadzierać z Grimes?

Owszem, jest to ograniczające. Ale piękno tej strony polega na tym, że masz pełne pozwolenie od piosenkarki na komercyjne wydanie swojego utworu w zamian za 50% tantiem z głównego nagrania.

Prawdopodobnie oznacza to zatrzymanie 100% udziału autora, chociaż uważam, że nadal istnieją pewne kwestie, jeśli chodzi o wydawanie w serwisach streamingowych, nad którymi pracuje jej zespół prawny. Jeśli jednak lubisz synchronizować muzykę, jesteś złoty.

Wycena

Elf Tech jest całkowicie darmowy. Wadą jest to, że po utworzeniu konta nie ma (oczywistego) sposobu na wylogowanie się lub usunięcie konta.

Inne funkcje

Witryna Elf.Tech oferuje również usługę dystrybucji i dostęp do podkładów dla Miss Anthropocene do remiksowania.

Uberduck

Strona internetowa

https://www.uberduck.ai/

Podsumowanie

Pamiętasz tę fałszywą piosenkę Drake'a sprzed kilku lat? Spowodowało to powstanie wielu podobnych utworów, które wykorzystywały modele głosowe AI do naśladowania innych artystów.

Jedną z witryn internetowych, która umożliwiła to wszystko, była Uberduck, aplikacja do zamiany tekstu na mowę, która pozwoliła również użytkownikom tworzyć rapowe wokale przy użyciu głosów AI, które brzmią jak ulubiony artysta - Kanye West, Drake i wielu innych było wśród niestandardowych głosów dostępnych do użycia.

Zabawa trwała jednak krótko, ponieważ artyści słusznie sprzeciwili się wykorzystywaniu ich unikalnych głosów bez pozwolenia.

Uberduck wciąż jednak żyje i możesz użyć jego opcji "rap", aby wygenerować wokale mówione do swoich kreatywnych projektów.

Masz możliwość skorzystania z gotowego bitu (nie jest dobry), stworzenia wokalu acapella lub przesłania nowego bitu do rapowania (tylko wersja płatna).

Wprowadź własny tekst (lub użyj generatora tekstów AI Uberduck na podstawie podpowiedzi), a następnie zostaniesz poproszony o wybranie rapera.

Do wyboru są tylko 4 opcje; mężczyzna i kobieta w języku angielskim i hiszpańskim.

Nie ma opcji zmiany głosów i chociaż wynik nie jest może materiałem na szczyty list przebojów, to z pewnością jest lepszy niż jakakolwiek próba, którą mógłbym podjąć. Z pewnością wystarczająco dobry, aby zobaczyć, jak kształtuje się beat w kontekście linii wokalnej.

Wycena

Chociaż w Uberduck dostępna jest opcja wypróbowania za darmo, aby faktycznie z niej skorzystać, będziesz potrzebować subskrypcji. Te zaczynają się od 4 USD miesięcznie za licencję niekomercyjną (świetną do makietowania utworów dla prawdziwych raperów do pracy) do 60 USD za pełny pakiet Pro.

Średni pakiet "Creator" kosztuje 10 USD miesięcznie - idealny dla twórców treści, którzy potrzebują nowego głosu dla swoich materiałów.

Inne funkcje

Uberduck oferuje również funkcję zamiany tekstu na mowę i generowania obrazu, aplikację do zmiany głosu oraz opcję klonowania głosu, dzięki której można stworzyć oryginalny głos na podstawie pojedynczego klipu audio.

Dźwięki zaćmienia

Strona internetowa

https://eclipsedsounds.com/

Podsumowanie

Firma Eclipse Sounds z siedzibą w Stanach Zjednoczonych oferuje 4 bazy danych głosów AI, które twierdzą, że zapewniają wokale o jakości studia nagraniowego. Wadą jest to, że można ich używać tylko w Synthesizer V DAW.

Każdy model AI jest szkolony na podstawie głosu prawdziwego artysty i obejmuje wszystkie zakresy wokalne od basu do mezzo sopranu. Każdy głos ma zakres wysokości i tempa jako wytyczne do pracy i oferuje różne "tryby" - czytaj: barwy - które można mieszać i dopasowywać, aby dopasować je do stylu i gatunku swoich piosenek.

Nie będąc posiadaczem Synthesizer V nie mogłem sprawdzić, jak działają pakiety, ale wiem, że można je ustawić tak, aby śpiewały dowolny tekst (w tym dla głosu tenorowego, śpiewającego w innym języku), a występy można edytować tak, jak każdą partię MIDI w edytorze w stylu rolki fortepianu.

W oparciu o dema na ich stronie internetowej wyniki są zaskakująco skuteczne. Trudno powiedzieć, czy przełoży się to na idealny głos do twojego projektu. Ale jeśli chodzi o tworzenie tymczasowej ścieżki do wysłania do prawdziwego wokalisty do pracy, wokaliści z Eclipse mogą zmienić zasady gry.

Artyści wykorzystywani do trenowania modeli głosowych AI są opłacani z góry za swoje dane wokalne i otrzymują tantiemy od każdej sprzedanej wtyczki. Mogą również wybrać, czy chcą udostępnić swoją prawdziwą tożsamość, czy też zachować ją w tajemnicy. Mamy tu więc do czynienia z etyczną praktyką sztucznej inteligencji.

Wszystkie głosy AI dostępne za pośrednictwem Eclipse są wolne od tantiem i wymagają jedynie uznania ich za awatary w komercyjnym wydaniu.

Podobnie jak w przypadku większości pakietów próbek, nie można odsprzedawać niczego wyprodukowanego przez te modele ani używać ich do trenowania innych modeli AI.

Wycena

Każdy model głosu od Eclipse kosztuje 90 USD, z rabatami przy zakupie hurtowym. Ponownie należy pamiętać, że działają one tylko w programie Synthesizer V DAW.

Inne funkcje

Zamek błyskawiczny. Nada. Ani jednej kiełbaski.

Audimee

Strona internetowa:

audimee.com

Podsumowanie

Wydaje się, że Audimee przyciągnęło uwagę zarówno profesjonalnych twórców, jak i amatorów. Strona docelowa firmy może pochwalić się Nicky Romero, Goodboys i Hugel wśród swoich użytkowników.

Dema na stronie docelowej mówią same za siebie, z solidną reprezentacją wielu głównych gatunków. Tak, nawet fani Nickelback mogą tworzyć muzykę z wirtualnymi wokalistami rockowymi!

Aby przekonwertować własny głos na jeden z wielu dostępnych na stronie głosów royalty free, wystarczy przesłać czyste nagranie lub nagrać je bezpośrednio na stronie.

Jeśli nie jesteś świetnym wokalistą, dostępne są opcje szybkiego automatycznego dostrojenia występu lub użycia wbudowanego edytora wysokości dźwięku, aby zrobić to ręcznie.

Z nich wybierasz głos, który pasuje do Twojego klimatu. Niektóre z tych głosów są całkowicie darmowe, inne wymagają subskrypcji. Za moje pieniądze istnieje szeroki zakres stylów wokalnych i wszystkie brzmią całkiem przekonująco, nawet jeśli brakuje im pewnego je ne sais quoi. To AI dla ciebie...

Niektóre z wielu głosów oferowanych przez Audimee

Wycena

Darmowy plan pozwala uzyskać dostęp do 14 głosów AI, generować 15 minut dźwięku miesięcznie, ale bez praw do użytku komercyjnego. Poziomy subskrypcji mają rozsądne ceny 12 USD, 25 USD i 49 USD miesięcznie, przy czym wyższe poziomy oferują inne głosy i więcej godzin konwersji miesięcznie.

Inne funkcje

Witryna Audimee oferuje również użytkownikom możliwość trenowania modelu sztucznej inteligencji na własnym głosie, izolowania wokali z miksu (uważaj tutaj - jeśli użyjesz go do trenowania modelu głosu, będziesz na skalistym gruncie) i wydawania co tydzień coverów acapella do wykorzystania we własnych remiksach.

Lalals

Wygląda jak Audimee. Nie Audimee...

Strona internetowa

https://lalals.com/

Podsumowanie

Nie jestem w 100% przekonany do Lalals ze względu na a) możliwe naruszenia etyczne poprzez oferowanie dźwiękonaśladowców i b) inne funkcje, które oferują. Więcej na ten temat później.

Jednak wersje demonstracyjne ścieżek wokalnych AI, które można usłyszeć na stronie docelowej, są przekonujące, choć nieco cukierkowe.

Użytkownik może filtrować według kategorii (piosenkarz, raper, celebryta lub polityk), języka, płci i tego, czy głos AI ma reprezentować rzeczywistą osobę, czy też pochodzi z ich kolekcji unikalnych głosów.

Gdy będziesz gotowy do użycia zmieniacza głosu, po prostu przeciągnij plik audio, nagraj siebie lub wprowadź link do YouTube.

Nie ma opcji przekształcania głosu w jakikolwiek sposób, poza podstawową zmianą wysokości dźwięku w górę lub w dół, w przypadku konwersji głosu żeńskiego na męski lub odwrotnie. Wystarczy kliknąć konwertuj, a zmieniacz głosu zrobi resztę za ciebie.

Darmowa warstwa jest niewiarygodnie wolna. Szybkie przetwarzanie jest dostępne w płatnych planach, więc może jestem po prostu wybredny. Ale wciąż czekam, aż Justin Timberlake zaśpiewa Livin' On a Prayer...

Po przetworzeniu można pobrać wynikowe ścieżki wokalne w formacie MP3 lub wysokiej jakości WAV, w zależności od poziomu subskrypcji.

Wycena

Lalals można wypróbować za darmo, z limitem 15 wygenerowanych minut miesięcznie wyłącznie do użytku osobistego i niską jakością renderowania.

Płatne poziomy obejmują Basic (12 USD), Pro (24 USD) i Studio (99 USD), które obejmują więcej minut korzystania ze zmieniacza głosu, więcej głosów i licencję komercyjną.

Inne funkcje

Oprócz możliwości zmiany głosu, płatne subskrypcje Lalals obejmują opcję klonowania głosu. Możesz utworzyć tyle własnych głosów, na ile pozwala twój plan subskrypcji, i mogą one być używane do zmiany głosu lub wprowadzania tekstu.

Inną ofertą jest możliwość tworzenia muzyki za pomocą sztucznej inteligencji. Bleurgh. Nie rób tego; pozostań przy samodzielnym tworzeniu muzyki.

Inni konkurenci dla wtyczki Vocal AI

Jeśli żadna z powyższych witryn do zmiany głosu nie przypadła ci do gustu, sprawdź, czy któraś z tych witryn pobudza twoją kreatywność:

Vocalist.ai

Kits.AI

EmVoice

Revocalize

Rozważania dotyczące korzystania z głosów AI w produkcji muzycznej

Zdjęcie autorstwa Possessed Photography na Unsplash

Rozwój sztucznej inteligencji zmienia zasady gry w produkcji muzycznej.

Jako producent muzyczny, korzystanie z głosów AI lub zmieniacza głosów AI pozwala stworzyć idealny głos do utworu. Jest to niesamowite narzędzie dla twórców treści, którzy potrafią zaśpiewać melodię, ale nie są profesjonalnymi wokalistami, umożliwiając im wyczarowanie ścieżek wokalnych pasujących do tonu ich treści.

Producenci muzyczni, którzy współpracują z innymi artystami i potrzebują przewodników po ścieżkach wokalnych do pracy, mogą również skorzystać z tych aplikacji royalty free, aby zwiększyć swoją kreatywność.

Są również piekielnie przydatne do tworzenia muzyki dla zabawy.

Jednak pomimo ich przydatności podczas produkcji muzyki, ścieżki wokalne AI wiążą się z pewnym bagażem.

Po pierwsze, pomimo jakości, jaką można uzyskać z niektórych generatorów głosu wymienionych powyżej, uzyskane głosy nigdy nie dorównają mocy ani emocjom prawdziwej istoty ludzkiej śpiewającej z całym ciężarem jej emocjonalnego doświadczenia.

Kolejnym czynnikiem są zasoby. Sztuczna inteligencja jest niezwykle energochłonna, a więcej energii zużywa się na złożone generacje sztucznej inteligencji, takie jak mowa i śpiew.

Wreszcie, istnieją kwestie etyczne i prawne dotyczące tego, na jakich danych głosy zostały przeszkolone. Aplikacje mogą twierdzić, że są wolne od tantiem, ale nie zawsze oznacza to, że będziesz mógł swobodnie rozpowszechniać wynikowy utwór bez żadnych konsekwencji.

Moim zdaniem generatory głosu AI są przydatnym narzędziem dla producentów muzycznych, ale powinny być używane ostrożnie i nigdy nie powinny zastępować prawdziwego muzyka. Ale to tylko moje 2 grosze.

Jakkolwiek zdecydujesz się to zrobić, idź naprzód i twórz muzykę!

Ożyw swoje utwory dzięki profesjonalnemu masteringowi w kilka sekund!