Штучний вокал: 5 найкращих вокальних AI-плагінів у 2024 році

Штучний вокал: 5 найкращих вокальних AI-плагінів у 2024 році Штучний вокал: 5 найкращих вокальних AI-плагінів у 2024 році

Подобається вам це чи ні, але штучний інтелект нікуди не дінеться. Відтоді, як у 2022 році на сцені з'явився ChatGPT, штучний інтелект стає дедалі більшою частиною нашого повсякденного життя, і музика не є винятком.

У той час як музичний продакшн зі штучним інтелектом вже давно існує завдяки таким сервісам, як eMastered, генератори голосу зі штучним інтелектом з'явилися відносно недавно. З кожним днем їх з'являється все більше, тому може бути складно визначити, який з них створить ідеальний голос для ваших пісень.

Ми в eMastered хочемо бути корисними, тому ми склали цей список з 5 найкращих плагінів для штучного інтелекту вокалу, доступних прямо зараз.

Готові? Поїхали!

Що таке плагіни для штучного вокалу?

У цій статті ми розглядаємо вокальні плагіни зі штучним інтелектом як будь-яке програмне забезпечення, плагін або хмарне, яке створює або маніпулює вокальними записами.

Деякі з них генерують вокальні доріжки самостійно. Інші використовують програмне забезпечення для зміни голосу, щоб скоригувати вокальну ідентичність запису.

Чи легальний штучний вокал?

З точки зору законності використання голосів штучного інтелекту, це буквально дикий захід. Ця плутанина пов'язана з матеріалом, на якому навчається технологія штучного інтелекту, і з тим, чи давали артисти, чиї голоси увійшли до навчальної моделі, згоду на таке використання.

Суть в тому, що якщо ви використовуєте ШІ для імітації голосу знаменитостей і робите його загальнодоступним, ви можете опинитися в гарячій точці.

Краще залиште ті кумедні треки Еда Ширана, які ви записали, між собою і своїми друзями.

5 найкращих голосових плагінів для штучного інтелекту

Elf Tech

Веб-сайт

https://elf.tech/

The Low Down

Elf.Tech - це генератор голосу зі штучним інтелектом, який має лише одну голосову модель - Граймса.

Запущене у 2023 році, програмне забезпечення з відкритим вихідним кодом було розроблене, щоб зробити соковитий голос Граймса доступним для творців і музикантів для використання у власній музиці.

Як і в багатьох інших плагінах, перелічених у цій статті, принцип роботи простий: завантажте вокальне виконання (або ваш власний голос, або голос того, хто дав на це дозвіл), і ви отримаєте його назад, перетвореним на характерний голос Граймса.

Ви не маєте великого контролю над тим, як ви можете маніпулювати голосом, але, з іншого боку, навіщо вам зв'язуватися з Граймсом?

Це обмежує, так. Але перевага цього сайту в тому, що ви маєте повний дозвіл від виконавиці випустити вашу пісню на комерційній основі, в обмін на 50% від роялті за майстер-запис.

Це, ймовірно, означає, що ви можете зберегти 100% частки автора, хоча я вважаю, що є ще деякі питання, коли справа доходить до випуску на стрімінгових сервісах, над якими працює її юридична команда. Якщо ви любите синхронізовану музику, то ви в шоколаді.

Ціноутворення

Elf Tech є абсолютно безкоштовним у використанні. Недоліком є те, що після створення облікового запису немає (очевидного) способу вийти з нього або видалити свій обліковий запис.

Інші функції

Сайт Elf.Tech також пропонує послугу дистрибуції та доступ до стебел Miss Anthropocene для реміксу.

Uberduck

Веб-сайт

https://www.uberduck.ai/

The Low Down

Пам'ятаєте фейкову пісню Дрейка кілька років тому? Вона породила купу схожих треків, які використовували голосові моделі штучного інтелекту для імітації інших артистів.

Одним із веб-сайтів, який зробив усе це можливим, був Uberduck, додаток для перетворення тексту на мову, який також дозволяв користувачам створювати реп-вокал за допомогою голосів штучного інтелекту, схожих на голоси ваших улюблених виконавців - Каньє Вест, Дрейк та багато інших були серед користувацьких голосів.

Однак веселощі були недовгими, оскільки артисти справедливо виступили проти використання їхніх унікальних голосів без дозволу.

Однак Uberduck все ще живе, і ви можете використовувати його опцію "реп" для створення розмовного вокалу для своїх творчих проектів.

У вас є можливість використовувати готовий біт (не дуже добре), створити вокальну акапелу або завантажити новий біт для репу (тільки платна версія).

Введіть свій власний текст (або скористайтеся ШІ-генератором текстів Uberduck на основі вашого запиту), після чого вам буде запропоновано вибрати репера.

На вибір лише 4 варіанти: чоловік і жінка англійською та іспанською мовами.

Немає можливості змінювати голоси, і хоча результат, можливо, не очолив чарти, це, безумовно, краще, ніж будь-яка спроба, яку я міг би зробити. Безумовно, досить добре для того, щоб побачити, як формується біт в контексті вокальної лінії.

Ціноутворення

Хоча на Uberduck є пробна версія, для того, щоб користуватися сервісом по-справжньому, вам знадобиться підписка. Вона починається від $4 на місяць за некомерційну ліцензію (чудово підходить для макетів треків для справжніх реперів) до $60 за повноцінний Pro-пакет.

Середній пакет "Творець" коштує $10 на місяць - ідеально підходить для творців контенту, які потребують нового голосу для своїх матеріалів.

Інші функції

Uberduck також пропонує перетворення тексту на мову та генерацію зображень, додаток для зміни голосу, а також опцію клонування голосу, за допомогою якої ви можете створити оригінальний голос на основі одного аудіокліпу.

Звуки затемнення

Веб-сайт

https://eclipsedsounds.com/

The Low Down

Компанія Eclipse Sounds, що базується в США, пропонує 4 бази даних голосів зі штучним інтелектом, які стверджують, що забезпечать вокал студійної якості для вашого треку. Недоліком є те, що їх можна використовувати тільки в DAW Synthesizer V.

Кожна модель штучного інтелекту навчається на голосі реального виконавця і охоплює всі вокальні діапазони від баса до меццо-сопрано. Кожен голос має діапазон висоти і темпу як орієнтир для роботи, а також різні "режими" - читай: тембри - які ви можете змішувати і підбирати відповідно до стилю і жанру ваших пісень.

Не будучи власником Synthesizer V, я не міг перевірити, як працюють пакети, але я знаю, що ви можете змусити їх співати будь-який текст, який ви хочете (в тому числі для тенорового голосу, який співає іншою мовою), і що виконання можна редагувати так само, як будь-яку MIDI-партію в редакторі фортепіанних партій.

Судячи з демо-версій на їхньому сайті, результати є напрочуд ефективними. Важко сказати, чи перетвориться це на ідеальний голос для вашого проекту. Але з точки зору створення тимчасового треку, який можна надіслати вашому реальному вокалісту для роботи, вокалісти з Eclipse можуть змінити правила гри.

Артисти, які навчають голосові моделі ШІ, отримують аванс за свої вокальні дані та роялті за кожен проданий плагін. Вони також можуть обирати, чи ділитися своєю справжньою ідентичністю, чи залишати її в таємниці. Таким чином, ми маємо справу з етичною практикою ШІ.

Усі голоси ШІ, доступні в Eclipse, не потребують авторських відрахувань, і їх потрібно лише вказати як аватар у комерційному релізі.

Як і у випадку з більшістю пакетів зразків, ви не можете перепродати нічого з того, що було створено цими моделями, або використовувати їх для навчання інших ШІ-моделей.

Ціноутворення

Кожна модель голосу від Eclipse коштує $90, зі знижками при покупці оптом. Знову ж таки, зверніть увагу, що вони працюють тільки всередині Synthesizer V DAW.

Інші функції

Блискавка. Нічого. Не сосиска.

Audimee

Веб-сайт:

audimee.com

The Lowdown

Audimee, схоже, привернула увагу як професійних творців, так і аматорів-аматорів. Цільова сторінка компанії може похвалитися Нікі Ромеро, Goodboys та Hugel серед своїх користувачів.

Демо-версії на цільовій сторінці говорять самі за себе, з солідним представництвом багатьох мейнстрімних жанрів. Так, навіть фанати Nickelback можуть створювати музику з віртуальними рок-вокалістами!

Щоб перетворити свій голос на один з багатьох безкоштовних голосів, доступних на сайті, просто завантажте чистий вокальний дубль або запишіть його безпосередньо на сайті.

Якщо ви не дуже добре співаєте, ви можете швидко автоналаштувати своє виконання або скористатися вбудованим редактором висоти тону, щоб зробити це вручну.

З них ви обираєте голос, який відповідає вашій атмосфері. Деякі з цих голосів можна використовувати абсолютно безкоштовно, інші вимагають підписки. Як на мене, є широкий вибір вокальних стилів, і всі вони звучать досить переконливо, навіть якщо їм не вистачає певного je ne sais quoi. Це ШІ для вас...

Деякі з багатьох голосів, що пропонуються на Audimee

Ціноутворення

Безкоштовний план дозволяє отримати доступ до 14 голосів ШІ, генерувати 15 хвилин аудіо на місяць, але без права комерційного використання. Рівні підписки коштують $12, $25 і $49 на місяць, причому вищі рівні пропонують інші голоси та більше годин конвертації на місяць.

Інші функції

Сайт Audimee також пропонує користувачам можливість тренувати ШІ-модель на власному голосі, виокремлювати вокал з міксу (обережно - якщо ви використовуєте його для тренування голосової моделі, ви опинитеся на кам'янистому ґрунті) і щотижня випускати кавери акапельно, щоб використовувати їх у власних реміксах.

Лалалс

Схоже на Audimee. Не Audimee...

Веб-сайт

https://lalals.com/

The Low Down

Я не на 100% довіряю Lalals через а) можливе порушення етики через пропозицію саундлайків, і б) інші можливості, які вони пропонують. Більше про це пізніше.

Втім, демо-версії вокальних треків ШІ, які ви чуєте на лендінгу, переконливі, хоча й трохи солодкуваті.

Користувач може фільтрувати за категорією (співак, репер, знаменитість чи політик), мовою, статтю, а також за тим, чи є голос штучного інтелекту реальною людиною, чи він взятий з колекції унікальних голосів.

Коли ви будете готові скористатися диктофоном, просто перетягніть аудіофайл, запишіть себе або введіть посилання на YouTube.

Не існує жодної можливості трансформувати голос, окрім базової зміни висоти тону, щоб перетворити жіночий голос на чоловічий або навпаки. Просто натисніть на кнопку "Перетворити", і конвертер зробить все інше за вас.

Безкоштовний рівень неймовірно повільний. Висока швидкість обробки доступна в платних планах, тому, можливо, я просто прискіпливий. Але я все ще чекаю, коли Джастін Тімберлейк заспіває Livin' On a Prayer...

Після обробки ви можете завантажити отримані вокальні доріжки у форматі MP3 або WAV високої якості, залежно від рівня підписки.

Ціноутворення

З Lalals ви можете спробувати безкоштовно, з обмеженням 15 згенерованих хвилин на місяць для особистого користування і низькою якістю рендерингу.

Платні рівні включають Basic ($12), Pro ($24) і Studio ($99), які включають більше хвилин використання диктофона, більше голосів і комерційну ліцензію.

Інші функції

На додаток до можливостей зміни голосу, платні підписки Lalals включають можливість клонування голосу. Ви можете створити стільки власних голосів, скільки дозволяє ваш план підписки, і використовувати їх для зміни голосу або озвучування текстового введення.

Інша пропозиція - можливість створювати музику за допомогою штучного інтелекту. Бляха. Не робіть цього, краще створюйте музику самі.

Інші учасники конкурсу плагінів для вокального штучного інтелекту

Якщо жоден з перерахованих вище сайтів для зміни голосу вам не підходить, подивіться, може, якийсь із цих сайтів розпалить вашу творчу фантазію:

Vocalist.ai

Kits.AI

EmVoice

Ревокалізувати

Що потрібно враховувати при використанні AI-голосів для музичного продакшну

Фото Possessed Photography на Unsplash

Поява штучного інтелекту змінює правила гри у сфері музичного продакшну.

Як музичний продюсер, ви можете створити ідеальний голос для своєї пісні за допомогою ШІ-голосів або ШІ-чейнджера. Це неймовірний інструмент для творців контенту, які вміють співати, але не є професійними вокалістами, що дозволяє їм створювати вокальні доріжки, які відповідають тональності їхнього контенту.

Музичні продюсери, які співпрацюють з іншими артистами і потребують вокальних доріжок для роботи, також можуть скористатися цими безкоштовними додатками, щоб стимулювати свою творчість.

Вони також дуже корисні для створення музики просто для задоволення.

Але, незважаючи на їхню корисність при створенні музики, вокальні доріжки зі штучним інтелектом мають певний багаж.

Почнемо з того, що, незважаючи на якість, яку ви можете отримати від деяких з перерахованих вище генераторів голосу, отримані голоси ніколи не зрівняються з силою або емоціями реальної людини, яка співає з усією вагою свого емоційного досвіду за плечима.

Ресурси - ще один фактор. ШІ неймовірно енергоємний, причому більше енергії витрачається на складні генерації ШІ, такі як мова та спів.

Нарешті, існують етичні та юридичні міркування щодо того, на яких даних були навчені голоси. Додатки можуть заявляти, що вони не вимагають авторської винагороди, але це не завжди означає, що ви зможете вільно розповсюджувати отриману пісню без жодних наслідків.

Як на мене, ШІ-генератори голосу - корисний інструмент для музичних продюсерів, але використовувати його слід з обережністю і ніколи не замінювати справжнього музиканта. Але це лише мої 2 копійки.

Як би ви не вирішили це зробити, йдіть вперед і створюйте музику!

Оживіть свої пісні за допомогою мастерингу професійної якості за лічені секунди!