Нравится вам это или нет, но искусственный интеллект никуда не денется. С тех пор как ChatGPT впервые вышел на сцену в 2022 году, ИИ становится все более важной частью нашей повседневной жизни, и музыка не является исключением.
В то время как музыкальное производство с помощью искусственного интеллекта уже давно существует благодаря таким сервисам, как eMastered, генераторы голоса с помощью искусственного интеллекта появились относительно недавно. С каждым днем их появляется все больше, поэтому бывает непросто понять, какой из них создаст идеальный голос для ваших песен.
Мы в eMastered любим быть полезными, поэтому составили список из 5 лучших плагинов вокального ИИ, доступных на данный момент.
Готовы? Поехали!
Что такое вокальные плагины AI?
В рамках этой статьи мы рассматриваем вокальные плагины AI как любое программное обеспечение, плагин или облако, которое создает или манипулирует вокальными записями.
Некоторые из них сами генерируют вокальные дорожки. Другие используют программы для изменения голоса, чтобы скорректировать вокальную индивидуальность записи.
Легальны ли вокальные партии искусственного интеллекта?
С точки зрения юридических аспектов, связанных с голосами ИИ, это буквально дикий запад. Эта путаница связана с тем, на каком материале обучается технология искусственного интеллекта, и дали ли артисты, чьи голоса были использованы в обучающей модели, согласие на такое использование.
В итоге, если вы используете искусственный интеллект для имитации голоса знаменитости и выкладываете его в открытый доступ, вы можете оказаться в горячей воде.
Лучше оставьте эти забавные треки Эда Ширана между собой и своими друзьями.
5 лучших плагинов для искусственного голоса
Эльфийская техника
Сайт
Низкий уровень
Elf.Tech - это генератор голоса ИИ, который имеет только одну модель голоса - Граймса.
Запущенное в 2023 году программное обеспечение с открытым исходным кодом было разработано для того, чтобы сделать сочный голос Граймс доступным для творцов и музыкантов для использования в их собственной музыке.
Как и многие другие плагины, перечисленные в этой статье, принцип работы прост: загрузите вокальное исполнение (свое или кого-то, кто дал на это разрешение), и вы получите его обратно, преобразованным в характерный голос Граймса.
Не так уж много возможностей для управления голосом, но, опять же, зачем вам возиться с Граймсом?
Это ограничение, да. Но прелесть этого сайта в том, что у вас есть полное разрешение от исполнительницы на коммерческий выпуск вашей песни в обмен на 50 % отчислений за мастер-запись.
Предположительно, это означает, что вы получаете 100% авторских отчислений, хотя я полагаю, что еще есть некоторые проблемы с выпуском на потоковых сервисах, которые решает ее юридическая команда. Однако если вы любите синхронную музыку, вы в выигрыше.
Ценообразование
Elf Tech совершенно бесплатен для использования. Недостатком является то, что после создания учетной записи нет никакого (очевидного) способа выйти из нее или удалить свой аккаунт.
Другие особенности
Сайт Elf.Tech также предлагает услуги по распространению и доступ к стебам Miss Anthropocene для создания ремиксов.
Uberduck
Сайт
Низкий уровень
Помните ту фальшивую песню Дрейка пару лет назад? Она породила кучу похожих треков, в которых использовались голосовые модели ИИ для подражания другим исполнителям.
Один из сайтов, который сделал все это возможным, - Uberduck, приложение для преобразования текста в речь, которое также позволяет пользователям создавать рэп-вокал с помощью голосов искусственного интеллекта, которые звучат как ваш любимый артист - Канье Уэст, Дрейк и многие другие были среди пользовательских голосов, которые можно использовать.
Однако веселье было недолгим, поскольку артисты справедливо выступили против использования их уникальных голосов без разрешения.
Однако Uberduck продолжает жить, и вы можете использовать его опцию "Рэп", чтобы генерировать вокал для ваших творческих проектов.
У вас есть возможность использовать готовый бит (не очень хорошо), создать вокал акапельно или загрузить новый бит для рэпа (только в платной версии).
Введите свой текст (или воспользуйтесь генератором текстов Uberduck, созданным искусственным интеллектом на основе вашей подсказки), после чего вам будет предложено выбрать рэпера.
На выбор предлагается всего 4 варианта: мужской и женский на английском и испанском языках.
Здесь нет возможности изменить голоса, и хотя результат, возможно, не является материалом для хит-парада, он определенно лучше, чем любая попытка, которую я мог бы сделать. Конечно, он достаточно хорош для того, чтобы посмотреть, как формируется ритм в контексте с вокальной линией.
Ценообразование
Хотя в Uberduck есть возможность попробовать бесплатно, для получения реальной пользы от него вам понадобится подписка. Стоимость подписки начинается от 4 долларов в месяц за некоммерческую лицензию (отлично подходит для создания треков для настоящих рэперов) до 60 долларов за полноценный пакет Pro.
Средний пакет "Creator" стоит 10 долларов в месяц - идеальный вариант для создателей контента, которым нужен новый голос для своих материалов.
Другие особенности
Uberduck также предлагает функцию преобразования текста в речь, генерацию изображений, приложение для изменения голоса, а также функцию клонирования голоса, позволяющую создать оригинальный голос на основе одного аудиоклипа.
Звуки затмения
Сайт
Низкий уровень
Компания Eclipse Sounds, базирующаяся в США, предлагает 4 базы голосов AI, которые, как утверждается, обеспечивают студийное качество записи вокала для вашего трека. Недостатком является то, что их можно использовать только в DAW Synthesizer V.
Каждая модель искусственного интеллекта обучена на основе голоса реального исполнителя и охватывает все вокальные диапазоны - от баса до меццо-сопрано. Каждый голос поставляется с диапазоном высоты тона и темпа в качестве ориентиров для работы, а также имеет различные "режимы" - читай, тембры - которые вы можете смешивать и сочетать, чтобы соответствовать стилю и жанру ваших песен.
Не будучи владельцем Synthesizer V, я не смог проверить, как работают пакеты, но я знаю, что вы можете заставить их петь любую лирику, какую захотите (в том числе для тенорового голоса - петь на другом языке), и что выступления можно редактировать, как любую MIDI-партию, в редакторе в стиле piano roll.
Судя по демонстрационным роликам на их сайте, результаты удивительно эффективны. Будет ли это идеальным голосом для вашего проекта, сказать сложно. Но в плане создания временного трека, который можно отправить реальному вокалисту для работы, певцы из Eclipse могут стать отличным решением.
Артисты, используемые для обучения голосовых моделей искусственного интеллекта, получают аванс за свои вокальные данные и роялти с каждого проданного плагина. Они также могут выбирать, сообщать ли им свою настоящую личность или держать ее в секрете. Таким образом, здесь имеет место этическая практика ИИ.
Все голоса ИИ, доступные через Eclipse, бесплатны, и их нужно только указать в качестве Аватара в коммерческом релизе.
Как и в случае с большинством пакетов образцов, вы не сможете перепродать что-либо, созданное этими моделями, или использовать их для обучения других моделей ИИ.
Ценообразование
Каждая модель голоса от Eclipse поставляется по цене $90, при покупке оптом предоставляются скидки. Опять же, обратите внимание, что они работают только в DAW Synthesizer V.
Другие особенности
Молния. Ни-че-го. Ни одной сосиски.
Audimee
Веб-сайт:
Низкий уровень
Audimee, похоже, привлекла внимание как профессиональных творцов, так и любителей. На целевой странице компании можно найти Ники Ромеро, Goodboys и Hugel.
Демо-версии на целевой странице говорят сами за себя: в них представлены многие основные жанры. Да, даже фанаты Nickelback могут создавать музыку с виртуальными рок-вокалистами!
Чтобы преобразовать свой собственный голос в один из множества бесплатных голосов, доступных на сайте, достаточно загрузить чистый вокальный дубль или запись прямо на сайт.
Если вы не очень хорошо поете, есть возможность быстро автонастроить ваше исполнение или воспользоваться встроенным редактором питча, чтобы сделать это вручную.
Из них вы выбираете голос, который соответствует вашей атмосфере. Некоторые из этих голосов можно использовать совершенно бесплатно, другие требуют подписки. На мой взгляд, здесь представлен широкий выбор вокальных стилей, и все они звучат довольно убедительно, даже если им не хватает определенного je ne sais quoi. Это AI для вас...
Ценообразование
Бесплатный тарифный план дает доступ к 14 голосам ИИ, позволяет генерировать 15 минут аудио в месяц, но не дает права на коммерческое использование. Уровни подписки имеют разумные цены - 12, 25 и 49 долларов в месяц, причем более высокие уровни предлагают другие голоса и больше часов конвертации в месяц.
Другие особенности
Сайт Audimee также предлагает пользователям возможность тренировать модель искусственного интеллекта на собственном голосе, выделять вокал из микса (будьте осторожны - если вы используете его для тренировки модели голоса, вы окажетесь на каменистой почве), а также выпускать акапельные каверы каждую неделю, чтобы использовать их в собственных ремиксах.
Лалалс
Сайт
Низкий уровень
Я не на 100% согласен с Lalals из-за а) возможных этических нарушений при предложении звуковых аналогов и б) других возможностей, которые они предлагают. Подробнее об этом позже.
Однако демо-версии вокальных треков AI, которые вы слышите на целевой странице, выглядят убедительно, хотя и немного приторно.
Пользователь может отфильтровать голос по категории (певец, рэпер, знаменитость или политик), языку, полу, а также по тому, является ли голос ИИ представителем реального человека или взят из коллекции уникальных голосов.
Чтобы воспользоваться функцией изменения голоса, просто перетащите аудиофайл, запишите себя или введите ссылку на YouTube.
Нет никакой возможности как-то трансформировать голос, кроме базового повышения или понижения высоты тона, для преобразования женского голоса в мужской или наоборот. Просто нажмите на кнопку convert, и программа для изменения голоса сделает все остальное за вас.
Бесплатный уровень невероятно медленный. Высокая скорость обработки доступна на платных тарифных планах, так что, возможно, я просто придираюсь. Но я все еще жду, когда Джастин Тимберлейк споет Livin' On a Prayer...
После обработки вы можете скачать вокальные треки в формате MP3 или WAV высокого качества, в зависимости от уровня вашей подписки.
Ценообразование
Lalals можно попробовать бесплатно, с ограничением в 15 сгенерированных минут в месяц только для личного использования и низким качеством рендеринга.
Платные уровни включают в себя Basic (12 долларов), Pro (24 доллара) и Studio (99 долларов), которые включают в себя больше минут использования программы смены голоса, больше голосов и коммерческую лицензию.
Другие особенности
В дополнение к возможности изменения голоса в платных подписках Lalals есть возможность клонировать голос. Вы можете создать столько собственных голосов, сколько позволяет ваш тарифный план, и использовать их для изменения голоса или ввода текста.
Другое предложение - возможность создавать музыку с помощью искусственного интеллекта. Блеск. Не делайте этого; займитесь созданием музыки самостоятельно.
Другие претенденты на звание плагина вокального искусственного интеллекта
Если ни один из вышеперечисленных сайтов для изменения голоса не подходит вам по вкусу, посмотрите, не зажжет ли какой-нибудь из этих сайтов ваш творческий потенциал:
Рекомендации по использованию голосов искусственного интеллекта для создания музыки
Возникновение искусственного интеллекта изменит ситуацию с производством музыки.
Как музыкальный продюсер, использование ИИ-голосов или ИИ-голосозаменителя позволяет создать идеальный голос для вашей песни. Это невероятный инструмент для создателей контента, которые могут напеть мелодию, но не являются профессиональными вокалистами, позволяя им создавать вокальные композиции, соответствующие тону их контента.
Музыкальные продюсеры, которые сотрудничают с другими артистами и нуждаются в вокальных треках для работы, также могут воспользоваться этими бесплатными приложениями, чтобы повысить свой творческий потенциал.
Они также очень полезны для создания музыки просто для удовольствия.
Но, несмотря на свою полезность при создании музыки, вокальные дорожки AI несут в себе определенный багаж.
Для начала, несмотря на качество, которое вы можете получить от некоторых генераторов голоса, перечисленных выше, полученные голоса никогда не сравнятся с мощью или эмоциями настоящего человека, поющего со всей тяжестью своего эмоционального опыта.
Еще одним фактором являются ресурсы. ИИ невероятно требователен к мощности, причем больше энергии расходуется на сложные порождения ИИ, такие как речь и пение.
Наконец, есть этические и юридические аспекты, связанные с тем, на каких данных были обучены голоса. Приложения могут заявлять о том, что они свободны от авторских прав, но это не всегда означает, что вы сможете свободно распространять получившуюся песню без каких-либо последствий.
На мой взгляд, генераторы голоса AI - полезный инструмент для музыкальных продюсеров, но использовать его нужно с осторожностью и никогда не заменять им настоящего музыканта. Но это только мои 2 цента.
Как бы вы ни решили это сделать, идите вперед и создавайте музыку!