Копируем и воспроизводим голос другого человека: ультимативный гайд по DeepFake Voice

Копируем и воспроизводим голос другого человека: ультимативный гайд по DeepFake VoiceПриветствую, дамы и господа, любители технологий и экспериментов! Сегодня у нас в гостях скучный Павел, который расскажет нам, как с помощью нейронной сети можно скопировать и воспроизвести голос любого человека. Да-да, вы не ослышались! Теперь каждый из вас может стать имитатором звезд или просто разыграть друзей до слёз.

Начнем, пожалуй, с самого начала — подготовки данных. Чтобы успешно скопировать голос нужного человека, нам понадобится датасет с его речью. Не знаете, откуда взять такие данные? Ну что ж, аудиокниги, подкасты или даже видеоигры могут послужить отличным материалом для создания «клонов» голосовых характеристик. А вот я выбрал для эксперимента голос главного редактора IXBT.Games Виталия Казунова — надеюсь, он не обидится!

Представляю вам шаг номер один: скачиваем видеоролик и открываем его в удобном видеоредакторе. Мой фаворит — Shotcut. Просматриваем содержимое и убеждаемся, что там нет посторонних шумов или «невошедших» голосов. Если что-то нашли — удаляем и конвертируем запись в формат wav или mp3. Создаем папку Dataset на диске С: и переносим туда нашу запись. Готово!

Перейдем к следующему этапу — установке и обучению нейросети. Скачиваем портативную версию софта (спасибо Ba1yya за перевод!) и распаковываем её. Запускаем программу через go-web.bat и погружаемся в мир обработки данных. Задаем параметры модели, выбираем алгоритм копирования тона и запускаем обучение. А потом…ждем. Иногда очень долго.

А теперь самое интересное — использование полученной модели! Можно заставить вашего друга спеть «Мурку» или озвучить свой любимый мультфильм. Вариантов полно! Например, заставим Виталия Казунова исполнить «Ведьмаку заплатите чеканной монетой». Как? Просто найдите песню в интернете, отделите вокал от инструментала (поможет бесплатная программа), замените голос и… радуйтесь результату!

Надоели шутки про записанный голос? Тогда предлагаю шутить онлайн! Заменим свой голос прямо при разговоре через микрофон. Установите Virtual Audio Cable (VAC), выберите алгоритм обработки голоса и добавьте профиль обученной модели. Развлекайтесь на здоровье! Ничто так не поднимает настроение как общение со звездами или собственными «клоунами».

И вот мы подходим к заключению этого безумного эксперимента! Друзья мои, будущее уже здесь — возможность копирования чужих голосов лежит прямо у вас под рукой (если вы следуете инструкции). Нейросети — это всего лишь инструмент, а как им пользоваться — решать только вам! Уважайте свободу слова, цените юмор и не бойтесь быть оригинальными.

С вами был Павел — ваш проводник в мир безграничных возможностей технологий! До новых встреч!

Комментарии 0