Чтобы создать короткий ролик, разработчики загрузили в нейросеть 14 часов видео, пишет Engadget. Машина изучила мимику Обамы по его еженедельным обращениям и определила позицию губ для каждого звука. Потом эти движения наклеили на другое видео. Кое-где компьютер исправлял наклон головы или положение челюсти в процессе речи, чтобы сделать изображение максимально правдоподобным
Программисты показали на видео прогресс нейросети через три минуты, час, семь и 14 часов обучения. Чем глубже программа погружалась в процесс, тем точнее передавала движения. В ролике есть шероховатости: иногда у Обамы появляется второй подбородок, а когда он произносит межзубный “th”, картинка не передает естественного движения языка.
Нейросети уже научились сочинять стихи в стиле Nirvana и твиты в стиле Рамзана Кадырова, писать сценарии, музыку и фанфики про Гарри Поттера. Программа Face2Face позволяет совмещать на видео мимику и речь одного человека с телом другого. Технологии открывают дорогу фейковым новостям — вероятно, в будущем нам потребуются специальные приложения, чтобы отличать фальшивки от подлинных материалов.
Комментарии (0)