Запах тостов вместо напалма. Программисты заменили слова людей на видео так, что заметить подвох невозможно

Ксения Шлёнская Ксения Шлёнская

Эксперты по машинному обучению провели эксперимент, в ходе которого изменили речь людей на видео. Поддельные отрывки создала программа компании Adobe, а героям оригинальных роликов не пришлось произносить новые фразы. Похоже, это плохая новость для знаменитостей и хорошая для мошенников.

Исследовательская группа экспертов по машинному обучению из Стэнфордского и Принстонского университетов совместно со специалистами компании Adobe сделала шаг в мрачное будущее и научилась заменять слова людей в видео так, что зрителям сложно заметить разницу.

Опасный эксперимент получил скучное название <<Основанное на тексте редактирование видео с говорящими головами>>. Его результаты были опубликованы на сайте проекта, а в скором времени будут представлены на научной конференции SIGGRAPH.

В рамках опыта исследователи проанализировали видео с говорящими людьми и изолировали фонемы — мельчайшие единицы звука в речи подопытных. В то же время учёные при помощи программ сканировали лица говорящих, мимику и движения губ, а затем создавали их 3D-модели.

Далее дело было за малым: программы разделяли звуки и движения, а после соединяли их в соответствии с новой фразой. Так, девушка, говорившая фразу <<О Romeo, Romeo! Where fore art thou Romeo?>>, сказала <<О Romeo, Romeo! Why are you Romeo?>>

Другой подопытный произнёс перед камерой знаменитую фразу из фильма Фрэнсиса Копполы <<Апокалипсис сегодня>>: <<Я люблю запах напалма поутру>>. После обработки его речь изменилась на <<Я люблю запах французских тостов поутру>>. Ни один из испытуемых не записывал видео со вторым вариантом фразы — его создала программа.

Помимо прочего, специалисты смогли удалить слова из речи говоривших, а также создать компиляции из нескольких отрывков записи. В каждом из случаев итоговое видео выглядело оригинальным роликом. Посмотреть демонстрацию результатов эксперимента можно здесь.

Чтобы отредактированный эпизод сливался с остальным видео, учёные использовали VoCo — программное обеспечение для редактирования голоса, которое компания Adobe представила в 2016 году. Если вы будете внимательно следить за движениями героя в поддельном ролике, то сможете найти подмену. Однако, не зная о подвохе, вы вряд ли заметите несоответствия.

В отчёте о результатах эксперимента исследователи вспомнили об этической части проекта. Любой пользователь компьютера сможет повторить действия экспертов и отредактировать видео по своему желанию. Это не может не волновать специалистов.

Мы признаём, что плохие люди могут использовать данные технологии для фальсификации публичных заявлений и клеветы на известных людей. Мы обеспокоены возможностью обмана и злоупотребления.

Технологии монтажа видео доступны давно, так что не стоит ругать учёных за привлечение излишнего внимания к опыту. По мнению специалистов, своей работой они смогут повысить осведомлённость людей о методах редактирования записей и мотивировать зрителей скептически относиться к тому, что они видят.

Несмотря на потенциальные угрозы, людям не стоит бояться новых технологий. Программистка показала, что искусственный интеллект тоже может стареть и сходить с ума. Для этого ему достаточно забыть всё об окружающем мире.

Современные люди, наоборот, показывают чудеса умственного развития. Канадский турист приехал во Францию и смог открыть таинственный сейф, который у местных жителей не получалось взломать 40 лет. Не зря старался, ведь он спас музей от закрытия.