Нейросеть научили создавать картинки по описаниям. Кажется, она черпает чистый ужас из глубин подсознания
Нейросеть AttnGAN, которая тренируется создавать изображения на основе словесных описаний, довольно быстро перешла к методам абстрактного экпрессионизма. Теперь на просьбу нарисовать человека или кота искусственный интеллект выдаёт жутковатые картины, которым самое место в музеях современного искусства. Найти там искомый объект порой бывает непросто. Мы потестили странную нейросеть, и вы тоже можете это сделать.
О новом искусственном интеллекте, который на основе базового алгоритма сам учится создавать изображения, пишет блог Motherboard. Программа под названием AttnGAN по замыслу должна считывать текстовые описания, <<обращать внимание>> на важные детали и, используя базовый набор фотографий, создавать уникальные изображения, но уже с поправкой на детали.
В пример авторы программы, статья о которой опубликована на arXiv.org, приводят такой текст:
Это красная с белым птица, и у неё очень короткий клюв.
В результате после обработки исходных изображений по алгоритмам с несколькими циклами должна получиться реалистичная картинка несуществующей в реальности, но <<похожей>> на настоящую птицы. Выглядит это так:
Программу создала команда из Центра глубинного машинного обучения Microsoft. Идея в том, чтобы научить машину, во-первых, правильно оценивать важность тех или иных слов в описании и правильно находить те участки изображения, к которым они относятся. Название программы расшифровывается как Attentional Generative Adversarial Network, что можно перевести как <<созидательная сеть, работающая на принципах конкуренции и внимания>>.
Например, словосочетание <<красная с белым>> означает, что в оперении птицы намного больше красного, а белым должно быть только какое-то пятно. Также программа должна правильно отнести слова <<очень короткий>> именно к клюву, распознать, где у птицы клюв, сделать его коротким и при этом создать изображение, образ которого не выходит за рамки реализма.
Сеть обучали на изображениях птиц, и с птицами она справляется неплохо, но, когда дело дошло до других объектов, стало немного хуже. По правде говоря, стало очень плохо. Даже немного страшновато.
<<Красивая женщина с длинными волосами и улыбкой на лице>> (искусственный интеллект, фоторедактор, 2018).
Видно, что программа использовала изображения женщин и явно оперировала понятия <<волосы>>, <<красивый>>, <<улыбка>>, <<лицо>>. Но с вниманием, конкуренцией и их применением что-то пошло не так.
<<Робот, который хочет убить всех людей>>.
Ну хорошо. А если дать нейросети задачу попроще? Без эпитетов и описаний. Журналисты попросили нейросеть просто нарисовать кота.
Программа не справилась с заданием. Судя по всему, в процессе обучения что-то в нейросети пошло не туда, и теперь выдать обычное изображение обычного объекта она не в состоянии.
Мы тоже немного потестили нейросеть AttnGAN с помощью демо, выложенного в сеть и открытого для публики. Результаты, когда к ним привыкаешь, уже не пугают. Но кажется, что эти изображения вполне могли бы претендовать на место в коллекциях Музея современного искусства в Нью-Йорке или хотя бы в частных галереях поклонников абстрактной живописи.
<<Большие белые грибы в лесу>>.
<<Дождливый день>>.
<<Новостник за ноутбуком>>.
Недавно мы писали о нейросети, которая умеет видеть людей даже сквозь стены. Искусственный интеллект опирается на радиоволны, которые отражаются от человеческого тела. Технология поможет распознавать преступников, несмотря на маски и темноту. Но и добропорядочные граждане не скроются от её внимательного взгляда.
Тем временем пользователи Reddit уже вовсю используют нейросети, работающие с изображениями, по прямому назначению. Теперь есть программа, с помощью которой несложно делать фейковые порноролики с голливудскими знаменитостями. Порносессия с Галь Гадот или Мэйси Уильямс? Без проблем. Теперь свои фантазии может воплотить любой. Вот только актрисы из настоящего порно очень недовольны новой технологией — так же, как в своё время луддиты были против машин.