Version: 0.1.0

Заменит художника, "упакует" кота: чем удивляет нейросеть DALL-E 2

Первую версию нейросети компания OpenAI представила в январе 2021 года.

В Сети появилась подборка классических картин, "дорисованных" с помощью нейросети DALL-E 2. Так, у Моны Лизы появились ноги, а у "Девушки с жемчужной сережкой" – целая комната. DALL-E 2 – программа, позволяющая генерировать изображения по текстовому описанию на английском языке. Впервые нейросеть была представлена в январе 2021 года, а через год вышла ее усовершенствованная версия. На что способна DALL-E 2? Рассказываем в материале РЕН ТВ

"Технологическое чудо" 

DALL-E 2 – нейросеть, способная генерировать изображения по текстовому описанию на английском языке. Первую версию нейросети компания OpenAI представила в январе 2021 года, а в апреле 2022-го появилась усовершенствованная DALL-E 2. Первые пользователи, опробовавшие нейросеть, назвали ее "технологическим чудом" – они смогли создать иллюстрации с высочайшей точностью и детализацией.

На данный момент DALL-E 2 доступна только для ограниченного количества разработчиков. Желающие могут подать заявку на закрытое тестирование программы на сайте. В дальнейшем нейросеть должны добавить в API, чтобы другие разработчики могли создавать приложения с ее использованием.

На что способна DALL-E 2

Нейросеть DALL-E 2 поддерживает несколько режимов: она может генерировать и трансформировать картинки по описанию, а также "дорисовывать" существующие изображения. Так, приложение позволяет создавать новые иллюстрации на основе существующих и делать их в духе оригинала, трансформировать одно изображение в другое по описанию, "состарить его", а при загрузке двух картинок – сгенерировать третью, которая будет сочетать элементы исходных изображений. 

Кроме того, в усовершенствованной версии появилась возможность редактировать фотографии. Так, пользователи могут добавить ирокез на голову "Джоконде", заменить собаку на фотографии котом, преобразовать дом под стиль художника-графика Маурица Эшера, трансформировать обычного поросенка в летающего, демодернизировать картину Джексона Поллока и даже "упаковать кошку".

Для того, чтобы создать изображение по текстовому описанию, необходимо предоставить нейросети исходное изображение и указать, какая иллюстрация должна получиться в конечном итоге. В ходе этого процесса DALL-E 2 создает серию промежуточных результатов: пользователь может увидеть, как проходит трансформация. Усовершенствованная версия DALL-E 2 позволяет создавать картинки в разрешении до четырех раз выше, чем первая. Иллюстрации получаются более реалистичными и детальными.

"Беспрецедентный фотореализм"

24 мая 2022 года компания Google представила собственную нейросеть Imagen. Она генерирует изображения по описанию в более высоком качестве, чем DALL-E 2. Программу разработала команда исследовательского проекта Google Brain.

Нейросеть способна распознавать текст с использованием больших языковых моделей и генерировать на основе полученных данных первое изображение размером 64х64 пикселей. После этого разрешение полотна поэтапно повышается до 256х256 и 1024х1024 точек. В компании отмечают, что нейросеть генерирует изображения по описанию с "беспрецедентным фотореализмом".

Google предложил протестировать Imagen в ограниченном технодемо, однако пока пользователи не могут сами вводить запросы. Проект находится в экспериментальной фазе, и когда компания предложит желающим воспользоваться нейросетью, пока неизвестно.