Нейросеть научили создавать картинки из текста — и она блестяще справляется!

Исследователи в области искусственного интеллекта из OpenAI создали нейросеть DALL-E, которая генерирует реалистичные изображения по простенькому текстовому описанию. 

Название DALL-E выбрано не случайно — оно отсылает к имени художника Сальвадора Дали и роботу WALL-E из одноименного мультфильма студии Pixar. Алгоритм основан на самой сложной языковой модели GPT-3 с 12 миллиардами параметров и обучен генерировать изображения из текстовых описаний на английском языке на парах текст-картинка.

Нейросеть умеет создавать изображения одежды, интерьера, мебели, еды и животных. Теоретически, она способна гененировать образы чего угодно с нуля. Вот несколько примеров:

Кресло в форме авокадо

Эмодзи пингвиненка, одетого в голубую шапку, красные перчатки, зеленую футболку и желтые штаны

Улитка в форме арфы

Телефоны прошлого

DALL-E может не только генерировать изображения, но и дорабатывать существующие. В качестве примера за основу взяли верхнюю часть фотографии бюста Гомера и дали задание завершить ее:

Пока OpenAI не спешит делать нейросеть общедоступной, поскольку ее продвинутые генеративные возможности могут оказать слишком сильное влияние на отрасль. Тем не менее, разработчики планируют и дальше совершенствовать алгоритм. 

Нейросети
Back to top