Прохор Шаляпин опубликует книгу
Доминик Уэст и Сиенна Миллер сыграют бывших супругов в триллере «Война»
Forbes: чат-бот Илона Маска Grok случайно слил в сеть 370 тысяч диалогов с пользователями
Россиянка Марина Старовойтова стала первой в истории женщиной-капитаном атомного ледокола
Урожай миндаля в 2025 году будет аномально низким. Это приведет к изменению рецептов сладостей
Британец прокатился на 55 американских горках за неделю ― и попал в Книгу рекордов Гиннесса
Пятый сезон «Эмили в Париже» выйдет в декабре
В Бурятии нашли собаку, уплывшую на лодке с заведенным мотором
Огненный шар пролетел над Японией
Джозеф Косински рассказал, что получил первую работу в Голливуде благодаря Дэвиду Финчеру
Доходы женщин после рождения детей уже не восстанавливаются до уровня мужчин
Дженифер Энистон обливают краской в трейлере нового сезона «Утреннего шоу»
МВД объявило в розыск блогера Алекса Лесли
СМИ: в Москве школа ввела плату за сообщения в родительском чате
Джеффри Райт и Октавия Спенсер снимутся в новой экранизации «Смерти коммивояжера»
Женщина из Китая пыталась избежать 5-летнего тюремного срока, постоянно беременея и рожая детей
«Макдоналдс» представил коллаборацию с группой BTS
Второй сезон «Уэнсдэй» увеличил спрос на готическую одежду в России
В екатеринбургском музее посетитель пририсовал персонажам на картине глаза шариковой ручкой
Суд взыскал с ресторанного критика 200 тыс. рублей за негативный отзыв о московском ресторане
Джорджу Мартину намекнули, что ему «осталось недолго» и стоит передать дело другому автору
Минпросвещения создало список современной патриотической литературы для внеклассного чтения
Глава Минэкономразвития предложил создать черный список покупателей на маркетплейсах
В Госдуме предложили ввести песню Надежды Кадышевой «Веночек» в школьную программу
«Все рушится»: вышел трейлер «Черного кролика» с Джудом Лоу и Джейсоном Бейтманом
Певец Игорь Николаев зарегистрировал бренд «Привет, Андрей!»
Том Фелтон в роли конструктора-изобретателя в тизере-трейлере боевика «Альтер»
«Яндекс Еда» и бренд Flat 22 из Махачкалы выпустили керамическую посуду с дагестанскими мотивами

Нейросеть научили превращать текст в картинки. Она изобразила редиску с собачкой и кресло-авокадо!

Изображение на превью: OpenAI

Американская команда разработчиков OpenAI создала нейросеть, способную превращать текст в картинки. В ее основе — алгоритм последнего поколения для обработки языка GPT-3, который уже обучали генерировать идеи для бизнеса, тексты песен, статьи и даже отвечать на философские вопросы.

Новая разработка получила название DALL·E. Принцип ее работы следующий: человек описывает некий предмет или ситуацию, к примеру, «редиска выгуливает собаку» или «кресло в форме авокадо», а алгоритм изображает это на картинке.

При одном и том же запросе результат каждый раз получается разным. Некоторые из сгенерированных картинок будут неотличимы от созданных человеком, другие — едва связными и понятными. Однако серьезных ошибок и абсолютной бессмыслицы алгоритм не допускает.

На сайте OpenAI показаны десятки примеров работы алгоритма, в которых можно самостоятельно поменять параметры. Например, «профессиональную высококачественную иллюстрацию химеры жирафа и черепахи» можно превратить в не менее качественно нарисованную смесь кота и слона или льва и цыпленка, создавая сотни различных версий мутантов (иногда милых, иногда пугающих).

Все примеры на сайте — это 30 лучших, по мнению разработчиков, изображений из 512, сгенерированных нейросетью по указанному запросу. Никакой ретуши к картинкам не применялось.

DALL·E учитывает 12 млрд параметров (цвет, высота, названия предметов, их расположение и так далее) и может создавать антропоморфных животных, фотографически точные изображения, а также комбинировать несвязанные понятия.

К примеру, нейросеть способна понять фразу «эмодзи пингвина, который одет в синюю шапку, красные перчатки, зеленую футболку и желтые штаны». Однако разработчики подчеркивают, что результат сильно зависит от формулировки запроса. Часто идентичные по смыслу предложения интерпретируются алгоритмом по-разному и приводят к неверной визуализации.

Текстовый запрос: «эмодзи пингвина, который одет в синюю шапку, красные перчатки, зеленую футболку и желтые штаны».

Программа также может изобразить объект с разных ракурсов — она видит различие между «капибарой крупным планом» и «капибарой, сидящей в поле». Более того, изображения гипсового бюста под разными углами, сгенерированные DALL·E, позволили создать плавную 3D-анимацию вращающейся головы.

Исследователи считают, что работа с генеративными моделями, такими как DALL·E, может оказать серьезное влияние на общество. В будущем они планируют проанализировать связь подобных моделей с социальными проблемами, к примеру с воздействием экономики на рабочие процессы и профессии, а также изучат долгосрочные этические последствия, к которым может привести технология.

Расскажите друзьям