Сегодня / 06:08
Кантемир Балагов приступил к съемкам своего дебютного англоязычного фильма
Сегодня / 12:21
Волка из «Ну, погоди!» назвали самым стильным героем советских мультфильмов
Сегодня / 12:16
Бывшая редакция «Ножа» запустила новое научпоп-медиа «Пчела»
Сегодня / 11:35
Причиной смерти Паши Техника стала легочная инфекция
Сегодня / 11:11
Второй сезон «Миротворца» выйдет 21 августа
Сегодня / 11:04
В Петербурге спасли четырех детенышей тюленей
Сегодня / 10:45
Вуди Харрельсон не смог сняться в третьем сезоне «Белого лотоса» из‑за отпуска с семьей
Сегодня / 09:30
Две новые сцены, медиаискусство и кемпинг с пляжем: Outline 2025 раскрыл подробности
Сегодня / 09:15
В Москве к середине недели выпадет до 100% месячной нормы осадков
Сегодня / 08:27
Продажи российского вина растут на фоне подорожания импортного
Сегодня / 07:56
«Это хорошо сыгранная чушь»: Борис Джонсон раскритиковал показ сериала «Переходный возраст» в школах
Сегодня / 07:17
Англоязычный дебют Педро Альмодовара «Комната по соседству» выйдет на Netflix 19 апреля
Сегодня / 06:57
Креативный директор Tom Ford «удочерил» слоненка
Вчера / 18:29
Александр Овечкин стал лучшим снайпером в истории НХЛ
Вчера / 17:05
«Minecraft в кино» показал лучший старт в прокате среди всех экранизаций видеоигр
Вчера / 15:56
Названы самые доступные для аренды жилья районы Москвы
Вчера / 12:21
Американец подтянулся 10 001 раз за сутки и вернул себе мировой рекорд
Вчера / 10:40
На Кубе планируют запустить такси на базе «москвичей»
Вчера / 09:33
Рэпер из США совершил убийство и намекнул об этом в треке. Арестовать его помог клип
Вчера / 07:13
Англиканская церковь устраивает соревнования по рестлингу, чтобы привлечь прихожан
Вчера / 06:00
Москву накрыл снегом циклон «Зион». В ближайшие сутки снегопады усилятся
5 апреля / 17:59
Умер кот Хатико, который семь лет охранял могилу хозяина в Дагестане
5 апреля / 15:59
«Minecraft в кино» показал лучший кассовый дебют в 2025 году
5 апреля / 15:56
«Трон: Арес» получил первый трейлер
5 апреля / 12:46
Мошенники начали просить у детей «сдать в аренду» аккаунты в соцсетях
5 апреля / 11:39
Сценариста «Таксиста» Пола Шрейдера обвинили в домогательствах и отказе от выплаты компенсации
5 апреля / 09:45
Битцевский маньяк готов признаться еще в 11 убийствах
5 апреля / 08:53
В Москве запустят новый регулярный речной маршрут

Нейросеть научили превращать текст в картинки. Она изобразила редиску с собачкой и кресло-авокадо!

6 января 2021 в 13:12
Изображение на превью: OpenAI

Американская команда разработчиков OpenAI создала нейросеть, способную превращать текст в картинки. В ее основе — алгоритм последнего поколения для обработки языка GPT-3, который уже обучали генерировать идеи для бизнеса, тексты песен, статьи и даже отвечать на философские вопросы.

Новая разработка получила название DALL·E. Принцип ее работы следующий: человек описывает некий предмет или ситуацию, к примеру, «редиска выгуливает собаку» или «кресло в форме авокадо», а алгоритм изображает это на картинке.

При одном и том же запросе результат каждый раз получается разным. Некоторые из сгенерированных картинок будут неотличимы от созданных человеком, другие — едва связными и понятными. Однако серьезных ошибок и абсолютной бессмыслицы алгоритм не допускает.

На сайте OpenAI показаны десятки примеров работы алгоритма, в которых можно самостоятельно поменять параметры. Например, «профессиональную высококачественную иллюстрацию химеры жирафа и черепахи» можно превратить в не менее качественно нарисованную смесь кота и слона или льва и цыпленка, создавая сотни различных версий мутантов (иногда милых, иногда пугающих).

Все примеры на сайте — это 30 лучших, по мнению разработчиков, изображений из 512, сгенерированных нейросетью по указанному запросу. Никакой ретуши к картинкам не применялось.

DALL·E учитывает 12 млрд параметров (цвет, высота, названия предметов, их расположение и так далее) и может создавать антропоморфных животных, фотографически точные изображения, а также комбинировать несвязанные понятия.

К примеру, нейросеть способна понять фразу «эмодзи пингвина, который одет в синюю шапку, красные перчатки, зеленую футболку и желтые штаны». Однако разработчики подчеркивают, что результат сильно зависит от формулировки запроса. Часто идентичные по смыслу предложения интерпретируются алгоритмом по-разному и приводят к неверной визуализации.

Текстовый запрос: «эмодзи пингвина, который одет в синюю шапку, красные перчатки, зеленую футболку и желтые штаны».

Программа также может изобразить объект с разных ракурсов — она видит различие между «капибарой крупным планом» и «капибарой, сидящей в поле». Более того, изображения гипсового бюста под разными углами, сгенерированные DALL·E, позволили создать плавную 3D-анимацию вращающейся головы.

Исследователи считают, что работа с генеративными моделями, такими как DALL·E, может оказать серьезное влияние на общество. В будущем они планируют проанализировать связь подобных моделей с социальными проблемами, к примеру с воздействием экономики на рабочие процессы и профессии, а также изучат долгосрочные этические последствия, к которым может привести технология.

Расскажите друзьям
Читайте также