Иэн МакКеллен и Элайджа Вуд могут вернуться к своим ролям в «Охоте за Голлумом»
Футбольный комментатор посоветовал женщинам-арбитрам идти на кухню
Симулятор управления газетной империей News Tower выйдет 4 ноября
Sylvanian Families отозвал иск против популярной тиктокерши, которая снимала видео с его игрушками
В США медведь пришел к частному дому, чтобы искупаться в джакузи
10-летняя девочка стала самым юным женским международным мастером по шахматам
«Новая опера» и ММОМА представят перформативно-выставочную программу «Музей в опере/Опера в музее»
Самый кассовый фильм в карьере Брэда Питта «F1» выйдет в «цифре» 22 августа
YouTube хочет купить права на трансляцию «Оскара»
Производитель напитков Estecola ресторатора Аркадия Новикова подал иск о банкротстве
Россиянам для счастья необходимо 227 тыс. рублей — примерно 2,5 средней зарплаты
На рынок детских товаров вышли плюшевые игрушки с ИИ. Их озвучила Граймс
Боб Оденкерк заявил, что не собирается возвращаться к роли Сола Гудмана
Китайский блогер построил станцию метро для своих котов
Софи Тернер пошутила, что поцелуй с Китом Харингтоном в новом хорроре был «омерзительным»
«Скибиди», «делулу» и «традвайф» вошли в Кембриджский словарь
Лиаму Галлахеру запретили бросать в толпу маракасы и тамбурины концертах Oasis
Алан Камминг рад вновь сыграть Ночного Змея в фильме «Мстители: Судный день»
В Ленобласти завершили сезон спасения тюленей и нерп
Федора Смолова заблокировали на Twitch
Забег «Садовое кольцо» вошел в Книгу рекордов России
Вуди Аллен и Эмир Кустурица станут хедлайнерами Московской международной недели кино
Умер «король серфинга» Дейл Вебстер
В нацпроект «Космос» включили запуск корабля на Венеру
«Мальчик на лодке» принял участие в государственном параде в Индонезии
Ноа Уайл станет режиссером одного из эпизодов второго сезона сериала «Больница Питт»
Хамзат Чимаев стал новым чемпионом UFC в среднем весе
Синоптик предупредил, что в Москве за неделю может выпасть 7 ведер воды на квадратный метр

Alibaba представила бесплатный генератор картинок Qwen-Image

Изображение: Alibaba

Alibaba представила новую модель генерации изображений Qwen‑Image с открытым исходным кодом. Она доступна в чат-боте Qwen, а также на GitHub, Hugging Face и ModelScope.

Главное отличие Qwen-Image от многих конкурентов ― точная отрисовка текста. Новинка поддерживает как алфавитные, так и иероглифические системы письма, позволяя сочетать латиницу и иероглифы на одном изображении.

В компании отмечают, что их продукт отлично работает со сложной типографикой и многострочной версткой. Кроме того, он показывает «высокую стабильность при редактировании изображений, сохраняя смысловую целостность». По запросу можно стилизовать картинку, отредактировать текст, поменять фон или позы изображенных персонажей, удалить или заменить объекты. Это позволяет создавать контент вроде постеров, слайдов, витрин магазинов, каллиграфии и инфографики.

Журналист Venture Beat, опробовавший генерацию картинок в Qwen-Image, отметил, что точность следования запросу и качество текста оказались не выше, чем у Midjourney. Иногда модель неверно понимала запросы и передавала текст ― не спасали даже переформулировки.

Qwen-Image основана на архитектуре MMDiT с 20 млрд параметров — такой же, как у Flux.1 и будущей Stable Diffusion 3. Согласно техническому отчету, модель прошла многоэтапное обучение на миллиардах пар «изображение + текст».

В публичных тестах Qwen-Image показала равные или лучшие результаты, чем GPT Image 1, Seedream 3.0 и Flux.1 Kontext Pro. На платформе AI Arena модель занимает 3-е место среди всех и 1-е место среди open-source-решений.

Расскажите друзьям
Теги: