Alibaba представила ИИ-генератор изображений Qwen-Image

Alibaba представила новую модель искусственного интеллекта Qwen-Image 20B MMDiT, предназначенную для работы с изображениями. В этой модели разработчики значительно улучшили механизмы прорисовки сложных текстов и реализовали возможности точного редактирования изображений.

Доступ к модели будет открываться на платформе Qwen Chat в разделе «Генерация изображений». Qwen-Image обладает расширенными возможностями рендеринга текста, включая многострочные макеты с семантикой на уровне абзацев и детализированные элементы. Поддерживаются как алфавитные, так и иероглифические языки. Усовершенствованные механизмы многозадачного обучения увеличили возможности редактирования изображений, сохраняя при этом смысловое наполнение и визуальный реализм.

По заявлению Alibaba, новая модель превосходит существующие решения в ряде тестов на генерацию и редактирование изображений, включая GenEval, DPG, OneIG-Bench, GEdit, ImgEdit и GSO. Особенно хорошие результаты были достигнуты в тестах качества прорисовки текста, таких как LongText-Bench, ChineseWord и TextCraft, где модель показала лучшие результаты по сравнению с современными аналогами.

Qwen-Image, в частности, успешно отображает китайские иероглифы на вывесках магазинов с правильной глубиной резкости и создает детализированный английский текст на обложках книг и информационных слайдах, поддерживая двуязычный контент. Кроме обработки текста, модель также уверенно ориентируется в различных художественных жанрах — от фотореализма до импрессионизма.

В процессе редактирования изображений поддерживаются разнообразные операции, включая изменение стиля, добавление, удаление и улучшение деталей, а также редактирование текста и изменение поз персонажей. Как отмечают разработчики Alibaba, цель создания Qwen-Image заключалась в содействии развитию генерации изображений, снижении технических барьеров для создания визуальных материалов и вдохновении коллег на внедрение инновационных приложений.

Регион: 

Рубрики: 

Заметили ошибку? Выделите ее мышкой и нажмите Ctrl+Enter!