Alibaba создала бесплатный генератор картинок Qwen-Image


6 августа, 2025

Мир генеративных моделей пополнился новым игроком – Qwen-Image от Alibaba. Эта модель с открытым исходным кодом, доступная на GitHub, Hugging Face, ModelScope и интегрированная в чат-бот Qwen, обещает революцию в создании визуального контента, особенно благодаря своей исключительной точности в отображении текста. 

В отличие от многих конкурентов, Qwen-Image блестяще справляется с отрисовкой текста, поддерживая как латиницу, так и иероглифы, позволяя свободно комбинировать их в одном изображении. Это особенно важно для создания многоязычного контента и материалов, ориентированных на азиатский рынок. Компания Alibaba подчеркивает превосходную работу Qwen-Image со сложной типографикой и многострочной версткой. 

Модель демонстрирует высокую стабильность при редактировании, сохраняя смысловую целостность изображения даже после значительных изменений. Пользователи могут стилизовать картинку, изменять текст, фон, позы персонажей, удалять или заменять объекты – функциональность, открывающая широкие возможности для создания разнообразного контента. От рекламных постеров и презентационных слайдов до витрин онлайн-магазинов, образцов каллиграфии и наглядной инфографики – Qwen-Image позволяет реализовать самые смелые творческие идеи. 

Однако, как и у любой новой технологии, у Qwen-Image есть свои ограничения. Обзор Venture Beat показал, что, несмотря на заявленную точность, качество отрисовки текста и следование запросам не всегда превосходят аналогичные возможности Midjourney. В некоторых случаях модель неправильно интерпретировала запросы, и даже переформулировка не всегда помогала исправить ситуацию. Это указывает на необходимость дальнейшего совершенствования модели и улучшения ее понимания естественного языка. 

Фото на обложке: Qwen-Image

Комментарии