
【大河财立方 记者 陈薇】12月2日,阿里巴巴发布了图片生成及编辑模型Qwen-Image的更新。新模型在图像编辑中维持了更高的一致性,并在多视角转换、多图像融合、多模态推理等方面取得突破进展,可广泛用于概念创意、工业设计、日常修图等诸多场景。目前,新版本Qwen-Image已首发接入千问App,用户可无限次免费使用。
Qwen-Image-Edit基20B的Qwen-Image模型进一步训练,相较于上个版本,新的Qwen-Image-Edit模型还进行多项关键性能增强:在图片编辑中,新模型大幅减轻了主体偏移问题,生图不模糊、更稳定;同时提升了主体一致性,使得多张图片中的人物可顺畅融合为一张合照。Qwen-Image-Edit新模型在工业设计场景着重进行了优化,轻松实现变颜色、变视角、局部修改、材质替换等常用功能;新模型的推理能力也有大幅提升,特别是在几何推理方面,可直接在几何图上生成新的辅助线等效果。
Qwen-Image系列模型自开源发布以来,即刻成为全球AI社区最火热的开源视觉基础模型,当前总下载量已突破300万次,在全球最大的AI开源社区HuggingFace的“图生图”榜单排名前15。
目前,Qwen-Image-Edit最新模型已经在千问App全面上线,普通用户也可免费使用这一新模型。用户只需在千问App对话界面输入指令,即可自动调用Qwen-Image系列模型能力,实现生图、修图、多图融合等操作。
此外,结合千问App上接入的万相Wan2.5视频生成能力,用户还可实现生图、生视频的无缝串联:先生成人物图像,再一键实现“一张照片就跳舞”或“对口型唱歌”等功能,将静态画面转化为动态视频,实现从图像生成到创意表达的全新创作方法。
实习编辑:金怡杉 | 审校:陈筱娟 | 审核:李震 | 监审:古筝
