阿里通义实验室开源 Qwen-Image-i2L

阿里通义实验室正式发布 qwen-image-i2l,支持将任意单张图像即时转换为可训练、可迁移的lora(low-rank adaptation)模型。

阿里通义实验室开源 Qwen-Image-i2L

阿里通义实验室开源 Qwen-Image-i2L

无需依赖大规模图像数据集或高性能计算设备,用户仅需上传一张图片,系统即可自动生成轻量级LoRA适配模块,并可直接嵌入主流生成式AI模型中,快速实现“一图定风格”的高效迁移效果。

Qwen-Image-i2L 的技术核心在于其创新的图像语义解耦架构。该模型融合 SigLIP2、DINOv3 与 Qwen-VL 等先进多模态编码器,对输入图像进行深度解析,自动分离出“视觉风格、主体内容、空间构图、色彩倾向”等关键感知维度。这些结构化特征经由紧凑参数化压缩后,最终凝练为一个体积精简的LoRA组件——平均占用空间仅数GB,却能高度保真地复现原始图像的核心视觉特质。

阿里通义实验室开源 Qwen-Image-i2L

为适配多样化应用场景,Qwen-Image-i2L 推出四大定制化模型变体,各具明确功能定位:

  • 风格导向型(2.4B 参数):专精于抽象美学特征提取,适用于艺术化风格迁移任务,例如将油画笔触或水墨意境迁移到新生成图像中;
  • 广域理解型(7.9B 参数):兼顾全局内容语义与整体风格表达,适合建筑外观重构、自然场景重绘等中等复杂度生成需求;
  • 细节增强型(7.6B 参数):支持 1024×1024 高清分辨率建模,聚焦纹理质感与边缘锐度优化,常与广域理解型协同使用以提升输出精细度;
  • 一致性保障型(30M 参数):严格约束输出分布,确保结果与 Qwen-Image 原生风格高度对齐,特别适用于品牌视觉规范管理等企业级部署场景。

所有模型版本均遵循 Apache 2.0 开源协议免费开放。实测表明,其在文本驱动图像生成、细粒度语义编辑等多项权威评测中表现优异,性能媲美主流闭源方案,显著优于当前多数开源同类工具。

源码地址:点击下载

网友留言(0 条)

发表评论