通义万相团队发布 Wan2.5-Preview,实现多模态输入与电影级视频同步生成

通义万相团队正式推出wan2.5-preview版本,首次实现原生音画同步能力,全面升级视频生成、图像生成与图像编辑三大核心功能,助力广告、电商、影视等领域实现高质量商业内容创作。

通义万相团队发布 Wan2.5-Preview,实现多模态输入与电影级视频同步生成

通义万相团队发布 Wan2.5-Preview,实现多模态输入与电影级视频同步生成

体验地址:https://www.php.cn/link/859bf1416b8b8761c5d588dee78dc65f

通义万相团队发布 Wan2.5-Preview,实现多模态输入与电影级视频同步生成

Wan2.5-Preview核心亮点如下:

? 视频生成 —— 带“配音”的10秒微型电影引擎

  • 原生音画同步: 自动生成人声(支持多人对话)、ASMR、环境音效及背景音乐,涵盖中文、英文、小语种及方言,声音与画面高度匹配;
  • 10秒长视频支持: 时长翻倍,最高输出1080P 24fps视频,动态连贯性与结构稳定性显著增强,叙事表现更完整;
  • 指令理解升级: 支持复杂连续动作描述、镜头运动控制和结构化提示词输入,准确还原用户创意构想;
  • 图生视频ID保持优化: 在人物形象、商品外观等方面实现更高一致性,适用于品牌广告与虚拟角色制作;
  • 通用音频驱动视频: 可上传自定义音频作为引导,结合提示词或首帧图像生成匹配的视频内容,轻松实现“用自己的声音讲述AI生成的故事”。

?️ 文生图 —— 懂“排版”的智能设计助手

  • 视觉质感跃升: 光影真实感更强,细节刻画更精细,可精准还原多种艺术风格与设计美学;
  • 稳定文字渲染: 支持中英文、小语种、艺术字体、长段落文本及复杂布局的文字生成,海报、LOGO一键完成;
  • 图表直接输出: 能生成科学图表、流程图、数据可视化图、系统架构图以及带文字内容的表格等结构化图文信息;
  • 指令理解深化: 对复杂指令具备逻辑推理能力,可高精度还原现实IP形象与具体场景细节。

✂️ 图像编辑 —— 工业级“改字不走形”修图工具

  • 自然语言编辑: 支持换背景、调色、添加元素、风格迁移等多种操作,通过文字指令即可完成专业级编辑,无需PS经验;
  • 视觉一致性保障: 支持单图或多图参考进行编辑,确保人脸、商品、整体风格等关键元素在修改后仍保持原有特征,“换场景不变样”。

源码下载:点击获取

网友留言(0 条)

发表评论