腾讯混元开源端到端视频音效生成模型 HunyuanVideo-Foley

2026-01-09/ 31 次浏览/ 资讯

腾讯混元正式开源端到端视频音效生成模型hunyuanvideo-foley，仅需上传视频并输入文字描述，即可自动生成媲美电影质感的沉浸式音效。

例如，输入文本：“With a faint sound as their hands parted, the two embraced, a soft 'mm' escaping between them.”
系统便会输出一段画面与声音高度契合的完整视频：

腾讯混元开源端到端视频音效生成模型 HunyuanVideo-Foley

核心技术优势

腾讯混元开源端到端视频音效生成模型 HunyuanVideo-Foley

官方表示，HunyuanVideo-Foley成功突破了AI生成视频长期“有画无声”的瓶颈，终结无声AI视频时代，真正实现“理解画面、解析文本、精准配声”的一体化能力，为用户带来影院级的视听融合体验。该模型可广泛用于短视频生产、影视后期、广告创意及游戏音效设计等多个领域。

现在，开发者和创作者可通过以下平台免费获取模型资源：

关键词：git 腾讯 ai ai视频

<< 上一篇

下一篇 >>