生数科技联合清华发布并开源视频生成加速框架 TurboDiffusion
近日,生数科技携手清华大学 tsail 实验室共同推出并开源一款面向视频生成任务的高效推理加速框架——turbodiffusion。

开源地址:https://www.php.cn/link/5cefe77fe6363fc905997de406a0cd1e
官方信息显示,在几乎不牺牲视觉保真度与内容连贯性的前提下,该框架可达成最高达200倍的视频生成推理速度提升。TurboDiffusion 的核心技术突破,精准切中当前视频生成技术演进的关键瓶颈。尽管扩散模型在视频创作领域展现出卓越的表征与生成能力,但长期受限于高昂的计算开销与缓慢的推理节奏。


区别于传统单点性能调优路径,TurboDiffusion 采用多维度协同优化策略,深度重构了模型的计算范式、注意力机制设计及端到端推理流程,实现对视频生成全链路的系统性提效。
TurboDiffusion 并非依赖某一项孤立技术,而是融合多项前沿加速方法,形成一套有机集成的技术体系:
- 低比特注意力加速:引入 SageAttention 技术,将注意力运算迁移至低精度 Tensor Core 上执行,在零精度损失的前提下,实现注意力模块数倍级提速。
- 稀疏-线性注意力加速:集成可学习稀疏注意力机制 Sparse-Linear Attention(SLA),在 SageAttention 基础上进一步压缩注意力计算量,稀疏加速比最高可达 17–20 倍。
- 采样步数蒸馏加速:采用当前最先进的 rCM 蒸馏方案,使模型仅需 3–4 步即可输出高保真视频,显著缩短生成周期。
- 线性层量化加速:对模型中所有线性层的权重与激活值统一实施 8 比特块量化(128×128 粒度),即 W8A8 量化方案,既加快线性计算,又大幅降低显存占用。
TurboDiffusion 的面世,首次在维持专业级生成质量的同时,将视频生成耗时压缩至接近实时交互的水平,被业界视为视频大模型发展进程中的“DeepSeek Moment”。它正加速推动整个行业由早期技术验证阶段,迈入规模化部署与商业化应用的新纪元,也标志着 AI 视频内容生产正式步入“实时生成”时代。
参考链接:
TurboDiffusion:https://www.php.cn/link/5cefe77fe6363fc905997de406a0cd1e
SageAttention:https://www.php.cn/link/b0263bc40e0ff50f481b85a968c30ac1
Sparse-Linear Attention:https://www.php.cn/link/ee04d7461f4c27af47fb49708e132073
SLArCM:https://www.php.cn/link/bb5acdd12f1b38cff9b475186aadd33d
源码地址:点击下载
<< 上一篇
下一篇 >>
网友留言(0 条)