DeepSeek 拥抱国产 GPU 编程语言 TileLang

9 月 29 日,深度求索正式推出 deepseek v3.2-exp 模型(实验性版本),显著提升了长文本处理效率,并宣布 api 调用成本下降超过 50%。在此次发布的公告中,有这样一段值得关注的内容:

DeepSeek 拥抱国产 GPU 编程语言 TileLang

在新模型的研发过程中,需设计并实现大量全新的 GPU 算子。我们采用高级语言 TileLang 进行快速原型开发,以支持更深层次的技术探索。

据悉,TileLang 是一种轻量级的领域专用语言(DSL),专注于简化在 GPU 和 NPU 等加速器上的算子开发。其核心设计理念在于将复杂的硬件调度逻辑与算法实现分离,从而提升开发效率。

该语言由北京大学团队主导研发,主要贡献者包括王磊、董宇骐,以及北大计算机学院副研究员、博士生导师杨智。

DeepSeek 拥抱国产 GPU 编程语言 TileLang

https://www.php.cn/link/12c9572aee915aa05233c43f75e915a6

TileLang 的关键技术优势体现在以下几个方面:

  • 降低 NPU 算子开发难度:采用类似 Python 的语法结构,显著减少了编程门槛;通过将调度空间封装为可复用的原语,使开发者能更聚焦于数据流的设计。
  • 高度可扩展性:实现数据流与调度策略的解耦,NPU 算子的优化由编译器自动完成,同时充分挖掘底层硬件潜力。
  • 卓越性能表现:允许开发者感知并利用 NPU 硬件特性,在理论上相比 Triton 可实现更优的执行效率。

TileLang 使用类 Python 语法,并基于 TVM 构建其底层编译架构,既提升了开发效率,又保留了对高性能优化的支持能力,让开发者无需在生产力和性能之间妥协。

DeepSeek 拥抱国产 GPU 编程语言 TileLang

https://www.php.cn/link/7c9d8efa5f0fc84385730c20b6a569e3

TileLang 的重要意义在于大幅降低了 GPU 编程的入门门槛。长期以来,GPU 高性能计算被视为技术“高壁垒”领域,要求开发者掌握复杂的硬件架构、内存层级和并行机制。

DeepSeek 拥抱国产 GPU 编程语言 TileLang

据 TileLang 社区组织者、Tile-AI 发起人王磊博士在一次技术沙龙中介绍,传统模式下开发一个高效能算子往往需要数周时间,且代码维护困难。而借助 TileLang 的分层抽象设计,不同背景的开发者都能参与进来。他指出:

对于没有硬件背景的新手,可以像编写数学表达式一样进行编程;而对于资深工程师,则仍可深入到底层进行精细调优。

源码地址:点击下载

网友留言(0 条)

发表评论