“智谱AI输入法”发布,底座模型同步开源

智谱ai正式推出并开源glm-asr系列语音识别模型,并同步发布基于该系列打造的桌面级“智谱ai输入法”。

“智谱AI输入法”发布,底座模型同步开源

“智谱AI输入法”发布,底座模型同步开源

此次发布的模型与产品涵盖以下三款核心成果:

  • GLM-ASR-2512:具备国际领先水平的云端语音识别大模型;
  • GLM-ASR-Nano-2512:参数量仅为1.5B的轻量级开源端侧语音模型,性能达当前开源领域SOTA水准;
  • 智谱AI输入法:深度融合语音识别与大语言模型能力的桌面端高效生产力工具。

据官方介绍,GLM-ASR-2512是智谱全新一代语音识别模型,支持高实时性语音到文本转换。在涵盖多场景、多语种、多方言的真实复杂环境中持续验证,展现出行业顶尖的识别稳定性与准确性,字符错误率(CER)低至0.0717。

在此基础上,智谱AI进一步开源了GLM-ASR-Nano-2512。该模型虽仅含1.5B参数,却在多项基准测试中刷新开源语音识别性能纪录,部分指标甚至超越多个主流闭源方案。它专为本地部署优化,在保障识别精度的同时,显著提升数据隐私安全性与语音交互响应速度。

“智谱AI输入法”发布,底座模型同步开源

依托上述双模型技术底座,智谱AI正式上线“智谱AI输入法”,为Windows与macOS用户提供流畅自然的PC端语音交互体验。用户不仅能获得高准确率的语音转写能力,还可一键完成跨语言翻译、语义润色、内容改写等智能操作,真正实现“说话即指令,语音即生产力”。

“智谱AI输入法”发布,底座模型同步开源

即日起,智谱AI输入法全面向公众开放下载使用,并免费赠送2000积分,折合约28天的完整功能使用权。

  • GLM-ASR-2512

    • 快速入门指南:https://www.php.cn/link/eae815dbac9ddb49fcf84c3acb52ba08
    • 在线体验入口:https://www.php.cn/link/730036f0c7dc722bb48bf8b99398c4cb
    • API调用文档:https://www.php.cn/link/bbe4bffdb46a85d01137ad4638d846a9
  • GLM-ASR-Nano-2512

    • Hugging Face模型页:https://www.php.cn/link/e4c446f4b7669022a2bd89128a7dbc1f
    • 魔搭ModelScope主页:https://www.php.cn/link/1aace02b1dc7a9ee987286a90bbef89c
  • 智谱AI输入法Mac/Win用户请访问下载页面 → https://www.php.cn/link/86773a39ba758c892d3fa03b2e3cf711

源码获取地址:点击下载

网友留言(0 条)

发表评论