浙大联合华为发布开源安全大模型 DeepSeek-R1-Safe

浙江大学网络空间安全学院联合华为公司,推出了 deepseek r1 模型的安全增强版本——deepseek-r1-safe。

浙大联合华为发布开源安全大模型 DeepSeek-R1-Safe

浙大联合华为发布开源安全大模型 DeepSeek-R1-Safe

该模型基于华为昇腾AI芯片及 MindSpeedLLM 等技术框架进行研发,完整训练流程包括以下关键步骤:

  1. 数据集构建:生成符合安全规范与合规要求的高质量训练数据
  2. 安全监督微调:在训练中嵌入安全对齐机制,引导模型输出合规内容
  3. 安全强化学习:采用 RLHF 等先进方法进一步优化模型行为策略
  4. 综合性能评估:全面测试模型在安全性与通用能力方面的表现

该版本在大幅提升内容安全防护水平的同时,充分保留了原模型的通用智能能力,实现了安全性与实用性的良好兼顾。

浙大联合华为发布开源安全大模型 DeepSeek-R1-Safe

开源地址:https://www.php.cn/link/bf30380c97b6862a8c0d48cc21c09bbf

源码下载:点击获取

网友留言(0 条)

发表评论