华为与浙大携手发布 DeepSeek-R1-Safe 大模型：AI安全与性能完美平衡

2 0 0

在刚刚结束的华为全联接大会上，华为技术有限公司联合浙江大学推出了国内首个基于昇腾千卡算力平台的基础大模型——DeepSeek-R1-Safe。这一创新性产品旨在解决当前AI领域面临的安全与性能问题，开创了智能科技的新篇章。

浙江大学计算机科学与技术学院的院长任奎在会上详细介绍了这一模型的核心创新。DeepSeek-R1-Safe是通过一个全流程的安全后训练框架构建而成，涵盖了高质量的安全语料库、平衡优化的安全训练以及自主创新的软硬件平台。这一框架的设计旨在从底层解决AI模型在安全训练中的关键问题。

值得一提的是，DeepSeek-R1-Safe在千亿级参数的安全训练中实现了突破，其防御能力表现惊人。测试数据显示，该模型在对抗有毒有害言论、政治敏感内容及违法行为教唆等14个维度的有害信息时，整体防御成功率接近100%。而在多种越狱模式的防御上，成功率也超过了40%。综合安全防御能力高达83%，在与同类模型Qwen-235B和DeepSeek-R1-671B的对比中，表现优越，超出8%至15%。

此外，在MMLU、GSM8K、CEVAL等通用能力基准测试中，DeepSeek-R1-Safe的性能损耗控制在1%以内，这表明其不仅提高了安全防护能力，同时也确保了模型的可用性，成功达成了安全与性能的平衡。

华为昇腾计算业务总裁张迪煊在会上表示，华为正在积极推动基础软件创新与AI安全能力建设，通过开放协作与高校和产业伙伴共同推动技术进步。同时，该模型也已在ModelZoo、GitCode、GitHub、Gitee等社区全面开源，让更多开发者和研究人员能够参与其中。

这一里程碑式的发布不仅为AI安全领域带来了新的希望，更为未来的AI产业生态协同发展铺平了道路。

打赏赞