DeepSeek 推出 DeepSeekMath‑V2 模型，主打自验证数学推理能力

哈哈库新闻资讯 2025-11-27 20:57:49 60

11 月 27 日消息，DeepSeek 发布了 DeepSeekMath‑V2，主打可自我验证的数学推理训练框架。

团队认为，仅追求最终答案正确率难以保证推理链条的严谨性，尤其在定理证明等需要逐步推导的任务中更为突出。模型通过构建基于 LLM 的验证器，对生成的证明进行自动审查，并利用扩展的验证计算持续生成高难度训练样本提升验证器能力。

据了解，DeepSeekMath‑V2 基于 DeepSeek‑V3.2‑Exp‑Base，在 2025 年国际数学奥林匹克竞赛（IMO 2025）与 2024 年中国数学奥林匹克竞赛（CMO 2024）中均达到金牌水准，并在 2024 年普特南数学竞赛（Putnam 2024）中取得 118/120（近乎满分）的优异成绩。官方称，尽管尚有大量工作待推进，当前成果已表明：可自验证的数学推理是一条切实可行的研究路径，有望为构建更强大、更可靠的数学智能系统奠定基础。

Hugging Face：https://huggingface.co/deepseek-ai/DeepSeek-Math-V2

Github：https://github.com/deepseek-ai/DeepSeek-Math-V2

本文地址： http://hahaku.com/164390.html

文章来源： IT之家