中国人工智能初创公司DeepSeek近日发布了两款全新的人工智能模型,标志着其在激烈竞争的AI领域持续发力。该公司表示,新模型增强了推理与自主执行任务的能力,旨在进一步推动技术边界。 其中一款新模型名为DeepSeek-V3.2,是数周前发布的实验版本DeepSeek-V3.2-Exp的正式版。DeepSeek声称,该模型在多个推理基准(用于评估AI模型逻辑推理和问题解决能力的标准化测试)上,其性能与OpenAI的旗舰模型GPT-5相当。
这表明,中国的开源系统在特定指标上仍能与硅谷顶尖的专有模型一较高下。DeepSeek-V3.2的核心创新在于它首次将“思考”能力与工具使用(指模型能够调用外部工具如搜索引擎、计算器等以完成复杂任务的能力)相结合,使其能更自主地完成复杂任务。 另一款发布的模型是DeepSeek-V3.2-Speciale,该版本专注于数学计算及其他需要深度思考的复杂任务。DeepSeek表示,其目标是“将开源模型的推理能力推向极限,探索模型能力的边界”。
据公司披露,V3.2-Speciale的性能与谷歌最新的Gemini-3 Pro相匹配,并在国际数学奥林匹克(IMO)和国际信息学奥林匹克(IOI)等标准化测试中达到了金牌水平,展现了其在专业领域的强大实力。 此次发布是DeepSeek巩固其在中国AI竞赛中领先地位的最新举措。继今年一月凭借突破性AI模型震撼科技界后,这家影响力日益增长的人工智能实验室正通过持续创新来保持其研究势头。
DeepSeek还透露,其已创造出一种新的训练AI智能体(旨在自主实现目标的软件程序,能够通过与环境交互、分析数据和做出决策来完成任务)的方法,这将使AI处理变得更快速、更高效。就在上周,该公司刚发布了名为DeepSeekMath-V2的新开源模型,展示了强大的数学定理证明能力。