编辑:桃子 定慧
【新智元导读】DeepSeek V3.1新版正式上线,上下文128k,编程实力碾压Claude 4 Opus,成本低至1美元。
就在昨晚,DeepSeek官方悄然上线了全新的V3.1版本,上下文长度拓展到128k。

本次开源的V3.1模型拥有685B参数,支持多种精度格式,从BF16到FP8。
综合公开信息和国内大咖karminski3的实测,V3.1此次更新亮点有:
编程能力:表现突出,根据社区使用Aider测试数据,V3.1在开源模型中霸榜。性能突破:V3.1在Aider编程基准测试中取得71.6%高分,超越Claude Opus 4,同时推理和响应速度更快。原生搜索:新增了原生「search token」的支持,这意味着搜索的支持更好。架构创新:线上模型去除「R1」标识,分析称DeepSeek未来有望采用「混合架构」。成本优势:每次完整编程任务仅需1.01美元,成本仅为专有系统的六十分之一。值得一提的是,官方群中强调拓展至128K上下文,此前V3版本就已经支持。

对于这波更新,大家的热情可谓是相当高涨。
即便还未公布模型卡,DeepSeek V3.1就已经在Hugging Face的趋势榜上排到了第四。


DeepSeek粉丝数已破8万
看到这里,网友们更期待R2的发布了!


混合推理,编程击败Claude 4
这次最明显的变化是,DeepSeek在官方APP和网页端上,把深度思考(R1)中的「R1」去掉了。

同时,与V3-base相比,DeepSeek V3.1新增了四个特殊Token:
(id: 128796) (id: 128797) (id: 128798) (id: 128799)
对此,有推测认为,这可能暗示推理模型与非推理模型的融合。

而且,它的成本仅1美元,成为非推理模型中的SOTA。

在SVGBench基准上,V3.1实力仅次于GPT-4.1-mini,远超DeepSeek R1的实力。

一位网友实测,模拟六边形中小球自由落体的物理测试,DeepSeek V3.1理解力明显提升。


由于总结内容太长,我们截取了前三回,你觉得这个总结的怎么样?

在128K上下文测试中,DeepSeek-V3.1输出速度相比以往获得较大提升,并且在工程上做了一些优化。

上下滑动查看
参考资料:HYX
https://weibo.com/2169039837/Q0FC4lmeo
https://x.com/karminski3/status/1957928641884766314
相关文章









猜你喜欢
成员 网址收录40418 企业收录2986 印章生成263572 电子证书1157 电子名片68 自媒体91237