DeepSeek V3.1 一上线,官方的一条留言就把整个 AI 圈炸了。
新的架构、下一代国产芯片,短短不到 20 个字,却信息量满满,引发热议。

有网友调侃说:国产芯片迎来史诗级暴涨,DeepSeek 一句话,周五大盘直接冲上 3800 点。
这两天,DeepSeek 官方上线 V3.1 版本,没铺天盖地宣传,就像平常一样低调发个公告。

以前 DeepSeek 的产品线里,分工很清楚:V3 模型擅长通用对话,R1 模型更偏深度思考。这种分离式架构好处是,各个模型都能在自己擅长的领域表现不错,但用户来回切换很麻烦。
现在,V3.1 打破了这种壁垒,把通用对话、复杂推理、专业编程等多种核心功能集成在同一个模型里,让使用体验更灵活,效率更高。
不仅如此,V3.1 的推理效率也大幅提升。官方数据显示,思考模式下,它在各项任务的平均表现和前代顶级 R1-0528 持平,但输出的 token 数量减少了 20% 到 50%。非思考模式下,输出长度也更短,但性能不打折。

这下开发者都在刷屏了,Hugging Face 上的热度也蹭蹭往上。

还有人直接用 DeepSeek V3.1 做了个振动编码,当场变身 VJ。

不过,社区中还是有部分用户吐槽翻译和写作,SYSTEM PROMPT 需要现场写指令,中英夹杂和错词偶尔出现,有点乱。

感兴趣的狐友们,现在可以上官网自行体验一番了~
老狐觉得每次 DeepSeek 更新都让人期待下一次,几乎快成了国产 AI 的精神图腾了,一起期待 DeepSeek R2 吧。
参考资料:
DeepSeek、智东西、X、微博等网络
编辑:不吃麦芽糖
相关文章









猜你喜欢
成员 网址收录40418 企业收录2986 印章生成263572 电子证书1157 电子名片68 自媒体91237