DeepSeek线上版本模型已升级至DeepSeek V3.1,上下文窗口从原有的64k扩展至128k,网页、App、小程序都可体验这一模型。

架构创新:线上模型去除「R1」标识,分析称DeepSeek未来有望采用「混合架构」。成本优势:每次完整编程任务仅需1.01美元,成本仅为专有系统的六十分之一。
在MMLU多任务语言理解方面,DeepSeek V3.1毫不逊色于GPT-5。

看到V3.1模型的更新,网友们更期待R2的发布了!开源地址:https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base
相关文章









猜你喜欢
成员 网址收录40418 企业收录2986 印章生成263572 电子证书1157 电子名片68 自媒体91237