> 自媒体 > (AI)人工智能 > 悄然上线,DeepSeek 又有新动作!
悄然上线,DeepSeek 又有新动作!
来源:齐鲁壹点
2025-09-20 13:26:34
40
管理

3 月 24 日深夜,DeepSeek 悄然上线 V3 模型的升级版本 DeepSeek-V3-0324,并非市场此前一直期待的DeepSeek-V4或R2。目前,其开源版本已上线Hugging Face。此次升级不仅参数规模跃升至6850亿,更在代码生成、数学推理、硬件适配等维度实现突破。

同日,DeepSeek在其官方交流群宣布称,DeepSeek V3模型已完成小版本升级,欢迎前往官方网页、App、小程序试用体验,API接口和使用方式保持不变。

体验地址:

Hugging Face模型下载: https://huggingface.co/deepseek-ai/DeepSeek-V3-0324/tree/main

OpenRouter免费试用: https://openrouter.ai/chat?models=deepseek/deepseek-chat-v3-0324:free

技术突破:6850 亿参数 MoE 架构再进化

作为去年12月发布的初代V3模型的迭代版本,V3-0324延续了“极致性价比”的技术路线。通过FP8精度训练与动态专家路由机制,计算效率提升100%;新增的偏差项负载均衡技术,有效解决了传统MoE模型的专家过载问题。在保持6850亿参数量级的同时,激活参数规模控制在370亿,推理速度较前代提升1.8倍。

开发者社区实测显示,V3-0324 在复杂场景下的代码生成能力已接近 Claude 3.7 Sonnet 水平。例如,处理多线程异步任务时,模型能自动生成符合工程规范的代码结构,并主动标注潜在性能优化点;生成动态天气卡片动画时,其代码逻辑完整性与实现效果与闭源模型难分伯仲。

性能跃迁:从代码到数学的全面突破

此次升级在编码领域的提升尤为显著。开发者仅需简单文本提示,即可快速生成包含响应式布局、CSS 动画和 JavaScript 交互的完整网站代码。数学推理能力同步跃升。V3-0324 在 AIME 2025 竞赛题中展现出类似专业推理模型的解题逻辑,甚至能识别推理循环并自主回溯修正。

有网友表示,经过自己的测试,DeepSeek-V3-0324 在数学推理和前端开发方面的表现优于 Claude 3.5 和 Claude 3.7 Sonnet。

开发者生态:开源协议与工具链全面升级

此前于2024年12月发布的DeepSeek-V3模型曾以“557.6万美金比肩Claude 3.5效果”的高性价比著称,其多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。

DeepSeek 延续开源战略,将 V3-0324 的开源协议升级为与 R1 一致的 MIT 许可,允许模型蒸馏、商用等行为。权重文件已火速上线 Hugging Face,688GB 的存储规模与初代 V3 保持一致。

苹果机器学习工程师、AI 研究员 Awni Hannun 在社交媒体 X 上表示:“4 位量化后的 DeepSeek-V3-0324,在搭载 mlx-lm 的 512GB M3 Ultra 上,推理速度可达每秒 20 个 token!”

此外,用户可通过关闭 "深度思考" 功能获取更快响应,适合简单问答或代码片段生成;保留的深度思考模式则针对复杂任务提供详尽解析。

但截至目前,还没有任何关于新版 DeepSeek-V3的能力基准测试榜单出现。

尽管V3-0324并非推理模型,但其展现出的逻辑推理能力已接近部分闭源产品。社区普遍认为,此次升级可能是DeepSeek-R2的技术预演。随着开源生态的不断完善,DeepSeek正以“极致性价比 灵活开源策略”挑战闭源模型的统治地位,或将加速AI从“玩具”向“全民生产力工具”的转变。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
三菱退出中国?官方回应:将与现有伙伴继续合作
6月23日,有媒体报道称,三菱汽车将逐步取消包括欧洲、中国在内的市场业..
2026款三菱帕杰罗曝光,第二代超选四驱+2.4T/2.0T双动力..
硬派越野圈的“老将”居然换小排量了?2026款三菱帕杰罗刚露出消息,就把..
恩智浦计划退出5G功率放大器业务;三星或将退出SATA SSD市场;三菱化学出售..
五分钟了解产业大事每日头条芯闻 恩智浦计划退出5G功率放大器业务我国首..
实拍三菱全新欧蓝德!搭1.5T四缸,内饰配大屏,不比奇骏香?..
在重庆车展上,全新一代三菱欧蓝德终于在国内亮相了,相比其国外的发布时..
试驾广汽三菱奕歌:小巧灵动
■ 阅车试驾车型:广汽三菱奕歌长/宽/高(mm):4405/1805/1685轴距(mm..
新车 | 四驱越野MPV/配侧滑门/2.2T柴油机,新款三菱Delica D:5亮相..
文:懂车帝原创 高帅鹏[懂车帝原创 产品] 日前,2025东京车展开幕,新款..
三菱集团的传奇发家史
“三菱”两个字,在日本就像一把瑞士军刀:银行、飞机、汽车、火箭、寿司..
2026款三菱Montero曝光,S-AWC四驱+差速锁全配,普拉多见了..
当 “普拉多见了都得慌” 的话题在越野圈炸锅,2026 款三菱 Montero 的曝..
日韩巨擘数据,三星2.1万亿三菱21万亿,中国第一谁?..
图片来源于网络2025年,让人火大的资本较量又来一波。韩国三星手里握着2...
关于作者
舞月(普通会员)
文章
1634
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263572 电子证书1157 电子名片68 自媒体91237

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索