> 自媒体 > (AI)人工智能 > DeepSeek V3.1发布!拥抱国产算力芯片
DeepSeek V3.1发布!拥抱国产算力芯片
来源:核芯产业观察
2025-08-30 10:02:07
91
管理

电子发烧友网报道(文/李弯弯)2025年8月21日,DeepSeek正式官宣发布DeepSeek-V3.1大模型。新版本不仅在技术架构上实现重大升级,更通过参数精度优化与国产芯片深度适配。从混合推理架构到Agent能力突破,从API价格调整到国产芯片生态共建,DeepSeek V3.1的发布标志着中国AI产业进入技术突破与产业落地协同发展的新阶段。

图:在各项评测指标得分基本持平的情况下(来自DeepSeek官微)

参数精度优化是另一重大突破。V3.1采用UE8M0 FP8 Scale技术,将参数精度提升至8位浮点数规模。这一设计不仅减少30%的内存占用,更通过量化感知训练保持模型精度。DeepSeek官方透露,UE8M0 FP8标准是专为下一代国产芯片设计的计算范式,可显著提升芯片在AI推理场景下的能效比。

FP8是Float8的简称,即用8位二进制数表示浮点数,主要用于深度学习的训练和推理。相比传统的FP32(32位浮点数)或FP16(16位浮点数),FP8显著降低了显存占用和计算资源需求,同时通过优化设计(如动态范围调整)维持了较高的精度。‌‌FP8对国产芯片的使用效率提升显著,将进一步缩小与NVIDIA芯片的效率/成本差距,大大增加国产芯片的可用性。

在Agent能力方面,V3.1通过Post-Training优化实现质的飞跃。在代码修复测评 SWE 与命令行终端环境下的复杂任务(Terminal-Bench)测试中,DeepSeek-V3.1 相比之前的 DeepSeek 系列模型有明显提高。DeepSeek-V3.1 在多项搜索评测指标上取得了较大提升。在需要多步推理的复杂搜索测试(browsecomp)与多学科专家级难题测试(HLE)上,DeepSeek-V3.1 性能已大幅领先 R1-0528。官方将其定义为“迈向Agent时代的第一步”。

生态建设同步加速。官方App与网页端同步升级V3.1,用户可通过“深度思考”按钮自由切换模式。API接口价格自9月6日起调整为输入每百万tokens 0.5元(缓存命中)/4元(未命中),输出每百万tokens 12元,同时取消夜间优惠。尽管价格有所上调,但输入缓存命中成本保持不变,输出成本增幅控制在50%以内,体现技术优化带来的成本分摊效应。

国产芯片适配进程:从技术追赶到生态共建

DeepSeek与国产芯片的协同发展。2025年1月,华为昇腾910B率先完成V3模型适配,通过自研推理加速引擎使模型性能达到高端GPU水平,在智能安防、工业物联网等端侧场景实现本地化决策。2月,海光DCU完成V3与R1模型适配,其GPGPU架构支持全精度通用AI加速,通信延迟降低40%,训练效率提升35%。同月,龙芯中科发文称,搭载龙芯3号 CPU 的设备成功运行DeepSeek R1 7B模型,实现本地化部署。

多芯片厂商形成差异化竞争格局。沐曦曦云C500 GPU在V3推理中性能达国际主流产品的110%-130%,单位token成本仅为H100的70%;天数智芯支持R1千问蒸馏模型,提供稳定推理服务;壁仞科技壁砺系列覆盖1.5B至70B参数规模的全系列蒸馏模型。摩尔线程成为首个支持原生FP8的国产GPU厂商,其MUSA架构为V3.1提供原生计算支持;芯原股份NPU芯原VIP9000实现FP8技术从云端训练到硬件部署的快速迁移。

政策与市场形成双轮驱动。国家超算互联网平台将DeepSeek模型纳入标准算力库,三大运营商在5G基站部署中优先采用适配国产芯片的AI推理模块。

在能源行业私有化部署实践中,中国石油、中国海油、国家管网等央企已完成DeepSeek私有化部署,中国海油采用全国产化算力,在“海能”人工智能模型平台接入DeepSeek系列模型,通过私有化部署面向全集团提供开放服务。电网故障预测响应时间从分钟级压缩至秒级,需结合实时数据采集、高速算力支撑和智能算法优化,海光DCU的低延迟计算能力与DeepSeek模型的实时推理能力相结合,可满足这一需求。

重构中国AI产业竞争力

技术突破显著降低硬件门槛。DeepSeek通过MoE架构将激活参数量控制在合理范围,V3.1的UE8M0 FP8精度标准使国产芯片在推理场景下的能效比提升40%。实测显示,在671B参数规模下,沐曦曦云C500运行V3的单位算力成本较H100降低35%,推理延迟缩短至8ms以内。龙芯芯片在适配DeepSeek后,也凭借其架构优势,在特定场景下实现了较低的功耗和较高的性价比,为国产AI应用的普及提供了更多选择。

生态共建加速产业落地进程。华为云昇腾算力服务已承载超过7万颗910B芯片,订单价值超20亿美元;海光DCU在金融行业市占率突破28%,其适配的DeepSeek模型日均调用量达4.7亿次。龙芯在完成适配后,积极与众多软件厂商和系统集成商展开合作,推动基于龙芯芯片和DeepSeek模型的解决方案在更多行业落地。例如,在一些教育领域的智能教学系统中,龙芯芯片与DeepSeek模型结合,实现了智能答疑、个性化学习推荐等功能,提升了教学质量和效率。芯原股份与摩尔线程的合作,使FP8技术生态覆盖从训练到推理的全链条,开发周期缩短60%。

技术差距缩短在具体领域表现突出。华为昇腾910C在推理性能上达到H100的60%,能效比优于后者;沐曦曦云C500成为首个支持70B参数大模型单卡推理的国产GPU。龙芯芯片在不断研发和优化过程中,性能也在逐步提升,在一些特定的AI应用场景中,已经能够满足基本的需求,为中国在AI算力芯片等关键领域的自主化率提升贡献了力量。

写在最后

站在2025年的节点回望,DeepSeek V3.1的发布不仅是单一产品的迭代,更是中国AI产业生态重构的缩影。从技术参数的优化到产业生态的共建,从芯片算力的突破到应用场景的落地,中国AI正在走出一条不同于国际巨头的自主化道路。随着UE8M0 FP8标准成为行业新范式,随着“模型 芯片 应用”生态的持续完善,中国AI产业有望在2030年前实现全球竞争力的实质性跃升。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
三菱退出中国?官方回应:将与现有伙伴继续合作
6月23日,有媒体报道称,三菱汽车将逐步取消包括欧洲、中国在内的市场业..
2026款三菱帕杰罗曝光,第二代超选四驱+2.4T/2.0T双动力..
硬派越野圈的“老将”居然换小排量了?2026款三菱帕杰罗刚露出消息,就把..
恩智浦计划退出5G功率放大器业务;三星或将退出SATA SSD市场;三菱化学出售..
五分钟了解产业大事每日头条芯闻 恩智浦计划退出5G功率放大器业务我国首..
实拍三菱全新欧蓝德!搭1.5T四缸,内饰配大屏,不比奇骏香?..
在重庆车展上,全新一代三菱欧蓝德终于在国内亮相了,相比其国外的发布时..
试驾广汽三菱奕歌:小巧灵动
■ 阅车试驾车型:广汽三菱奕歌长/宽/高(mm):4405/1805/1685轴距(mm..
新车 | 四驱越野MPV/配侧滑门/2.2T柴油机,新款三菱Delica D:5亮相..
文:懂车帝原创 高帅鹏[懂车帝原创 产品] 日前,2025东京车展开幕,新款..
三菱集团的传奇发家史
“三菱”两个字,在日本就像一把瑞士军刀:银行、飞机、汽车、火箭、寿司..
2026款三菱Montero曝光,S-AWC四驱+差速锁全配,普拉多见了..
当 “普拉多见了都得慌” 的话题在越野圈炸锅,2026 款三菱 Montero 的曝..
日韩巨擘数据,三星2.1万亿三菱21万亿,中国第一谁?..
图片来源于网络2025年,让人火大的资本较量又来一波。韩国三星手里握着2...
关于作者
聚焦每日新资..(普通会员)
文章
1721
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263572 电子证书1157 电子名片68 自媒体91237

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索