> 自媒体 > (AI)人工智能 > 实测智谱新GLM-4.6 VS DeepSeek V3.2-国产Claude,当之无愧
实测智谱新GLM-4.6 VS DeepSeek V3.2-国产Claude,当之无愧
来源:人人都是产品经理
2025-10-20 07:48:06
195
管理

近期,两款国产大模型 —— 智谱 GLM-4.6 与 DeepSeek V3.2 先后发布,迅速在大模型领域掀起关注热潮。在终端基准硬评估中,DeepSeek V3.2 表现突出,甚至超越 Gemini 2.5 Pro;GLM-4.6 则一举登顶 Hugginface 榜单与 OpenRouter 趋势榜

放假回来了,回来了,幸好假期内没发新模型了,现在火的是节前最后两天前后脚发布的DeepSeek-V3.2-Exp和GLM-4.6。

那我立刻马上光速立刻掏出假期整理好大模型噩梦级测试案例1.0版,平时自己测,看别人测,看大模型自己测,都快看腻了,花了点时间归纳了一下,截止到2025年10月9号,主流的单case测试(特指非数据集)主要分为物理模拟、SVG、前端设计、可交互3D四大类,今天我一口气全测完,还要带上DeepSeek V3.2,测评方式还是老规矩啊,公开所有提示语,每个模型跑三次,取效果最好的一次作为最终结果。

有些提示语比较长,以及连同输出的代码和效果我都打包到文档了,公众号后台发“dsglm”就好啦。

先来个常见的物理模拟热热身,用 HTML、CSS 和 JavaScript 实现这样一个效果:一个小球被困在一个旋转的六边形内部。小球受到地球重力的作用,并与六边形内壁产生摩擦。小球的弹跳需要看起来逼真自然。

虽然没明说,但GLM-4.6和DeepSeek V3.2不约而同都选择了提供参数调整项,可以重置小球,加速和减速六边形的旋转速度,还可以取消动力,我记得DeepSeek R1那会小球能模拟出重力就已经算厉害的了。GLM-4.6还增加了重力参数,小球大小,甚至还有摩擦力。

再来试试看画SVG,绘制一个骑自行车的鹈鹕的 SVG 图像

这也是一个成名已久的超绝测试了,GLM-4.6(左侧)基本上元素都画出来了,有板有眼的,就是鹈鹕坐的位置有点低,DeepSeek V3.2(右侧)画出来的鹈鹕实现了脚身分离,方向也反了,车把也没了。

我还找到了另外16个模型的跑出来的鹈鹕,有的车把没了,有的鸟没了,有的头反方向了,有的都不在车丧,甚至有的车都没有画出来。

就这个测试它居然还有升级版,让鹈鹕骑自己。。。。

绘制一幅鹈鹕骑着另一只鹈鹕的 SVG 图像

大家有猜到哪个是GLM-4.6做的吗?

接着测测UI组件,说实话测天气组件已经测累了,来整点不一样的仪表盘,设计一个响应式的仪表盘(Dashboard)界面,包含导航栏、数据可视化图表和用户设置面板。使用诸如 Tailwind 这样的现代 CSS 框架。确保界面对所有用户都具备良好的可访问性,并在移动端同样兼容、显示正常。

提示语里要求的元素两个模型都是实现出来了,比的就是细节,GLM-4.6里的图标当鼠标移动过去的时候能展示出具体的细节,还可以顺利切换主题颜色,以及部分修改用户信息。

再再再来点怪的,让它们复刻我天天见的界面,帮我做一个 Excel 的克隆版本,但只需要前端部分。

这case还蛮新的,我是真没想到加粗、斜体、下划线都能实现出来,甚至连sum公式,单元格合并等也做出了接口,不过因为选不了多个单元格,这些功能没有起作用。比起DeepSeek V3.2,GLM-4.6还把居中、偏左偏右,单个单元格的复制黏贴剪切做出来了,照这样下去,Claude提出的Imagine with Claude,通过模型实时生成各种软件原型的理念真不远。

最后来个可交互的3D界面,创建一个交互式的 3D 粒子宇宙,包含 3 种模式,并能实时渲染多达 10,000 个粒子,呈现具有空间深度效果的三维视觉体验。使用 Three.js 实现。

GLM-4.6同样习惯性提供了更多的参数,可控调整的细节也更多,开3倍速的10000颗粒子迎面冲来的感觉,我感觉自己在穿越时间。

最后的最后,来看看GLM-4.6怎么接入最新版本的Claude Code V2.0吧,Claude Code的安装方法没啥变化,还是固定的3条

npm install -g @anthropic-ai/claude-code

export ANTHROPIC_BASE_URL=https://api.z.ai/api/anthropic

export ANTHROPIC_AUTH_TOKEN=你获得的APIkey

这个版本最大好处就是新增了检查点,可以回滚到之前的状态,按 Esc 两次或使用 /rewind 可选择恢复代码或者对话。

配合GLM-4.6的超低价,我都想不出我要自己写代码的理由。

买Coding Plan套餐包的话,是 1.99元/百万tokens,比 DeepSeek v3.2还便宜,均下来是Claude Sonnet 4.5的1/20到1/50,平均token消耗比GLM-4.5 省了30%左右,之前订阅过的会自动升级到GLM-4.6。

https://zhipuaishengchan.datasink.sensorsdata.cn/t/Vh

写在最后

写到这,有点想聊聊作为一个每天还要写代码的程序员对AI编程的想法,刚开始是不舍得用,额度一下子就没了,还会埋很多暗坑,过一段时间后,我特别喜欢用AI来写单元测试,或者编程语言的转换,把python转成sql啥的,不需要我去翻文档要导入什么包,安装什么环境,方便很多。

再后来,token大白菜了,我会在Cursor上把一些好用的github项目封装成说明书,让AI自己理解自己写,

最近就更过分了,因为我给自己的定位并不是那种遇到什么问题都尝试写个程序去解决的极客man,我都是等要用了临时学两手,立马解决问题。

所以编程对我来说更多是个工具,尤其是看到前人留下来的shi山代码,我的心已经比杀鱼十年的还要冷了,但AI编程让我感觉回到了很久很久之前,拿着本C# 就敢去开发的劲了,就好像没有什么是一行代码解决不了,有的话,多写两行就好了。

本文由人人都是产品经理作者【卡尔的AI沃茨】,微信公众号:【卡尔的AI沃茨】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。

题图来自Unsplash,基于 CC0 协议。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
三菱退出中国?官方回应:将与现有伙伴继续合作
6月23日,有媒体报道称,三菱汽车将逐步取消包括欧洲、中国在内的市场业..
2026款三菱帕杰罗曝光,第二代超选四驱+2.4T/2.0T双动力..
硬派越野圈的“老将”居然换小排量了?2026款三菱帕杰罗刚露出消息,就把..
恩智浦计划退出5G功率放大器业务;三星或将退出SATA SSD市场;三菱化学出售..
五分钟了解产业大事每日头条芯闻 恩智浦计划退出5G功率放大器业务我国首..
实拍三菱全新欧蓝德!搭1.5T四缸,内饰配大屏,不比奇骏香?..
在重庆车展上,全新一代三菱欧蓝德终于在国内亮相了,相比其国外的发布时..
试驾广汽三菱奕歌:小巧灵动
■ 阅车试驾车型:广汽三菱奕歌长/宽/高(mm):4405/1805/1685轴距(mm..
新车 | 四驱越野MPV/配侧滑门/2.2T柴油机,新款三菱Delica D:5亮相..
文:懂车帝原创 高帅鹏[懂车帝原创 产品] 日前,2025东京车展开幕,新款..
三菱集团的传奇发家史
“三菱”两个字,在日本就像一把瑞士军刀:银行、飞机、汽车、火箭、寿司..
2026款三菱Montero曝光,S-AWC四驱+差速锁全配,普拉多见了..
当 “普拉多见了都得慌” 的话题在越野圈炸锅,2026 款三菱 Montero 的曝..
日韩巨擘数据,三星2.1万亿三菱21万亿,中国第一谁?..
图片来源于网络2025年,让人火大的资本较量又来一波。韩国三星手里握着2...
关于作者
唐师(普通会员)
文章
1587
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263572 电子证书1157 电子名片68 自媒体91237

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索