两周前还在围观 Ring-1T-preview 的数学题解法,昨夜蚂蚁突然甩出全球首个开源万亿思考模型 Ring-1T,这个让 GPT-5 都捏了把汗的选手,不仅在 IMO 奥数题里解出银牌水平,连画骑自行车的鹈鹕都能精准甩出竞品三条街(DeepSeek 的鹈鹕至今坚持脚身分离)。当 Icepop 算法冻住万亿参数的训练崩裂,当 ASystem 让模型在沙箱里每秒练上万次,那个能种树的蚂蚁,这次真的在 AI 开源赛道上,把 "思考" 卷出了新高度。

蚂蚁最近好卷啊,两周内先后开源了Ring-1T-preview、Ling-1T和Ring-1T,Ring-1T同时是全球首个开源的万亿思考模型,这名头够响亮,也够让我半夜开机来个全面测试。

光速开测,用的是我的大模型噩梦级测试案例1.1版,跟DeepSeek V3.2(开深度思考)来个PK。公开所有提示语,每个提示语跑三次,取效果最好的一次作为最终结果。包括SVG、物理模拟、前端设计、可交互3D四大类
先来个SVG热热身,绘制一个骑自行车的鹈鹕的 SVG 图像

图左:GRPO训推差异随着训练成指数上升,Icepop较为平稳;
图右:训推差异最大值,GRPO随着训练上升非常明显,Icepop维持在较低水位
我用大白话解释一下:
左图看的是整体情况:IcePop整体很稳,GRPO整体上越来越不稳定。右图看的是极端情况:GRPO不仅整体不稳定,在最坏情况下的差异还在持续恶化。而IcePop在最坏情况下,差异也远小于GRPO,并保持在相对可控的范围内。另一个则是自研的高性能强化学习系统ASystem,它的任务只有一个,搞定万亿参数这种巨无霸模型的训练。
模型的个头太大,把它塞进显卡里,内存会爆掉。那就只把当前计算需要的那一小部分数据放进显卡。模型需要在一个安全的环境里不断练习才能进步。那就提供多个独立的练习房(沙箱),模型想练就练,而且每秒能支撑上万次练习。
可能很多人不知道蚂蚁还闷声搞了不少事,在模型层除了基础语言模型Ling-1T和这次的推理模型Ring-1T,马上还会更新多模态模型Ming,框架层也没放过,除了上面提到的Asystem,还有多智能体系统框架AWorld,应用层也还有,除了上面提到的多Agent百宝箱,还有AI健康管家AQ、AI理财管家蚂小财、AI生活管家该有的都有了,这样来看,蚂蚁开源模型更像是件顺手的事。
撰写:卡尔
本文由人人都是产品经理作者【卡尔的AI沃茨】,微信公众号:【卡尔的AI沃茨】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。
题图来自Unsplash,基于 CC0 协议。
相关文章









猜你喜欢
成员 网址收录40418 企业收录2986 印章生成263572 电子证书1157 电子名片68 自媒体91237