> 自媒体 > (AI)人工智能 > SAM3来了:从点选到“听懂人话”,CV分割再迎GPT-3时刻?
SAM3来了:从点选到“听懂人话”,CV分割再迎GPT-3时刻?
来源:侃易叨
2025-10-16 10:03:27
230
管理

最近AI圈有个新动静,第三代“分割一切”模型SAM3,已经悄悄投稿给ICLR2026了。

论文还在双盲评审,作者没露名字,但光看标题就知道不简单,这模型终于能听懂人话了,不用再像以前那样靠点选、画框才能分割东西。

比如你跟它说“条纹猫”,它就能自己在图里找出所有带条纹的猫,一个个都分割出来。

SAM3的“听懂人话”,靠的是啥技术?

能做到这点,可不是随便改改代码就行。

SAM3背后有个叫PCS的新任务范式,全称是“可提示概念分割”。

简单说,就是你给它个短语、或者一张示例图,它就能把所有匹配的东西都找出来。

为了实现PCS,SAM3还改了架构。

它的检测器用了DETR变形Transformer的设计,能根据文字和视觉提示找实例。

最关键的是加了个PresenceHead模块,把“认东西”和“找位置”拆开来处理。

老实讲,以前的模型老是把这两件事放一起做,比如判断“这是不是猫”的同时还要找猫在哪,很容易出错,尤其是东西多的时候。

现在拆开来,精度确实提上去了。

光有架构还不够,数据得跟上。

还有开源社区早就用YOLO加GPT-4API实现过类似功能,觉得SAM3有点“炒冷饭”。

这种质疑也有道理,SAM3确实是在现有基础上优化,但它把多实例、图片视频统一处理这些点整合到一起,还是有进步的。

整体来看,SAM3算是给分割模型开了个新方向,从“靠手点”变成“靠嘴说”,门槛低了很多。

以后做视频剪辑、AR/VR这些事,用它来分割东西会方便不少。

比如剪视频的时候,想把所有“人物”都挑出来,不用再一帧一帧画框,说句话就行。

不过要想更实用,还得解决那些短板。

比如把复杂语言理解加上,再适配医疗、工业这些细分场景。

要是下一代模型能做到这些,说不定真能像SAM1那样,在CV领域再掀起一次小浪潮。

毫无疑问,SAM3现在还不是终点,但它至少让我们看到了分割模型“更聪明”的样子。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
三菱退出中国?官方回应:将与现有伙伴继续合作
6月23日,有媒体报道称,三菱汽车将逐步取消包括欧洲、中国在内的市场业..
2026款三菱帕杰罗曝光,第二代超选四驱+2.4T/2.0T双动力..
硬派越野圈的“老将”居然换小排量了?2026款三菱帕杰罗刚露出消息,就把..
恩智浦计划退出5G功率放大器业务;三星或将退出SATA SSD市场;三菱化学出售..
五分钟了解产业大事每日头条芯闻 恩智浦计划退出5G功率放大器业务我国首..
实拍三菱全新欧蓝德!搭1.5T四缸,内饰配大屏,不比奇骏香?..
在重庆车展上,全新一代三菱欧蓝德终于在国内亮相了,相比其国外的发布时..
试驾广汽三菱奕歌:小巧灵动
■ 阅车试驾车型:广汽三菱奕歌长/宽/高(mm):4405/1805/1685轴距(mm..
新车 | 四驱越野MPV/配侧滑门/2.2T柴油机,新款三菱Delica D:5亮相..
文:懂车帝原创 高帅鹏[懂车帝原创 产品] 日前,2025东京车展开幕,新款..
三菱集团的传奇发家史
“三菱”两个字,在日本就像一把瑞士军刀:银行、飞机、汽车、火箭、寿司..
2026款三菱Montero曝光,S-AWC四驱+差速锁全配,普拉多见了..
当 “普拉多见了都得慌” 的话题在越野圈炸锅,2026 款三菱 Montero 的曝..
日韩巨擘数据,三星2.1万亿三菱21万亿,中国第一谁?..
图片来源于网络2025年,让人火大的资本较量又来一波。韩国三星手里握着2...
关于作者
冷冷的太阳..(普通会员)
文章
1660
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263572 电子证书1157 电子名片68 自媒体91237

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索