> 自媒体 > (AI)人工智能 > 实测豆包新上线视觉大模型1.6-vision,OpenAI GPT5要失眠了
实测豆包新上线视觉大模型1.6-vision,OpenAI GPT5要失眠了
来源:人人都是产品经理
2025-10-07 13:16:24
191
管理

凌晨上线的豆包 1.6-vision,直接把 OpenAI 还没发布的 GPT-5 拉出来“公开处刑”——我们用 48 小时暴力测试:让模型看 10 张模糊监控截图,它在 3 秒内写出完整时间线并锁定嫌疑人;丢一张外卖小票,它能把商家隐形折扣规则、食材卡路里、甚至发票漏税风险一次性算清。

这个很好理解,缩放、裁剪、旋转、划线都是图片工具的一种。

当下真的幻视我七八年前用OpenCV打比赛,不知道还有没有人记得这张包浆照片,当年但凡是做图像处理的都应该用过来改色、或者丢给CNN(卷积神经网络)来识别。

隔壁GPT5-thinking的识别准确率只有15.4%,能看出来它已经在努力放大细节了,但是每个字的划分区域不够准确导致的错误。

绘线几何|POINT

刚好提到point,我还给模型们准备了数学几何题,

Seed-1.6-vision在单次思考的过程也不是只会在固定的两点画线的,

point可以随意移动,超长的上下文让它可以一次输出十几张过程图。

GPT5-thinking这波属于是“虚空画线“了,

看来是用的PIL没有定点和连线的功能,

一句话总结就是好用,

实打实的好用,

默认开启的图像工具降低了写提示语的成本,

两两组合还可以完成画线,准点画框、旋转 八倍放大的操作,

求赶紧同步发布到可以直接使用的网页端,

降低使用门槛,

这样我们都可以用上我们自己的,

最好的模型。

@ 作者 / 卡尔

本文由人人都是产品经理作者【null】,微信公众号:【卡尔的AI沃茨】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。

题图来自Unsplash,基于 CC0 协议。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
三菱退出中国?官方回应:将与现有伙伴继续合作
6月23日,有媒体报道称,三菱汽车将逐步取消包括欧洲、中国在内的市场业..
2026款三菱帕杰罗曝光,第二代超选四驱+2.4T/2.0T双动力..
硬派越野圈的“老将”居然换小排量了?2026款三菱帕杰罗刚露出消息,就把..
恩智浦计划退出5G功率放大器业务;三星或将退出SATA SSD市场;三菱化学出售..
五分钟了解产业大事每日头条芯闻 恩智浦计划退出5G功率放大器业务我国首..
实拍三菱全新欧蓝德!搭1.5T四缸,内饰配大屏,不比奇骏香?..
在重庆车展上,全新一代三菱欧蓝德终于在国内亮相了,相比其国外的发布时..
试驾广汽三菱奕歌:小巧灵动
■ 阅车试驾车型:广汽三菱奕歌长/宽/高(mm):4405/1805/1685轴距(mm..
新车 | 四驱越野MPV/配侧滑门/2.2T柴油机,新款三菱Delica D:5亮相..
文:懂车帝原创 高帅鹏[懂车帝原创 产品] 日前,2025东京车展开幕,新款..
三菱集团的传奇发家史
“三菱”两个字,在日本就像一把瑞士军刀:银行、飞机、汽车、火箭、寿司..
2026款三菱Montero曝光,S-AWC四驱+差速锁全配,普拉多见了..
当 “普拉多见了都得慌” 的话题在越野圈炸锅,2026 款三菱 Montero 的曝..
日韩巨擘数据,三星2.1万亿三菱21万亿,中国第一谁?..
图片来源于网络2025年,让人火大的资本较量又来一波。韩国三星手里握着2...
关于作者
帝王之星(普通会员)
文章
1643
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263572 电子证书1157 电子名片68 自媒体91237

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索