编辑:定慧
【新智元导读】谷歌的Gemini 3.0疑似上线LMArena!众多实测提前曝光,但效果嘛,很难评。
Gemini 3.0传了这么久,终于还是露出「马脚」了。
依然还是LMAreana竞技场,Gemini 3.0的两个「马甲」被扒了出来。
Gemini 3.0 Pro的马甲:lithiumflowGemini 3.0 Flash的马甲:orionmist
一些拿到内测资格的开发者,放出了部分demo。

同样的问题,GPT-5 Thinking就有点「发癫」,直接识别成了12:30,有点时针、分针不分了。

如果竞技场里Gemini 3的马甲能力是真的,那确实Gemini 3还是非常值得期待!

SVG实测传统艺能,骑自行车的鹈鹕
新模型每次一出来,SVG测试是躲不开的。
Gemini 3 Pro的SVG测试效果,初看还是很不错的。




,时长01:35
你觉得这个音乐效果如何?
目前大部分实测还是在LMArena碰运气。
(顺便吐槽一下,跑了快100个提示了,还是没碰到Gemini 3)
那为什么判断这两个马甲就是Gemini 3的实测代号呢?
有人说「Orion」本身可能和Gemini 3有关,而且「orionmist」这种两个单词合成方法是谷歌会使用的。

甚至只有1分钟,Gemini 3 Pro就能用SVG做出一整个风格动画。

截取了部分动画,这个效果看起来还是挺「唬人」的。

不过,也有部分人遇到的实测效果并不理想。

谷歌的Gemini 2.5发布也快一年,目前各个大科技厂都盯着OpenAI的动作。
在OpenAI打出GPT-5和新版Sora 2两张牌以后,谷歌只跟了一张Veo 3.1。
这波上线LMArena的估计是发布前的试水了,Gemini 3应该很快了!
总的来说,虽然模型确实强了不少,能看表、能画SVG、还能作曲,但整个AI圈的「传统艺能」也越来越固定了——
先传风声、再上LMArena、然后一堆人去撞马甲、测SVG、看谁更像真货。
看多了也不免有点腻。
毕竟,无论是Gemini 3、GPT-5还是Claude新版本,最后都还是那一套「实测截图 prompt对比 看图说话」。
模型越来越聪明,但我们的评测方式似乎还停在老套路上。
希望下一次,不只是模型更强,而是真的能玩出点新花样。
相关文章









猜你喜欢
成员 网址收录40418 企业收录2986 印章生成263572 电子证书1157 电子名片68 自媒体91237