
8月6日消息,谷歌DeepMind发布了世界模型最新版本Genie 3,该模型能够生成可以实时互动的3D环境。该公司表示,用户与这些世界互动的时间将比以往更长,且模型能够记住物体的位置,即使用户移开视线后也能准确定位。
8月5日消息,当地时间8月4日,谷歌在其官网表示,其联合Kaggle推出了一个全新LLM(大语言模型)评估平台——Game Arena,这个平台通过让LLM在战略游戏中直接对抗,提供一个客观、动态且可扩展的评估新范式。为庆祝平台上线,谷歌将在北美时间8月5日举行首次LLM象棋比赛,八大顶尖AI模型(谷歌、OpenAI、Anthropic、xAI、DeepSeek、月之暗面)将参与。

8月5日消息,阿里通义千问Qwen开源Qwen-Image,一个20B的MMDiT模型。这是通义千问系列中首个图像生成基础模型,其在复杂文本渲染和精确图像编辑方面取得了显著进展。通过增强的多任务训练范式,Qwen-Image在编辑过程中能出色地保持编辑的一致性。在多个公开基准测试中的评估表明,Qwen-Image在各类生成与编辑任务中均获得SOTA,是一个强大的图像生成基础模型。

8月6日,Anthropic公司宣布推出Claude Opus 4.1模型,相比较今年5月推出的Claude 4系列模型,主要改进了编码、推理和执行指令的能力。
Anthropic表示,Claude Opus 4.1在SWE-bench Verified(用于评估软件工程准确性)上提升到了74.5%,作为对比,Claude Sonnet 3.7的准确率为62.3%,而Claude Opus 4的准确率为72.5%。具体来说,更新后的模型在“深度研究和数据分析技能,尤其是在细节追踪和代理搜索方面”表现得更加出色。

8月8日消息,据悉,特斯拉公司正在解散其Dojo超级计算机团队,该团队负责人彼得·班农(Peter Bannon)也将离开公司。这些人士称,该团队部分人员已转投DensityAI,其余Dojo团队成员将被重新分配至特斯拉内部的其他数据中心和计算项目。特斯拉计划加强对外部技术合作伙伴的依赖,包括在计算方面依赖英伟达公司和超威半导体公司,在芯片制造方面依赖三星电子公司。

8月4日,小米自研声音理解大模型MiDashengLM-7B正式发布,并全量开源。据小米官方介绍,MiDashengLM-7B速度精度上实现双突破:单样本首Token延迟仅为同类模型1/4、同显存下并发超20倍,在22个公开评测集上刷新多模态大模型最好成绩(SOTA)。
相关文章









猜你喜欢
成员 网址收录40418 企业收录2986 印章生成263572 电子证书1157 电子名片68 自媒体91237