胡鲁辉：“后GPT-4”有4大发展趋势，理解物理世界才能接近AGI-脚本导航

> 自媒体 > （AI）人工智能 > 胡鲁辉：“后GPT-4”有4大发展趋势，理解物理世界才能接近AGI

胡鲁辉：“后GPT-4”有4大发展趋势，理解物理世界才能接近AGI

来源：智东西

2025-09-23 10:20:38

181

管理

第一，从语言大模型到多模态大模型。

第二，迈向向量数据库。目前的大语言模型或多模态大模型不论多大，都有一定的局限性，导致向量数据库火起来了。大家可以把一部分或大部分的数据放在向量数据库里，把相关的数据放在大模型中。

第三，从自动Agent到将大模型作为操作系统。Agent比较火，但是它的背后依然是语言大模型或多模态大模型。Agent相当于软件自动实现。后续多模态大模型作为操作系统可能是比较核心的。

第四，开源模型从微调到引入插件平台。ChatGPT相当于一个平台，不仅可以微调，而且可以通过插件作为一个平台，因此插件可能是未来的一个方向。

为什么模型能够这么快发展，为什么我们能够支撑Scaling Law？很大原因是计算能力的发展。CPU时代有摩尔定律，GPU时代同样发展速度更快。去年英伟达发布能够支撑1亿FLOPS的算力，今年他们发布了新的DGX GB200，去年是GH200，现在是GB200，小了一点，更快一点，但还是一个量级的。好几个DGX串起来是很大的规模，近十年之前IBM计算机也是相当大的，而现在手机就能支撑以前的算力，GPU其实也一样。

有这个大模型或算力后，应用在发生什么变化？可以看到，AI 2.0比较以前的传统软件或互联网，用户和场景可能都一样。但是以前是用户从App到服务软件再到CPU，现在是用户从多模态到基础模型，然后到GPU，中间可以依赖数据库或者训练数据，传统的用数据库，现在用向量数据库。

接下来关于理解物理世界，AI赋能了智能手机、智能车、智能家居等等，围绕的计算核心是智能云。现在或未来中心会是AI factory（人工智能工厂），它的输入是Token，文字、视觉或视频，它的输出就是AI。过去应用有手机、有车，将来就是各种机器人。未来汽车某种意义上也是一种机器人。从架构来看，AI for Robotics是一个未来方向，未来即将爆发的方向，从云计算、AI工程、基础模型，生成式AI再到上面的AI for Robotics。

理解物理世界也比较有挑战性，现在的语言模型只能局限于训练的范围中，对外界的理解还是有相当的局限性。

理解物理世界到底有哪些特征，怎么能够从现有的多模态大模型转向理解物理世界，有了理解物理世界以后再向AGI接近？我认为有七个方面，最外面的紫色是比较优秀的人，因为人的水平都不一样，作为比较优秀的人能够理解物理世界的水平。

但GPT-4或最新的GPT-4 Turbo是什么样？是里面的圈。现在GPT-4 Turbo和人还是有很大的距离，只有从每个维度提升发展，才能真正理解物理世界，更加接近地通用人工智能。

理解物理世界不仅仅是对空间的理解或者空间智能，因为从概念上 “空间”相当于3D，不包括语言等核心AI。

说到这里，大家可能觉得比较抽象，这也是Meta最近在做的一些事情。Meta在开源大模型或者开源多模态大模型方面目前显得“落后”了，但Llama 3马上来了，是因为它把很多精力花在了世界模型中，同时在治理的7个方面提高模型的能力。

我最近成立一家公司叫智澄AI，致力于通用人工智能。“澄”的意思是逐步走向真正的智能。

以上是胡鲁辉老师演讲内容的完整整理。

赏礼

赏钱

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

没有了

软银官宣！清仓英伟达套现58亿美元，转投OpenAI……

16天前