2024清华五道口首席经济学家论坛于9月28日在北京举行。北京百川智能科技有限公司创始人兼首席执行官王小川出席并演讲。
以下为演讲实录:
王小川:我发现这一年多来对技术路径怎么发展,市场怎么发展,我讲的都是对的。
第一个,语言为中心,我反复强调语言为中心,这是最重要的一件事,语言变成数学是这一代的变化。行业老提多模态,包括周鸿祎说Sora很强,这是行业很多做多模态,不光是周总,整个学术界把多模态当回事儿,但其实这个突破是在语言上。
第二,行业开始往做的足够大的方向不断发展,但是有一个大的机会是范式的变化,GPT-o1的发布,从快思考走向慢思考,并不是像原来一样参数变得足够大也被验证了,前面两个技术被验证了。
第三个场景当中,什么场景是未来能够大的,且驱动中国发展的,全世界重大的问题,叫做赋能千行百业,或者提到今天还没有把它场景做大,往下要验证的事情就是医疗健康的贡献,甚至医疗是大模型皇冠上的明珠,我们最后走向AGI。
等待一年后再验证百川后面的思考。
今天有很多相通的地方,从科学时代迈向智能时代,这个题目开的更大一点。谈几个重要的观点,在去年年初的时候有争论,到底通用智能时代是不是到来了?我是坚定地相信到来了。我在2018年的时候讲过一句话“当机器掌握语言,强人工智能就到来。”2018年讲这个话的时候,离2023年还有五年的时间,其实那会儿是没有到来的。
当我开始用GPT,开始看到机器掌握语言之后,我知道变天了,我们开始进入智能时代。从工业时代、电气时代、信息时代,我们称为第四次工业革命。今天开始有这样一个共识了。今年年初的时候有些朋友跟我讲,小川,2024年元旦快乐。我说我们要叫做智能纪元二年元旦快乐,2023年是一个元年,新的纪元的开始。比大家想的更大的事。周鸿祎说我是信徒,我带着百川是在智能元年成立的一家公司,快速入场,快速成为中国头部的创业企业。
除此之外,我依然觉得这个事比大家想的还要更大,我不是当工业革命去看,当工业革命看还是一种惯性。我跟大家分享一些我理解不太一样的地方,我叫做科学时代,现在叫智能时代。
科学时代的起步,一个科学家叫牛顿,牛顿重要的工作是把物理学变成了数学,一个讲科学实验,科学实验范式是他提出来的,光子是旋转的还是光是复合的颜色?白光是什么东西?那是讲科学实验。另外重要的东西就是把物理学变成了数学,他有一本巨著叫做《自然哲学的数学原理》,在之前叫《自然哲学》,在他手上变成数学。从康德的讲法来讲,数学是理性的空间,我们没法得到真实的世界的,但是物理学是今天最接近真实的学科,天上星星怎样运动的,苹果怎么落地的,以前是不同的自然现象,但是通过他的翻译体系之后就变成了数学公式,变成了模型,变成了统一的一件事情了,世界的物理万物变成数学解释现实世界。像相对论、量子力学、麦克韦斯方程等等,都是以物理学变成数学作为起点,因此叫做科学的时代。
今天很重的一句话,我叫做智能时代,它跟科学时代不一样了!
科学时代更多讲我们对世界的观测,公式化,这是我们上个时代做的工作。我们这次的起步开始叫做把语言变成了数学,语言是人类认知世界中间重要的一个工具。其实人是观测者,没有观测者就没有创造者,观测使得我们对世界重新以人的意义体系建模,不管是维特根斯坦讲的语言的边界就是你世界的边界,语言中心位置,包括语言是符号体系,我们讲的数学、代码都是语言的符号。学过高等数学的知道,一个等号是一件非常复杂的事情,1+1=2,什么叫等号呢?这个等号是等价群的意思,1+1和2是在一个群里面是分在一个群里面的,叫相等。人类发明语言是对世界上做的重要的一种重新分类的活动,就是代表智能。
我有一句话叫做语言是我们知识、思考和沟通的载体,当语言变成数学问题之后,我们的沟通、知识和思考就变成了数学问题。像物理变成数学一样,这是非常重大的时代突出。在时代之前,第一步就是语言变数学,还有多模态在里面,但是没有那么重要。
第二件事情是从快思考到慢思考,因为今天思考变数学,今天大模型拍脑袋灵光一现给人一点输出,不是经过深思熟虑的。第二步强化学习,包括慢思考,用强化学习和思维链解决慢思考的问题就发生在两周前重大的事件,大模型国内偏冷,但其实我们又有人类智慧巨大的突破。
前两天有媒体问我说再预测下一个突破是什么?我们刚才提到了从语言了强化,下一步我想在五年、十年后还重要的一件事情是机器能够通过写代码去运行代码,获得解决问题的能力。今天我们知道像AlphaGo,咱们都做过,你能不能给我学会下围棋?机器会琢磨什么叫下围棋?围棋怎么判断输赢?把它变成数学代码,程序代码,下围棋的走子规则是什么?生成代码,机器开始自己生成一个下围棋的code,去运行它,运行完之后机器学会下围棋,可以想象通过语言背后能够产生代码的连接,跟同事讲的这个东西挺科幻的,再预测就是大的技术方向。
再往前推,我们还知道智能时代里面做工作,再往下还有一个时代,我认为是今天的物理科学带来的和今天智能还不能解决的问题,怎么把生命变成数学模型。后面我们理解生命,理解活着本身背后的数学问题,理解意识背后的数学问题,人跟机器在共生当中都是以生命的视角来看,而不是物理的世界模型,我称为共生时代,这是做一个预测,可能发生在十到二十年之后会进入新的时代。
黄仁勋已经在他的视频里面讲了,今天开始出生的人不要再学习写代码了,写代码的工作未来机器都会干,我们对未来从生物、生命、生物医药,这是后面的工作。如果刚才从第四次工业革命,我宁可叫做进入智能时代,而不是第四次工业革命,再往下从科学时代、智能时代走向共生的时代。
在智能时代里面,核心在做四个阶段性工作,前两个在信息时代开始解决的,我沿用的DIKW的模型。D是Data、Information、 knowledge、Wisdom。二十年以前人类最伟大的作品,开篇之作是搜索,是解决信息检索的问题,从我们的数据变成了信息。之后也有像收官之作,是作抖音和TikTok,信息从搜索走向了一个推荐。
再往后一直没解决的问题是知识问题,大家都听过一个词叫知识图谱,这是谷歌发明的一个词knowledge graph,我用一个概念讲叫做苦海无崖,回头是岸。这样的技术路线图是不通向未来的,靠人在里面大量的解三元组。中国的首都是北京,靠人去标记,去建立什么叫首都,什么叫城市,什么叫国家,我们在世界的理解里面还是人去做。我在感叹人这样教机器学会语言,像人教机器学会人连一样,本身是不可能实现的事情。而大模型一举攻破了这个问题,把知识变成了数学问题,语言变成数学之后解决了,所以语言模型解决这个问题。
之后开始走向搜索增强,把信息用起来,这个事情发生了18个月,GPT-o1的发布代表了从强化学习开始,我们跳出原来已经有的知识学习的分布。下面的图是重大的变化,可以讲两个模型,一个是生成式模式,语言模型它的特点是数据越多越智能,除了算力以外,尽可能多的数据进来,学的越多,它变得越聪明。这个学习系统按照中国的古话来讲叫做“学而不思则罔”。学东西很多,但是脑子是混乱的,并不经过自己的反思,跟这个真实世界的对齐,这个系统有它的天花板的。走向慢思考背后的一套语言体系就是强化学习,经典的代表之作是2016年发布的AlphaGo,在强化学习上工作,打游戏,做后面的其他的生物蛋白都走的强化学习的道路。
强化学习的做法正好跟大模型截然相反,大模型数据越多越好,强化学习让人的数据越少越好,专家越少越好,每丢掉一些专家就变得越聪明。后来就是Alphazero,AlphaGo训练用了人类6000万的起居做的训练,Alpha zero是0,就不要靠人教它怎么下棋,通过规则,自己通过思考学会了下棋,反而得到了比人更高的下棋的能力。如果它没有学习,只是靠思考,按照中国论语讲的思而不学则殆。一个是今天之前的传统大模型系统叫学而不思则罔,AlphaGo停在下围棋不会新的东西,学和思融合在一起会形成今天的范式。Open AI发布新的GPT-o1兼具这样的学习能力和思考能力,通过多轮的思考让自己凭空成长,你不用的时候它也在进化,这是思考的范式。
今天还有一个大的变革,从科学时代的尾声走向智能时代之后,一些范式在发生变化。我们更多是通过生产关系的变化推动社会进步,比如大家都用美团,美团连接了这些人和商家,店家,我们用滴滴连接了司机,我们用抖音和搜索都是连接的方式在解决的,本身自己并不提供后面的智能,所以是生产关系方面的改变。而且大模型的范式发生变化更是直接提出生产力,不是改变生产关系,而是自己产生了智能。
我们今天做大模型当之无愧是新质生产力中间的一个部分,甚至可能是中间最重要的部分,直接提升供给。最近国外一本书里面讲财富就是知识,大模型是知识引擎,甚至以后做AI For Science,今天成为财富引擎,是生产力带来的。之前我也接触很多的产品经理,如果大家跟互联网圈接触的话,产品经理是中间一个最神圣至高的位置,因为他代表发现了需求,发现潜在,但是没有被满足的需求,通过技术实现叫做PMF,就是Produce Market Fit跟市场的验证,叫做发现一个需求,实现它,去验证它,这是互联网之前的工作范式。但是大模型不是发现需求是重点,而是很多需求已经天然存在,但是更多是供给不足,生产力不足,提供不了。像医生、教师这样一些职位,需求是我要治好病,让自己变得更加有能力,这是一直实现的,对产品经理要求不是洞见需求,而是对技术本身的理解,需求驱动。
最后一句话,我们之前更多在造工具,上次我见到一个高管跟我说:“大模型行吗?”他觉得有问题,我说:“你质疑在哪儿?”我就怼了他一句,我说:“你会做吗?”他自己也不会。今天作为一个人,他本身不代表有工具能力,因此大模型自己有之后,我们实现的是造人,造自己的员工,造我们的伙伴,使得人类推向新的世界,人与智能形成共同面向世界的文明。
谢谢。
新浪声明:所有会议实录均为现场速记整理,未经演讲者审阅,新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。