对话王小川:人类进入AI新时代

来源:中国企业家杂志编辑: 赵东山 2023-06-01 16:02
核心提示:AI开始认知世界,成为有知识、能思考、善表达、会学习的智能体。

图片

 
ChatGPT引爆一系列变革之后,给王小川的直观感觉是“地动山摇,要变天了”。
 
过去一个多月里,几乎每隔一段时间,甚至是每隔几天,OpenAI就有新的技术进展,从GPT-4的发布,到与微软Office系列产品的结合,再到推出Plugin平台开放更多的插件,每天都在刷新人们的认知。
 
王小川对此的形容是“掉个渣儿都会产生很大的影响”。
 
ChatGPT也引发了国内的AI大模型创业潮。
 
在一系列的讨论中,王小川被认为是最有可能参与打造中国版OpenAI的候选人之一。
 
王小川是清华大学计算机系96级的知名人物,创办了搜狗搜索,多年前就通过AI技术探索在输入法、搜索、语音识别等应用。
 
更重要的是,2021年10月,卸任搜狗CEO后,王小川一直在寻求指引他再次创业的那盏明灯。
 
一年零两个月后,他终于看到了。
 
2023年1月,王小川在试用ChatGPT后,意识到“强人工智能时代到来了”。
 
仅3个月后,4月10日,他正式官宣入场大模型创业,和前搜狗COO茹立云联合创立人工智能公司——百川智能。
 
目前,百川智能已获得5000万美元启动资金,来自王小川与其业内好友的个人支持。
 
团队拥有包括来自搜狗、百度、华为、微软、字节、腾讯等知名科技公司的数十位顶尖AI人才。
 
不同于创办搜狗,这一次创业,王小川把自己的名字写进了公司名字中,他解释:
 
“百川不是我一个人,需要更多人来做这个事。”
 

每天,他花三分之一的时间找人,三分之一的时间学习。

 

他也非常有信心在年底做出中国最好的大语言模型。

 

过去十多年,王小川一直在关注人工智能的进展。

 

2016年,在AlphaGo与李世石展开人机大战之前,他就和几位AI大佬打赌并预测AlphaGo会赢。

 
不过,从搜狗退出后,他把重心转移到了生命健康领域,这些年他读了上千篇医学论文。
 
关于缺失在人工智能语境中的那两年,他告诉我们:
 
“可能有人比我先淋到雨,但有可能他不觉得在下雨。但当雨滴滴下来之后,我第一个意识到,变天儿了!”
 
短短三个月,他用ChatGPT的次数已经明显多于用搜索的次数。
 
针对“谁能在这场大模型竞争中胜出”这个问题,王小川表示:
 
“小创新大厂赢,大创新小厂赢。大厂的专注度和效率不一定比创业公司高,而且有追求的人可能在原有的地方也有瓶颈,这个事就适合用创新来做,我不觉得AI创新是专属于大厂的事情。”
 
王小川的精彩观点如下:
 
1、创业不是一个拼盘的过程,感觉好像拉几个人,概念上放在一块就行了。
 
它是一个生命体,要不断演化,一点点长起来。
 
2、我现在做的事是世界需要的,跟世界是连在一块的,不是公司需要、部门需要或者只是同学们需要的,这是不一样的。
 
3、机器掌握语言,强人工智能就到来了。
 
当你没有语言的时候,我们其实没法去认知这个世界,语言的边界就是世界的边界。
 
4、OpenAI需要特别自由的环境,甚至无目的性,不是为了赚个钱,或者为了有一种商业回报,就是对事情本身的好奇。
 
这种情况本身就跟科学精神更一致。
 
5.搜索正好是ChatGPT的反面,细节都知道,抽象知识不会。
 
ChatGPT是抽象知识会了,细节全忘了。就像一个相对论,一个量子力学,合在一块儿,才能构成更完整的一种智能。
 
6.OpenAI的逻辑叫做理想大于落地。
 
我们就要平衡这件事儿,理想上可以比OpenAI慢半步,落地要快半步。
 

谈ChatGPT

当它能多轮对话时,我觉得要变天了

 
问:我们最近访谈了很多人,他们谈到ChatGPT的时候,往往都有一个惊艳时刻,你有没有这样的惊艳时刻?
 
王小川:我们一直搞语言,搜狗当时也做了百亿参数的大模型,但交给腾讯之后,我开始转向把健康变成数学问题的研究,中间零零散散看到一些进展突破。
 
假如当时还在语境里,我可能会更早敏感到这个事儿。
 
尤其记得当时,当你提个问题,一旦后面加了一个prompt(提示词)“think step by step(仔细想一想)”,机器就答对了,我觉得好好玩儿。
 
到了今年1月,用了ChatGPT之后,当我开始追问它时,我就发现变天了。
 
它能够用最自然的方法,根据我的提问回答,然后我再追加几个字的问题,它能根据追问做调整,这个时候我就发现不得了了,通用人工智能时代已经到来了。
 
问:傅盛老对外讲他问ChatGPT,他的狗为什么叫三万的问题,随后让他惊艳,你有没有问这样的问题?
 
王小川:我跟他们其实很不一样。
 
我可能不需要一个特别能让大众理解的东西来触动我。
 
我记得当时有个会,我和傅盛都参加了。
 
我当时就讲,通用人工智能到来了,他还不信,还觉得我在装。
 
但后来他打电话跟我说,小川,你太英明了,他也跟我说了三万这个案例。
 
我的敏感跟大家不一样,看到它能够多轮对话了,我就觉得通用人工智能时代到来了,并不是需要三万这样一个惊艳的例子。
 
问:其实你很早就预言,“当机器掌握语言之后,强人工智能就到来了”,会想到这么快就被实现了吗?
 
王小川:没有这种时间上的概念。
 
刚好在技术突破的时候,我退出搜狗离开了这个语境,但当这个雨滴滴下来之后,我认为我是第一个意识到,变天儿了!
 
可能有人比我先淋到雨,但他不觉得在下雨。
 
问:国内这么多年来一直在人工智能方面深耕,还有很多卓越的创业者,为什么等到ChatGPT出来之后才恍然大悟?大家原来都忽略了哪一点,或者说不敢想?
 
王小川:本身这种原创性的想法,很多时候就发生在美国。
 
我简单讲,大家不是不敢做,是没想法居多,特别到了工业界更是这样子。
 
他有自己的业务目标,天天为了向老板怎么汇报,天天琢磨收入,谁没事儿琢磨这个呢?
 
但我想过。
 
AlphaGo出来之前,大概2013年我已经在想CNN网络(卷积神经网络)能下围棋,当时我就满清华去找老师合作,想去做下围棋这事儿。
 
系主任、党委书记、所长、实验室主任都找过,大家对这事没有太大的冲动和热情。
 
AlphaGo出来之后,我有两个断言:
 
第一,机器掌握语言之后,强人工智能时代就来了;
 
第二,预测下一个由AI改变的是视频。
 
我相信今天预测下一个由AI改变的是视频这个事儿,也一定有人在死磕,因为这意味着你对物理空间有新的理解。
 
我觉得需要有这种脑洞,这个脑洞需要特别自由的环境,甚至无目的性,不是为了赚个钱,或者为了有一种商业回报,就是对事情本身的好奇。
 
这种情况本身就跟科学精神更一致的,去理解一种规律,跟商业世界确实比较远。
 
问:即使最头部的大厂意识到通用人工智能的机会,可能也没有办法持续投入?
 
王小川:没错。
 
这也是为什么我觉得谷歌干不过OpenAI的原因。
 
谷歌里面的工程师,可能有这个想法,没人有这个想法也组织不起来了。
 

谈通用人工智能

语言的边界就是世界的边界

 
问:你在很多场合说过语言的重要性。你认为语言在人类的文明,包括未来智能文明当中,扮演的角色是什么?
 
王小川:我之前说“机器掌握语言,通用人工智能就到来”,就是把语言跟通用人工智能放在一个画等号的位置上。
 
我之前从做搜索、做输入法,都是以语言为核心。
 
我们小学上课的时候就知道,马克思、恩格斯也讲,人跟动物的区别,就是会语言、会使用工具。
 
我经常举一个例子,有一件艺术品叫做“三把椅子”:
 
一把真的椅子在这儿,一张椅子的照片,还有一个是椅子这个词。
 
三把椅子,哪个才是椅子?
 
我们的第一反应可能都是,真正的椅子它是。
 
但是,我们去想,假设没有发明椅子这个词,人类没有个概念之前,那你坐着的就是一个东西,你没有办法抽象成一个具体的功能载体。
 
当没有语言的时候,我们其实没法去认知这个世界。
 
维特根斯坦也讲到,语言的边界就是世界的边界。
 
语言既是知识的载体,也是沟通的载体。
 
问:我听到一种说法,之前的深度学习的方式更像是一个人学习外语的方式,现在这种大模型的学习语言的方式,更接近于学习母语的方式。
 
王小川:我是认同的。
 
其实今天的问题,是深度学习之上更大的一个复杂方式,区别在哪儿?
 
学外语的时候,你等于要重新挂一个模块进来,通常是强迫你在迅速高密度地知道这种语料。
 
所以本身是大量的叫做监督数据或者标记数据里去做映射,例如英文映射成中文,你再去学习它,这是我们通常学的一种方法。
 
我们之前做机器翻译也是一样的。
 
但今天的做法,是让你先去书读百遍,其义自见,就跟小朋友学习一样。
 
第一天不是先教他学东西,而是先自由地到处看,他可能看到泡泡往上走、气球往上飞会特别兴奋。
 
他会很关注,然后去学。
 
他学的是世界上基本的规律,不是当成一个知识来学。
 
自然语言处理是人工智能皇冠上的明珠。
 

谈行业变化

地动山摇,掉个渣都会有很大影响

 
问:AI大模型出来之后,整个科技界就像打了一剂强心针,你身在其中,有什么感觉?
 
王小川:地动山摇。
 
我认为这是一个大时代的变化。
 
我们已经走出了互联网时代、信息时代,进入到了一个智能时代,这种情况下,掉个渣都会产生很大的影响,我觉得这是一种新的文明。
 
基础大模型其实需要特别多的钱,但不妨碍在中间有各种开发,做各种事情,有很多垂直领域的做法。
 
我不认为今天可能就只有这么一件事情去做,有太多周边垂直的事情,然后更有创造力的事情,都被发展起来,就像人类社会一样。
 
问:现在GPT-4不是开源的,对于创业来说,这不是在源头断掉了?
 
王小川:局面很复杂。
 
微软中国正在推云上接口,排队排得很长。
 
中小企业排队,前面排了15000到20000个企业,还要先提前注册,然后排到一个半月甚至两个月后。
 
此外,你还要写清楚,我的公司是干吗的,我的网页长啥样子,然后我调这个服务器干吗用的。
 
对方审完了,才给你接口。
 
问:前段时间OpenAI推出的Plugin平台,将会产生一个非常大的操作系统、生态系统,你怎么看?
 
王小川:今天大家都说要做中国版OpenAI,但很少有把ChatGPT当成它一部分来看的。
 
其实ChatGPT特别重要,是to C以后最大的一种颠覆性的入口和人机交互界面,就像黄仁勋讲,这是iPhone时刻。
 
这种情况下,ChatGPT未来也会做增强,可能有不同的路线图。
 
在我的想法里,会去做搜索增强,你知道现在时效性不够,以及会有实时性的东西缺乏,需要用搜索去跟它接。
 
搜索正好是反面,细节都知道,抽象知识不会。
 
这个抽象知识会了,细节全忘了。
 
就像一个相对论,一个量子力学,合在一块儿,才能构成更完整的一种智能。
 
今天至少OpenAI的做法,就是一路狂奔,它不屑于把搜索当成一个老的轮子挂着,而通过Plugin的方式去解决,OpenAI的逻辑叫做理想大于落地。
 
我们就要平衡这件事儿,理想上可以比OpenAI慢半步,落地要快半步。
 
问:这一波浪潮来了之后,搜索是在被海浪拍的最前沿的那个海岸线,是吧?
 
王小川:是的。
 
今天我用搜索的次数已经开始低于ChatGPT的次数。
 
问:你之前在做生命科学领域,后来出来做大模型,这中间你自己的变化是什么?
 
王小川:生命科学比这事更有理想,这个事今天做,十有八九只是觉得小川你适合干。
 
说明这事是更现实的,是已经被别人突破了。
 
前几年突破之前,中国其实也有一些人想做,但是理想坚定度不够,或者受到局限。
 
生命科学更复杂,更遥远,我认为健康本来就是数学模型,提了三个观点:
 
第一,牛顿把物理学变成了数学模型;
 
第二,OpenAI把语言变成了数学模型;
 
第三,我思考把医疗健康变成数学模型。
 
因此,我在选择时也力图在新公司里,把医疗健康作为重要的组成部分。
 

谈创业

这不是属于大厂的游戏

 
问:你大概在什么阶段决定正式筹备百川智能?
 
王小川:2月份我开始认真想这件事。
 
问:你把名字融入到公司名字,这个事看来很不王小川,是表明自己要All in?
 
王小川:对,以前做搜狗的时候,没有这样一种机缘。
 
这次来讲,确实你说得对。
 
问:百川最核心的创始团队怎么达成的?吸纳更多外部的人,还是找原来一些创业伙伴?
 
王小川:这是两个问题。
 
首先,我是比较坚定一开始先从搜狗那边来搭团队。
 
因为创业其实不是一个拼盘的过程,创业是一个生命体,要不断演化这种过程,是一点点长起来的。
 
所以,今天的时代不允许你开始由两三个人一点点去找。
 
第二,搜狗的团队离AI非常接近,很多人觉得无人驾驶是AI,搜索不是。
 
其实搜索对AI的使用是非常多的,搜索也是数据、算力、算法,数据本身基本上是语言数据。
 
搜狗其实是在语言数据上,到今天为止最有能力掌握数据的公司。
 
此外,安全问题、意识形态问题等,搜狗也都是有成套的处理经验。
 
问:探讨大模型创业,算力、数据、人才都是成本,如果拿不到足够多的投资,实际上这个事没法做。
 
王小川:不同的路线图。
 
如果想做的是离AGI(通用人工智能)最近的公司,那么我预测是3亿到20亿美元的资金投入。
 
3亿只是入门的门槛。我们目前是选了对资金要求比较高的道路。
 
问:在路线图选择上有过纠结吗?要选择离大模型最近的一条,还是做离使用更近的?
 
王小川:双轮驱动。
 
超级应用需要跟底层产生非常强的连接,如果没有底座是没有办法支撑超级应用,在我心中大底座和大应用是相辅相成的。
 
问:具备什么样的素质才能选择离大模型更近的路?
 
王小川:至少两件事:
 
一是本身对技术有足够多的理想,因为它就是很挑战技术的活;
 
二是中间有一定体量的公司治理的号召力和能力,否则肯定不会做。
 
图片
摄影:邓攀
 
问:一端是对技术的理解,一端是对创业本身的理解。你说过有信心在年底做出中国最好的大语言模型,敢说这句话的人现在不多。
 
王小川:大厂的专注度和效率不一定比创业公司高,而且有追求的人可能在原有的地方也有瓶颈,说白了这个事就适合用创新来做,我不觉得这是属于大厂的事情。
 
不知道大家怎么看,我只不过长过一次教训,比如搜索那一波。
 
最早搜索起来所有门户都做了一遍,搜狗是拆分完了好不容易活下来了,百度也活下来了,但是阿里、腾讯也都没有做成,而那还是可以看得见的成熟的东西。
 
但今天有巨大的变化,对于决策的专注度、灵活度、专业性都有很高的要求,历史没有告诉我们大厂可以干这个事。
 
问:大家认为大厂,有可能是基于眼睛可以看到的,比如现在有多少A100的芯片,有多少人才,看起来像是大力出奇迹,你认同吗?
 
王小川:上一轮搜索也不是当时的大厂跟进的,这一波AGI也不是大厂可以做到的,但大家都说大厂可以干。
 
这个东西就是“小创新大厂赢,大创新小厂赢。”
 
问:现在大家都比较关注算力,其实数据高质量也很重要,如果数据质量比较低的话,算力再多最后也浪费了,你们在数据或者语料这一块怎么做的?
 
王小川:语料做搜索公司尽可能把公开的语料或者以前收集到的语料用起来,质量怎么评价会做得更好一些。
 
问:现在在搭建下一步团队的时候有什么样的标准?前两天听到说全世界的人都在挖OpenAI的人,但是没有人离开,还有大量的人才往OpenAI去。
 
王小川:确实有距离,需要敬仰的一个状态,现在人才储备有两条路,一是把国内最好的都能够聚到一块,甚至有好的效能把它发挥出来;
 
有机会再从硅谷摸到一点人或者认知。
 
我4月底会去一次美国交流学习。
 
问:你每天花在找人的时间多吗?
 
王小川:三分之一,找到合适的人之后还要做沟通,三分之一的时间还要学习,每天新的技术、新的产品发布都需要时间去学习。
 
问:你常说包袱变轻了,但好像压力变大了,怎么理解?
 
王小川:现在做的事是世界需要的,跟世界是连在一块的,不是公司需要、部门需要或者只是同学们需要,它需要的东西不一样的。
 
确实是压力变大了。
 
现在有太多创业需要整理的人和事,这个精力是远远不够用的状态。

 

 

  ·   END   ·  









免责声明:
 
文章系本网编辑转载,会尽可能注明出处,但不排除无法注明来源的情况,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与本网联系.
 
[声明]本站文章版权归原作者所有,内容为作者个人观点,不代表本网站的观点和对其真实性负责,本站拥有对此声明的最终解释权.
分享
0
评论
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
用户名: 验证码:点击我更换图片
 
分享到: