
ChatGPT引爆一系列变革之后,给王小川的直观感觉是“地动山摇,要变天了”。
过去一个多月里,几乎每隔一段时间,甚至是每隔几天,OpenAI就有新的技术进展,从GPT-4的发布,到与微软Office系列产品的结合,再到推出Plugin平台开放更多的插件,每天都在刷新人们的认知。
王小川对此的形容是“掉个渣儿都会产生很大的影响”。
在一系列的讨论中,王小川被认为是最有可能参与打造中国版OpenAI的候选人之一。
王小川是清华大学计算机系96级的知名人物,创办了搜狗搜索,多年前就通过AI技术探索在输入法、搜索、语音识别等应用。
更重要的是,2021年10月,卸任搜狗CEO后,王小川一直在寻求指引他再次创业的那盏明灯。
2023年1月,王小川在试用ChatGPT后,意识到“强人工智能时代到来了”。
仅3个月后,4月10日,他正式官宣入场大模型创业,和前搜狗COO茹立云联合创立人工智能公司——百川智能。
目前,百川智能已获得5000万美元启动资金,来自王小川与其业内好友的个人支持。
团队拥有包括来自搜狗、百度、华为、微软、字节、腾讯等知名科技公司的数十位顶尖AI人才。
不同于创办搜狗,这一次创业,王小川把自己的名字写进了公司名字中,他解释:
每天,他花三分之一的时间找人,三分之一的时间学习。
他也非常有信心在年底做出中国最好的大语言模型。
过去十多年,王小川一直在关注人工智能的进展。
2016年,在AlphaGo与李世石展开人机大战之前,他就和几位AI大佬打赌并预测AlphaGo会赢。
不过,从搜狗退出后,他把重心转移到了生命健康领域,这些年他读了上千篇医学论文。
“可能有人比我先淋到雨,但有可能他不觉得在下雨。但当雨滴滴下来之后,我第一个意识到,变天儿了!”
短短三个月,他用ChatGPT的次数已经明显多于用搜索的次数。
针对“谁能在这场大模型竞争中胜出”这个问题,王小川表示:
“小创新大厂赢,大创新小厂赢。大厂的专注度和效率不一定比创业公司高,而且有追求的人可能在原有的地方也有瓶颈,这个事就适合用创新来做,我不觉得AI创新是专属于大厂的事情。”
1、创业不是一个拼盘的过程,感觉好像拉几个人,概念上放在一块就行了。
2、我现在做的事是世界需要的,跟世界是连在一块的,不是公司需要、部门需要或者只是同学们需要的,这是不一样的。
当你没有语言的时候,我们其实没法去认知这个世界,语言的边界就是世界的边界。
4、OpenAI需要特别自由的环境,甚至无目的性,不是为了赚个钱,或者为了有一种商业回报,就是对事情本身的好奇。
5.搜索正好是ChatGPT的反面,细节都知道,抽象知识不会。
ChatGPT是抽象知识会了,细节全忘了。就像一个相对论,一个量子力学,合在一块儿,才能构成更完整的一种智能。
我们就要平衡这件事儿,理想上可以比OpenAI慢半步,落地要快半步。
当它能多轮对话时,我觉得要变天了
问:我们最近访谈了很多人,他们谈到ChatGPT的时候,往往都有一个惊艳时刻,你有没有这样的惊艳时刻?
王小川:我们一直搞语言,搜狗当时也做了百亿参数的大模型,但交给腾讯之后,我开始转向把健康变成数学问题的研究,中间零零散散看到一些进展突破。
尤其记得当时,当你提个问题,一旦后面加了一个prompt(提示词)“think step by step(仔细想一想)”,机器就答对了,我觉得好好玩儿。
到了今年1月,用了ChatGPT之后,当我开始追问它时,我就发现变天了。
它能够用最自然的方法,根据我的提问回答,然后我再追加几个字的问题,它能根据追问做调整,这个时候我就发现不得了了,通用人工智能时代已经到来了。
问:傅盛老对外讲他问ChatGPT,他的狗为什么叫三万的问题,随后让他惊艳,你有没有问这样的问题?
我当时就讲,通用人工智能到来了,他还不信,还觉得我在装。
但后来他打电话跟我说,小川,你太英明了,他也跟我说了三万这个案例。
我的敏感跟大家不一样,看到它能够多轮对话了,我就觉得通用人工智能时代到来了,并不是需要三万这样一个惊艳的例子。
问:其实你很早就预言,“当机器掌握语言之后,强人工智能就到来了”,会想到这么快就被实现了吗?
刚好在技术突破的时候,我退出搜狗离开了这个语境,但当这个雨滴滴下来之后,我认为我是第一个意识到,变天儿了!
问:国内这么多年来一直在人工智能方面深耕,还有很多卓越的创业者,为什么等到ChatGPT出来之后才恍然大悟?大家原来都忽略了哪一点,或者说不敢想?
王小川:本身这种原创性的想法,很多时候就发生在美国。
我简单讲,大家不是不敢做,是没想法居多,特别到了工业界更是这样子。
他有自己的业务目标,天天为了向老板怎么汇报,天天琢磨收入,谁没事儿琢磨这个呢?
AlphaGo出来之前,大概2013年我已经在想CNN网络(卷积神经网络)能下围棋,当时我就满清华去找老师合作,想去做下围棋这事儿。
系主任、党委书记、所长、实验室主任都找过,大家对这事没有太大的冲动和热情。
我相信今天预测下一个由AI改变的是视频这个事儿,也一定有人在死磕,因为这意味着你对物理空间有新的理解。
我觉得需要有这种脑洞,这个脑洞需要特别自由的环境,甚至无目的性,不是为了赚个钱,或者为了有一种商业回报,就是对事情本身的好奇。
这种情况本身就跟科学精神更一致的,去理解一种规律,跟商业世界确实比较远。
问:即使最头部的大厂意识到通用人工智能的机会,可能也没有办法持续投入?
谷歌里面的工程师,可能有这个想法,没人有这个想法也组织不起来了。
谈通用人工智能
语言的边界就是世界的边界
问:你在很多场合说过语言的重要性。你认为语言在人类的文明,包括未来智能文明当中,扮演的角色是什么?
王小川:我之前说“机器掌握语言,通用人工智能就到来”,就是把语言跟通用人工智能放在一个画等号的位置上。
我们小学上课的时候就知道,马克思、恩格斯也讲,人跟动物的区别,就是会语言、会使用工具。
一把真的椅子在这儿,一张椅子的照片,还有一个是椅子这个词。
但是,我们去想,假设没有发明椅子这个词,人类没有个概念之前,那你坐着的就是一个东西,你没有办法抽象成一个具体的功能载体。
问:我听到一种说法,之前的深度学习的方式更像是一个人学习外语的方式,现在这种大模型的学习语言的方式,更接近于学习母语的方式。
其实今天的问题,是深度学习之上更大的一个复杂方式,区别在哪儿?
学外语的时候,你等于要重新挂一个模块进来,通常是强迫你在迅速高密度地知道这种语料。
所以本身是大量的叫做监督数据或者标记数据里去做映射,例如英文映射成中文,你再去学习它,这是我们通常学的一种方法。
但今天的做法,是让你先去书读百遍,其义自见,就跟小朋友学习一样。
第一天不是先教他学东西,而是先自由地到处看,他可能看到泡泡往上走、气球往上飞会特别兴奋。
谈行业变化
地动山摇,掉个渣都会有很大影响
问:AI大模型出来之后,整个科技界就像打了一剂强心针,你身在其中,有什么感觉?
我们已经走出了互联网时代、信息时代,进入到了一个智能时代,这种情况下,掉个渣都会产生很大的影响,我觉得这是一种新的文明。
基础大模型其实需要特别多的钱,但不妨碍在中间有各种开发,做各种事情,有很多垂直领域的做法。
我不认为今天可能就只有这么一件事情去做,有太多周边垂直的事情,然后更有创造力的事情,都被发展起来,就像人类社会一样。
问:现在GPT-4不是开源的,对于创业来说,这不是在源头断掉了?
中小企业排队,前面排了15000到20000个企业,还要先提前注册,然后排到一个半月甚至两个月后。
此外,你还要写清楚,我的公司是干吗的,我的网页长啥样子,然后我调这个服务器干吗用的。
问:前段时间OpenAI推出的Plugin平台,将会产生一个非常大的操作系统、生态系统,你怎么看?
王小川:今天大家都说要做中国版OpenAI,但很少有把ChatGPT当成它一部分来看的。
其实ChatGPT特别重要,是to C以后最大的一种颠覆性的入口和人机交互界面,就像黄仁勋讲,这是iPhone时刻。
这种情况下,ChatGPT未来也会做增强,可能有不同的路线图。
在我的想法里,会去做搜索增强,你知道现在时效性不够,以及会有实时性的东西缺乏,需要用搜索去跟它接。
就像一个相对论,一个量子力学,合在一块儿,才能构成更完整的一种智能。
今天至少OpenAI的做法,就是一路狂奔,它不屑于把搜索当成一个老的轮子挂着,而通过Plugin的方式去解决,OpenAI的逻辑叫做理想大于落地。
我们就要平衡这件事儿,理想上可以比OpenAI慢半步,落地要快半步。
问:这一波浪潮来了之后,搜索是在被海浪拍的最前沿的那个海岸线,是吧?
今天我用搜索的次数已经开始低于ChatGPT的次数。
问:你之前在做生命科学领域,后来出来做大模型,这中间你自己的变化是什么?
王小川:生命科学比这事更有理想,这个事今天做,十有八九只是觉得小川你适合干。
前几年突破之前,中国其实也有一些人想做,但是理想坚定度不够,或者受到局限。
生命科学更复杂,更遥远,我认为健康本来就是数学模型,提了三个观点:
因此,我在选择时也力图在新公司里,把医疗健康作为重要的组成部分。
谈创业
这不是属于大厂的游戏
问:你把名字融入到公司名字,这个事看来很不王小川,是表明自己要All in?
问:百川最核心的创始团队怎么达成的?吸纳更多外部的人,还是找原来一些创业伙伴?
因为创业其实不是一个拼盘的过程,创业是一个生命体,要不断演化这种过程,是一点点长起来的。
所以,今天的时代不允许你开始由两三个人一点点去找。
第二,搜狗的团队离AI非常接近,很多人觉得无人驾驶是AI,搜索不是。
其实搜索对AI的使用是非常多的,搜索也是数据、算力、算法,数据本身基本上是语言数据。
搜狗其实是在语言数据上,到今天为止最有能力掌握数据的公司。
此外,安全问题、意识形态问题等,搜狗也都是有成套的处理经验。
问:探讨大模型创业,算力、数据、人才都是成本,如果拿不到足够多的投资,实际上这个事没法做。
如果想做的是离AGI(通用人工智能)最近的公司,那么我预测是3亿到20亿美元的资金投入。
3亿只是入门的门槛。我们目前是选了对资金要求比较高的道路。
问:在路线图选择上有过纠结吗?要选择离大模型最近的一条,还是做离使用更近的?
超级应用需要跟底层产生非常强的连接,如果没有底座是没有办法支撑超级应用,在我心中大底座和大应用是相辅相成的。
一是本身对技术有足够多的理想,因为它就是很挑战技术的活;
二是中间有一定体量的公司治理的号召力和能力,否则肯定不会做。
问:一端是对技术的理解,一端是对创业本身的理解。你说过有信心在年底做出中国最好的大语言模型,敢说这句话的人现在不多。
王小川:大厂的专注度和效率不一定比创业公司高,而且有追求的人可能在原有的地方也有瓶颈,说白了这个事就适合用创新来做,我不觉得这是属于大厂的事情。
不知道大家怎么看,我只不过长过一次教训,比如搜索那一波。
最早搜索起来所有门户都做了一遍,搜狗是拆分完了好不容易活下来了,百度也活下来了,但是阿里、腾讯也都没有做成,而那还是可以看得见的成熟的东西。
但今天有巨大的变化,对于决策的专注度、灵活度、专业性都有很高的要求,历史没有告诉我们大厂可以干这个事。
问:大家认为大厂,有可能是基于眼睛可以看到的,比如现在有多少A100的芯片,有多少人才,看起来像是大力出奇迹,你认同吗?
王小川:上一轮搜索也不是当时的大厂跟进的,这一波AGI也不是大厂可以做到的,但大家都说大厂可以干。
问:现在大家都比较关注算力,其实数据高质量也很重要,如果数据质量比较低的话,算力再多最后也浪费了,你们在数据或者语料这一块怎么做的?
王小川:语料做搜索公司尽可能把公开的语料或者以前收集到的语料用起来,质量怎么评价会做得更好一些。
问:现在在搭建下一步团队的时候有什么样的标准?前两天听到说全世界的人都在挖OpenAI的人,但是没有人离开,还有大量的人才往OpenAI去。
王小川:确实有距离,需要敬仰的一个状态,现在人才储备有两条路,一是把国内最好的都能够聚到一块,甚至有好的效能把它发挥出来;
王小川:三分之一,找到合适的人之后还要做沟通,三分之一的时间还要学习,每天新的技术、新的产品发布都需要时间去学习。
问:你常说包袱变轻了,但好像压力变大了,怎么理解?
王小川:现在做的事是世界需要的,跟世界是连在一块的,不是公司需要、部门需要或者只是同学们需要,它需要的东西不一样的。
现在有太多创业需要整理的人和事,这个精力是远远不够用的状态。
免责声明:
文章系本网编辑转载,会尽可能注明出处,但不排除无法注明来源的情况,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与本网联系.
[声明]本站文章版权归原作者所有,内容为作者个人观点,不代表本网站的观点和对其真实性负责,本站拥有对此声明的最终解释权.