百度李彦宏:2030年脑力劳动者的生产效率会有四倍的提升
封面新闻记者 孟梅
3月26日,百度推出“文心一言”大型算法模型。文心一言发布会后一小时内,排队申请文心一言企业版API调用服务测试的企业用户已达3万多家,申请产品测试网页多次被挤爆,百度智能云官网流量飙升百倍。在答记者问环节,封面新闻记者提问百度创始人、董事长兼首席执行官李彦宏,就文心一言具体能给百度,以及其他企业带来什么进行了深进解读。同时,百度首席技术官王海峰也对文心一言在技术层面的突破给予了详尽分析。
解读
2019年开始预研文心大模型 3年积存今日发布
记者:刚才您在演讲当中提到,百度在2019年开始预研了文心大模型,在这个节点发布是有很多的考量的,其中一部分重要考量是客户需要,还有没有新的其他的考量?中间经历了什么?
李彦宏:百度连续十几年一直在人工智能领域进行果敢的投进,十几年的技术发展非常快,从最早期用深度学习来解决图象识别问题,到后来几乎每一年都出现一个新的算法,使得更多的事情变成可能。所以我们在过往这些年当中,也是不断在迭代,不断推出各种各样的人工智能技术,并且把它尽量推向市场,给百度、搜索、信息流各个领域、自动驾驶等来使用。
过往这一年多,人工智能领域发生了比较明显的转变,就是从过往的判别式的人工智能,转向了生成式的人工智能,什么喊判别式的人工智能?就是过往人工智能是拿来一个东西,不管是一个照片还是视频,人工智能判别说这个跟用户检索的东西是不是最相关,应该排在第几位?拿来一个照片说这是杯子还是茶壶,过往十几年时间人工智能在做这件事。在过往一两年时间,人工智能开始走向生成式,就是你提一个要求,可以产生符合你要求的东西,不管是文字、图片,还是视频。
往年夏天,我们有一个推断,就是人工智能的技术发展方向,发生了转变。可能有人注重到在往年世界人工智能大会上,2022年9月1号,我有一个视频发言,就是讲我们认为过往一年,当时那个时点往前推一年,人工智能技术发生了方向性的改变。当时在预备讲稿的时候,其实团队告诉我说,世界人工智能大会那一年的主题是元宇宙,问我要不要讲一讲?我对人工智能技术发展的推断不在那个方向上,我的推断更是从判别式走向生成式这样的一个转变。那次主要讲了人工智能技术发生的方向性的改变,这个也是我第一次对外表达这种看点,但是后来这半年多的时间,其实基本上可以证实了我们这个推断还是正确的,更多的机会出现在了生成式AI这些方面,无论是百度内部产品还是协作伙伴需求都是非常强烈,这是为什么在非常积极地进行研发,在迭代,在推出文心一言这样的产品,来称心各行各业对这个产品的需求。
展开全文
记者:之前谷歌微软都在“一本正经地胡说八道”上翻车,百度的产品做了哪些改良?
李彦宏:这种生成式的语言大模型会出现一种现象就是一本正经地胡说八道,大家在其他的大模型体验过程当中应该有这种感觉。百度在这个方面确实有优势,刚才在演讲当中也提到,我们做了知识增强和检索增强,所谓的知识增强就是有5500亿的知识图谱里面的事实,它叠加了这些生成式大模型之后,就可以做一些检查,看看生成出来的到底和事实是否吻合,由于有这个方面的优势,我们刚才那些例子假如在其他模型上试的话,还是挺轻易出错,但是在文心一言上试都对了。
检索增强也是一样的,很多高时效的东西,我昨天问你怎么看GPT4?非常及时地可以总结出来这些信息和内容。所以有检索能力,有知识增强这些,叠加这些预练习生成大模型,就可以做得更好,未来大家在这个方面也会看到我们不断的进取。
记者:今年2月以来,我们关注到国内多家科技公司先后公布了有关大模型与类GPT相关的进取,百度率先发布了文心一言,百度是如何在技术层面做到的?为什么能够做到率先实现这样的产品进展?
王海峰:这不是头脑发热,是十余年的技术积存和产业实践的水到渠成,我们在人工智能四层的技术架构上都有很深的积存,特别是框架层和模型层联合优化发扬了非常大的作用。具体到文心大模型本身,百度从2019年开始深耕预练习模型研发,到现在历时四年,既有基础大模型,也发布了全球首个知识增强千亿大模型鹏城-百度·文心,后面还有一系列更新的模型,而这些模型就是练习文心一言的基础。同时,在技术上,不管是深度学习本身的技术还是对话技术,都有很多积存。另一方面,我们知道有了技术,还要有数据,这是我们在人工智能发展的过程中,特别在使用过程中,比如搜索引擎挠取了非常浩大的网页库,经过很多精美的处理,积存了高质量的数据。过往几年,特别是随着百度智能云的发展,在服务客户过程中,我们也积存了很多行业数据,所有这些叠加在一起促成了今天在这里开文心一言的发布会。
人工智能永远不会直接完全跟人类的智能划等号
记者:文心一言对百度、对其他企业意味着什么?
李彦宏:之所以我们对文心一言寄予这么高的期看,它跟每个企业都是相关的,由于它在自然语音理解方面的超强的能力,非常清楚的表达能力,以及相应的数理逻辑推理能力,打开了很多新的可能性,过往我们很多事情没有做,并不是说做这个事情没有价值,而是说做这个事情成本会太高,大家就不往做了,当任何一个公司想要服务自己客户时,肯定都期看能够给自己的客户以无微不至的关怀,什么问题都能随时进行解答,有什么需求可以随时称心,在技术没有达到的时候,这样的理想其实是不可能实现的。
打一个比方,像可口可乐,全世界可能有几十亿的客户,客户有疑问或者有需求时,不可能在7×24小时都有专属客服能够称心他的需求,或者能够清楚的表述可口可乐的立场。但是当有了文心一言这种大模型时这件事变成可能了,利用这些能力拉近你这个公司或者产品跟你客户之间的关系,就变得可能了。这种事情它的价值其实是很大的,过往不做是因为做不了,或者做起来太贵,不可能算得过来账,未来这种事情会越来越多,跟每个企业、公司、产品都是相关的。假如你能够尽早的靠新技术拉近你和你的潜在客户之间的距离,你显然就可以更好挠住你的客户,甚至把竞争对手的客户都挠到你的手上来,就获得了非常明显的竞争优势,这在过往是不可能的。而在今天不管是在哪个行业都可以做到。
不仅仅是公司和自己客户之间的沟通效率提升,公司内部生产效率的提升也是非常明显的,我刚才提到到2030年脑力劳动者它的生产效率会有四倍的提升,这个是颠覆性的,绝大多数人的工作性质都会因此而改变,天天跟电脑、跟计算机打交道的频率会高很多,你对它的依靠程度高很多,过往用10天才能做完的事,今天2.5天就做完了,所以这些可能性还只是我们在第一天发布文心一言的时候,我个人能想到的可能性。有那么多聪明的人都在涌向这个赛道,大家会逐步发现还有很多过往想也想不到、想也不敢想的可能性,能够大幅度提升效率、提升公司的竞争力的各种各样的可能性。所以我非常期待,我也期看大家特殊关注这个新的技术,新的平台,能够给社会,给公众带来的各种各样新的可能性。
记者:您认为现在的AI技术距离AGI(通用人工智能)有多远?
王海峰:首先这个问题没有准则答案,每个人心中有不同的答案。在回答这个问题之前,我想先举一个例子类比,我们都知道,我们生活在地球上,地球有自己的卫星,就是月球,同时过往几十年人类科技在飞速发展,也有很多人造地球卫星,这些人造地球卫星技术越来越强,也为人类带来了越来越大的价值,但是我们知道人造地球卫星和月球这种自然的卫星,在构造和目的上,都是截然不同的,人造地球卫星永远也不会和月球这样的自然卫星划等号。
为什么喊人工智能呢?我们研究人工智能是在研究用技术手段来模拟延伸和拓展人的智能,最终的目的是为了人类带来更先进的科技、服务人类更美好的生活,服务人类社会的发展。所以其实我个人认为人工智能也永远不会直接完全跟人类的智能划等号,我们要做的是不断研究更先进的人工智能技术服务人类,人类具有很多能力,比如说思维、理解、学习能力,人工智能逐渐在具备。而基于这些能力,比如说今天发布的文心一言就具备了很强的学习能力,这个学习既指用了深度学习相关的技术,同时有了这些技术,像文心一言天天在如饥似渴地看各种书籍、各种资料、各种数据,不断地在学习进取,而这个不断进取的人工智能体,它具有越来越强的能力,在很多能力上甚至已经逐渐在和人类水平相当,甚至超越人类。
举个例子,我们文心系列大模型就是从自然语言理解模型开始的。早在2019年,我们文心大模型以 9 个任务平均得分首次突破 90 大关的成果登顶国际权威排行榜GLUE榜首,超过了人类得分,这是对语言的理解。再比如说现在很多人都会用到翻译,百度翻译都可以翻译200多种语言,天天翻译上千亿的字符,大多数人不可能把握200多种语言,这阐明人工智能在很多方面已经逐渐超越人类。但是这些超越并不代表就实现了所谓的通用人工智能,虽然人工智能本身通用性越来越好,特别现在这套深度学习平台加大模型技术,无论从C端到B端,千行百业都可以用这套技术。这个和前几次人类发生的第一次、第二次、第三次工业革命,从机械技术到电力技术,到信息技术一样,有很强通用性,现在人工智能技术也有很强的通用性,而现在深度学习平台加大模型在里面起了非常重要的作用。
另一方面,我们假如回忆前几次工业革命会发现这些通用性技术,真正发扬广泛的价值是什么时候,是它进进到工业大生产阶段,而工业大生产阶段有一些显著的特征,比如说技术更加准则化、自动化、模块化,而现在的深度学习加大模型,飞桨+文心,已经具备了很好的通用性、很强的准则化、自动化和模块化的工业大生产、产业大生产的特征。技术在不断进取,使用在越来越广泛,这是我们追求的目的。当你发现AI在很多领域都达到了人类水平,甚至超越人类水平的时候,你可以认为一定程度上已经实现了(AGI),你也可以不关怀这个概念本身,而关怀它为人类带来的价值。