百度文心一言今日开放邀请测试 李彦宏称大语言模型尚未发展至完美阶段
作者 | 《财经》新媒体 王婧雅 编辑 | 高素英
3月16日,对标ChatGPT产品的百度“文心一言”正式对首批用户邀请测试,后续将陆续开放给更多用户。同时,百度智能云即将面向企业客户开放文心一言API接口调用服务。
百度创始人、董事长兼首席执行官李彦宏介绍并展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。李彦宏坦言,这类大语言模型远未到发展完美的阶段,还是有很多不完美的地方。之所以抉择现在发布,原因在于百度的产品和客户有需要。
从现场展示来看,文心一言在某种程度上具有了对人类意图的理解能力,回答的正确性、逻辑性、顺畅性都逐渐接近人类水平。在在文学创作、商业文案创作场景中,文心一言可以依据对话问题将《三体》核心内容进行总结,并提出续写意见角度;同时,文心一言还可以完成给公司起名、写Slogan、写新闻稿的创作任务。
尤为重要的是,文心一言已经具备了一定的思维能力,能够学会数学推演及逻辑推理等相对复杂任务。面对“鸡兔同笼”这类磨练人类逻辑思维的经典题,文心一言能理解题意,并识别出问题的错误。在收到正确问题后,文心一言可以像学生一样,按照解题步骤,一步步算出正确答案。
不容漠视的是,多模态是生成式AI一个明确的发展趋势,在此场景中,文心一言也具备了生成文本、图片、音频和视频的能力。不过,李彦宏表达,由于文心一言的视频生成能力成本较高,现阶段还未对所有用户开放,未来会逐步接进。
李彦宏认为,文心一言这类大语言模型会成为每个人必不可少的生产力工具。但无论是哪家公司,都不可能靠突击几个月就能做出这样的大语言模型。深度学习、自然语言处理,需要多年的坚持和积存,没法速成。
目前,IT技术的技术栈已从过往芯片层,操作系统层和使用层三层分层演化至芯片层、框架层、模型层和使用层四层分层。文心一言正处于模型层。
据李彦宏介绍,早在2019年,百度就推出了文心大模型ERNIE 1.0。目前,ERNIE 3.0天天接受数十亿次用户的搜索请求。这让文心一言能够基于一个浩大的、高效的数据池,快速地学习和改良。
需要指出的是,大模型练习离不开大算力、大数据和大模型支撑,每一次练习任务都耗资浩大。
李彦宏认为,全栈布局的优势在于可以在技术栈的四层架构中,实现端到端优化,大幅提升效率。比如,为了支持千亿参数模型的高效分布式练习,百度飞桨研发了 4D 混合并行技术。另外,芯片、框架、大模型、和终端使用场景,可以形成一个反馈闭环,扶助大模型不断往调优迭代。