百度文心一言今日开放邀请测试李彦宏称大语言模型尚未发展至完美阶段

misa2 03-17 3次浏览 0条评论

作者 | 《财经》新媒体王婧雅编辑 | 高素英

3月16日，对标ChatGPT产品的百度“文心一言”正式对首批用户邀请测试，后续将陆续开放给更多用户。同时，百度智能云即将面向企业客户开放文心一言API接口调用服务。

百度创始人、董事长兼首席执行官李彦宏介绍并展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。李彦宏坦言，这类大语言模型远未到发展完美的阶段，还是有很多不完美的地方。之所以抉择现在发布，原因在于百度的产品和客户有需要。

从现场展示来看，文心一言在某种程度上具有了对人类意图的理解能力，回答的正确性、逻辑性、顺畅性都逐渐接近人类水平。在在文学创作、商业文案创作场景中，文心一言可以依据对话问题将《三体》核心内容进行总结，并提出续写意见角度；同时，文心一言还可以完成给公司起名、写Slogan、写新闻稿的创作任务。

尤为重要的是，文心一言已经具备了一定的思维能力，能够学会数学推演及逻辑推理等相对复杂任务。面对“鸡兔同笼”这类磨练人类逻辑思维的经典题，文心一言能理解题意，并识别出问题的错误。在收到正确问题后，文心一言可以像学生一样，按照解题步骤，一步步算出正确答案。

不容漠视的是，多模态是生成式AI一个明确的发展趋势，在此场景中，文心一言也具备了生成文本、图片、音频和视频的能力。不过，李彦宏表达，由于文心一言的视频生成能力成本较高，现阶段还未对所有用户开放，未来会逐步接进。

李彦宏认为，文心一言这类大语言模型会成为每个人必不可少的生产力工具。但无论是哪家公司，都不可能靠突击几个月就能做出这样的大语言模型。深度学习、自然语言处理，需要多年的坚持和积存，没法速成。

目前，IT技术的技术栈已从过往芯片层，操作系统层和使用层三层分层演化至芯片层、框架层、模型层和使用层四层分层。文心一言正处于模型层。

据李彦宏介绍，早在2019年，百度就推出了文心大模型ERNIE 1.0。目前，ERNIE 3.0天天接受数十亿次用户的搜索请求。这让文心一言能够基于一个浩大的、高效的数据池，快速地学习和改良。

需要指出的是，大模型练习离不开大算力、大数据和大模型支撑，每一次练习任务都耗资浩大。

李彦宏认为，全栈布局的优势在于可以在技术栈的四层架构中，实现端到端优化，大幅提升效率。比如，为了支持千亿参数模型的高效分布式练习，百度飞桨研发了 4D 混合并行技术。另外，芯片、框架、大模型、和终端使用场景，可以形成一个反馈闭环，扶助大模型不断往调优迭代。

百度文心一言今日开放邀请测试 李彦宏称大语言模型尚未发展至完美阶段