百度版ChatGPT“文心一言”表态，李彦宏：开展远未完美、朝上进步空间很大

misa2 04-09 4次浏览 0条评论

百度版ChatGPT“文心一言”表态，李彦宏：开展远未完美、前进空间很大

（文/吕栋贺喜格）

在OpenAI推出GPT-4一天后，百度官宣已久的类ChatGPT产物“文心一言”也末于公开露面，而且和GPT-4一样也是多模态。

北京时间3月16日下战书，百度召开发布会，主题围绕新一代大语言模子、生成式AI产物“文心一言”。

看察者网在现场看到，百度首席施行官李彦宏和百度首席手艺官王海峰均出席了发布会，并在现场展现了“文心一言”在文学创做、贸易案牍创做、数理推算、中文理解、多模态生成五个利用场景中的综合才能。

百度版ChatGPT“文心一言”表态，李彦宏：开展远未完美、前进空间很大

令市场感应有些许失落的是，百度并未在现场间接挪用“文心一言”，而是摘用提早录好的视频停止展现。表态了，但又没有完全表态。那种情状可能也在必然水平上影响了百度股价，招致其盘中呈现短线下挫。

从现场展现来看，文心一言某种水平上具有了对人类企图的理解才能。但李彦宏也屡次提及，那类大语言模子还远未到开展完美的阶段，朝上进步空间很大，将来那段时间它必然会飞速开展。

展开全文

看察者网从现场领会到，此次“文心一言”公开表态后，其实不会间接面向公家推出，而是先摘用邀请测试计划。从3月16日起，首批用户可通过邀请测试码，在“文心一言”官网体验产物，后续才会陆续开放给更多用户。那可能也间接证明，“文心一言”目前尚未成熟。

那么，百度为何甜冒风险，略显仓皇地推出“文心一言”呢？那一方面可能是为了夺得对标ChatGPT的头筹，获得更多用户以操练大语言模子，另一方面则可能考虑到表里部的需求。

李彦宏在现场表达：“在全球的大厂中，百度是第一个做出对标ChatGPT的产物的企业。固然‘文心一言’的内测体验不克不及称做完美，但为什么如今发布呢？是因为百度的各个产物现都在等着如许的产物，我们的客户和协做伙伴也在等着如许的手艺。”

在此次发布会之前，有外媒援引知恋人士称，为了开发“文心一言”，数百名百度员工不断在夜以继日地工做。以至在正式发布前夜，“文心一言”基于的AI模子仍在承受数据操练。一些员工坦言，他们没有足够的时间来打造一款功用完美的产物。

根据百度方面的披露，“文心一言”大模子的操练数据包罗万亿级网页数据、数十亿的搜刮数据和图片数据、百亿级的语音日均挪用数据，以及5500亿事实的常识图谱等。

那此次通过视频表态的“文心一言”表示若何呢？在现场，李彦宏展现了“文心一言”在五个利用场景的表示，包罗文学创做、贸易案牍创做、数理推算、中文理解和多模态生成。

以文学创做场景为例，“文心一言”根据对话问题将《三体》的核心内容停止了总结，并提出了五个续写《三体》的定见角度，表现出对话问答、总结阐发、内容创做生成的综合才能。贸易案牍创做场景中，文心一言顺利完成了给公司起名、写Slogan、写新闻稿的创做使命。

百度版ChatGPT“文心一言”表态，李彦宏：开展远未完美、前进空间很大

在数理推算场景中，“文心一言”可以学会数学推演及逻辑推理等相对复杂使命。面临“鸡兔同笼”那类磨练人类逻辑思维的典范题，文心一言能理解题意，并有准确的解题构想，进而像学生做题一样，按准确的步调，一步步算出准确谜底。

百度版ChatGPT“文心一言”表态，李彦宏：开展远未完美、前进空间很大

做为扎根于中国市场的大语言模子，文心一言在中文语言和中国文化上，比拟国外的大模子产物无疑会有更好的表示。在现场展现中，文心一言准确阐了然成语“洛阳纸贵”的含义、“洛阳纸贵”对应的经济学理论，还用“洛阳纸贵”四个字创做了一首躲头诗。

昨日（3月15日），OpenAI发布多模态模子GPT-4，可领受图像和文本输进来输出文本内容，遭到外界存眷，而文心一言本次发布的版本同样具备多模态功用，撑持文本、图片、音频、视频生成。

在更表现手艺才能的多模态生成方面，李彦宏现场展现了“文心一言”生成文本、图片、音频和视频的才能。有趣的是，“文心一言”以至可以生成四川话等方言语音；“文心一言”的视频生成才能则因成本较高，现阶段还未对所有用户开放，将来会逐渐接进。

百度版ChatGPT“文心一言”表态，李彦宏：开展远未完美、前进空间很大

从“文心一言”的表示看，某种水平上它具有了对人类企图的理解才能，答复的准确性、逻辑性、顺畅性都逐步接近人类程度。但整体而言，那类大语言模子还远未到开展完美的阶段，有赖于通过实在的用户反应而逐渐迭代。

王海峰表达，文心一言，是新一代常识加强大语言模子，是在ERNIE及PLATO系列模子的根底上研发的。它的关键手艺包罗有监视精调、人类反应的强化进修、提醒、常识加强、检索加强和对话加强。

前三项是那类大语言模子城市摘用的手艺，ERNIE和PLATO中也已经有利用和积存，在文心一言中又有了进一步强化和打磨；后三项则是百度已有手艺优势的再立异。

多年来，百度大语言模子上投进积极，有市场数据展现，百度研发的50%-60%的投进都给到了Ernie。

近日有外媒援引知恋人士称，跟着ChatGPT热度上升，本年1月初，百度高管让其天然语言处置团队起头用文心大模子整合出一款对标ChatGPT的产物。但前述知恋人士表达，与其他处置类ChatGPT手艺的AI开发者所碰着的情状一样，那一项目面对一些挑战。

此中一个挑战是，需要操练该模子对有多种释义的短语或可指代多人的名字停止辨认，从而能对用户的要求做出更切确的反响。另一个挑战是使该聊天机器人生成的语言看起来更像人类说的话。第三个挑战是进步事实准确性，那是大语言模子的一个手艺限造；大语言模子会根据差别词语可能呈现在一路的概率将句子串起来，而不是根据信息片段。那种限造也使得那种模子难以掌握以制止灵敏话题。

“文心一言”的实在程度若何，还有待看察百度后续推出的公测版本。据百度披露，自2月份该公司官宣“文心一言”以来，已有超越650家企业公布接进文心一言生态。

有市场看点指出，百度之所以没有敏捷开放公测，一方面是因为产物尚未成熟，另一方面可能也是出于成本和收进考虑。之前有预算称，ChatGPT天天成本消耗有超越10万美圆。来自摩根士丹利的阐发师估量，ChatGPT每次查询的成本大约是谷歌传统搜刮查询成本的七倍。

在本次发布会上，李彦宏表达：“无论哪家公司，都不成能靠突击几个月就能做出如许的大语言模子。深度进修、天然语言处置，需要多年对峙和积存，没法速成。”他同时提到，假设成立起实在用户反应、开发者挪用和模子迭代之间的飞轮，“文心一言”效果会敏捷提拔。

三国杀百度版

【设想法例】若何精进你的设想常识系统之—古腾堡原则！照片压缩200k怎么压缩？快来学图片压缩身手