中国版ChatGPT比赛战,国际权势巨子机构为百度背书
机器之心原创
做者:杜伟
对标 ChatGPT,国内厂商实的能够做到。
2023 开年以来,OpenAI 人机对话利用法式 ChatGPT 成为最火爆的科技热点,为 AI 大规模贸易化落地供给了一个绝好的契机,遭到了科技巨头们的逃捧和追逐。
ChatGPT 之所以可以成为现象级利用,很大水平上要回功于长久以来业界对大模子开展的重视。从 BERT 和 GPT-3 开展至今,大模子带来了 AI 开发新范式。日益齐全和成熟的大模子成为了 AIGC 开展新引擎,催生了 AI 写做、AI 绘画等利用层面的产物。大模子手艺的那波积存,让 ChatGPT 的火爆变得水到渠成。
跟着 ChatGPT 的出圈,良多国内大厂也起头撑持类 ChatGPT 大模子研究。但想要做出对标 ChatGPT 的产物谈何随便,正如它基于大规模预操练模子 GPT-3.5 一样,国内大厂也要有坚实的大模子手艺积存,不然便成了无源之水、无本之木。
那就要问了,国内大模子厂商的实力若何?能否支持起类 ChatGPT 的利用呢?近日,国际权势巨子征询机构 IDC 发布《2022 中国大模子开展白皮书》(以下简称 IDC 白皮书),让我们一窥国内支流大模子的开展现状。IDC 白皮书提出业界首个大模子评估框架,各厂商围绕核默算法与模子层、上层软件平台深进规划优化,此中百度文心大模子在产物、利用和生态才能上全面领先,让我们看到了打造中国版 ChatGPT 的实力和期看。
此前 2 月 7 日,百度公布将上线百度版 ChatGPT—— 文心一言,英文名为 ERNIE Bot。文心一言是百度基于文心大模子手艺推出的生成式对话产物。文心一言事实能否实正实现类 ChatGPT 的才能,我们或能够从文心大模子的才能展现中得出谜底。
产物、利用和生态三手挠、三手都要硬
做为 AI 开发新范式,大模子可以加强 AI 的通用性和泛化性,还能够显著降低 AI 利用门槛。但若要实现那些目标,大模子不只需要在才能构建上尽可能八面玲珑,评判大模子好欠好也不克不及仅看某一方面。
展开全文
针对大模子的才能,IDC 初次搭建了大模子评估框架 V1.0,并细化为了「1-3-6-11」架构,即 1 个整体评估框架、3 个评估维度、6 个一级目标和 11 个二级目标。
起首是产物才能,它细分为 3 个一级目标,别离为模子才能、东西平台才能和开放性,次要考虑大模子的手艺才能、功用丰富度以及底层深度进修平台的核心支持才能。其次是利用才能,它细分为 2 个一级目标,次要考虑「大模子 + 深度进修平台」的利用广度、深度以及贸易化前景。最初是生态才能,它次要考虑大模子市场生态规划情状。下图为 IDC 大模子评估框架 V1.0 整体概览。
能够那么说,IDC 大模子评估框架 V1.0 从模子层、东西与平台层、利用与生态层停止了拆解,不只让人们对大模子应有的才能有了一个十分清晰和全面的领会,并且为大模子评估供给了一套通用的原则。
有了大模子评估框架 V1.0,IDC 对国内市场支流大模子厂商停止了评估,从宏看上领会它们当前的开展历程以及在哪些方面有所长、有所短。
详细来讲,IDC 拔取了国内支流厂商(N=9),根据产物才能、利用才能、生态才能以及各自细分下的共 11 项目标,通过定性和定量两种体例打分评估,并最末计算出各大厂商在差别维度的得分和均匀分情状。
如下图所示,IDC 将大模子在产物、利用和生态 3 个维度的才能划分为了 L1-L5 五个层级,层级越高代表厂商在大模子市场梯队中越靠前。2022 中国大模子评估成果展现,在当前大部门厂商才能处于 L2-L3 层级之时,百度文心大模子脱颖而出。除利用才能为 L3 程度之外,产物才能和生态才能均到达了 L4 程度,位各国内大模子市场格局第一梯队。
百度文心大模子在产物才能方面闪现较强手艺实力和平台积存,「文心大模子 + 飞桨深度进修平台」立异 AI 研发新范式,称心市场大规模落地需求,到达行业前端程度;利用才能方面落地普遍,在金融、能源、造造、城市、传媒和互联网等行业打造标杆案例,通过更契合场景需求的行业大模子加速落地,参与到客户营业流程关键环节中,利用深度与广度位列前沿;生态才能方面积极开展与开发者、行业用户、上下流财产的正向互动,处于行业领先地位。
文心大模子又是若何做到产物、利用和生态才能的全面领先呢?那就要从文心大模子的核心特色、系统构建、深度进修平台继续赋能等多方面逐个说起。
才能全面领先,文心大模子厚积薄发
深度进修范畴「炼大模子」风潮已经继续至今,国内 AI 领头雁百度凭仗其文心财产级常识加强大模子力图在合作中连结领先优势,其实不断通过手艺立异、深化规划和拓展财产利用来加强本身实力。
自 2019 年深耕预操练模子研发以来,百度在文心大模子历次晋级中构成了本身的核心特色:常识加强和财产级。而且通过多年的手艺摸索与财产理论,百度文心大模子已经构建了「模子 + 东西平台 + 产物社区」三层系统。
在模子层,文心构成了「根底、使命和行业」三级模子系统,努力于更精准的场景需求适配。根底大模子涵盖 NLP、CV 和跨模态三大标的目的,聚焦手艺标的目的的挑战、通用性、泛化性摸索。使命大模子包罗对话、搜刮、信息抽取、生物计算等多个典型使命,深进理解使命特征,打造紧贴使命的模子才能。11 个行业大模子与能源、金融、航天、造造、传媒等多个行业的头部企业或机构共建,合成行业数据、常识和专家体味,构建更适配行业的模子底座。
在东西平台层,文心面向差别手艺、营业布景的开发者,供给了全流程撑持利用落地的东西和办法,称心定造化 AI 需求。那层次要包罗新一代预操练范式的 NLP 算法定造开发东西集 ERNIEKit、面向利用开发者或营业专家的零门槛 AI 开发平台 EasyDL、面向 AI 算法开发者的全功用 AI 开发平台 BML 以及 NLP 大模子 ERNIE3.0、跨模态大模子 ERNIE-ViLG 和对话大模子 PLATO 的开放 API。
在产物社区层,文心构建了旸谷大模子创意与摸索社区,将大模子才能开放给各行各业和通俗开发者。同时不竭立异场景化产物,在文生图场景上推出业界首个 AI 艺术与创意辅助平台文心一格,实现一语成画;在搜刮场景上推出基于大模子驱动的财产级搜刮系统文心百中,通过搜刮设置装备摆设、数据导进和搜刮体验三步完成搜刮引擎构建。
能够说,百度在中国科技企业中打造了最成熟的大模子产物系统和开发东西,为企业和开发者供给了丰富抉择,其实不断降低利用难度。
同时,深度进修平台也为大模子开展与利用「保驾护航」。在百度,文心大模子 + 飞桨深度进修平台成为核心开展形式,并基于此修建财产智能化基座。做为飞桨模子库的重要构成部门,文心大模子与飞桨合成开展、共享生态,带来更低门槛、更优效果、更原则化流程,鞭策 AI 手艺立异和利用进进新阶段。
文心大模子「模子 + 东西平台 + 产物社区」三层系统,加之飞桨深度进修平台撑持,使其在 IDC 大模子评估框架中表示十分凸起,成为百度打造文心一言的坚实手艺根底。
文心大模子努力于在千行百业、多样化利用场景兑现本身的才能,出格为丰富的 AIGC 利用场景供给手艺支持,并已在智能对话、小说等文本生成,文本到图片、视频等跨模态生成有深进财产利用。此外,文心大模子不竭助力文档智能场景、无人驾驶场景、工业量检场景等。
百度文心成熟的大模子系统以及相关利用的落地理论,那一切都为文心一言未来在百度表里多样化场景中大显神通打好了样。
打造中国版 ChatGPT,百度势在必行
近些天,ChatGPT 已然成为了 AI 以至整个科技圈的风向标。浩瀚大厂虽有亮相跟进类似研究,但深究之下,想要做出完全对标 ChatGPT 的产物,似乎只要百度有此实力。IDC 白皮书中的大模子评估成果是更好的例证,同时还有以下几个方面的原因。
起首从整个 AI 规划来看,ChatGPT 相关的手艺,百度都有。百度在其人工智能四层架构中具有全栈规划,包罗底层芯片、深度进修框架、大模子和最上层的搜刮等利用,贯穿了 AI 全财产链,不存在卡脖子手艺。出格关于支持 ChatGPT 的大模子手艺,百度更不遑多让。凭仗齐全的「模子 + 东西平台 + 产物社区」系统,文心大模子实现了产物、利用和生态才能的全面领先,为做出文心一言预备好了前提。
还有一点值得存眷,从目前的信息来看,文心一言将来也会通过百度智能云对外供给办事,那也将底子性地改动云市场的游戏规则。之前抉择云厂商更多看算力、存储等根底云办事,以后用户对云厂商的需求愈加聚焦智能办事,会更多存眷模子、框架、芯片以及利用,那四层架构之间的协同。
其次,百度开发类 ChatGPT 产物也非从零起头,具有先发优势。早在 2019 年 3 月,百度就已发布预操练大模子 ERNIE 1.0,2020 年起头将文心大模子利用到搜刮营业,赋能搜刮相关性、深度问答和内容理解等,从大模子的投进到利用有着持久积存和财产理论。由此可见,文心一言有着丰富的胜利体味可循。
最初,国度、处所的政策撑持为百度做出文心一言供给有利的大情况。国度「十四五」期间针对人工智能和大模子陆续出台相关批示计划和鼓励支持政策,进一步加速大模子研发及利用落地。近日《2022 年北京人工智能财产开展白皮书》重磅发布,北京明白亮相撑持头部企业打造对标 ChatGPT 的大模子。
内有文心大模子的持久手艺积存、利用理论,外有国度政策的鼎力撑持,可谓天时人地相宜兼备,百度做出文心一言更显得瓜熟蒂落了。
外界也对百度文心一言抱有极大等待,虽还未正式发布,便已遭到浩瀚出名企业的存眷。爱奇艺、集度汽车(通过 Apollo)、小度、宇信科技、汉得信息、金蝶软件、宝宝巴士、智联雇用、承平洋汽车网等名企纷繁公布将加进文心一言生态圈,那势必进一步强化文心一言才能,拓展利用场景,加速 AI 贸易化落地。
参考链接:
1.夺中国版 ChatGPT 首发的公司们
2.以落地考验价值,大模子的财产大考来了
3.手艺、生态和财产齐头并进,AI 开展进进「深度进修 +」阶段