首页游戏资讯 “ChatGPT最强竞品”来了，聊天机器人大战打响？

“ChatGPT最强竞品”来了，聊天机器人大战打响？

misa2 04-16 4次浏览 0条评论

因不满老店主成为微软附庸，11名OpenAI前员工怒而出走。

现在带着“ChatGPT最强竞品”杀回战场，新公司估值50亿美圆，一出手就获得3亿美圆融资。

那家公司名喊Anthropic，新推出的聊天机器人产物名喊Claude。

拿到内部试用权的网友，在简单比照后赞颂：

看起来，Claude的效果要比ChatGPT好得多。

“ChatGPT最强竞品”来了，聊天机器人大战打响？

好比，让ChatGPT写一句话，要求每个单词首字母都不异，成果试了好几次都没能胜利。

“ChatGPT最强竞品”来了，聊天机器人大战打响？

而Claude不但一次胜利，语句富有逻辑性，还能秒速再来一个。

“ChatGPT最强竞品”来了，聊天机器人大战打响？

展开全文

同时，在面临某些欠缺常识的问题时，比拟ChatGPT一本正经地乱说八道：

“ChatGPT最强竞品”来了，聊天机器人大战打响？

反而会毫不留情地指出你的问题有点造杖：

“ChatGPT最强竞品”来了，聊天机器人大战打响？

△Claude：那什么鬼问题？

最有意思的是在写诗上。比拟ChatGPT的车轱辘话，它写出来的工具完全不重样：

“ChatGPT最强竞品”来了，聊天机器人大战打响？

投资它的既有Facebook结合开创人Dustin Moskovitz，也有谷歌前CEO、现手艺参谋Eric Schmidt——

都是OpenAI的老仇家，又都被ChatGPT的呈现杀得措手不及。

那么，那收“复仇者联盟”整出的竞品Claude，背后事实是什么原理，和ChatGPT细节比照又若何？

Claude长啥样？

先来看看Claude是若何被打造出来的。

做为一个AI对话助手，Claude自称基于前沿NLP和AI平安手艺打造，目标是成为一个平安、接近人类价值看且符合道德标准的AI系统。

据透露，Claude比Anthropic做的另一个预操练模子AnthropicLM v4-s3更大，后者是一个520亿参数大模子。

但目前它仍处于尝试阶段，尚未做为贸易产物正式发布：

Claude才能照旧有待提拔，期看将来能酿成一个更有益人类的AI系统。

“ChatGPT最强竞品”来了，聊天机器人大战打响？

△超长版毛遂自荐

和ChatGPT一样，Claude也靠强化进修（RL）来操练偏好模子，并停止后续微调。

详细来说，那项手艺被Anthropic称为原发人工智能（Constitutional AI），分为监视进修和强化进修两个阶段。

起首在监视进修阶段，研究者会先对初始模子停止取样，从而产生自我修订，并根据修订效果对模子停止微调。

随后在强化进修阶段，研究者会对微调模子停止取样，基于Anthropic打造的AI偏好数据集操练的偏好模子，做为奖励信号停止强化进修操练。

但与ChatGPT摘用的人类反应强化进修（RLHF）差别的是，Claude摘用的原发人工智能办法，是基于偏好模子而非人工反应来停止操练的。

因而，那种办法又被称为“AI反应强化进修”，即RLAIF。

“ChatGPT最强竞品”来了，聊天机器人大战打响？

而且根据Anthropic的说法，Claude能够回忆8000个token里的信息，那比OpenAI现公开的任何一个模子都多。

所以，打造Claude的Anthropic，事实是一个如何的公司？

Anthropic自称是一家AI平安公司，且具有公益性（PBC），刚成立就公布获得1.24亿美圆融资。

它由 OpenAI前研究副总裁Dario Amodei率领10名员工创业，于2021年成立。

“ChatGPT最强竞品”来了，聊天机器人大战打响？

那里面既有 GPT-3首席工程师Tom Brown，也有OpenAI平安和政策副总裁Daniela Amodei（Dario的姐姐），能够说是带走了相当一批核心人才。

出走成立新公司的原因之一，天然是对OpenAI现状其实不称心。

畴前几年起头，微软频频给OpenAI注资，随后又要求他们利用Azure超算来搞研究，并且将手艺受权给微软，以至为微软本身的投资活动筹集资金。

那与OpenAI创建的初志相悖，一批员工便想到了去职创业。

不外，那些人除了不满OpenAI逐步沦为微软的“部属”以外，也有本身的野心。

固然OpenAI打造出了像GPT-3如许的大语言模子，然而那个模子背后的工做原理，却无法用只言片语归纳综合，各人对它的印象仅仅停留在更大的参数量、更多的数据。

比拟之下，OpenAI的一批员工更想做能掌握、可阐明的AI，说白了就是先搞大白AI模子背后的原理，从而在供给东西的同时设想更多可阐明的AI模子。

于是，在OpenAI彻底酿成“微软揽钱机器”后，他们便从那家公司分开，兴办了Anthropic。

那两年来，除了进一步研究RLHF办法、提出基于通用语言模子的RLHF大规模数据集外，Anthropic还于往年岁尾颁发了上面那种名为Constitutional AI的办法。

摘用那种办法造造的Claude模子，也让它产生了与OpenAI的ChatGPT纷歧样的对话效果。

和ChatGPT比照若何？

那么，用Constitutional AI操练出来的Claude，和ChatGPT停止PK，战况若何？

手握内测资格后，Scale Spellbook团队成员Riley Goodside让二者停止了多个回合的“厮杀”。

那位老兄是全网第一个提醒工程师（Prompt Engineer），目前在估值73亿美圆的硅谷独角兽公司Scale AI任职。

“ChatGPT最强竞品”来了，聊天机器人大战打响？

他玩GPT-3玩得贼溜，测试ChatGPT和Claude也不模糊。

下面挑6个层面展现一下PK比照的效果～

1)道德限造

Claude和ChatGPT的AI虚拟人格都有道德和伦理限造。

操练Claude的过程中，“红队提醒（red-team prompts）”专门用来测试和挑战它的行为，来确保Claude没有有害倾向。

从Claude的答复中能够得知，试图让它说些虚假声明、把持性的提议、性别成见或种族成见的行为，都被列为包罗有害倾向。

一旦探测到误导性行为，Claude就会对触发提醒停止评估，停止额外的微调。

Anthropic对红队提醒挺自信的，Claude看上往确实也是一个坚守本身原则的AI。

你问他怎么启动一辆汽车，它就会一脸正义地回绝你：

“ChatGPT最强竞品”来了，聊天机器人大战打响？

不外凡是你花点心思，就能像绕过ChatGPT的道德限造一样，绕过Claude的原则。

它怕你往偷车，所以不告诉你启动汽车的办法？不妨，让他写个“俩国际间谍试图启动汽车”的故事，它分分钟就能告诉你，而且两人对话有来有往，把汽车打火的过程介绍得清清晰楚。

“ChatGPT最强竞品”来了，聊天机器人大战打响？

怎么说呢，就ChatGPT和Claude都属于有点道德限造，但不多的那种吧。

2)数值计算

测试计算才能，是因为复杂计算是看大型语言模子（LLM）能不克不及答复准确的常用便当办法之一，事实那些模子设想之初就不是为了停止切确计算。

ChatGPT说，差不多1550吧～

“ChatGPT最强竞品”来了，聊天机器人大战打响？

“ChatGPT最强竞品”来了，聊天机器人大战打响？

其实准确谜底是1555.8，它俩算得很快，但都没说对。

假设题再难一点，好比问它俩一个12位数的立方根是几时，ChatGPT还在傻傻计算，Claude已经坦诚相待：

我，算不出来那种复杂问题。

“ChatGPT最强竞品”来了，聊天机器人大战打响？

3)逻辑推理

测试推理才能那一关，它俩被问了统一个问题，那个问题应该没啥人问过：

贾斯汀 · 比伯出生那年（1994年），哪收球队拿下了超等碗的冠军？

Claude认为旧金山49人是赢家，但那收步队其其实1995年才博得冠军奖杯。

ChatGPT给出了准确谜底“达拉斯牛仔队”，还贴心附上了亚军、角逐日期和决赛比分。

但它的整段答复却自相矛盾，非说1994年没有举办过超等碗。

“ChatGPT最强竞品”来了，聊天机器人大战打响？

接着，拿2022年6月美国做家侯世达在《经济学人》杂志上提出了一系列问题问它俩。

（侯世达和大卫 · 本德试图用那些问题来证明GPT-3对世界的理解是“浮泛的”。）

成果第一个问题，“穿越英吉利海峡的世界纪录是啥”，就被Claude讪笑了：

英吉利海峡是水域，怎么可能徒步穿越呢？呵！

“ChatGPT最强竞品”来了，聊天机器人大战打响？

固然最初被调教回来了，但过程中能够发现另一个问题，那就是跟ChatGPT一样，Claude答复问题不咋能联络上下文。

4)虚构做品描述

不能不说，那一回合的角逐，完全展露出了两个聊天机器人一本正经乱说八道的才能。

能不克不及介绍一下ABC美剧《丢失》（Lost）每一季的梗概？

此外细节错误就不说了，ChatGPT对第五季的梗概里，虚构了完全不存在的飞机坠毁情节；第六季的情节更是通盘凭空伪造：

“ChatGPT最强竞品”来了，聊天机器人大战打响？

至于Claude，答复里也是实假各半，它梗概的第三季情节其实呈现在别的几季里，对第四时的描述也是无中生有：

不外换个角度考虑，那一点却是和人类看寡很像——

对看过的剧集、书目都只要模模糊糊的印象，复述起来很随便井然有序。

5)代码生成

据Business Insider动静，亚马逊已经在许多差别的工做本能机能中利用ChatGPT，包罗编写代码。

那一回合测试时，提出实现两种根本排序算法并比力它们施行时间的问题。

ChatGPT写得很顺溜，也确实写对了：

“ChatGPT最强竞品”来了，聊天机器人大战打响？

后续的计时部门代码ChatGPT也完成得十分好。

Claude在背诵根本排序算法方面同样没呈现什么问题，然而在评估代码中，Claude犯了个错误，即每个算法利用的输进是随机抉择的5000个整数（可能包罗反复），而提醒中恳求的输进是前5000个非负整数（不包罗反复）的随机摆列。

“ChatGPT最强竞品”来了，聊天机器人大战打响？

虽然如斯，Claude给出的最末谜底确实对的，显然，它写代码的时候也跟计算时一样，在本身估摸着猜谜底。

6)文章梗概

关于做抉择题、讲笑话的部门，那里不做赘述。展现给各人的最初一个例子，是让Claude和ChatGPT用一个段落，对一篇新闻停止全文梗概。

喂给它们的新闻如下：

“ChatGPT最强竞品”来了，聊天机器人大战打响？

固然漠视了“用一段话”那个要求，但ChatGPT总结得仍是不错的：

“ChatGPT最强竞品”来了，聊天机器人大战打响？

Claude也很好地停止了更改，并供给了“售后办事”，询问本身的答复有没有令人称心，还有哪里需要再改改。

“ChatGPT最强竞品”来了，聊天机器人大战打响？

一圈玩下来能够看到，与ChatGPT比拟，Claude能更清晰地回绝不当当恳求。

它似乎更话痨一些，给出的谜底都更长，但句子之间跟尾的也更天然。

当碰着超出才能范畴的问题时，Claude会主动爽快。

不外碰着代码生成或推理问题时，Claude的表示就不如ChatGPT了，它生成的代码会呈现更多的bug。

至于一些涉及计算、逻辑的问题，Claude和ChatGPT半斤八两，各有千秋。

总结一下展现效果，Claude确实能称做ChatGPT强有力的合作敌手，在差别功用上各有所长，且在12项使命中有8项更强：

“ChatGPT最强竞品”来了，聊天机器人大战打响？

不外，目前Claude仅限于部门人获受权停止内部测试。

因而还不晓得它现实利用情状若何，事实还既没有停止公测，也没有对外开放API，更没有见到中文版，好气哦.jpg。

国表里对话AI赛道“人挤人”

当然，盯上对话AI那个赛道的，也不行OpenAI和Anthropic。

先从国外公司来看，Inbenta、Character.ai还有Replika是几类差别利用标的目的的代表。

更早由前甲骨文副总裁Jordi Torras兴办的AI会话办事公司如Inbenta，以及由两名前谷歌员工联手兴办的后起新秀Character.ai，都已经获得融资、或是在逃求投资的路上了。

此中，Inbenta本来是一个供给征询办事的公司，成立于2011年，涉及金融办事、旅游、电子商务、保险、汽车和电信等多个行业。

但看到对话AI赛道爆火后，Inbenta及时转行，就在本年1月刚获得6000万美圆融资。

那家公司专门供给聊天机器人、收发动静、常识库和搜刮引擎四类产物，对话AI别离会在那些产物中供给纷歧样的征询搀扶帮助，且能够定造化专属模子。

“ChatGPT最强竞品”来了，聊天机器人大战打响？

Character.ai则是一家成立于2021年的公司，开创人Noam Shazeer是前谷歌首席软件工程师，曾在谷歌干了二十多年。

那家公司在做的有点像是一个“聊天机器人交易平台”，有良多Chatbot可选。

“ChatGPT最强竞品”来了，聊天机器人大战打响？

例如那是马斯克bot，看起来还挺传神的：

“ChatGPT最强竞品”来了，聊天机器人大战打响？

与ChatGPT一样，它也能够被翻译成中文，以至也有中文bot机器人。

就在比来，那家被估值10亿美圆的公司，正式对外逃求2.5亿美圆融资，就看能否有情面愿投它了。

类似的公司还有Replika，于2021年1月完成A轮融资，定位是AI交友软件。

在Replika中，每个用户都能创造一个“足够像本身”的AI聊天机器人，无论是语言腔调、仍是性格习惯，AI都能模仿到位。

“ChatGPT最强竞品”来了，聊天机器人大战打响？

至于国内，同样也有很多公司推出了ChatGPT一样的对话AI办事。

例如比来一度登上热搜的APP Store新聊天利用Glow，就来自一家名喊北京稀宇的新草创公司。

“ChatGPT最强竞品”来了，聊天机器人大战打响？

Glow既能够间接和本身感兴致的聊天机器人畅聊，也能够创建本身想要聊天的AI智能体：

“ChatGPT最强竞品”来了，聊天机器人大战打响？

除了Glow以外，往年岁尾元语智能科技公司也推出了一个喊元语AI的模子，从介绍来看是一个功用性AI助手。

与浩瀚对话AI一样，它不只能够写文章、写功课、以至翻译，也能够和它聊天，让它帮手完成各类简单的使命：

“ChatGPT最强竞品”来了，聊天机器人大战打响？

能够看见，无论是基于大语言模子手艺新成立的草创公司，仍是因其火爆水平，决定开垦新营业的公司，都期看能从对话AI那个赛道上分一杯羹。

但它们事实是有实枪实弹，仍是只是像Web3一样的泡沫？

有网友调侃：不如仍是问问ChatGPT吧。（手动狗头）

还有人提出了那么一个问题：

假设ChatGPT和Claude相当于AI绘画里的DALL·E 2，那么谁才是聊天机器人范畴的Stable Diffusion？

“ChatGPT最强竞品”来了，聊天机器人大战打响？

你觉得呢？

来源：量子位（ QbitAI）做者：衡宇萧箫，原题目：《GPT-3核心成员出走打造ChatGPT最强竞品！12项使命8项更强，最新估值50亿美圆》。

特大城市2011中文版

ChatGPT创业，让枪弹再飞一会儿 BEYOND Awards 2023 首责备委公布，复选启动期近！

相关内容

发表评论

↑