“文心一言”和ChatGPT谁更聪明？我们帮你试了试 | 封面天天见

misa2 03-16 3次浏览 0条评论

封面新闻记者孟梅欧阳宏宇

在ChatGPT的“继任者”GPT-4发布一天之后，3月16日，百度在北京公开展示了新一代知识增强大语言模型、生成式AI产品“文心一言”。

作为后来者，文心一言无法逃脱与ChatGPT对比的命运。此前，不少人认为百度是“全村的期看”，但也有网友用一张梗图表达了对文心一言的担忧。

之所以如此，在于谷歌此前急炫AI搜索肌肉时暴露出了若干个瑕疵，导致了股价暴跌近8%；这次，在发布会进行的同时，百度港股市值也大幅下跌超9%。

和ChatGPT一样，文心一言是一个多模态大模型，包括文学创作、商业文案创作、数理逻辑推算等能力。那么，这个中国版的ChatGPT到底实力如何？能否担得起“全村的期看”？记者对文心一言和ChatGPT进行了实测。

中文检索正确度高

文学创作偏理性

展开全文

在文学创作上，文心一言一开场就被提问《三体》的文学常识。

看起来已是准则答案。再用同样的问题问ChatGPT呢？

延续了“一本正经”胡说八道的习惯：直接把刘慈欣的籍贯都给改了。

下一个问题是对《三体》进行续写。

看起来中规中矩，比较理性。然后是ChatGPT的答案。

自古“文无第一”，你对谁的续写构思更有兴致？

能给公司起名字

更懂中文背后的寓意

接下来，文心一言展示了在商业文案创作上的能力。

比如，给新公司起个名字，并且还强调这个名字是有寓意的。

再看看ChatGPT的商业策划能力。

看起来，ChatGPT对中文的理解还是相对肤浅。

解小学奥数题无压力

还知道出错了题

数学计算能力是考验生成式大模型的一大难题。ChatGPT刚上线时，也翻了不少车。现场，文心一言被问到的是小学数学竞赛常见的鸡兔同笼问题。

值得一提的是，现场展示的第一题题目出错了，文心一言也给与了及时反馈。修改了题目后，文心一言给出了详尽的解题步骤。

中文理解力更胜一筹

英文能力稍欠缺

作为扎根于中文世界的生成式AI，广大网友对文心一言的中华文化理解力寄予厚看。那么，其对中文的理解能力究竟如何？

用“洛阳纸贵”分别问文心一言和ChatGPT。

文心一言不但阐明了成语及其来源，还阐释了背后的经济学原理。

相比较而言，ChatGPT对中华文化的理解就要逊色一些。

只不过在阐释经济学原理上，与文心一言能力相当。

再看看双方写的躲头诗。

文心一言的七绝略显得“打油”。

ChatGPT给出的答案就更加离谱，似乎不理解“躲头诗”是什么含义。

据介绍，在英文上，文心一言虽然也能处理，但能力是显著不如中文的。这或许和目前能用到的练习数据有关。

不过，在发布会后，百度港股股价也有所回升。对此，文心一言还阐明了个中缘由，不过话里话外都是“客看原因”。

不服气的记者又问了一个关于“自己”的问题。答案却是……

怪不得不少网友对文心一言展示出的能力不太称心，甚至有人调侃，看完之后感觉“提前退休的日子看起来还可以缓一缓”。

不过也有网友表达，期看能给国产产品多一点时间和耐烦。

在此之前，已经有超过650家生态协作伙伴公布加进文心一言，包括封面新闻、环球时报等媒体，以及企业和机构组织。这款中国造ChatGPT究竟好不好用，能走多远，信赖很快就会有答案。