“文心一言”和ChatGPT谁更聪明?我们帮你试了试 | 封面天天见
封面新闻记者 孟梅 欧阳宏宇
在ChatGPT的“继任者”GPT-4发布一天之后,3月16日,百度在北京公开展示了新一代知识增强大语言模型、生成式AI产品“文心一言”。
作为后来者,文心一言无法逃脱与ChatGPT对比的命运。此前,不少人认为百度是“全村的期看”,但也有网友用一张梗图表达了对文心一言的担忧。
之所以如此,在于谷歌此前急炫AI搜索肌肉时暴露出了若干个瑕疵,导致了股价暴跌近8%;这次,在发布会进行的同时,百度港股市值也大幅下跌超9%。
和ChatGPT一样,文心一言是一个多模态大模型,包括文学创作、商业文案创作、数理逻辑推算等能力。那么,这个中国版的ChatGPT到底实力如何?能否担得起“全村的期看”?记者对文心一言和ChatGPT进行了实测。
中文检索正确度高
文学创作偏理性
展开全文
在文学创作上,文心一言一开场就被提问《三体》的文学常识。
看起来已是准则答案。再用同样的问题问ChatGPT呢?
延续了“一本正经”胡说八道的习惯:直接把刘慈欣的籍贯都给改了。
下一个问题是对《三体》进行续写。
看起来中规中矩,比较理性。然后是ChatGPT的答案。
自古“文无第一”,你对谁的续写构思更有兴致?
能给公司起名字
更懂中文背后的寓意
接下来,文心一言展示了在商业文案创作上的能力。
比如,给新公司起个名字,并且还强调这个名字是有寓意的。
再看看ChatGPT的商业策划能力。
看起来,ChatGPT对中文的理解还是相对肤浅。
解小学奥数题无压力
还知道出错了题
数学计算能力是考验生成式大模型的一大难题。ChatGPT刚上线时,也翻了不少车。现场,文心一言被问到的是小学数学竞赛常见的鸡兔同笼问题。
值得一提的是,现场展示的第一题题目出错了,文心一言也给与了及时反馈。修改了题目后,文心一言给出了详尽的解题步骤。
中文理解力更胜一筹
英文能力稍欠缺
作为扎根于中文世界的生成式AI,广大网友对文心一言的中华文化理解力寄予厚看。那么,其对中文的理解能力究竟如何?
用“洛阳纸贵”分别问文心一言和ChatGPT。
文心一言不但阐明了成语及其来源,还阐释了背后的经济学原理。
相比较而言,ChatGPT对中华文化的理解就要逊色一些。
只不过在阐释经济学原理上,与文心一言能力相当。
再看看双方写的躲头诗。
文心一言的七绝略显得“打油”。
ChatGPT给出的答案就更加离谱,似乎不理解“躲头诗”是什么含义。
据介绍,在英文上,文心一言虽然也能处理,但能力是显著不如中文的。这或许和目前能用到的练习数据有关。
不过,在发布会后,百度港股股价也有所回升。对此,文心一言还阐明了个中缘由,不过话里话外都是“客看原因”。
不服气的记者又问了一个关于“自己”的问题。答案却是……
怪不得不少网友对文心一言展示出的能力不太称心,甚至有人调侃,看完之后感觉“提前退休的日子看起来还可以缓一缓”。
不过也有网友表达,期看能给国产产品多一点时间和耐烦。
在此之前,已经有超过650家生态协作伙伴公布加进文心一言,包括封面新闻、环球时报等媒体,以及企业和机构组织。这款中国造ChatGPT究竟好不好用,能走多远,信赖很快就会有答案。