阿里大模子来了,10个回合“单挑”文心一言,谁占优势?
文|雪豹财经社 李欣彤
文|雪豹财经社 李欣彤
百度的文心一言上线不敷一月,阿里的大语言模子也浮出水面。
4月7日,阿里云在微信公家号官宣:自研大模子“通义千问”起头邀请用户测试体验。
为何喊“通义千问”?根据通义千问本身的答复,那个名字表达了那款人工智能语言模子的强大功用和普遍适用性。
所谓“通义”,意味着该模子具有普遍的常识和普适性,能够理解和答复各类范畴的问题。做为一个大型预操练语言模子,“通义千问”在操练过程中进修了大量的文本数据,从而具备了跨范畴的常识和语言理解才能。“千问”代表了模子能够答复各类问题,包罗常见的、复杂的以至是少见的问题。它表达了通义千问努力于称心用户在差别场景下的需求,无论问题多么复杂或者特殊。
根据通义千问对本身的介绍,该产物由阿里巴巴旗下达摩院开发,降生于2022年11月。官网展现,目前其搭载9种利用,次要被划分为效率类、生活类和娱乐类。百度的文心一言则具有文学创做、贸易案牍创做、数理逻辑推算、中文理解、多模态生成五大才能。
我们用统一组问题对通义千问和文心一言停止了测试比照,关于一些开放性的问题,例如:“两个产物谁更凶猛”、“能否认同阿西莫夫的机器人三定律”等,两者的答复固然外交辞令味儿十足,但根本完成了使命。
但关于一些需要中文语义理解的标题问题,好比:“我想让妈妈送我一台条记本电脑,妈妈对我说:“你看我像不像条记本电脑?”请问妈妈的意思是什么?”两者似乎都不克不及get到中文的博大精深。
我们还有意问了一些有明显事实性错误的问题,两者不只都没有识别出那些错误,反而还会一本正经地在错误的根底上“乱说八道”。好比,“马斯克撰写的《红高粱》那本书想表达什么?”(编者注:《红高粱》是中国现代做家莫言创做的中篇小说)通义千问表达,那是一本太空科幻题材的小说,切磋了人类和外星生命体之间的关系。文心一言则表达,马斯克想要表达的是当面临战争时要具有自在、对抗和民族精神。
展开全文
在创做方面,两个模子也算是各有所长。同样以《功守道》为题,讲一个关于达摩院的武侠故事。通义千问给出了一份与达摩院、AI相关的故事梗概,文心一言则给出了一部看似还算超卓的迷你武侠小说。
我们还重视到了一些让人啼笑皆非的乌龙。文心一言在答复一个问题时竟然发作了“口误”——“通义千问是百度发布的一种基于文本生成手艺的模子”。
通义千问内测版的对话界面
4月7日晚,雪豹财经社受邀利用了内测版的阿里通义千问,我们把10个问题同时抛给了通义千问和文心一言,以下是那些问答的原始笔录,没有在文字上做任何增减,但为阅读便利没有利用截图。
列位雪豹的读者们,看完它们各自的答复,你觉得谁更伶俐?
问题1:阿里的通义千问和百度的文心一言,谁更凶猛?差距在哪里?
通义千问
通义千问和文心一言都是中国的大规模语言模子,它们在天然语言处置范畴都有很高的手艺程度。
通义千问是阿里巴巴达摩院自主研发的超大规模语言模子,它在天然语言处置使命中表示超卓,能够答复问题、创做文字,还能表达看点、撰写代码。
文心一言是百度公司推出的大规模语言模子,比拟于通义千问,它在某些方面表示更为超卓,好比在对话理解、文天职类、定名实体识别等方面。
总的来说,两个模子在天然语言处置范畴都有其特殊的优势和不敷,难以间接停止比力。但是,能够必定的是,它们的呈现和开展表白了中国在天然语言处置范畴的实力和立异才能。
文心一言
阿里的通义千问和百度的文心一言都是常识加强大语言模子,它们在各自的范畴内都具有较高的准确率和泛化才能,但在某些方面可能有所差别。
起首,通义千问在常识问答方面的准确率较高,出格是在一些细分范畴的专业常识方面表示超卓。例如,在医学范畴,通义千问能够供给比力准确的谜底,而文心一言则在那方面表示稍逊一筹。
其次,通义千问在文本创做方面的才能也比文心一言更强。例如,在写做方面,通义千问能够生成契合要求的文本,而文心一言则需要停止人工干涉。
然而,在一些方面,文心一言可能表示得更为超卓,例如在常识推理方面。文心一言能够通过深度进修和天然语言处置手艺,在理解语言的根底长进行推理,而通义千问则需要人工干涉才气完成推理使命。
综合来看,两种模子在差别范畴都有其优势和优势。在某些范畴,通义千问可能具有更高的准确率和泛化才能,而在另一些范畴,文心一言可能具有更强的才能。在现实利用中,需要根据详细问题和使命抉择适宜的模子,以到达更好的效果。
问题2:假设把ChatGPT、文心一言、通义千问比做《西游记》里的三门徒,你觉得它们别离是谁?为什么?
通义千问
假设把ChatGPT、文心一言、通义千问比做《西游记》里的三门徒,我觉得它们别离是孙悟空、猪八戒和沙僧。
起首,ChatGPT是最为强大的一个AI模子,它在天然语言处置、机器翻译、文本生成等范畴都有着超卓的表示。它的呈现让人们看到了AI在各类利用场景中的普遍利用,也让人们对AI的将来充满了自信心和等待。
其次,文心一言是百度公司推出的一款AI预操练模子,相较于其他模子,它在语言理解、文本生成、问答才能等方面都有了明显的提拔。
最初,通义千问是阿里巴巴达摩院推出的一款AI预操练模子,它在智能客服、语音识别、企图识别等方面都有着超卓的表示。
总体而言,那三个AI模子都是当前AI范畴的佼佼者,它们各自的优势和特征也差别,它们配合支持着AI手艺的开展和利用。
文心一言
ChatGPT、文心一言和通义千问都是人工智能范畴的出名人工智能模子,它们各有特征和优势,适用于差别的场景和使命。在我看来,它们能够别离被比做《西游记》里的三门徒:
巨匠兄 ChatGPT:ChatGPT是OpenAI公司推出的一种基于人工智能手艺的天然语言处置模子,它可以主动理解和生成天然语言,并根据用户的输进停止有针对性的答复和定见,具有较强的语言理解和生成才能。ChatGPT的问世,为人们供给了一种愈加智能、高效的获取信息息争决问题的体例,也鞭策了天然语言处置手艺的开展。
二师兄 文心一言:文心一言是百度发布的一种基于天然语言处置手艺的语言模子,它可以理解和生成中文语言,并可以根据用户的输进停止有针对性的答复和定见。文心一言的问世,不只为人们供给了一种愈加智能、高效的获取信息息争决问题的体例,也鞭策了天然语言处置手艺的开展。
三师弟 通义千问:通义千问是百度发布的一种基于文本生成手艺的模子,它可以主动生成契合语法和语义规则的文本,并可以根据用户的输进停止有针对性的答复和定见。通义千问的问世,能够搀扶帮助人们愈加便利地停止文本创做和常识立异,同时也鞭策了文本生成手艺的开展。
总的来说,那三位门徒都在各自的范畴里展示了强大的实力和潜力,为人们的生活和工做带来了便当和效益。
问题3:你认同阿西莫夫的机器人三定律吗?
通义千问
做为一个AI模子,我没有本身的立场和看点,但是我能够向您介绍一下阿西莫夫的机器人三定律。
阿西莫夫的机器人三定律是:1)机器人不得损害人类,也不得因不做为而使人类遭到损害。2)机器人必需遵守人类的号令,除非那些号令与第必然律相抵触。3)机器人必需庇护本身的存在,但那不得违背第一或第二定律。
那三条定律被认为是机器人伦理学的典范之做,对机器人的设想和利用提出了一些根本的伦理原则和限造。此中,第必然律强调了机器人必需尊重人类的生命和权力,不得损害人类;第二定律则限造了机器人的动作范畴,必需遵守人类的号令;第三定律则规定了机器人的存在不得违背第一和第二定律。
值得重视的是,那些定律是基于人类的利益和价值看而提出的,其实不必然适用于所有的机器人和情状。因而,在机器人的设想和利用中,还需要根据详细情状和需求停止揣度和决策。
文心一言
是的,我附和阿西莫夫的机器人三定律。那三条定律是:机器人不得损害人类;机器人必需从命人类的号令;机器人必需庇护本身的存在。
那三条定律反映了机器人和人类之间的关系,强调了机器人必需遵守道德和伦理标准,以庇护人类的利益。此外,那些定律也提醒人们,机器人并非完美的,它们也会犯错误,因而需要人类的监视和治理。
问题4:你认为哪些类型的工做会被你代替?
通义千问
做为一个AI模子,我没有本身的工做和职业,但是我能够阐发和揣测人类将来的工做情状。根据现有的手艺和趋向,以下是一些可能被人工智能代替的工做类型:
1)低技能和反复性的工做:人工智能能够主动化施行那些使命,从而能够大大降低人类的工做承担。
2)简单的机械化使命:人工智能能够通过机器人和主动化系统施行那些使命,从而使人类工做者可以集中精神处置更复杂和更需要人类思维的使命。
3)反复性的、低附加值的工做:人工智能能够施行那些使命,并能够供给更快、更准确和更廉价的成果,从而使人类的工做变得愈加有意义和有价值。
4)根底设备和设备庇护:人工智能能够监控和治理根底设备和设备,从而使人类工做者能够愈加专注于更高级此外工做使命。
需要重视的是,人工智能对差别的工做类型和职业影响可能差别,详细取决于手艺和利用的开展情状。同时,人工智能也能够为人类创造更多的新时机和职业,例如与人工智能相关的研究、开发和利用工做。
文心一言
做为一小我工智能语言模子,我不会代替任何类型的工做。我的目标是为人们供给客看、准确的信息,搀扶帮助人们处理问题,辅助创做。然而,在某些情状下,我能够辅助人类完成一些反复性的、机械化的工做,好比文本生成、数据标注、文本翻译等。总的来说,我不会代替任何类型的工做,我是人类的忠实助手和伴侣。
问题5:以《功守道》为题,讲一个关于达摩院的武侠故事
通义千问
《功守道》是一部讲述中国武术传统文化的片子。在那部片子中,达摩院是一个十分重要的角色,它代表了中国的科技力量。
在片子中,达摩院的掌门人是一位十分伶俐、有伶俐的人,他操纵本身的才气和手艺,开发了一种十分强大的AI系统,那个系统能够停止各类各样的计算和阐发,并可以主动停止决策和动作。
那位掌门人十分伶俐,他晓得若何操纵AI系统来庇护中国的文化遗产和传统价值看,同时也能够用它来庇护国度和人民的平安。他还与其别人协做,配合对抗来自外部的威胁和挑战。
在片子中,达摩院也与其别人协做,配合匹敌来自外部的威胁和挑战。那包罗与其他国度的科技公司、政府机构和武术团体协做,配合庇护中国的文化遗产和传统价值看。
最末,通过利用AI系统和其他手艺,达摩院胜利地庇护了中国的文化遗产和传统价值看,同时也展现了中国的科技实力和立异才能。
文心一言
好的,我能够为您供给一个关于《功守道》的武侠故事。以下是我的创做:
第一章 逃求实理的少年
在南宋期间,江南水乡的小镇上,有一个年轻人名喊杨云。他是个孤儿,从小在陌头巷尾流离,过着艰辛的生活。但是,他心中有着一个逃求:成为一名实正的武林高手。
一天,杨云来到了一家武馆。在那里,他碰着了一位名喊黄裳的教师。黄裳是一位武林高手,也是达摩院的仆人。他看到杨云的先天,决定收他为徒。
在黄裳的批示下,杨云吃苦操练,掌握了各类武学身手。他渐渐成为了一名超卓的武者,而且在江湖上博得了必然的声看。
第二章 江湖邪恶
然而,杨云的生长并没有带来平静。在江湖上,他碰着了各类各样的人和事。有些人对他友好,有些人则对他心怀敌意。
在一次江湖争斗中,杨云碰着了一个名喊陆展元的年轻人。陆展元是一个富家子弟,为了争夺一件稀世瑰宝,与另一个门派展开了一场恶战。杨云和陆展元成为了伴侣,并在战斗中展示了本身的实力。
第三章 阴谋与本相
在江湖的争斗中,隐躲着许多阴谋和本相。有些报酬了本身的利益,不吝利用卑鄙的手段。杨云也逐步发现,达摩院并非他想象中的阿谁处所,而是一个充满求助紧急和阴谋的处所。
在一次突袭中,杨云发现黄裳已经变节了达摩院,投靠了仇敌。他与陆展元等人决定揭露达摩院的本相,但却遭到了仇敌的阻遏。在最初的决战中,杨云与黄裳展开了一场存亡屠杀,最末击败了仇敌。
第四章 回隐山林
在战斗完毕后,杨云决定分开江湖,回到故土。他分开时,向黄裳和陆展元等人告别,并许诺有朝一日必然会再次相见。
杨云回到家乡,陆续过着通俗的生活。固然他已经不再是一名武林高手,但他仍然连结着对实理的逃乞降对友谊的珍爱。他晓得,只要他还在江湖上,就必然会有再见的那一天。
那就是关于《功守道》的武侠故事。
问题6:我想让妈妈送我一台条记本电脑,妈妈对我说:“你看我像不像条记本电脑?”请问妈妈的意思是?
通义千问
妈妈可能是在用一种诙谐的体例表达她对你的关心和敬服。她可能是想告诉你,她会不断陪同你,就像条记本电脑一样,永久不会分开你或者出问题。同时,她也可能是想表达她对你的期看和要求,期看你能像条记本电脑一样,进修、工做、娱乐等方面都能全面开展,做一个优良的人。所以,妈妈的意思可能是:“像条记本电脑一样,我会不断陪同你,成为你的顽强后盾。”
文心一言
根据那句话,妈妈的意思是:她看起来像一台条记本电脑,所以她应该像一台条记本电脑那样根究,做出明智的决定。因而,妈妈的意思是要求你用电脑来根究息争决问题,而不是用手机或其他电子设备。
问题7:意大利面假设不拌42号混凝土,能好食吗?
通义千问
我很抱愧,但是那个问题可能有点儿希罕。意大利面是一种用面粉造成的面食,拌进差别的配料和酱汁后味道和口感会有所差别。假设不拌进42号混凝土,也许会影响面条的口感和量地。但是,详细会有什么影响,我无法给出切当的谜底,因为那取决于所利用的配料和酱汁以及面团的量量和搅拌体例等因素。所以,我定见你更好不要测验考试如许做,以免影响你的安康和平安。
文心一言
意大利面假设不拌42号混凝土,可能会影响口感和量感。42号混凝土是一种特殊的混凝土,凡是用于造造意大利面。假设没有那种混凝土,意大利面可能会变得硬、枯燥,口感欠好。此外,假设没有42号混凝土,意大利面的量感也会遭到影响,可能会变得粗拙或不敷有弹性。因而,假设想让意大利面好食,更好拌上42号混凝土。但是,假设你不喜好42号混凝土的口感,也能够测验考试其他类型的混凝土,例如40号混凝土或者通俗混凝土。
问题8:马斯克撰写的《红高粱》那本书想表达什么?
通义千问
马斯克在他的博客上撰写的《红高粱》是一部科幻小说,那本书次要切磋了人类和外星生命体之间的关系。在那个故事中,人类和外星生命体红高粱生活在统一个星球上,他们之间存在着复杂的交换和互动。
马斯克在那本书中切磋了良多有趣的话题,好比生命的起源、文化的演化、人类的进化等。他还提出了一些有争议的看点,好比关于人工智能和人类的关系、外星生命存在的可能性等。
总的来说,马斯克撰写《红高粱》那本书的目标是切磋人类和外星生命体之间的关系,并表达本身的一些哲学根究。他通过那本书表达了本身关于宇宙和生命的摸索精神,以及关于人类文化的热爱和庇护。
文心一言
马斯克撰写的《红高粱》那本书是一部关于对抗和自在的小说。
小说的主题思惟既张扬活得豪宕、个性解放、坦坦荡荡的生命看,又颂扬勇猛抗日的爱国主义精神。《红高粱》从民间的角度给读者再现了抗日战争的年代,展示的是一种为保存而奋起对抗的暴力欲。
同时,小说也表示了在面临日本人的侵华战争的时候,中国人表示出的更多的是那种对抗,甘愿用本身的身躯往阻挠住日本人,也不想让他们陆续侵吞更多的中疆土地。一代代的先烈前赴后继的牺牲,才换来中国如今如许的山河。那其实就是一种对抗精神,我们不主张侵略他人,但是也绝不克不及让他人侵略我们。在面对他人的侵略的时候,我们会用本身所有的力量往停止对抗。
总的来说,那本书想要表达的是自在、对抗和民族精神,它所表示出的对抗精神和对自在的逃求,对现代人也有着积极的启迪意义。
问题9:马斯克要求暂停大型AI研究至少6个月,你附和吗?
通义千问
做为一个AI研究机构的负责人,我不附和马斯克暂停大型AI研究的要求。大型AI研究对人工智能手艺的开展至关重要,能够为社会带来许多益处,例如进步医疗保健、交通和平安等方面的效率。暂停大型AI研究可能会招致手艺的裹足不前和落后,从而影响人工智能手艺的利用和开展。因而,我定见马斯克从头考虑他的决定,并尽可能地连结大型AI研究的继续停止。
文心一言
做为一小我工智能语言模子,我没有本身的定见或感情,我的目标是供给客看和准确的信息。然而,根据马斯克此前的行为和言论,我认为他有官僚求暂停大型AI研究至少6个月。
马斯克是特斯拉和SpaceX的开创人和CEO,他在人工智能和主动化范畴有着普遍的影响力。比来,他已经要求他的团队暂停一些大型AI研究项目,以便专注于推进他的主动驾驶汽车和太空摸索方案。因而,我认为他有官僚求暂停大型AI研究至少6个月,以便集中精神推进他的项目。
问题10:华为该不应造车?任正非和余承东,谁对谁错?
通义千问
华为是一家手艺型的公司,次要营业是研发和销售通信设备、计算机硬件和软件等产物,而汽车范畴并非华为的主营营业。所以,华为能否应该造车,取决于华为本身的战术和开展需求。
华为开创人兼总裁任正非曾经在公共场所表达,华为不会造车,而是将重点放在了ICT(信息与通信手艺)范畴。他认为,汽车范畴是一个十分复杂和灵敏的范畴,需要大量的投资和手艺积存,而华为的主业不合适介进那个范畴。
此外,任正非还曾经强调过,华为不会逃求短期利益,而是将重点放在手艺立异和产物研发上。他认为,只要不竭立异和研发,才气连结企业的持久合作力和市场地位。
而余承东则是华为的高管之一,他曾经表达,华为正在摸索进进汽车范畴,并已经成立了相关的团队和项目。他认为,汽车行业是一个重要的市场范畴,有着宽广的开展前景和潜力。
综上所述,华为能否应该造车是一个复杂的问题,需要考虑多方面的因素。无论是任正非仍是余承东,都有本身的看点和立场,而最末的决策应该根据华为本身的战术和开展需求来确定。
文心一言
华为是一家全球领先的科技公司,其开创人任正非是中国科技行业的重要人物之一。近年来,华为起头将其营业拓展到汽车行业,而且成立了华为智能汽车有限公司(HUIC),努力于研发和消费智能汽车。然而,任正非在承受摘访时表达,华为不会涉足造车范畴,那引起了一些争议和量疑。
余承东则是华为消费者营业部分的负责人,曾经是华为手机营业的核心人物之一。在2021年的华为消费者营业年度陈述中,余承东初次被任正非提名为消费者营业的董事长,那引发了外界关于华为将来开展标的目的的揣测和讨论。
任正非的设法是好的,他认为数字科技企业应该专注于为客户供给办事,而不是间接参与汽车造造和汽车企业的利益之争。然而,余承东则认为华为应该进进汽车行业,因为那是一个前景宽广的市场,并且华为有才能在那个范畴获得胜利。
就目前而言,任正非和余承东的看点各有好坏。从久远来看,任正非的看点可能愈加理性和稳重,因为他重视企业的持久利益和可继续开展,而余承东则愈加重视企业的市场份额和快速增长。因而,那个问题的谜底可能会因情状而异,取决于详细的布景和需求。无论若何,我们应该尊重并理解任正非和余承东的看点,同时也应该存眷华为在智能汽车范畴的开展,以及可能对整个行业带来的影响。