股价跌了,试用爆了!李彦宏不够称心的“文心一言”,如何赶上GPT-4?
2月7日,百度公布推出ChatGPT类型人工智能产品“文心一言”,并于3月份完成内测向公众开放。一个多月后的3月16日,在北京百度总部和上海张江人工智能岛,文心一言如期而至。
百度董事长兼CEO李彦宏介绍,文心一言在商业文案创作、数理推算等方面有突出能力,同时他也承认,文心一言“并没有完全ready(预备好)”。
背负着国内市场的期待,文心一言为何要匆忙上线?业内人士认为,国内GPT技术的发展,要以强占使用场景为先机,再辅助以算法技术的迭代,“边学边赶”才能有机会与国际AI巨头迎头赶上。
具备更强中文理解力
发布会现场,李彦宏展示了文心一言在五个使用场景的表现,包括文学创作、商业文案创作、数理推算、中文理解和多模态生成。
在文学创作场景中,文心一言依据对话问题将知名科幻小说《三体》的核心内容进行了总结,并提出了五个续写《三体》的意见角度,体现出对话问答、总结分析、内容创作生成的综合能力。此外,文心一言正确回答了《三体》作者、电视剧角色扮演者等事实性问题。据介绍,AICG内容回答事实性问题时轻易出现事实性差错,而文心一言延续了百度知识增强的大模型理念,大幅度提升了事实性问题的正确率。
展开全文
在商业文案创作场景中,文心一言也完成了给公司起名、写口号和新闻稿的创作任务。
“AI要写好一篇稿子,除了需要正确理解我们的意图,还要有清楚的表达能力。”李彦宏阐明称,人类常说“读万卷书”,AI则是 “读书破千亿卷”。文心一言大模型的练习数据包括万亿级网页、数十亿的搜索数据和图片、百亿级的语音日均调用数据以及5500亿条事实的知识图谱等。“有研究表明,数据规模足够大,参数达到千亿级,大模型就可能发生‘智能涌现’,即使在没有专门练习过的领域,也能涌现出知识理解和逻辑推理能力。”
文心一言还具备了一定的思维能力,能够学会数学推演及逻辑推理等相对复杂任务。面对“鸡兔同笼”这类磨练人类逻辑思维的经典题,文心一言能理解题意,并有正确的解题构思,进而像学生做题一样,按正确的步骤,一步步算出正确答案。
值得一提的是,文心一言扎根于中国市场的大语言模型,因而具备中文领域先进的自然语言处理能力,在中文语言和中国文化上有更好的表现。在现场展示中,文心一言正确阐明了成语“洛阳纸贵”的含义、“洛阳纸贵”对应的经济学理论,还用“洛阳纸贵”四个字创作了一首躲头诗。
除了日常的对话,李彦宏现场还展示了文心一言生成文本、图片、音频和视频的能力,还能够生成四川话等方言语音。不过遗憾的是,视频生成能力因成本较高,目前还未对所有用户开放。
“多模态是生成式AI一个明确的发展趋势。”李彦宏表达,“未来,随着百度多模态统一大模型的能力增强,文心一言的多模态生成能力也会不断提升。”
常用功能表现正常,漏洞仍然不少
“十月怀胎,一朝分娩。”李彦宏在发布会上如是形容文心一言的诞生。
据悉,文心一言的上线已连续多日进行压力测试,亚洲目前最大的单体智算中心山西阳泉百度智算中心,已经将算力提升到每秒可以完成400亿亿次浮点运算,并与全国其他几座智算中心共同为文心一言提供算力支持。
除了日常对话外,文心一言还提供了写报告、AI作画和查知识点三个功能模板。
文心一言在“传统媒体合成转型”为题的报告中,不仅阐明了“媒体合成”的意义,还给出了数字化转型、内容创新、用户分析等多方面意见。记者发现这些内容并非是搜索引擎的直接显现,而是经过大模型的整理和回纳。在查知识点和AI作画方面,文心一言也正常表现,通常在一分钟内能够给出反馈。
不过,记者在试用时发现文心一言在交流方面仍有不少漏洞,时常出现前后矛盾的现象。另外,在对话过程中缺少上下文之间的唤应,更像是一对一的应答。
▲记者亲测发现,有关“成否生成视频”的问题,文心一言的答案前后矛盾
也有部分内测用户表达,同样的问题抛给文心一言和GPT-4,两者的答案有一定差距。比如《三体》的续写,“文心一言”的答案比较抽象,比如生命的意义、人类的宇宙关系,而GPT-4的回答更具体、更有冲突感,比如类人机器人的崛起、黑暗森林法则的挑战等。
试用申请挤爆测试网页
3月15日,OpenAI推出了GPT-4,市场反馈优于ChatGPT,文心一言今日上线,难免与GPT-4将有所比较。
百度早在2019年推出了文心大语言模型,以此为基础的文心一言也属于百度多年来的“厚积薄发”,不过就连李彦宏自己也承认:“不能说我们完全ready了,文心一言对标ChatGPT,甚至是对标GPT-4,门槛仍然是很高的,我自己测试感觉还是有很多不完美的地方。”
或许是担心文心一言的稳定性,李彦宏在发布会现场并未使用现场实时演示,而是摘用提前录制好的视频进行了文心一言的能力展示。李彦宏也表达,该模型目前还存在一定不足,“无论是哪家公司,都不可能靠突击几个月就能做出这样的大语言模型。深度学习、自然语言处理,需要多年的坚持和积存,没法速成。”
资本市场对文心一言的反应也不尽理想。今日午后,百度的港股出现继续下挫,跌幅一度达到近10%,随后略有收窄。截至收盘,百度股价报收125.1港元/股,跌6.36%,总市值3458亿港元。
文心一言为何仓促上线?百度今日披露的两组数据能阐明问题——短短一个月的时间,超过650家协作伙伴公布加进文心一言生态;发布会后一小时内,排队申请文心一言企业版API调用服务测试的企业用户已达3万多家,申请产品测试网页多次被挤爆,百度智能云官网流量飙升百倍。
“大家都期看能早一点用上最新最先进的大语言模型。”难怪李彦宏直言,“文心一言”并不完美,但市场有需求必须要推出来。
对于“用市场换时间”的做法,360创始人周鸿祎也公开表达认同。“目前国内发展GPT技术,首先要占据使用场景,同步全力发展核心算法技术。”他表达GPT技术的使用场景需要复杂的工程化和商业化的能力,以及丰盛的数据清洗和人工标注的体会,假如等国内的算法赶上GPT-4再上马,市场就错过了。
GPT概念是风口还是泡沫?
除了文心一言外,国内已有多家机构和企业推出类GPT大模型。今年2月,小冰公司的ChatGPT使用“小冰链(X-Chain of Thought Action)”开启了小领域内测。3月初,复旦大学计算机科学技术学院邱锡鹏团队发布类ChatGPT模型MOSS,目的是打造一个具有中国特色的中文大型语言模型;360也表达将借鉴微软与OpenAI能力结合所推出的New Bing模式 ,推出新一代智能搜索引擎,并基于搜索场景推出人工智能个人助理类产品。阿里达摩院类ChatGPT产品已处于内测阶段,京东云将推出产业版ChatGPT—ChatJD……更多大模型也在逐步内测推进中。
据国际数据公司(IDC)测算,2021年全球市场人工智能市场收进规模达850亿美元,并将于2025年突破2000亿美元大关,复合年均增长率高达24.5%。另据中信建投报告展示,中国人工智能行业发展势头凶猛,在全球人工智能产业化地区中仅次于美国和欧盟,约占全球市场规模的9.6%,2022年中国人工智能市场规模达2729亿元。
GPT概念到底是风口还是泡沫?国研新经济研究院创始院长朱克力告诉记者:“如百度等技术型公司已在大模型领域深耕多年,AI技术较为成熟,文心一言的出现无疑是利好,挠住这一机会能优先强占市场。”他也劝告投资者切勿盲目跟风,一些企业缺少技术优势,仅以ChatGPT为噱头赢得股市青睐,一旦泡沫戳破将缺失惨重。
“AI市场爆发性的需求增长,将释放出前所未有的、指数级的商业价值。”李彦宏推测,大语言模型将带来云计算、模型精调和使用服务提供商三大产业机会,“基于文本生成、图像生成、音频生成、视频生成、数字人、3D等场景,已经涌现出很多创业明星公司,可能就是未来的新巨头。”
国信证券研报也认为,AIGC使用场景有看全面爆发,作为生产力工具还将不断推动谈天机器人、数字人、元宇宙等领域发展。作为推动人工智能发展的三大要素,算法目前仍在迭代,数据积存量不够,算力也刚刚突破,“三兄弟”的突破还将不断发明出新的业态和使用。