百度文心一言来了！李彦宏想要“革新生产力工具”

misa2 03-24 3次浏览 0条评论

十年磨一剑，“文心一言”终于利刃出鞘。

3月16日下午，百度创始人、董事长兼首席执行官李彦宏现场展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。

据介绍，百度文心一言定位于人工智能基座型的赋能平台，将助力金融、能源、媒体、政务等千行百业的智能化变革，最终“革新生产力工具”。

即日起，首批用户即可通过邀请测试码，在文心一言官网体验产品，后续将陆续开放给更多用户。此外，百度智能云即将面向企业客户开放文心一言API接口调用服务。3月16日起正式开放预约，搜索“百度智能云”进进官网，可申请加进文心一言云服务测试。

尽管在现场展示中，文心一言已经几乎能媲美ChatGPT，但李彦宏也坦言：确实不尽完美，“这类大语言模型还远未到发展完美的阶段，进取空间很大”。

对标ChatGPT，文心一言“人有我有”

凭什么“革新生产力工具”？在李彦宏的现场展示中，文心一言在五大使用场景中，展露了其五大能力。

从对标ChatGPT的层面来看，文心一言基本做到了“人有我有”。

1.文学创作

假如你体验过ChatGPT，那么对于其强大的“人工智能谈天机器人服务”，应该是印象深刻的。

这一点当然也只是最低门槛，百度凭借其在搜索业务的积存，拥有世界上较大的知识图谱，可以轻而易举地实现这一功能。

在李彦宏现场展示的文学创作场景中，文心一言依据对话问题将科幻小说《三体》的核心内容进行了总结，并提出了五个续写的意见角度，体现出对话问答、总结分析、内容创作生成的综合能力。

此外，文心一言正确回答了《三体》作者、电视剧角色扮演者等事实性问题。面对“于和伟和张鲁一有哪些共同点”、“于和伟和张鲁一谁更高”这类问题，文心一言也基于推理能力得出了正确答案。

2.商业文案创作

ChatGPT的“发明力”，也是让人“惊艳”。

在这一局的PK中，百度文心一言在商业文案创作场景中，顺利完成了给公司起名、写Slogan、写新闻稿的创作任务。

展开全文

来源：百度

据介绍，文心一言大模型的练习数据包括万亿级网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据，以及5500亿事实的知识图谱等。这让百度在中文语言的处理上，能够处于独一无二的位置。

3.数理逻辑推算

“鸡兔同笼”成为了文心一言，展示其“数理逻辑推算”能力的案例。

面对“鸡兔同笼”这类磨练人类逻辑思维的经典题，文心一言能理解题意，并有正确的解题构思，进而像学生做题一样，按正确的步骤，一步步算出正确答案。

4.中文理解

作为扎根于中国市场的大语言模型，文心一言具备中文领域最先进的自然语言处理能力，在中文语言和中国文化上有更好的表现。

在现场展示中，文心一言正确阐明了成语“洛阳纸贵”的含义、“洛阳纸贵”对应的经济学理论，还用“洛阳纸贵”四个字创作了一首躲头诗：洛阳城里春光好，阳艳无双不负赏。纸贵漫天诗词赋，贵比黄金乐未央。

李彦宏提到，文心一言也支持英文，但是“懂得都懂”，相较于ChatGPT仍是“不尽完美”。但是，未来，文心一言必然会朝着支持多种语言的方向，陆续进取。

5.多模态生成

李彦宏在现场以“2023世界智能交通大会”为题，展示了文心一言在多模态生成方面，生成文本、图片、音频和视频的能力。

最初，文心一言为“2023世界智能交通大会”创作了一张海报；随后，对于“智能交通最适合哪个城市发展”这个问题，也给出了相应的看点解答；有趣的是，文心一言甚至能够生成四川话等方言语音；最后，文心一言甚至可以将上述文本、图片、音频信息，统一生成一个完全的视频版本。

来源：百度

遗憾的是，由于视频生成的成本较高，目前尚不对所有用户开放。但是，熟悉百家号的用户，已经在使用这一功能了：你创作的文字内容可以快速转制成视频模式并自动发布在百家号上。

李彦宏表达，“多模态是生成式AI一个明确的发展趋势。未来，随着百度多模态统一大模型的能力增强，文心一言的多模态生成能力也会不断提升。”

相较GPT-4，文心一言“人有我待优”

复刻ChatGPT，注定是一场巨头专属游戏，创业公司胜出的概率无限趋近于0。即便是最被寄予厚看的百度，也只能用“对标”而非超越，用“人有我有，人有我待优”，而非“人有我优”。

在演讲的开始，李彦宏就提到了“不尽完美”，“大家的期看值是要对标ChatGPT，甚至要对标GPT-4，这个门槛还是很高的。”

事实，或许也正如此。就在文心一言正式发布的前一天，OpenAI发布了多模态预练习大模型GPT-4（接受图像和文本输进，发出文本输出）。

OpenAI官方称，GPT-4是OpenAI扩展深度学习的最新里程碑。其联合创始人；； CEO Sam Altman也表达，“GPT-4是我们迄今为止功能最强大、对齐最好的模型！”

为了初步了解GPT-4在其他语言上的能力，OpenAI使用Azure Translate，将一套涵盖57个主题的1.4万多项抉择题的MMLU基准，翻译成了多种语言，然后进行测试。

在测试的26种语言中，有24种语言，GPT-4优于GPT-3.5和其他大语言模型的英语语言性能。其中，中文达到了80.1％的正确性，而GPT-3.5的英文的正确性为70.1％。

也就是说，在这个测试中，GPT-4对于中文的语言理解，已经优于此前ChatGPT对于英文的理解。

来源：OpenAI

此前，文心一言或许能够比使用GPT-3.5的ChatGPT优异，但想要与使用GPT-4的ChatGPT一较高下，似乎还需要更快进取、成长。

于是，保守起见，文心一言原本可称之为“人有我优”的“中文理解”，也只得回为“人有我有”。

而在多模态生成方面，文心一言的展示有限，似乎也只能是“人有我待优”。

当然，也无需妄自菲薄，李彦宏强调：“文心一言将建立起真实用户反馈、开发者调用和模型迭代之间的飞轮，效果会迅速提升，给你‘士别三日，当刮目相看’的惊喜。”

此前在2月份财报发布后，李彦宏也曾表达，百度计划将多项主流业务与文心一言整合，包括搜索、智能云、Apollo自动驾驶、小度智能设备等。

想必在未来，我们也将在实实在在的生活中，便利直看地体会文心一言。

李彦宏推测三大产业机会，“杀手级使用现象级产品”将涌现

“无论是哪家公司，都不可能靠突击几个月就能做出这样的大语言模型。深度学习、自然语言处理，需要多年的坚持和积存，没法速成。”李彦宏指出。

事实确也如此，近十年来，百度累计研发投进超过1000亿元。2月底发布的2022年的财报也展示，百度核心研发费用达到214.16亿元，占核心收进比例达22.4％。

李彦宏表达：“人类进进人工智能时代，IT技术的技术栈发生了根本性的转变。过往基本分为三层：芯片层，操作系统层和使用层。现在可以分为四层：芯片层、框架层、模型层和使用层。百度是全球为数不多、进行全栈布局的人工智能公司，从高端芯片昆仑芯，到飞桨深度学习框架，再到文心预练习大模型，到搜索、智能云、自动驾驶、小度等使用，各个层面都有领先业界的要害自研技术。”

李彦宏认为，百度AI全栈布局的优势在于，可以在技术栈的四层架构中实现端到端优化，大幅提升效率。特别是框架层和模型层之间，有很强的协同作用，可以扶助构建更高效的模型，并显著降低成本。

来源：百度

而更低的成本，也就意味着可以吸引更多的用户试用、体验。自2月份百度官宣“文心一言”以来，已有超过650家企业公布接进文心一言生态。这意味着很多企业已经理解到，文心一言和生成式AI代表了一个新的技术范式，它会影响到每一家公司。

李彦宏认为，AI市场爆发性的需求增长，将释放出前所未有的、指数级的商业价值。他推测，“大语言模型将带来三大产业机会。”

第一类是新型云计算公司，其主流商业模式从IaaS变为MaaS。文心一言将根本性地改变云计算行业的游戏规则。之前，企业抉择云厂商更多看算力、存储等基础云服务。未来，更多会看框架好不好、模型好不好，以及模型、框架、芯片、使用这四层之间的协同。

文心一言将通过百度智能云对外提供服务，扶助企业构建自己的模型和使用，农业、工业、金融、教诲、医疗、交通、能源等重点领域，都会因此效率大幅提升，并在每一个行业快速形成新的产业空间，助力数字中国的实现。

第二类是进行行业模型精调的公司，这是通用大模型和企业之间的中间层，他们可以基于对行业的洞察，调用通用大模型能力，为行业客户提供解决方案。这方面，百度文心大模型已经在电力、金融、媒体等领域，发布了十多个行业大模型。

第三类是基于大模型底座进行使用开发的公司，即使用服务提供商。李彦宏断言，对于大部分创业者和企业来说，真正的机会并不是从头开始做ChatGPT和文心一言这样的基础大模型，这很不现实，也不经济。基于通用大语言模型夺先开发重要的使用服务，这可能才是真正的机会。目前，基于文本生成、图像生成、音频生成、视频生成、数字人、3D等场景，已经涌现出很多创业明星公司。

李彦宏表达，AI对各行各业的颠覆性改变才刚刚开始。未来，将会有更多的杀手级使用、现象级产品出现，将会有更多的里程碑事件发生。

来源：猎云精选

侠义无双官网

16年后，再看《武林外传》9位女演员，现状差距大，小配角成一线百度文心一言发来测试邀请发方言语音、秒画大熊猫生成式AI时代启幕