风起阿里云:中国 AI 大模子「生态」,千问开启
互联网时代的杰做是「毗连」,人工智能时代的标记是「决策」。——在过往的一个月,关于人工智能时代的定义区分,大大都行业人士在大模子的创造力上找到了谜底。
举个例子,为何大数据与机器进修算法的连系早已呈现,过往的十年(2012年到2022年)却仍然停留在互联网时代,而 ChatGPT 的呈现却勾画出了人们心中所想的人工智能时代呢?
那背后的素质,归纳综合来说,其实是 AI 算法能对消费力产生多大的影响。所谓「消费力」,形象的说法是机器与人的 ROI 比例区分,而大数据与过往统计进修、小模子深度进修的连系,没有在消费过程中明显降低人力的投进。例如,过往十年全球 AI 研究者在计算机视觉的摸索上,饰演了高净值的「科技民工」角色,AI 消费即便注进高门槛的科技属性,也还没有脱节堆人力的「劳动密集型」属性,因而 AI 消费力的释放有限。
但在 GPT-3 为代表的大模子风潮中,大模子处理多项使命的「通用」表示让 AI 第一次有了从项目交付跨向平台赋能的可能,有效掌握成本、进步收益,并在ChatGPT 的产物设想立异中发作大规模可行性、在 GPT-4 中愈加彰显「通用人工智能」(AGI)潜力。借助大模子,AI 的落地由此第一次称得上「智能」消费力,AI 时代降临。
例如说,ChatGPT 较于互联网,一次「询问」的搜刮,互联网产物的反应成果是一条条检索信息,需要用户花大量的时间往挑选、鉴别;而人工智能产物,如 ChatGPT,是基于检索信息做「决策」性的整合,一键生成婚配用户询问的谜底,节约了大量的时间成本,以及人力成本。
然而,我们只停留在基于大模子的单一「产物形态」(如对话形态的通义千问、ChatGPT...)上是没有意义的。假设只将想象力放在「沟通」上,那么随便走 Siri 为代表的对话产物老路。关于人机对话,过往 AI 范畴的研究学者囿于「改进沟通语气」的目标上,招致了上一代智能对话产物更多局限于感情安慰的效果;而 OpenAI 的研究者率先重视到更背后的需求:「沟通」是为了提拔处理问题的效率,所以他们将大模子的语言理解与生成才能,与对话做告终合,创造出了 ChatGPT。
由此再看 OpenAI 的通用人工智能途径:2020年推出的 GPT-3 是大模子的手艺,2022年推出的 ChatGPT 是基于大模子的产物形态,2023年与可口可乐等企业协做则是基于大模子的「生态」创造。据 EnterpriseAppsToday 统计,截行 2023 年 1 月, OpenAI 已跟科技、教导、企服、造造、金融、零售等等行业的 902 家企业构成协做关系。手艺-产物-生态是 OpenAI 的三部曲,此中,生态是 OpenAI 跑进人工智能时代的最初一公里。
目前,国内绝大大都的存眷点聚焦在类 ChatGPT 的「产物」形态上,也就是第二步。但现实上,从2017年谷歌推出 BERT 以来,Transformer引领的大模子研究就已在中美两国如火如荼展开,又在 2020 年GPT-3 的爆红中吸收了堆数据、堆算力的操练启迪,因而,早已进进大模子赛道的各家巨头,如海外的微软、谷歌,以及国内的阿里几乎处于统一起跑线。ChatGPT 固然带来产物的立异,但手艺含量并不是不成超越,因而国内的科技巨头也很快胜利追逐上,好比阿里、百度、智谱以至360,都能很快推出本身的类 ChatGPT 产物。
但论最末「生态」的合作,事实谁更有优势?背后其实是综合才能的比赛。而综合才能,比拼三点:一是利用大模子的根底设备;二是先有落地场景与平台的比拼;三是降本增效的工程才能。囿于综合才能的限造,「生态」迟迟未在国内开展。
展开全文
曲到今天。
刚刚兼任阿里云智能集团CEO的张勇(花名:逍远子)在阿里云北京峰会上放出重磅动静:阿里所有的产物都将用「通义千问」大模子革新。此外,阿里云智能集团CTO周靖人称,通义千问将基于阿里云根底设备向企业开放,企业能够在阿里云上操练企业本身的行业、垂类大模子。到那个时候,中国 AI 行业者才第一次嗅到利用大模子的春风,国内大模子的逐赶者才意识到:
中国大模子「生态」的比赛,被阿里云领先了一个身位。
01 大模子在前,利用在后
若何从互联网时代迈进人工智能时代?
过往数月,那是威胁中国互联网时代利益既得者的最核心问题。差别于曲播带货对传统电商平台的冲击,前者是在统一个范式(互联网)下的合作,大模子产物 ChatGPT 的「一键搜刮与生成」才能代表的是人工智能对信息链接的降维冲击。
处理那个心头大患,中国的互联网创业者快速履历了两波开展:一,下场做大模子,如王小川、王慧文、李志飞等人;二,基于大模子做产物利用立异,如 Adobe、金山办公等没有大模子发电厂的团队。
加上微软利用 OpenAI 大模子才能的启迪,互联网迈向人工智能的第一步最末抉择了一条显而易见的道路:互联网毗连平台的晋级,例如:大模子+搜刮,呈现微软的New Bing、谷歌的 Bard;大模子+办公,呈现微软的Copilot。那些产物都能够视为 Bing、谷歌搜刮、MS Office 的 3.0 做品(PC互联网时代是1.0,挪动互联网时代是2.0,人工智能时代则是3.0)。
毫无疑问,国内大模子的落地场景也起首会呈现在各类先有的互联网产物上。而BAT、美团、字节等擅长打平台战的企业对此都有需求,然而,并不是每个互联网巨头都有通用大模子的手艺积存。同理,新一轮的 AI 海潮中,拥有大模子积存的创业公司不具备成熟的互联网产物。因而,在那一局中,那一轮领跑者必需具备两个前提:一是大模子,二是落地场景。
而如上所述,大模子的比赛中,大厂之间只要具备算力、数据与算法,效果没有素质上的差距,百度有文心、阿里有通义(包罗M6/PLUG)、华为有盘古……所以决胜点之一就是利用的数量与量量。所以,当张勇表达阿里巴巴集团旗下全系产物都将接进 AI 大模子时,阿里云峰会的台下看寡沸腾了——
阿里系产物家族:
•电商:天猫,淘宝,速卖通,闲鱼
•出行:高德,飞猪
•娱乐:优酷,淘票票,灵犀互娱,大麦,西瓜影视,微博
•生活:饿了么,淘鲜达,盒马
•搜刮:UC阅读器
•办公:钉钉
•家居:天猫精灵……
OpenAI 没有大规模产物形态,因而第一阶段只能依靠微软的利用产物来释放大模子的消费力,如落地成 NewBing 与 Copilot。其余大模子的合作者还停留在手艺与产物打磨的第一或第二阶段,消费力的释放也仍遭到客看局限。兼备大模子手艺(通义)、产物(通义千问)与利用(钉钉、天猫精灵等)的阿里,很天然地冲到了「生态」前面,成为独立创作发明生态的玩家(区别于微软与OpenAI的联手创作发明)。
阿里云北京峰会上,接进了「通义千问」大模子手艺的钉钉,初次翻开了国内 AI 时代智能产物的想象力——
新一代的钉钉向智能办公迈进:针对办公会议,钉钉能够在会议完毕后主动生成会议纪要与待处事项;针对日常办公的文本写做,钉钉能够主动生成活动筹谋、会议筹谋等工做流程计划,以及文生图;针对群聊,钉钉能够主动生成群聊的聊天要点;针对开发,钉钉能够拍一张功用草图主动生成小法式……
在过往,文本总结、文本生成、文本翻译、文生图等等都是天然语言处置(NLP)中的一个个细分标的目的,大模子呈现之前,NLP 研究者是各自抉择一两个细分标的目的深耕,固然各有精辟,但在落地上成本与效益不婚配,类似大炮轰小鸟;但大模子呈现后,一个大模子就能够处理总结、生成、翻译等等多项使命,落地也就转为了高速公路的构想:固然建立成本高,但笼盖用户广、利用频次高,就具备了贸易可行性。
在将来,用大模子做单个产物的智能晋级,将成为行业趋向,我们能够拭目以待。
和其它团队差别的是,阿里更大的优势是其场景丰富,笼盖电商、出行、娱乐、生活、办公、搜刮等等品类,使其在大模子产物形态的立异上为「生态」做了更进一步的展垫:
以「帮我造定一份五一出游攻略」的问题为例,若询问 ChatGPT,用户只能得到一份关于机票、酒店、本地交通、饮食等等方面的文字答复;而询问「通义千问」,用户不只能够得到一份文字版的攻略,将来还能响应获取基于阿里产物生态及其外围协做商家所供给的机酒饮食娱乐等实在产物与办事:
阿里旗下每个利用单个拎出来均扛打,对其在「AI 生态」第一阶段的规划至关重要。
同时,阿里因为从 2019 年起头存眷 Transformer手艺做预操练大模子的摸索,在大模子手艺上有深挚积存,推出全球首个万亿级参数 M6 大模子,又率先在多模态标的目的上摸索出通义系列大模子,为其自己利用软件的迭代晋级做足了手艺储蓄,相辅相成。
外表上看,那是阿里借助 ChatGPT 的一次领跑,但逃根溯源,仍是其打磨垂类产物、对峙大模子研发多年的厚积薄发。阿里进局大模子比赛,没有停留在单一的产物形态上,而是率先将重心放在缩小 AI 大模子与影响行业之间的鸿沟上,是其能领跑大模子「生态」的原因所在。
02 不克不及被漠视的「 AI 根底设备」
用大模子将旗下所有产物停止一次革新,是阿里从手艺、产物迈向生态的第一步。
但一个完全生态的构成不克不及光靠阿里一家。「开放才气共赢」——那个看点在文生图模子 Stable Diffusion 凭仗开源赶超 OpenAI 的 DALL·E 2.0 上得到了验证,在 HuggingFace 为代表的 AI 模子开源社区中也得到了验证,因而,国内的科技巨头如百度、阿里、华为在大模子比赛中也强调那一点。
如张勇所言,面向智能时代,所有的公司都在统一起跑线上。以通用人工智能(AGI)为中心的 AI 时代才刚刚拉开序幕,大厂也好,创业公司也好,大模子利用创业者也好,若何跑完「降本增效」的最初一公里才是最末华山决胜的关键所在。
我们必需熟悉到手艺开展的一个客看需求:大模子的成熟,不是单一算法的成功。与操练大模子的框架、算法同样重要的,还有计算、开发、办事等配套设备。「布衣版」大模子是科学家挑战本身的主看命题,也是大模子落地行业的客看需求。
「虽然谷歌在那波大模子产物立异中落后 OpenAI 与微软,但我们不能不必定它的一点是,谷歌做大模子会从底层架构(如 Pathways)、算力设备(如 TPU)等多方面投进,共同降低大模子的研发成本。研发成本低,最末基于大模子的产物利用成本才气低。」一位行业人士告诉雷峰网。
换言之,大模子的底层根底设备决定了它的才能下限,同时又决定了它的利用上限。
从阿里云北京峰会的发布重点来看,「通义千问」更像是阿里研究大模子过程中的一个中间形态,而非起点。在云计算、互联网利用(如钉钉、天猫精灵)与魔搭社区等等功效的加持下,诸如「通义千问」的大模子成为链接行业的重要一环。
大会现场,周靖人表达,每个企业都能在阿里云拥有一个专属的「大模子空间」,既能够挪用「通义千问」的 AI 才能,也能够连系企业本身的行业常识与利用场景,操练出独有的「企业专属大模子」。换言之,阿里也要做 AI 时代的「发电厂」,成为给各个企业供给电力。
AI 海潮降临,大模子的才能有目共睹,那衍生出一系客看的行业事实:
起首,不只是阿里本身,相信国内大部门的公司城市用 AI 大模子将先有的软件晋级一遍,那无疑会引发操练与推理大模子的算力需求井喷。但另一方面,国内大大都公司没有才能自建大模子操练的根底设备;即便关于许多行业头部企业,操练大模子的费用也高于预期,对成本与效率的需求需要平衡。
千亿级参数的大模子研发,不是单一的算法问题,而是囊括了底层算力、收集、存储、大数据、AI 框架、AI 模子等复杂手艺的系统性工程问题,需要 AI 与云的全栈手艺才能;云办事来看,AI 根底设备需要超大规模且超高性能的算力底座,那又指向公共云是更佳载体。
阿里云则早已锻造了强大的根底设备:
在IaaS层,阿里云自建的「飞天智算平台」是目前国内规模更大的智算中心,单集群可达10万台规模,千亿级文件数,EB级别存储空间,千卡并行效率达 90%,能够处理计算拥堵问题,提拔计算效率。在PaaS层,基于飞天智算的阿里云深度进修平台PAI,可将计算资本操纵率进步 3 倍以上,AI 操练效率提拔 11 倍,推理效率提拔 6 倍。
在手艺立异和规模效应的加持下,阿里云则将普惠推向了极致,据张勇介绍,跟十年前比拟,阿里云供给的算力办事价格降低了 80%,存储办事的价格降低了接近 90%。
在阿里云北京峰会上,周靖人还发布了一个努力于「大模子生态」建立的方案——「飞天免费方案」,闪开发者免费试用云上开发大模子利用来处理营业问题。
周靖人称,阿里在拥抱「Serverless」(往办事器化)的概念,同时推出了一款新的弹性计算产物,喊「U 实例」。U 实例具有通用计算特征,可以聚合当前多种办事器的规格,无需开发者停止繁琐的资本婚配,能够降低生态伙伴在利用大模子开发过程中利用弹性计算的门槛,促进云上的大模子利用开发。
在IaaS和PaaS之上,阿里的另一个杀手锏是MaaS(Model as a service),做为业界首个提出那一理念的企业,阿里在往年云栖大会发布了国内首个 AI 模子开源社区——魔搭(ModelScope)。而那也被认为是链接大模子、开发者及下流利用的关键一环。
不久前,微软亚洲研究院与浙江大学的研究团队将 ChatGPT 与 HuggingFace 连系,推出了大模子的一个新弄法,喊「HuggingGPT」。HuggingGPT 将大模子产物形态化做一个掌握器,背靠模子开源社区HuggingFace,用户在前端发问,大模子能够挪用 HuggingFace 里在那个问题上表示更好的开源模子往解答。素质上,那是大模子+开源项目标联手成功。
同样地,阿里推出「通义千问」后,「通义千问+魔搭社区」也打造了类似的形式。在魔搭社区上,不单单是阿里在开放AI模子,还有智谱 AI 等出名大模子团队均在魔搭社区上奉献了自家模子,目前,社区模子量已超越800 个,总用户量超 100 万,模子总下载量超 1600 万。
通义千问发布后,阿里也给开发者开放了 API。企业与小我开发者都能够登岸阿里灵骏平台获取 API 钥匙,快速拜候「通义千问」,挪用通义千问的大模子才能,如许能够搀扶帮助利用开发者以更低的成本、更少的操练数据实现 AI 场景利用立异。
阿里的立场很明白:
在 AI 大模子时代,他们要做对根底设备要求更高的通用大模子,如通义大模子,并基于通用大模子做通用类的大模子产物形态,如「通义千问」。做好本身的「天职」后,阿里率先晋级自家产物,一是彰显通义大模子手艺和产物的落地可行性,二是率领 AI 大模子生态的富贵。
同时,外部企业能够基于通义大模子操练各自行业的「垂类大模子」。行业垂类大模子同样存在壁垒,如「高量量的行业数据、足够深进的行业 Know-How、先发规划的试点验证」,企业连系本身营业特征在通用大模子的根底上精调行业模子,开发出能够产生现实价值的利用,才是大模子走向行业,AI 生态最末构成的序曲。
03 仰看星空
先有「云原生」,此后有「智能原生」。
无论是手艺,产物仍是生态,中国的大模子仍处于起步阶段。手艺上,与 GPT-4 比拟,国内的大模子研发仍存在必然差距。但依靠用户、数据与场景的优势,大模子的生态正在敏捷开展。无论是 3 月百度文心一言的领跑,仍是四月大模子手艺的集中发布,中国的手艺立异者都感触感染到了好像十年前挪动互联网刚起来的炽热。雷峰网
我们驱逐人工智能时代的第一步,是对大模子产物的猎奇心;第二步,则是对大模子产物的利用,也是在那一步,AI 的「生态」起头构成——大模子成为消费力,改动消费关系,一定要走向现实、影响详细行业。雷峰网
创作发明一个新的时代——那是一个浩荡的事业。因而,在大模子「生态」的创作发明上,每小我都能找到本身的位置。借助「通义千问+」、云根底设备与模子开源的理念,阿里起首撕开了「生态」的口子,在智能贸易平台的倾覆上做了楷模启迪,也在手艺底座上传达了「办事者」的心态。
有人说那是 ChatGPT 加剧了 SaaS 的冷冬,但也有人说,「通用大模子+垂类大模子」的打法恰好是利好行业办事者。大模子的「功用集成」与「一键解答」思惟,恰好是实现降本增效的手段启迪。
阿里的大模子在短时间内历经手艺、产物与生态三个阶段,也间接传达了市场焦灼的形态:大模子初步进进工程化阶段,根底设备、产物立异、工程落地的齐发力,哪怕错过一个环节(如算力的缺失),晚一个月,也可能被时代的巨浪远远甩在后面。阿里率先撬开生态的口子,是实力的自信,也是行业开展需求使然。
关于不具备大模子研发才能、算力根底设备的新一代 AI 淘金者,他们所面对的表里「强逼」也不亚于互联网大厂。每一个不想被时代裁减的人,在大模子主导的产物改革海潮中,每一步都变得至关重要。抉择对的协做伙伴,也变得重要。
AI 的新时代,碰杯欢庆的同时,愿我们跨过险滩,抵达新的彼岸。雷峰网