首页游戏资讯AI大模子:虚火过旺仍是星辰大海?

AI大模子:虚火过旺仍是星辰大海?

misa2 04-16 4次浏览 0条评论

你方唱罢我退场。

过往一周,国产AI大模子赛道热闹特殊。先是阿里巴巴旗下超大规模语言模子“通义千问”开放内测,后有商汤科技、昆仑万维放出自家打造的大模子功效。与此同时,科大讯飞、腾讯、360、字节跳动等也在“蠢蠢欲动”,纷繁将开展人工智能列为将来企业的核心战术……

国内科技企业围绕AI大模子上演“百团大战”背后,谁能凭硬实力拔得头筹?那一新兴手艺,事实是虚火过旺仍是星辰大海?

AI大模子:虚火过旺仍是星辰大海?

绘图:杨佳

国产大模子“百舸争流”

AI大模子,指的是拥有数百万以上参数规模的深度神经收集模子。那类模子在颠末专门的操练后,即可对海量数据停止复杂处置和使命处置。由海外科技公司OpenAI开发的ChatGPT之所以拥有强大的对话交互才能,背靠的恰是名为“GPT”的AI预操练模子。

本年以来,跟着ChatGPT爆红“出圈”,“大模子热潮”也从国外涌向了国内。

4月7日,阿里巴巴正式发布超大规模语言模子“通义千问”,并定向邀请用户测试体验。与百度于3月中旬上线的“文心一言”大模子东西类似,“通义千问”也具备与用户停止多轮对话的才能,并撑持代码编程、案牍创做等功用。

固然没赶上国内大模子产物的“首发”,但是“通义千问”却可能是最早通过各个场景利用融进人们生活的一个。据阿里巴巴集团董事会主席兼CEO、阿里云智能集团CEO张勇透露,钉钉、天猫精灵将于不久后正式接进该模子,将来阿里巴巴全系产物都将用上。

4月9日,360公布,将基于360GPT大模子开发人工智能产物矩阵“360智脑”,将来将其率先落地在“360搜刮”场景,后续面向电商、营销、办公等场景深度落地。

4月10日,商汤科技公布“日日新SenseNova”大模子系统雏形,并现场演示了该模子系统下“筹议SenseChat”语言东西的超长文本阅读理解、安康征询等立异才能。同日,游戏起身的昆仑万维也对外预告,克日将发布和奇点智源协做自研的大模子功效——“天工”3.5,并声称那是“中国第一个实正实现智能涌现的国产大语言模子”。

展开全文

京东、科大讯飞、腾讯、字节跳动打造的大模子产物也有看在将来一个月集中表态。

除此之外,由美团结合开创人王慧文、立异工厂开创人李开复、搜狗开创人王小川等企业高管领衔的“AI大模子创业军团”,也对AI大模子风口“虎视眈眈”。

“当前AI大模子仍是新兴手艺,将来的合作格局在必然水平上取决于各厂商的行动、战术标的目的与本钱投资标的目的。”IDC中国助理研究总监卢言霞指出,目前AI大模子处于百花齐放的形态,将来企业要想实正跑赢敌手,不克不及仅靠“一头热”,而是需要培育提拔本身在数据、场景、软硬一体算力等方面的多重才能。

大厂上演AI“军备竞赛”

“每年5000万到1亿美圆的破费,是千亿级大模子操练的出场券。”昆仑万维CEO方汉指出,AI大模子昂扬的操练成本和研发投进,让浩瀚进局者“看而生畏”。而据公开材料展现,无论是百度、阿里巴巴买仍是腾讯、华为每年在研发上投进的资金均在百亿元规模,研发团队人数破万,且在手艺研发上实力雄厚,是目前当之无愧的“第一梯队”玩家。

以华为为例,身处“造裁常态化”压力之下,2022年企业研发投进仍高达1615亿元,占总营收的25.1%,现金流表示整体安康。在AI大模子相关的手艺积存上,华为拥有芯片、算力、模子、算法等完美的生态链规划。早在2019至2020年间,公司内部就已启动“盘古大模子”立项,该模子在预操练阶段累计进修了40TB大小的文本材料,参数规模达千亿级别,目前在工业、造造、金融、医药等行业场景都已有成熟的利用案例。

百度在人工智能范畴规划已有近10年时间,是国内少数在芯片层、框架层、模子层、利用层有全栈规划的科技企业。同样早在2019年,公司就已打造文心大模子ERNIE 1.0。颠末多轮迭代,目前模子已经晋级到3.0版本。除在模子框架内的根底操练外,ERNIE3.0天天还要领受数十亿用户的搜刮恳求,那为“文心一言”积存了丰富的语料库。

相较之下,阿里巴巴与腾讯在大模子方面固然没能侵占“头啖汤”,但是基于原有营业、资本和手艺的积存,他们却是最有时机鞭策模子手艺向C端用户普及的两家。在业内人士看来,深挚的算力积存和丰富的利用场景,都是阿里和腾讯的更大“法宝”。

AI大模子:虚火过旺仍是星辰大海?

造表:陈乐

以阿里巴巴为例,张勇曾经指出,大模子是一场“AI云计算”的全方位合作。超万亿参数的大模子研发,其实不仅仅涉及算法问题,更囊括了底层浩荡算力、收集、大数据、机器进修等诸多范畴的复杂系统性工程,需要有超大规模AI根底设备的支持。而阿里云从2019年就起头投进大模子研发,算力优势凸起,是全球首个完成10万亿参数AI大模子操练的企业。

腾讯方面固然还没有发布通用的AI大模子东西,但企业本身不乏在收集、存储、软件优化、操练框架和芯片等大模子手艺上的积存,间隔打造一款成熟产物只要“一步之远”。

而从各自的特有优势来看,百度拥有“搜刮”那一核心流量进口,有利于第一时间侵占用户心智;阿里、腾讯各自拥有钉钉、天猫精灵,微信/QQ等丰富的利用生态,可以鞭策普遍的场景落地;华为大模子功效在B端已有成熟落地,有看率先在垂曲细分范畴做出功效。

“曲道冲锋”任重而道远

浙商证券指出,大模子越来越成为当下科技企业核心合作力的重要表现。与“元宇宙”等概念差别,大模子有着相对清晰的贸易形式和利用场景。目前,业内也已根本构成共识:大模子将成为AIGC(即AI生成内容的消费体例)时代的核心支持。

“中国需要有本身的AI大模子,那是彰显科技立异实力的需要,也是经济和社会开展的需要。”互联网阐发师易方冷告诉南方日报记者,以语言大模子为代表的大模子,做为实现通用人工智能的关键途径之一,将成为国表里科技企业竞逐的主赛道。

然而,在鞭策国产AI大模子开展的过程中,人才储蓄不敷、算法和模子量量不高、算力存在短板等问题,仍然是摆在百度、阿里巴巴等科技企业面前的难题。

以算法和模子量量不高为例。经与ChatGPT比照,百度“文心一言”、阿里巴巴“通义千问”等模子在逻辑思辨、复杂数理计算上仍有不小的提拔空间。此外,在中文语料库方面,据深圳数据交易所董事长李红光指出,我国还面对数据分离,招致数据支持不敷的问题。

“数据分离在差别的处所,碎片化比力严峻,也比力封锁,同时,没有颠末整理的数据,存在字段缺失、信息禁绝等问题,目前国内数据畅通中存在赐与不敷的问题,出格是高量量的数据赐与不敷,限造了国内AI大模子的开展。”李红光阐发,数据资本酿成数据要素,关键点就是数据治理,原始数据颠末治理晋级后才会成为人工智能范畴的支持。那也恰是数据交易所存在的价值——给国内AI大模子的开展供给数据“养分”。

能耗方面也有挑战。在中兴通信施行副总裁、首席运营官谢峻石看来,大模子的高速开展,也意味着浩荡的能耗——有数据展现,ChatGPT的总算力消耗约为3640PF-days,需要7-8个投资规模30亿元、算力500P的数据中心才气支持运行。若何降低操练大模子的成本和能耗?能否通过自研AI加速芯片降低推理成本?那同样需要业界配合根究并处理。

此外,生成式AI也带来了一系列隐患,包罗国度平安、虚假内容、数据泄露、侵权风险、赋闲风险、滥用风险等。对此,西南政法大学数字法治政府研究院研究员郑志峰认为,我国需要构建一套涵盖研发、操纵全过程、全要素的监管机造,划清手艺红线,确保手艺向善。

“中国认知智能大模子的开展不只要‘弯道超车’,还需要‘曲道冲锋’。”科大讯飞副总裁、研究院院长刘聪指出,我国丰富的互联网利用生态,为国产AI大模子的落地供给了肥饶的土壤。此外,在垂曲类别或多模态的大模子范畴,我国也存在“弯道超车”的时机。

虽然如斯,要想对标目标并连结差距不竭缩小,我国仍然需要在芯片、高量量数据、系统迭代等方面“正面击破”。“我们要无视差距,而且以更先进程度为目标奋起曲逃。”

【记者】 许隽 叶丹 郜小平

【做者】 许隽;叶丹;郜小平

南方财产智库

开放软件
中国AI大模子竞速:机遇当头与人潮汹涌 蓝山,读懂了“500以内更好的SUV”的实正含义
相关内容
发表评论

游客 回复需填写必要信息