一张估值20亿的“笑脸”,正在拆掉OpenAI的围墙
由ChatGPT引发的人工智能风潮还在猛烈地刮着。但从各个角度来看,目前那都是一个巨头争霸的战场:更大的模子、更强的算力、更多的用户、更雄厚的资金……那些都似乎成为了想要加进那场比赛的门票。与此同时,核心手艺的研究也逐步开放走向封锁。
而在那高墙正在筑起的过程中,也有一些新锐的创业公司想要高举旗号来一场革命。此中,出格有目共睹的是一家名为Hugging Face开源创业公司。
目前,Hugging Face已经是全球更受欢迎的开源机器进修社区和平台,不只创下了GitHub有史以来增长最快的AI项目笔录,估值也一路打破了20亿美圆。近期,微软和浙江大学结合发布的一篇关于HuggingGPT的论文更是把Hugging Face推到了舞台中心,也让更多人存眷到了当前那股不同凡响的人工智能开展力量。
HuggingGPT火了,Hugging是啥?
本月初,微软亚洲研究院和浙江大学结合发布了一项最新的名为HuggingGPT的研究,介绍了一个全新的协做系统,闪开发者可以在ChatGPT的搀扶帮助下快速、准确地往抉择适宜的人工智能模子,从而完成包罗文字、视频、语音等多模态在内的复杂使命。
该项目目前已经在Github上开源,还有一个超拉风的名字喊JARVIS(没错,就是跟钢铁侠的助手一个名字)。在那个研究中,次要涉及到了两个主体,一个是寡所周知的ChatGPT,另一个则是AI社区Hugging Face。
图片来自HuggingGPT研究论文
那么Hugging Face是做什么的?
简单来说,Hugging Face是一个针对人工智能的开源平台,用户能够在上边发布和共享预操练模子、数据集和演示文件等。目前Hugging Face上已经共享了超越10万个预操练模子,1万多个数据集,包罗微软、谷歌、Bloomberg、英特尔等各个行业超越1万家机构都在利用Hugging Face的产物。
在HuggingGPT中,ChatGPT通过饰演了“操做大脑”的角色,可以主动解析用户提出的需求,接着在 Hugging Face 的“AI模子池”里停止主动模子抉择、施行和陈述,为开发者们开发更复杂的人工智能法式供给了极大的便当。
展开全文
固然在模子上ChatGPT跟Hugging Face可以牵手,但从素质上来说,Hugging Face跟OpenAI目前是在做两个相反标的目的的事。此中更大的差别点在于,在开发者办事方面,OpenAI如今正在搭建人工智能开发的围墙,仅容许称心前提的机构和小我进进,但Hugging Face则期看每小我都能够拜候生成式 AI 模子,包罗各类企业和所有通俗开发者。
本年2月,OpenAI上线了一个名为Foundry的新开发者平台,允户能够在那个平台上运行OpenAI最新的机器进修模子,但在产物的描述中,OpenAI明白表达Foundry是为运行较大工做负载的尖端客户设想,而根据一份价格表展现,即便是 GPT-3.5 的轻量级版本,三个月费用高达7.8万美圆,一年费用为 26.4万美圆。
就在Foundry发布后,Hugging face便立即公布了其与 AWS 的最新协做伙伴关系,并发出了“让人工智能走向开放”的唤吁。通过该协做,任何开发人员都将可以利用 AWS 的托管办事并处置 Hugging Face 上可用的任何模子。
图片来自Hugging face CTO推特
在如今巨头林立的人工智能战场上,Hugging Face就像是一收强有力的民间力量。当巨头们都在勤奋连结本身生成式 AI 的霸主地位的时候,Hugging Face 的目标则是觅觅各类路子来连结 AI 研究空间的开放。
而如许特征也让Hugging Face目前颇有一些“中立”的色彩。无论微软、谷歌、亚马逊、Meta那些大公司打得再猛烈,但它们几乎全都是Hugging Face的撑持者。
那么,Hugging Face事实是若何开展起来的,它详细做着什么样的营业?
一次歪打正着的创业,培养AI界的顶流“笑脸”
在通俗人的眼中,人工智能一贯都属于“冷感”很强的手艺范畴,无论是充溢着大量数字、模子的算法,仍是由各类机械零件组拆成的机器人,都难免让人感应有些间隔感。但做为专为人工智能开发者办事的Hugging Face却主打了一个反差萌,笑脸Emoji再加上一双摊开的小手,logo以至有点过份心爱。
之所以有如许一个心爱的logo,是因为一起头Hugging Face做的产物其实是一款针对青少年群体的聊天机器人。
其时Hugging Face的设法是基于天然语言处置 (NLP) 的人工智能手艺,来为年轻人们开发一个带有娱乐性、类似于电子宠物一样的个性化聊天机器人,让各人能够在无聊的时候跟它聊八卦、问它问题、让它生成一些有趣的图片之类的工作。
那种别致的人机社交形式得到了一些存眷。2017年3月9号,Hugging Face App在iOS App Store正式推出,并拿到了包罗SV Angel、NBA球星杜兰特在内的120万美圆的天使投资。尔后一年多,Hugging Face都不断围绕着本身的聊天机器人营业在做着天然语言理解的相关操练并发布相关的产物,顶峰期间天天处置的动静数量到达了1百万条。在2018年5月,它又获得了400万美圆的种子轮融资。
Hugging Face聊天软件界面
固然开展的还算不错,但因为其时的人工智能的理解才能和聊天程度远不及ChatGPT如许智能有趣,再加上并不是刚需的营业场景,Hugging Face的规模不断都难以扩展。
但为了开发那个聊天机器人,Hugging Face的团队做了一个很重要的事,那就是构建了一个底层库来包容各类机器进修模子和各类类型的数据集。包罗搀扶帮助操练聊天机器人检测文本动静情感、生成连接的响应、理解差别对话主题等,而且在GitHub上始末以开源项目标形式继续发布该底层库的一些内容。
就如许不温不火地开展了一段时间后,2018岁尾,Hugging Face迎来了一个重要的转折。
昔时11月,谷歌公布推出基于双向 Transformer 的大规模预操练语言模子BERT,霎时成为了天然语言理解范畴最受开发者存眷的模子。但一起头,Google只发布了BERT的TensorFlow版本,Hugging Face就想为啥没有Pytorch版本呢?于是Hugging Face开创人之一的Thomas Wolf就用几天的时间完成并开源了PyTorch-BERT,但没想到,就是那么一个“无心插柳”的项目让Hugging Face一炮而红。
借着BERT的东风,Hugging Face的Pytorch-pretrained-BERT发布3个多月后,快速达成了在Github上5000+ 星标的成就,到了7月份其Star数量已经超越了1万,开展速度远超其他同类开源项目,在Github的AI项目范畴里一飞冲天。
在如许的开展势头下,Hugging Face的产物战术起头发作了调整。他们将更多精神放到了开源模子的建立上,将 Pytorch-pretrained-BERT项目正式定名为Transformers,同时撑持Pytorch和Tensorflow 2.0。
借助 Transformers库,开发者能够快速利用BERT、GPT、XLNet、T5 、DistilBERT等NLP大模子,并利用那些模子来完成文天职类、文本总结、文本生成、信息抽取、主动QA等使命,节约大量时间和计算资本,尔后Hugging Face在人工智能开源范畴的名气也越来越大。
Hugging Face在Github上的Star曲线,图片来自于Lux Capital
到了2019年12月,Hugging Face拿到了由Lux Capital 领投的A轮融资,融资额也比上一轮上了一个量级到达了1500万美圆。值得重视的是,从那一轮起头,Hugging Face的标签起头不再是聊天机器人,而是把AI开源营业放在了首位。那张心爱的笑脸emoji也起头被广阔人工智能开发者们所熟知。
朝着人工智能界的Github前进
在2019岁尾All in AI开源之后,Hugging Face起头动手构建一套完全的开源产物矩阵。用Hugging Face本身的话来讲,他们所做的工作,就是要架起人工智能科研和利用的桥梁(bridges the gap from research to production)。
过往那些年,人工智能范畴的科研和贸易利用是相对独立的两个板块,科研部分的使命就是对前沿手艺停止研究,搞模子、发论文,利用部分的人则是要将最新手艺用到产物中摸索贸易变现。若何将科研功效停止系统性的整合成为开源产物,闪开发者们可以很快上手往利用转化是持久困扰业界的一个问题。
Hugging Face之前歪打正着地摸到了那个痛点,接着起头认实向下发掘。简单来说,Hugging Face就是承担了人工智能科研走向利用那个过程中几乎所有复杂、繁琐、细碎的工做,然前方便任何人工智能从业者都能够往便当地利用那些研究模子和资本。
目前,除了头号产物Transformers之外,Hugging Face还成立了Tokenizers、Datasets、Accelerate等库,从模子到数据集、从托管平台到性能优化,以开源社区为载体,Hugging Face已成立起了完全的人工智能开发作态,涵盖了 NLP、计算机视觉、语音、时间序列、生物学、强化进修等各个范畴。
值得重视的是,Hugging Face并非因为ChatGPT带火的。2022年5月,当市场的重视力都还停留在Web3、元宇宙之上时,Hugging Face拿到了有红杉、Lux Capital参与的1亿美圆融资,让其估值一举打破了20亿美圆。
Hugging Face的融资汗青,图片来自于企查查
Hugging Face当前的目标是想成为人工智能范畴的Github。其开创团队认为,只要将那些少数人掌握的手艺妥帖给更多人利用,才气实正更大程度地推进整个行业的朝上进步。而从贸易的角度来说,Hugging Face认为赋能整个AI社区所可能产生的价值可能比一个专有的东西超出跨越千倍,而只要将此中的1%变现就可以足以撑起一个高市值的公司,类似的例子包罗MongoDB、Elastic等等。
除了兴旺开展的开源社区,从2020年起头,Hugging Face也起头做面向企业的定造天然语言模子,其客户涵盖彭博社、高通、英特尔等各类大中小型公司,并推出了包罗AutoTrain、Inference API Infinity、Private Hub、Expert Support等针对差别开发者类型的产物。据报导展现,从2021年起头Hugging Face就不断处于正现金流的形态。
Hugging Face的的产物办事,图片来自于其官网
Hugging Face在当前的人工智能范畴中可以以开源社区的形式异军突起,有一些偶尔也有一定。起首,过往那些年,人工智能手艺所获得的朝上进步都是由全世界的科研和财产范畴配合协做所鞭策的,它的手艺基因里其实就带着开放,因而成立起一个平台来链接研究者和开发者适应了行业开展的汗青和趋向。
此外,Hugging Face通过完成大量的根底性工做,来搀扶帮助填补在人工智能范畴里持久存在的科学与消费之间的鸿沟,那是过往良多开源平台没有存眷和做到的。
在此前的一个摘访中Hugging Face的CEO Clément Delangue表达,机器进修手艺仍然还处于早期开展阶段,开源社区的才能将是浩荡的。他认为,在将来5到10年,我们必然还会看到更多开源机器进修公司的兴起。
注:封面图来自于hugging face,版权属于原做者。假设不附和利用,请尽快联络我们,我们会立即删除。