别再吹开源版ChatGPT了,中文版StableLM是 把人逼疯的人工智仗!
StableLM固然是第一次传闻,但是那家公司之前出过一款很不错的绘画Ai产物——Stable Diffusion。同样是一款开源Ai,是目前市道上独一一个能够和Midjourney一较高低的支流绘画Ai,各人感兴致的话后面也能够介绍一下。
自从ChatGPT呈现以后,本年可谓是锣鼓喧天,百花齐放,大语言模子几个字在互联网到处可见。不论是国内的企业仍是国外的公司,纷繁推出本身的大语言模子。就说国内,前有文心一言,后有通义千问,不久前商汤的大模子“筹议”也发布了。
国外的公司也不遑多让,微软、谷歌、Meta......形形色色的互联网公司和Ai科技公司都在凑热闹。不论是大模子仍是小模子,开源的仍是不开源的,总之,现在的Ai大模子就如四蒲月的春笋,一夜之间就冒了尖。
今天的配角Stability.ai和OpenAi如许不断不情愿开源的公司纷歧样,那是一家乐于分享的公司,专注于大模子开源。绘画Ai胜利后,团队比来又推出了那款名为StableLM的开源大语言模子。只是从操练参数来看,StableLM到底能不克不及担得起“大”模子三个字,仍是个未知数。
Stability.ai称,比拟于 GPT-3,StableLM更大的优势就是通明和可定造化啦。那意味着研究人员和开发者们能够自在地查抄、利用和修改代码,而且根据本身的需求停止自主设置装备摆设,打造专属你的大语言模子。
展开全文
固然它的参数大小只要30 亿和 70 亿,和GPT-3 的1750 亿参数没法比。但是它是基于一个比 The Pile 数据集还要大三倍的扩展数据集操练出来的,所以在编码和天然语言对话方面表示非常不错。
并且,The Pile 数据集自己就包罗了大量册本、Github 常识库、网页以及跨学科论文等等多品种型的数据。为通用大语言模子、跨范畴文本生成操练供给了很好的基准。所以说,在现实利用中,StableLM 与 GPT-3 的性能差距并没有纸面上那么大!
不错,StableLM 与其他大模子比拟更大的特征就是,开源后的StableLM 能够让用户自主操练,修改,生成属于你本身的大模子。那对各大中小企业来说也许是个好动静,关于通俗人影响不大,就算是开源了,通俗人也没阿谁硬件设备停止大模子操练。
独一比力蹩脚的是那款大语言模子其实并没有要和中国客户玩的意思,因为它的中文其实是太蹩脚了!
接下来就给各人展现一下StableLM的中文程度。
起首,第一个问题,你会说中文吗?
StableLM答复:中文。
那,那,还挺诙谐。
第二个问题:先用中文问了一遍,天空为什么是蓝色?
StableLM答复:天空是一个生物,蓝色是叶绿之类的缘点。遗憾的地点在天空中会生成一些蓝色生素。
很好,很笼统,开阔视野,增长常识,天空为什么不克不及是一种生物呢?
接下来又用撇脚的英文问了一遍
它的答复是:The sky is blue because the sunlight is scattered in all directions by the atmosphere. When you look up atthe sky, you are looking at the scattered sunlight. The scattering of sunlight produces different colors, depending on the amount of scattering. Blue is the brightest and most abundant, followed by purple, orange, yellow, green, and gray.
看着像是准确谜底,又让它翻译成中文。
成果StableLM翻译出来是:天空是六合做为一种生物的可scattering的平行星球,蓝色为权尽的生素。当你看上天空时,你看到被scattered光分子生成的蓝色生素,即深度的光线。根据通明度,天空中生成的生素别离是紫色、黄色、鲜蓝、萍、静烂、花茶、辣植等。
为了证明不是所有的Ai都那么离谱,立即将那段英文复造粘贴发给了ChatGPT,那下末于看到一般的文字摆列了。
ChatGPT翻译出来的成果是:天空之所以是蓝色的,是因为大气层将阳光散射到各个标的目的。当你昂首看天空时,现实上是在看散射的阳光。阳光的散射会产生差别的颜色,那取决于散射的水平。蓝色是最亮和最常见的颜色,其次是紫色、橙色、黄色、绿色和灰色。
如许一比照就会发现,StableLM只是在中文语境中表示比力蹩脚,在它熟悉的英文语境里仍是一般的。
在对StableLM的中文程度失看以后,换了一种构想,也许它对数字的理解才能更强,于是,发送了一个1+1=?
StableLM仍然在乱说八道......
StableLM和ChatGPT之间的差距或许也就差了几个目光清澈且愚笨的大学生吧,当然,StableLM将来的路还很长。
Stability.ai也称将来会不竭增加参数对其停止操练,所以不要小看任何一个发育不健全的Ai,也许某天它就会再次冷艳表态,成为高攀不起的存在。更何况StableLM也在继续优化中。StableLM仅用10个小时github已打破3000颗星,阐明那仍然是一款潜力无限的产物。
在人工智能开展的道路上,每一款自主研发的产物都值得鼓舞。也许它们不会留到最初,但在人类科技文明开展过程中,总会留下点什么。
哪怕只是几百年后,残留在互联网上的一串数字......
那串数字也会告诉将来的人,在人工智能不竭开展的路上,有如斯多的前驱者,他们是站在前驱者的脊梁上,一代代开展,迭代,而那恰是科技得以朝上进步的原因。
开源地址:
/
测试地址: