比 ChatGPT 更早发布的微信大语言模子,如今什么程度?
你可能错过的新闻: 高通演示在安卓机运行 Stable Diffusion、MOSS 目标看向通用人工智能、疑似华为 P60 摄影样张曝光、《名侦查柯南:贝克街的亡灵》国内定档......
ChatGPT 的呈现让 AI 手艺一跃成为了科技圈的当红炸子鸡。
几乎全能的 ChatGPT 让写邮件、拟合同等反复性工做失往了意义,关于写代码、写小说、写 PPT 等工做它更是信手拈来。
但讨论 ChatGPT 能做什么、能代替些什么等话题已颠末时了,如今人们更想要晓得下一个「ChatGPT」在哪?
微软的新 Bing?如今列队可能要排到天荒地老。
百度的文心一言?目前似乎「文」字还没一撇。
Google 的 Bard?那更是一个未知数。
莫非如今除了 ChatGPT 以外,就没有懂得聊天的机器人了吗?
先别急,什么都懂一点的微信不会随便地让你失看。
展开全文
在往年 10 月微信低调发布了一个名为 WeLM 语言模子,其时微信对 WeLM 的定义只是一个能「唠嗑」的 AI。
如今回看,WeLM「唠嗑」的才能已经能称心我们对文本生成式 AI 的等待。
不外微信强调 WeLM 并非聊天机器人,而是一个补全用户输进信息的生成模子。
根据微信反应的动静,WeLM 只是微信内部的立异型尝试项目,没有方案利用到现实的产物之中,也不会与微信 app 的体验有所联系关系,将来 WeLM 有可能会不按时下架。
八项万能
WeLM 能做什么呢?
先给它出个关于阿房宫问题,看看它的常识储蓄量。
似乎答复得没什么弊端,再看看它对二次元领会几。
看来一些根本的二次元常识对 WeLM 来说仍是过于简单了。
既然常识常识问不倒他,那么问点最新资讯看看 WeLM 能不克不及答复得上来。
当我问到它知不晓得 ChatGPT 时,WeLM 的答复起头呈现错误,谜底和事实误差十万八千里。
再问问一些特殊细节的问题,例如《心爱女人》的第一句歌词是什么?
心爱女人坐船头是什么异次元混搭……
WeLM 的表示也不克不及令人称心。
那也是 WeLM 的局限性所在。根据微信团队给出的阐明,WeLM 并非一个间接对话的机器人,而是一个补全用户输进信息的生成模子。
WeLM 全称为 Well-Read Language Model,更大的模子版本的操练参数达 100 亿,它的强项在于中文理解和生成才能,可以在在零样本或少样本的情境下完成多种 NLP 使命(包罗多语言使命)。
根据官方给出的发问教程,WeLM 的答复问题的偏重点应该是在「补全句子」上。
例如在「给猫取名字」的例子上,发问者需要先给 WeLM 举出一些例子,再让 WeLM 来补全。
也许是测试版本的原因,目前 WeLM 补全谜底时的发散性似乎要大于准确性,因而你会发现 WeLM 什么都能答上来,但是答复得纷歧定准。
关于它的一些「胡言乱语」,只能说各人笑一笑就好。
那种补全内容的答复机造能够降生出各类各样的弄法,微信官方为此供给了「对话、案牍生成、文本改写、阅读理解、翻译、文章续写、自在使命」共八种形式。
先来尝尝商品案牍生成,我用它为造糖工场的硬糖充电头生成了一段商品案牍,前半段看起来还像模像样的,但写到后面的商品描述时似乎 CPU 就过载了。
不能不说,最初一句「一种只为爱的甜美味道」还有点耐人觅味的意思。
再来尝尝翻译,那可是微信的强项。
我用它翻译了一段 OpenAI 对 ChatGPT 的介绍,WeLM 轻松完成了使命。
根据官方的介绍,WeLM 不只能完成多种语言间的翻译,还能翻译同时同化着多种语言文段。
例如那段同时包罗中文、英文、日文的复杂语句,WeLM 就能完全地翻译出来。
当你在看像公司财报那样又长又复杂的文章时,能够将它复造到 WeLM 里,用「阅读理解」间接检索出想要的信息。
不外 WeLM 的理解才能还比力外表,它根本上只能答复出能在文章中间接检索到信息,假设你想基于苹果 2022 年的营收额和增长率,问它苹果 2021 的营收额是几,那种拐个弯的问题它就不克不及计算出来。
或者说,你需要用更精准的提醒词(prompt)指令才有可能让它答出。
WeLM 的对话功用是一个可玩性挺高的功用,你能够通过一系列的提醒词为 WeLM 设立人设(酿成李白、酿成乔布斯、酿成马斯克),实现一场逾越时空的对话。
我试着让 WeLM 饰演的李白评判一下杜甫,「李白」评判道读杜甫的诗就像饮下一壶琼浆,还引用了杜甫的《哀江头》。
《哀江头》做于至德二年(757 年),而李白逝世于宝应元年(762 年),没准李白生前还实的读过杜甫的《哀江头》。
你还能够让 WeLM 饰演马斯克,让它评判一下特斯拉、Twitter、主动驾驶等问题,以至能够摘访它关于李白的观点。
WeLM 是怎么做到的?
一番体验事后,我明显觉得到 WeLM 关于精准提醒词的依靠性要高于 ChatGPT。
固然两者都有很强的天然语言理解才能和表达才能,但 WeLM 的进修成本和利用成本要更高,在让 WeLM 答复问题之前你需要先给它讲清晰答复问题的逻辑(举例答复),提醒词也要不竭地打磨,最末才会得到你想要的谜底。
比拟之下,ChatGPT 是一个平易近人的蓬菖人,进可高山流水,退可下里巴人。无论是简单的问句、文章总结,仍是复杂的编程问题,ChatGPT 根本上都能一并解答。
图片来自:微信 AI
那当然也和两者的模子算法、操练参数量有关,WeLM 的一大优势在于它是摘用多样化和普遍的中文网页、册本、新闻、论坛和学术论文数据集停止操练,关于中文的理解才能会愈加凸起。
WeLM 的进修数据来源次要从 Common Crawl 下载的近两年的中文网页数据,除此之外还包罗大量的册本、新闻、论坛数据和学术论文等,总数据量为 10 TB。
图片来自:微信 AI
抛开 ChatGPT 如许的尖子生不谈,WeLM 在和 CPM、华为 Pangu、百度 Ernie 3.0(文心一言前身)等同级别模子比照时,在 14 项 NLP 使命上 WeLM 根本上都能实现领先。
可惜的是,那只是微信的一次尝试性测验考试,在将来有可能会不按时下架,短期内我们应该也很难在微信上见到类似的智能聊天功用,本文仅做为功用体验分享。
WeLM 体验地址:
/
重视:WeLM 只是微信内部的立异型尝试项目,没有方案利用到现实的产物之中,也不会与微信 app 的体验有所联系关系,敬请连结开放、摸索的心态停止体验。
点击「在看」
是对我们更大的鼓舞