个性化定造属于你的AI声音 讯飞智做引领AIGC+声音变化潮水
2023-02-22 11:02:54 做者:宋均益
你想象过吗?苹果集团开创人乔布斯“死而复活”,和播客主持人讨论本身的大学光阴、对计算机的观点、工做形态以及崇奉等等。如斯赛博的场景,竟然实地在现实中发作了,它来自一档名为Podcast.ai的播客的第一期节目。
那是一个完全由是一个完全由AI生成的播客。Podcast.ai通过乔布斯的列传,和搜集收集上关于他的所有灌音,用Play.ht的语言模子大量操练,最末生成了一段美国出名播客主持人Joe Rogan摘访乔布斯的播客内容。在那期播客里,乔布斯的各类语音、腔调都模仿的十分类似。
某种水平上说,借由AI,我们的声音就能实现“数字长生”,又或者,你能够听到任何你想要的人声。听起来是不长短常诱人?
事实上,关于国内用户来说,拥有专属于本身的AI声音并非远远的梦想。2022科大讯飞全球1024开发者节的手艺发布会上,科大讯飞AI研究院副院长高建清分享了科大讯飞在语音合成手艺范畴的新打破——多风气多感情合成系统SMART-TTS。
2月19日,科大讯飞官方微信视频号中发布了一条关于节气《雨水》的视频。深厚厚重的男低音,自带量感,让那段视频的level至少上了一个品级。你必定猜到了,那段配音由SMART-TTS系统合成,其语气的改变、语句的停顿、声音的细腻水平都和实人所差无几。
比来大火的ChatGPT是AIGC+文字范畴的产物,而SMART-TTS则是AIGC在声音范畴的利用。在许多人潜意识中,语音合成往往带着一股机器味儿,不只生硬并且很随便辨认。为了让机器声音能媲美人类,专注语音手艺20多年,讯飞始末对峙泉源手艺立异,继续停止摸索。2008年初次让语音合效果果超越了通俗人说话程度。2019年,科大讯飞在国际语音合成大赛的天然度、类似度两项目标荣获第一,持续14年稳坐冠军宝座。讯飞在语音合成方面已实现人声天然充沛,传神度高,富有表示力,人机交互更具实在感,同时供给适应新闻播报、阅读听书、语音助手等多种场景的100+发音人。在线语音合成可撑持37个语种、11种方言、2种民族语言。
而SMART-TTS在多感情、多风气方面实现了新的打破。SMART-TTS系统可供给“兴奋、抱愧、撒娇、严厉、哀痛、猜疑、恐惧、鼓舞、生气、安抚、宠溺”等11种感情,每种感情具备40档强弱度差别的调剂才能;也能供给声音的创造才能,如停顿、重音、语速等,能够根据本身爱好调剂,实正实现了合成系统媲美具备个性化特征的实人表达才能。
展开全文
良多人想晓得,在哪里定造属于本身的AI声音?讯飞有声APP和讯飞开放平台都开放了SMART-TTS语音合成系统,开发者能够在讯飞有声APP间接下载体验,或在讯飞开放平台停止挪用。别的,科大讯飞最新推出的AIGC内容创做基地——讯飞智做,包罗的各类AIGC东西中已上线了SMART-TTS聆系列主播,助力内容创做者更高效地输出优良的音视频做品。
在讯飞智做中,已经开放了讯飞配音、实人配音、虚拟人视频、PPT生成视频等功用。以讯飞配音为例,用户能够在100多位合成主播中抉择合适的声音,有性别、年龄、范畴、风气、语种等浩瀚抉择原则,自在调剂速度、腔调、音量、感情系数等多重变量。能够料想到,AIGC在讯飞智做中的利用可以给音视频消费范畴带来全新的变化,内容消费者们以较低的成本获得合适内容的高量量音视频,创做的效率大大进步,还能够让不克不及启齿说话的事物配音,《假设国宝会说话》的跨年特殊闪现中,SMART-TTS语音合成系统让文物拥有了亲热天然的音色,讲述本身的风姿与前人的伶俐。
SMART-TTS语音合成系统已经落地良多需要声音的场景,也将有更多功用向用户、企业开放,天然顺畅、富有感情的合成语音将走进千家万户。翻开导航时它有力可靠、阅读有声书时它让人设身处地、怠倦时它温存甜美带来力量......连系讯飞虚拟数字人手艺,还能够实现定造智能聊天对象,成立有详细形象的AI助手、AI朋友不无可能,也许我们还能够与拥有本身声音的AI停止交互。那不就是我们曾经妄想过的美妙将来吗。
讯飞智做是人人都可触碰着的AIGC利用,现在AIGC的大时代正在到来。那个已经起头的手艺变化对我们来说意味着什么?那一波AI产物可能的利用场景有哪些?将来可能会构成如何的新AI财产生态...那些问题暂且还没有了了的谜底。但在大海潮的初始,那些摸索者值得被继续存眷。