首页游戏资讯思必驰“声音复刻”,仅需一句话快速“克隆”你的声音

思必驰“声音复刻”,仅需一句话快速“克隆”你的声音

misa2 04-20 4次浏览 0条评论

“车辆已启动,走着。”

“开了挺长时间了,歇会吧,也让我歇会。”

在漫长的行车旅程中,明星导航语音包因其独有的音色为我们带来了良多欢乐。那些搞笑的明星音色恰是通过声音复刻造造而成。

近期,思必驰推出一句话复刻功用,用户仅需录造一句话,即可复刻出本身的音色,然后输进肆意文本,即可倾听由本身音色朗读的内容。目前,声音复刻手艺可利用于导航播报、讲故事、新闻播报、短视频配音等场景。

仅需一句话,“克隆”你的声音

“声音复刻”是语音合成手艺(TTS ,Text To Speech)的个性化利用。在以往的声音复刻过程中,往往需要消耗大量时间。

此前,思必驰DUI平台上线声音复刻手艺,基于多年累积的多说话人的声学特征,将新数据输进既有的模子参数里停止迁徙进修和精调,通过20句灌音等少量语料,就可操练出高类似度的声音模子。

本次思必驰推出一句话复刻,用户仅需录造一句约二三十字的话,即可停止声音复刻,大大减小了对语音样本量的需求,进一步缩短了声音复刻的时间。

思必驰“声音复刻”,仅需一句话快速“克隆”你的声音

想要体验声音复刻的小伙伴,能够扫描上方小法式二维码,进进“小驰慧听”小法式,点击“声音复刻”栏目,输进一句话,即可“克隆”本身的声音。该小法式自带情况检测以及录造的音频量量检测,保障音频输进的量量,更大化复原用户的声音。

那么,思必驰一句话复刻具有如何的特征呢?

(1)低数据量需求:在声音复刻过程中,起首对灌音停止降噪处置,然后对根底大模子部分更新参数,并提取该说话人的发音特征,使得在少少量数据的情状下仍能挠取该说话人的音色和发音习惯。因而,用户仅需输进一句约二三十字的话,即可停止声音复刻,比拟以往愈加便当高效。

(2)无需音频标注:在声音复刻过程中,无需开发人员停止音频标注,简化了复刻流程,进步了复刻效率,降低了成本。

展开全文

(3)首帧延时小于300ms:声音复刻需要颠末模子操练和语音合成两个过程。目前,思必驰对声音停止模子操练仅需5分钟摆布。首帧延时,即用户点击“合成”按钮到听到本身合成声音的时间,该时间小于300ms,大大进步了用户体验。

此外,思必驰撑持全链路接进,仅利用一套SDK就可完成全数资本的利用,简单灵敏。

声音复刻,让你的声音无处不在

我们曾妄想能够操纵科技“克隆”一个本身,替本身完成低效的工做,那么,被“克隆”后的声音又能够搀扶帮助人类完成哪些工做呢?目前,声音复刻可利用于车载导航、讲故事、新闻播报、短视频配音、智能客服等,让你的声音在差别的场景中发扬出力量。

思必驰“声音复刻”,仅需一句话快速“克隆”你的声音

在儿童讲故事场景中,儿童故事机通过复刻妈妈的声音,能够用妈妈的音色为儿童讲故事,既能让儿童感触感染到父母的声音陪同,又能将家长的时间解放出来。

在新闻播报场景中,通过复刻儿女的声音停止新闻播报,能够陪同远在老家的父母,缓解父母的孤单感。

在车载导航中,家人朗读录造固定的文本,能够快速合成个性专属的小我语音包。在每日上班途中,让家人的声音时刻相伴。

短视频配音场景中,声音复刻能够搀扶帮助视频创做者快速完成配音,进步内容消费效率。

在智能客服场景中,能够削减话务员的工做量,将话务员从反复的语音问答中解放出来。

声音复刻是语音合成(TTS)的子范畴,是TTS的个性化利用。思必驰在语音合成范畴已有多项核心专利加持。思必驰语音合成办法及系统(创造专利,专利号: ZL 2020 1 0706916.4)、基于隐马尔科夫模子的统计语音合成办法及安装(创造专利,专利号:ZL2015 1 0272044.4)、带有韵律的语音合成办法及系统(创造专利,专利号: ZL 2020 1 1643693.8)、语音合成模子操练办法和语音合成办法(创造专利,专利号: ZL 2020 1 1454223.7)等关键性手艺获得国度专利。

思必驰“声音复刻”,仅需一句话快速“克隆”你的声音

目前,思必驰 “声音复刻”手艺办事,撑持男声、女声、童声的复刻,撑持中、英文文本,撑持UTF-8等多种文本格局,撑持SSML标签掌握。同时,该办事撑持8k、16k、32k等多种摘样率,撑持合成mp3、wav、pcm等多种音频格局……

将来,思必驰将继续提拔语音手艺,为用户供给更高效便当的语音办事,推送智能语音在各行各业的落地,为社会带来更有温度的手艺办事。

仙剑奇侠传5语音包
若何在斗战神中赚取官银? iOS微信8.0.33发布:备注撑持多图等多项更新优化!
相关内容
发表评论

游客 回复需填写必要信息