思必驰“声音复刻”，仅需一句话快速“克隆”你的声音

misa2 04-20 4次浏览 0条评论

“车辆已启动，走着。”

“开了挺长时间了，歇会吧，也让我歇会。”

在漫长的行车旅程中，明星导航语音包因其独有的音色为我们带来了良多欢乐。那些搞笑的明星音色恰是通过声音复刻造造而成。

近期，思必驰推出一句话复刻功用，用户仅需录造一句话，即可复刻出本身的音色，然后输进肆意文本，即可倾听由本身音色朗读的内容。目前，声音复刻手艺可利用于导航播报、讲故事、新闻播报、短视频配音等场景。

仅需一句话，“克隆”你的声音

“声音复刻”是语音合成手艺（TTS ，Text To Speech）的个性化利用。在以往的声音复刻过程中，往往需要消耗大量时间。

此前，思必驰DUI平台上线声音复刻手艺，基于多年累积的多说话人的声学特征，将新数据输进既有的模子参数里停止迁徙进修和精调，通过20句灌音等少量语料，就可操练出高类似度的声音模子。

本次思必驰推出一句话复刻，用户仅需录造一句约二三十字的话，即可停止声音复刻，大大减小了对语音样本量的需求，进一步缩短了声音复刻的时间。

思必驰“声音复刻”，仅需一句话快速“克隆”你的声音

想要体验声音复刻的小伙伴，能够扫描上方小法式二维码，进进“小驰慧听”小法式，点击“声音复刻”栏目，输进一句话，即可“克隆”本身的声音。该小法式自带情况检测以及录造的音频量量检测，保障音频输进的量量，更大化复原用户的声音。

那么，思必驰一句话复刻具有如何的特征呢？

（１）低数据量需求：在声音复刻过程中，起首对灌音停止降噪处置，然后对根底大模子部分更新参数，并提取该说话人的发音特征，使得在少少量数据的情状下仍能挠取该说话人的音色和发音习惯。因而，用户仅需输进一句约二三十字的话，即可停止声音复刻，比拟以往愈加便当高效。

（２）无需音频标注：在声音复刻过程中，无需开发人员停止音频标注，简化了复刻流程，进步了复刻效率，降低了成本。

展开全文

（３）首帧延时小于300ms：声音复刻需要颠末模子操练和语音合成两个过程。目前，思必驰对声音停止模子操练仅需5分钟摆布。首帧延时，即用户点击“合成”按钮到听到本身合成声音的时间，该时间小于300ms，大大进步了用户体验。

此外，思必驰撑持全链路接进，仅利用一套SDK就可完成全数资本的利用，简单灵敏。

声音复刻，让你的声音无处不在

我们曾妄想能够操纵科技“克隆”一个本身，替本身完成低效的工做，那么，被“克隆”后的声音又能够搀扶帮助人类完成哪些工做呢？目前，声音复刻可利用于车载导航、讲故事、新闻播报、短视频配音、智能客服等，让你的声音在差别的场景中发扬出力量。

思必驰“声音复刻”，仅需一句话快速“克隆”你的声音

在儿童讲故事场景中，儿童故事机通过复刻妈妈的声音，能够用妈妈的音色为儿童讲故事，既能让儿童感触感染到父母的声音陪同，又能将家长的时间解放出来。

在新闻播报场景中，通过复刻儿女的声音停止新闻播报，能够陪同远在老家的父母，缓解父母的孤单感。

在车载导航中，家人朗读录造固定的文本，能够快速合成个性专属的小我语音包。在每日上班途中，让家人的声音时刻相伴。

短视频配音场景中，声音复刻能够搀扶帮助视频创做者快速完成配音，进步内容消费效率。

在智能客服场景中，能够削减话务员的工做量，将话务员从反复的语音问答中解放出来。

声音复刻是语音合成（TTS）的子范畴，是TTS的个性化利用。思必驰在语音合成范畴已有多项核心专利加持。思必驰语音合成办法及系统（创造专利，专利号: ZL 2020 1 0706916.4）、基于隐马尔科夫模子的统计语音合成办法及安装（创造专利，专利号:ZL2015 1 0272044.4）、带有韵律的语音合成办法及系统（创造专利，专利号: ZL 2020 1 1643693.8）、语音合成模子操练办法和语音合成办法（创造专利，专利号: ZL 2020 1 1454223.7）等关键性手艺获得国度专利。

思必驰“声音复刻”，仅需一句话快速“克隆”你的声音

目前，思必驰 “声音复刻”手艺办事，撑持男声、女声、童声的复刻，撑持中、英文文本，撑持UTF-8等多种文本格局，撑持SSML标签掌握。同时，该办事撑持8k、16k、32k等多种摘样率，撑持合成mp3、wav、pcm等多种音频格局……

将来，思必驰将继续提拔语音手艺，为用户供给更高效便当的语音办事，推送智能语音在各行各业的落地，为社会带来更有温度的手艺办事。

仙剑奇侠传5语音包