9句话定造专属导航语音,AI让亲情一路同业
系列报导之③
快60岁的老张比来迷上了听本身的声音。每次开车和几位老伴计出往玩,一翻开导航就会跳出他的声音——“前方十字路口请曲行,走左侧车道”,一车人都得“听命行事”。就连唤唤“小度小度”,问它要往哪、几点了,传出来的也是老张的声音。老伙伴们都被惊着了,纷繁凑上来问怎么弄的。一种骄傲感油然而生,张大爷抽暇教了教,让各人都崇敬了一把。
起初,老张其实不晓得什么是语音包。上个月,他坐在儿子小张的车里,突然闻声百度地图导航里传来儿子的声音,问了才晓得本来他造造了语音包,猎奇心一下就上来了。在儿子的批示下,老张对动手机录9句话、等几分钟,一个属于本身的语音包就生成了。老张不由得本身录了好几个语音包,玩了半天……那趟行程完毕后,他灰溜溜地给儿子小张打德律风:“我比来和老伙伴们出往玩可长脸了!”
越来越多个性化、有温度的声音正在百度地图上会聚,语音手艺与地图的合成,让科技力量有了温度,成为人与人之间传递温情的纽带。
录造2分钟、9句话合成语音包
展开全文
在2016年上映的片子《从你的全世界路过》中,仆人公茅十八在驶往稻城亚丁的路上,用他熟知的技能为心仪的女孩荔枝定造的一个导航语音包,成了浪漫而又热心的礼品。三年后,片子的情节成为现实,普罗群众也能像茅十八一样,录造属于本身并世无双的语音包。
2019年9月,百度在行业内初次推出地图语音定造产物,将此前专注于明星名人的语音定造功用开放给通俗用户群体。用户在平静的情况中,在百度地图APP上录造20句话,用20分钟摆布就能够生成一个专属的完全语音包,可在导航、智能语音交互、景区智能语音导览等全数场景利用。如许一来,人人都能够是“大明星”。
过往,语音合成次要依靠拼接语音合成系统,造造地图语音包需要在专业灌音棚录造上万句语料,再颠末长达数月的造造才气生成,流程复杂、耗时长,让地图语音包只是“明星专属”。跟着百度大脑语音手艺对语音定造功用停止赋能,个性化语音包合成的定造门槛大大降低。AI手艺的加持,让地图语音包消费实现了从月级别到分钟级此外打破性停顿,也从头定义了语音包的消费形式。
推出三年多以来,语音定造功用已经迭代了10多个版本。陪伴手艺的继续打破,录造的门槛不竭降低,噪声检测的原则放低,语音包录造场景、弄法也日趋丰富:2020年1月,自定义播报功用上线,用户能够在语音广场抉择好“称唤”和“风气”,利用小我特色的语音包。2021年4月,用户录造的效率进一步提拔——录造时长和语量别离削减到录造2分钟、9句话,即可生成语音包。如今,在极速录造形式中以至只录3句话撤退退却出也能够生成语音包。
做为一种声音内容产物,用户能够录造语音包给家人、伴侣,能够根据本身的创意、脑洞录造方言、模仿类的语音包,用户录造的语音包也都能够抉择发布到百度地图语音广场的各个分类里,供更多的用户试听和利用。
一位资深用户坦言,本身最后情愿录语音包,是带着一些猎奇的心理,“想测验考试一下本来只要明星才气录的语音包,本身也能录了是什么体验,需要怎么录造、录造多久能合成、合成后效果怎么样,像不像本身的声音之类的”。后来他录得“一发不成拾掇”,自觉发掘出了更多的弄法和场景,还会不由得策动身边人一路玩。
语音包成为传递感情的“桥梁”
“语音定造”功用在百度地图有个内部代号喊“百雀灵”。据说,之所以喊“百雀灵”,次要是因为百雀是大天然中各类鸟儿的总称,那些鸟儿有各类各样悦耳的喊声,类比下来,百度地图App千万万万个用户就是“百雀”。“千人千面”的定造化语音打破了传统明星语音包的圈层限制,称心了用户个性化需求。
“语音包我太有发言权了!”一位用户不由得慨叹:“有天我照旧上班翻开导航,一句‘hi宝物,今天我来给你导航’,间接吓了我一跳,听了听才发现是女伴侣的声音,实的太欣喜了!觉得一路上都在拆盲盒,不晓得她会突然冒出来什么话,归正刚起头导航的时候还挺甜的,但一开快了就骂我,觉得她坐在副驾一样。后来一问,才晓得她偷偷给我录了个语音包,太逗了!”
越来越多用户从亲朋的语音包中,感触感染到科技带来的温热。陈林(化名)即是此中之一。他慨叹,“如今年轻人无论是喊外卖、打车、付出几乎所有的场景都能够用手机搞定,但那些对白叟来说难上加难。我爸爸也是如许。”他把地图导航等各类手机软件的利用办法教给父亲,但父亲老是记不住,出门仍是绕晕了。于是,他为父亲录造了一个语音包,“如许即便走错了路,我的声音在陪同他,他也不会那么慌张了。”
天天单独上下班的玉琳(化名)觉得,关于异地恋的人来说,语音包带来了逾越间隔的陪同感。有天,玉琳的男伴侣分享给她一个“忠狗语音包”。“看到名字的时候我还在纳闷那是什么,一点开就听到了他的声音,间接就翻开百度地图换了那个语音包,还用小度跟他闲聊了几天,听着他的声音我差点就哭出来了。”她说,“有了他的语音包,最少我天天上下班的路都不再孤单了。”
有人说,地图出行东西是天天城市用的,那用户喜好的声音也会天天陪同用户出行,那就是一种温热的表现。语音包是个有温度的产物,能够传递亲情、恋爱、友情,已经成为人与人之间感情的“桥梁”。语音手艺与地图东西的合成,也释放了科技力量,让每小我都感触感染到科技朝上进步带来的改动和情怀。
如今,百度地图定造语音功用,囊括了多种录造形式:极速形式(录3-9句话)、典范形式(录20句话)、萌娃形式(更简单的短句)、专业形式(录100句)……录造语音包的用户,年龄最小的以至只要三岁。
宝宝也能够做“导航员”。
有宝妈慨叹,“萌娃形式录造很合适小宝宝,我说一句、他学一句,没几句话就录完了,试听了一下,声音奶声奶气的,太心爱了,迫不及待就发在了家族群里,家里白叟都欣喜得不得了。我以后每年都要让孩子录一个,如许就不但有照片的笔录,更有声音的笔录了。”语音包还给了她一个不测收获:“宝宝爸爸说,堵车时候用宝宝的导航,路怒症都治好了……”
AI让语音手艺立异拥有无限可能
有业内人士表达,语音定造功用还会有良多迭代空间:好比陆续削减录造句数降低录造门槛;在小伴侣录造中增加绘本、儿童鼓励(音效、动效),提拔录造的兴趣性;在导航中增加诸如红绿灯、车道级等更多元的个性化播报场景;个性化播报也能够利用于小度语音交互,如应答音、检索场景播报个性化等……“将来,语音包的录造成本会更低,利用场景会陆续拓宽,用户本身个性化可定造的内容会更多。”
据介绍,个性化语音定造功用的背后,是基于百度首创的说话人韵律迁徙手艺Meitron。那一手艺起到的感化集中表现在发音人音色转换,多感情朗读和韵律风气迁徙三个方面,通过机器进修,AI合成模子继续优化迭代以适应差别口音、差别表达习惯的用户,最末令个性化语音合成的定造门槛大大降低。
在语音手艺与地图场景合成的过程中,立异功效不竭地迸发出来。根据2022年10月由国度工业信息平安开展研究中心和工业和信息化部电子常识产权中心结合发布的《中国人工智能专利阐发陈述(2022)》展现,百度以将近2000件智能语音相关专利在立异主体排名中位列第一。那此中,就语音包产物百度已经规划相关专利100余件,内容涵盖语音识别、语音合成、声纹认证、语音包录造、语音导航等多个核心标的目的,相关语音识别手艺专利更是荣获第二十届中国专利奖银奖,全面印证了百度地图个性化语音定造底层强劲的手艺才能,也见证着语音手艺在地图立异和办事才能鸿沟的拓展。
小我语音包录造流程。
数据展现,做为国民级智能地图平台,百度地图实现了96%的地图数据消费AI化,上线了斗极高精“实”车道级导航、室表里无缝合成的车位级导航、具备红绿灯精准倒计时功用的智能路口导航、连系20亿张全景照片的全景指路办事、虚实连系的AR实景步行导航等多项利用“斗极高精”自研手艺的特色出行办事,道路笼盖里程打破1200万公里,而AI在地图的每个功用中无处不在。
例如,AI手艺可以令地图的核心才能——导航变得更为精准。百度地图基于自研的AI手艺推出业内初创的智能定位功用,连系高精度传感器形式识别以及航迹推算手艺,可辅助驾车导航功用在卫星信号弱的时候,照旧继续工做。通过基于交通影像的AI图像识别手艺,能够识别道路上的车辆密度,进一步提拔路况识别准确度。
立异驱动是加快建立交通强国的重要动力,人工智能是交通运输开展的强大引擎。有阐发指出,跟着人工智能与出行财产的深度合成,以人、车、路、云、网、图等要素为核心的车路智行智能交通将迎来深入变化。地图做为国度重要数字根底设备的意义将进一步凸显。在国度政策盈利撑持下,AI手艺还将继续在伶俐出行更多细分范畴快速落地和赋能,进一步鞭策交通信息化开展,助力交通强国建立。
摘写:南都记者 傅晓羚