在动画片《名侦探柯南》中,主角柯南的变声蝴蝶结可以让他随心所欲的模仿别人的声音来破案。而最近,百度的人工智能(AI)也掌握了这种黑科技。据英国《每日邮报》3月5日报道,百度AI“深度语音”(Deep Voice)只需听一个人说话一分钟,就能模仿其嗓音,与真人声音别无二致。
“深度语音”是百度AI研发的一个完全由深度神经网络构建的高质量语音转文本系统,可以分析并学习发言者交谈时的声音特质,从而“克隆”出发言者的合成语音,达到以假乱真的地步。
研究人员已经用2400人的声音样本对该AI进行了800多小时的训练。现在,通过分析100段5秒的声音片段它就可以完全复制一个人的嗓音,而且只用10段5秒的声音片段就可以有95%的几率通过语音识别系统的测试。即使在远处,儿童受试者也会以为合成的父母的语言是真正的父母在呼唤。
开发人员称,该AI可以帮助丧失发声能力的人重新“发声”,为电子游戏中的上百个虚拟角色配上各具特色的真人嗓音,以节省请配音演员的成本,甚至可以用不同的语言来模仿发言人的嗓音,从而提升AI口音的“逼真感”。