系统:Android 大小:13.4M
类型:影音图像 更新:2017-05-26 15:8
百度方言翻译器是一款可以翻译方言的语音助手软件,内置强大的DeepVoice TTS系统,和人类的声音十分接近,功能十分强大,中国各地区方言都可以模仿,需要的用户快来下载吧!
据美国科技媒体Engadget报道,百度的DeepVoice TTS系统取得了巨大进步,与人类的声音更为接近,甚至可以精准模仿不同地区的口音。
百度表示,Deep Voice 2可以“学习数百种不同的语音,从每个说话者那里吸收的数据不到半个小时,但却可以实现很高的音质。”而上一代产品要达到类似的目的,每个声音需要接受20小时的训练。在短短几个月的时间内,该系统便在效率上进一步超越谷歌WaveNet。
百度表示,与之前的TTS系统不同,Deep Voice 2可以完全凭借自己的能力找到进行训练的语音之间的共同特点,不需要接受任何事先指导。“Deep Voice可以学习并完美模仿数百种语音。”该公司在博客中说。
百度还在一篇论文中总结道,该公司的神经网络只需要通过数百个不同的讲话者吸收很小的声音样本便可创作很好的语音效果。由此看来,可能要不了多久就能听到数字语音助手用更加自然的语音与我们交流。
百度语音助手是一款支持语音指令,语音搜索,语音对话功能的智能语音服务软件。
通过语音操作,你可以:
操作手机:发微博,打电话,发短信,设置提醒,播放音乐等。
搜索信息:查询天气,查询航班,查询周边美食,搜索股票等。
语音问答:讲个笑话,念首诗,聊天调侃等。
目前,要搭建这样一个系统,最大的阻碍在于声频合成的速度,此前的方法一般都需要数分钟或数小时来生成几秒的语音。
我们解决了这一难题,并且证明我们能够进行实时的音频合成。在速度上,这一系统比WaveNet 参数部署要快400倍。
从文本中生成人造的语音,通常被称为文本转语音(TTS),它是许多应用,比如,语音驱动的设备、导航系统和视力障碍者设备中不可或缺的工具。从根本上说,它能让人在不需要视觉交互的情况下与技术进行互动。
现代的 TTS 系统都是基于复杂的、多步骤的处理管道,其中,每一个管道都可能会依赖于人为设计的特征和启发。由于这种复杂性,建造新的TTS 系统是非常消耗人力,而且也会非常困难的。
DeepVoice 受到传统的本文到语音的管道启发,并且采纳了相同的架构,但是,DeepVoice 使用神经网络来代替全部组件,并使用了更简单的特征。这是的我们的系统能更好地适用于新的数据库、声音和领域,而不需要任何人为的数据标注或者额外的特征设计。
DeepVoice 为真正的端到端的,且不需要复杂处理管道、不依赖于手动设计特征进行输入和预训练的语音合成奠定了基础。
我们目前的管道依然不是端到端的,它由一个音素模型和一个音频合成组件构成。
声音中的机器人声音特性产生于管道结构和音素模型,然后,声频生成组件单独可以生成更加自然的音频片段。
应用信息