UFO中文网

 找回密码
 注册会员
查看: 114|回复: 0
收起左侧

一分钟模仿你的声音,谷歌实验室发布重磅语音合成技术

[复制链接]
online_member 发表于 2022-4-16 12:48:32 | 显示全部楼层 |阅读模式
一分钟模仿你的声音,谷歌实验室发布重磅语音合成技术是怎么回事,是真的吗?2017年05月19日是本文发布时间是这个时间。下面一起来看看到底怎么回事吧。
                                一分钟模仿你的声音,谷歌实验室发布重磅语音合成技术
                               
                                新的语音合成技术只需要1分钟的声音样本,就可以模仿任何人说话。
                               
                                 
一分钟模仿你的声音,谷歌实验室发布重磅语音合成技术400 / 作者:UFO爱好者 / 帖子ID:86174


谷歌的一家实验室已经开发出一项新技术,能够在1分钟模仿任何声音,把声音合成技术提高到一个崭新的高度。跟普通的声音合成软件相比,它已经能够听懂每个人说话的独特语调,并且在几乎所有语境下都能熟练运用。

开发这项技术的正是谷歌2016年在加拿大蒙特利尔大学建立的人工智能实验室(MILA)。基于声音合成技术,MILA在今年4月份刚刚成立了Lyrebird公司。

很巧的是,这家公司的名字也是一种叫做琴鸟的鸟类名字。琴鸟的神奇之处在于,它不仅能模仿多种其他鸟类的声音,它还能模仿大自然不存在的声音,比如说汽车鸣笛声、伐木用的电锯声、相机的快门声。你可以从下面这段视频中领略琴鸟高超的声音模仿技巧。

声音合成,只需1分钟

琴鸟的模仿者,lyrebird公司在众多声音合成公司中脱颖而出。它宣称,只需要1分钟的声音样本,就可以模仿任何人说话。

之所以能产生如此高还原度的合成声音,背后的技术正是神经网络(Neural Network)和机器学习(Machine Learning)。神经网络模拟电信号在人脑神经元之间的传递过程,对输入数据进行处理。它利用分层的神经元,从大量样本数据中总结出共同特征。目前,神经网络在图片识别、字幕生成等方面受到了广泛应用。

在这里,研究人员首先用很多不同的声音训练神经网络,把声音的音节数据还原成声音。Lyrebird公司的创始人亚历山大·布雷比松(Alexandre de Brébisson)说:“不同的声音中包含了很多信息。”神经网络能够从声音样本中抓取关键特征,如音色、音调、音节、停顿等等,而这些关键特征足够定义一个人的声音,这跟人们根据声音判断说话者是一个道理。布雷比松把这些关键特征比作声音的DNA,“在学习了很多不同讲话者的声音后,学习一个全新的陌生声音就会快很多,这也是我们为什么不用那么多数据的原因。更多的数据肯定也是有帮助的,不过一分钟就足够捕捉声音的DNA中的大部分信息了。”

除了表现出出色的模仿效果,Lyrebird公司的声音合成技术还能在快速合成声音。公司官网上宣称,借助系统的GPU群,它可以在半秒钟内合成1千句话。它的合成原理简单来说就是,记录某人1分钟的声音,lyrebird把声音中的DNA压缩成特殊的钥匙,随后用这个钥匙就可以合成任何与说话者相似的声音。

有了这项技术,网络上的流行混剪视频的制作将容易很多,制作者只需把画面剪切在一起,lyrebird完全可以生成你需要的任何声音。除了这类应用以外,lyrebird声音合成技术在更多的场景中都能派上用场,比如说为失语者配音。你可以把它想象成一款脑洞编辑器,可以让我们的生活更有趣。Lyrebird公司设想了一些应用场景,如虚拟现实、有声书朗读、游戏、动画等,以及提高人们生活质量的应用,如个人助手、心理治疗等。

双刃剑

然而这项技术的漏洞也是显而易见,不在于技术本身,而在于使用它的人。如果这项技术被图谋不轨的人利用,社会上的误导、迷惑、欺骗行为可能会更加猖獗。小到钱财,大到人身安全、社会集体利益可能都会受到威胁,无意间的犯罪或者被侵犯都是非常可怕的事情。

关于技术的道德问题,Lyrebird在其官网也专门给出了解释,他们声明开发的技术实在警醒人类在未来(甚至现在)声音篡改模仿都是可能的,尽管现在法庭上还将录音作为一项重要的证据,他们不认为这是很妥当的,因为谁都可能伪造这种证据。而通过将这项技术发布给全世界,他们希望确保技术的安全性,希望人人都能接触到这个信息:在不久的将来声音也可以被破解。
您需要登录后才可以回帖 登录 | 注册会员

本版积分规则

UFO中文网

GMT+8, 2024-11-3 03:35

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表