您的位置
主页 > 联盟资讯 » 正文

AI语音真假面:你的“声音DNA”可能会被复制

来源:www.jz265.com 点击:959

如果有技术可以在一秒钟内复制或模仿你的演讲,你会感到惊讶或害怕吗?

2019年,人工智能技术的应用越来越多样化。香港科技大学迅飞和搜狗等科技公司先后发布了语音合成技术的应用。通过AI,用户可以将他们的声音改变为社交名人或他们想要在一秒钟内模仿的其他声音。

互联网技术悄然改变了我们的生活。对于AI企业来说,语音识别技术的广泛应用已不再困难。但是,潜在的道德和安全风险可能成为人工智能技术发展不容忽视的问题。

实时语音转换技术在AI公司受到一秒钟改变声音的影响

“大家好。我今天很开心。我一直非常喜欢科技大学(香港科技大学)新产品发布会......

这是在2019年香港科技大学旬飞新产品发布会上发生的一幕。通过科技,科大轩飞董事长刘庆峰模仿了丹田坊,林志玲,罗永浩的发言,致开幕词。特别是当罗永好的声音响起时,很多人都认为老罗已经到了现场。

“你看到刘庆峰,但你听到老罗的声音。”刘庆峰在舞台上表示,这是该公司最新的实时变声技术。据报道,新的语音合成技术只需要一分钟的声音样本来模仿任何人的讲话。

不仅是KUST Xunfei,而且最近,搜狗CEO王小川在一次会议上展示了搜狗的改变声音的功能。通过手机软件,王小川模拟了高晓松和她在中国东北的妹妹的声音,当场引起了不断的笑声。然后他在歌曲中展示了声音替换。据报道,该系统首先训练他的声音14分钟,然后移动音色。

这是搜狗最新的语音合成技术,它可以将任何人的声音转换为特定的声音,林志玲和马云的声音可以在几秒钟内改变。王小川说,这不仅仅是一个简单的语音合成,而是可以迁移语音的情绪。

目前,在搜狗输入法中,用户可以自由地将自己的声音转换为喜欢的声音,可以用于微信,QQ和Momo等主要社交场景。搜狗为19种特定声音提供了几类星星,卡通人物,游戏IP,方言等。

▲王小川

事实上,语音合成一直是一项新技术。在我们看到更多内容之前,我们将文本转换为声音。例如,在导航,音译,智能扬声器,Siri和其他智能语音助理中,真正的人并不是在说话。

今年,许多人工智能公司在语音变换和语音cos等场景中应用了语音合成,将真人产生的声音转换为特定的声音。

百度也有相关技术的应用。今年5月初,在央视公益计划《等着我》中,百度大脑基于智能语音技术,综合了已故老兵的声音,帮助64岁的同志实现“重逢”。

据介绍,该技术采用百度的端到端语音分离和建模方案,利用多套神经网络独立模拟语音的不同维度,如音色,情感,风格等,以指导最终合成。

在这些人工智能技术的应用背后,一方面反映了人工智能技术的应用进展以及为社会带来的包容性价值观念。例如,搜狗将语音发声技术和人工智能合成锚技术与行业相结合,将媒体,教育,内容制作和旅游相结合,带来更多的价值想象力。

另一方面,不应忽视未来技术漏洞和滥用的潜在风险。一些网友指出“小心使用电信诈骗”,“未来你可能会接到马云的电话”.

一位语音行业内部人士认为,音频作为交互式产品的工具应该是有用的,但对于作为内容载体在线音频平台的音频,其积极意义仍有待观察。

因此,对于企业而言,在不断寻求技术突破和商业价值的同时,也应树立技术安全责任感。

语音合成技术在实际水平上有很多难度。

据了解,神经网络和机器学习的支持是栩栩如生的语音合成技术的基础。神经网络模拟人脑神经元之间的电信号传输过程并处理输入数据。它使用分层神经元来汇总来自大量样本数据的共同特征。

语音合成技术广泛应用于商业化领域,如语音交互,有声读物,新媒体,智能客户服务,泛娱乐等。

在接受新浪科技采访时,蜻蜓调频专业教育类负责人牛森表示,音频领域的语音合成技术将大大减少文字内容对音频的人员,时间和经济成本。

谈到语音cos,牛森指出,在练习中有很多难受的伤害,如合成音频和真实的声音在情感和情感表达方面不能完全一致。

他说,对于音频用户来说,相同的内容,阅读手稿和讲述的体验会有很大的不同,只有最真实的语音才能引发深刻的情感共鸣,同时也是音频的价值。

在道德和安全层面,牛森认为,第一步是在技术上确认声音和合成声音。从右边开始,有必要澄清版权链。任何未经授权的合成音频都是违法的。我们将严格执行版权和质量控制。“

据了解,在某些音频平台上,语音合成技术主要用于儿童节目。在其他内容中,AI模拟效果不是很好,并且还没有被广泛使用。

对于语音合成的安全隐患,在改变声音技术发布后,刘庆峰在现场强调:人工智能应该继续发展,核心是它的价值是如何健康和人性化的,所以一个黑色像改变语音技术这样的技术,我们显然要开放各种应用程序并不容易,它必须是一种健康,安全和有趣的方式来与世界联系。

此前,刘庆峰还提到,在人工智能领域,技术合作需要法律和道德的合作。

对于安全问题,搜狗对新浪科技说,“技术是一把双刃剑,可以用来造福并带来灾难。搜狗致力于科学和技术。变革技术是人工智能的前沿应用,基于移动学习技术可以将任何人的声音转化为特定人的声音(Any-to-One)。搜狗在这方面取得了突破,并在实际阶段处于领先地位。这项技术也可以应用于电影和电视配音,家庭陪伴等。帮助人们提高现场的工作效率和幸福感。“

搜狗透露,为了确保这项技术不被人们小心滥用,公司已经做出严格的管理和限制:

1.搜狗不会向第三方输出变声技术,以确保技术的可控性和安全性。

2.语音改变功能的所有目标声音均由搜狗定义,不允许用户模仿。

三。变声后的声音在微信、QQ等应用中使用。它不能转发和复制,并且可以跟踪发送者的可跟踪性。

此前,王小川在接受媒体采访时也提到了人工智能立法:在人工智能发展的现阶段,尽快根据技术的发展不断调整和完善,是最切实可行的应对手段。人工智能带来的法律和伦理风险。

然而,当前技术的发展仍然领先于伦理和法律。周鸿毅在今年5月的世界情报会议上提到,在人工智能领域,如果没有人文思想,可能设计的系统就是一场悲剧。

人工智能技术背后的人文思考

事实上,人工智能技术背后的“假现实主义”现象不仅出现在音响领域,三星的一项技术应用也引起了人们的关注。

据国外媒体报道,三星在莫斯科的人工智能实验室研究人员,基于大量的电影和视频资料,以及“深卷积神经网络”训练,可以通过人工智能技术准确识别某些面部特征,可以把静止图像变成电影甚至视频。

在实验中,研究人员根据爱因斯坦、玛丽莲梦露甚至蒙娜丽莎的静止图像生成了他们正在谈论的视频,但视频质量目前很低。

也就是说,随着未来人工智能图像生成技术的进步,一个假视频只能由一张照片生成。

在此之前,人工智能变脸也引起了社交媒体的热议。有人用94版的《射雕英雄传》李竹隐换了杨幂的脸,网友称“不违规”、“假真话”,甚至嘲笑“老戏最划算的方式”。

这本来是一个恶搞或纯娱乐视频,但在这次行动背后,很多人担心技术会被滥用。如果没有在正确的地方使用,它将涉及版权,肖像权,安全性和其他问题。

这种技术两年前就存在并在国外技术界传播。一些网民将锚的脸变成了一颗星。但是,由于各种因素,这项技术还比较少见。

在美国,人工智能被用来取代色情影片中的女主角与女明星。这项技术引起了恐慌并被抓获。

此外,在某些行业,这种技术将带来新的思路。例如,某些音频会被篡改,造成社会问题;在未来的影视剧中,可能会出现诸如明星头像AI脸部变化,AI合成配音等场景。虽然这些技术在一定程度上节省了电影和电视制作的成本,并加快了电影和电视制作的进程,但需要讨论在道德和人文层面发布的价值观。

无论是人工智能语音变化还是人工智能面临变革,高科技的快速发展也给法律规则带来了新的挑战。

值得注意的是,在4月份全国人民代表大会常务委员会审议的《民法典人格权编(草案)》中,正式加入:任何组织或个人都不得以信息伪造方式侵犯他人肖像的权利。技术。

也就是说,一个好的信号是,未来AI面临变化甚至语音合成技术的应用将受到法律控制。

目前,人工智能技术的应用正在不断开辟虚拟世界与现实世界之间的界限。我们需要考虑的是,如果这些技术在未来变得更加强大和流行,那么区分真假技术将变得越来越困难。如何在开发过程中控制安全风险?