OpenAI震撼发布：AI模仿人声工具问世，引发数据滥用疑虑-城市新闻网icitynews

OpenAI发布了一款新的人工智能工具，可以惊人地模仿人类的声音。这款AI语音生成器有着多种潜在应用，包括提供无障碍服务，但也可能引发对错误信息和其他形式的滥用担忧。

OpenAI分享了他们称为“语音引擎”（Voice Engine）的新工具的早期测试样本。这个工具使用了15秒的语音样本来生成非常逼真的语音副本。用户可以输入一段文字，然后工具会用人工智能生成的语音来朗读。虽然已经有几种AI生成的语音服务面向公众提供，但OpenAI以其ChatGPT等突破性人工智能工具的成功广泛采用而闻名。该公司表示，这种AI驱动的文本转语音工具可用于翻译、儿童阅读辅助，甚至帮助失去说话能力的人群。然而，一些人担心它可能会导致虚假信息的产生，或者让实施诈骗变得更加容易。

OpenAI表示，他们目前只允许“一小群可信赖的合作伙伴”使用Voice Engine，这些合作伙伴包括教育和健康技术公司。他们将根据这些合作伙伴的测试结果来确定是否以及如何扩大使用范围。据该公司称，这些测试人员已经同意，在未经他们明确同意的情况下，不会重现人们的声音，并会明确告知听众，他们听到的声音是由人工智能生成的。OpenAI在一篇博客文章中写道：“我们认识到，生成类似于人类声音的语音存在严重风险，尤其是在选举年。”该公司承认，随着人工智能生成的音频越来越普及，需要进行重大变革，尽管他们目前没有计划立即向公众发布Voice Engine。例如，该公司建议逐步取消基于语音的银行账户认证。

OpenAI表示：“任何合成语音技术的广泛应用都需要有声音认证功能，用来确认原始说话者是否有意将自己的声音添加到服务中，并设立一个禁用声音的清单，以检测和阻止创建与著名人物过于相似的声音。”Voice Engine可以利用一个语言的声音样本来生成能够说多种其他语言的仿制声音。该公司在博客文章中发布了一个人类朗读一篇关于友谊的文章的音频片段，以及由人工智能生成的音频，听起来像是同一个人用西班牙语、普通话、德语、法语和日语朗读同一篇文章。在每个人工智能生成的样本中，原始说话人的语气和口音都得以保留。

在即将发布Voice Engine预览版时，用户们都在期待OpenAI上个月发布的人工智能视频生成工具Sora的正式发布。Sora能够根据文字描述制作出逼真的60秒视频，包括多个角色、各种动作以及精心设计的背景细节。OpenAI的ChatGPT也能够从文字提示生成图像。此外，OpenAI在4月1日（周一）宣布，任何人都可以使用ChatGPT，无需注册即可使用该服务。公司表示，它可能会利用加载到ChatGPT中的任何文本来改进其模型。不过，即使没有账户，用户也可以通过设置关闭这一功能。但是，如果没有账户，用户将无法保存或查看聊天记录，也无法访问各种功能，包括语音对话和自定义指令。

（图片源于CNN）

未经允许不得转载：城市新闻网icitynews » OpenAI震撼发布：AI模仿人声工具问世，引发数据滥用疑虑

精彩推荐