OpenAI 可以重现人类声音——但尚未发布该技术

自1978年Speak & Spell玩具问世以来,语音合成技术已经取得了长足的进步。现在,使用深度学习人工智能模型,软件不仅可以创建听起来逼真的声音,还可以使用小音频样本令人信服地模仿现有声音。OpenAI本周发布了语音引擎,这是一种文本转语音人工智能模型,用于根据15秒的录制音频片段创建合成语音。但OpenAI尚未准备好广泛发布其技术,该公司最初计划在本月早些时候启动一项试点计划,供开发人员注册语音引擎API。但在更多地考虑道德影响后,该公司决定暂时缩减其雄心壮志。该公司表示,他们希望通过预览展示语音引擎的潜力,并激发增强社会抵御力的需求,以应对越来越令人信服的生成模型带来的挑战。总体而言,语音克隆技术并不是特别新鲜,但OpenAI正在逐步让任何人使用其特定品牌的语音技术的想法值得注意。该公司表示,语音技术的好处包括通过自然的声音提供阅读帮助、为创作者提供全球影响力、为非语言个体提供个性化的语音选项以及帮助患者在术后恢复自己的声音。但这也意味着任何拥有某人15秒录制声音的人都可以有效地克隆它,这对潜在的滥用具有明显的影响。因此,OpenAI正在以负责任的方式警告我们所有人有关这种已经存在的技术,并表示他们正在寻找逐步淘汰基于语音的银行账户身份验证、教育公众了解“欺骗性人工智能内容的可能性”,以及加速开发可跟踪音频内容来源的技术等解决方案。

$ARS

$AIGX

$FET $SOL $BTC #Ai赛道