​ChatGPT 语音功能升级,实时翻译对话更自然流畅

AI资讯2个月前发布 阿力
17 0

最近,OpenAI对其ChatGPT的语音功能进行了全面升级,特别是针对订阅用户,旨在提升AI的语音表达的自然性和情感丰富度。根据OpenAI的说法,更新后的“高级语音模式”现在可以实现更流畅、情感更细腻的语音输出,包括对语调、停顿以及表达同理心或讽刺等情感的改进。

图源备注:图片由AI生成,图片授权服务商Midjourney

值得注意的是,此次更新还新增了实时翻译功能。用户现在可以选择特定的语言对,要求ChatGPT进行翻译。AI将会不断地对话双方的内容进行翻译,直到用户指示停止。这一功能非常适用于餐馆点餐或多语言的工作场景。

付费用户只需在聊天界面的语言图标上点击,即可在所有平台上体验这些语音改进。然而,OpenAI也指出仍存在一些已知问题。用户可能会遇到偶尔的音频质量下降,比如音调或音量的突变,这在某些语音中可能更为明显。此外,所谓的“幻觉”现象仍然存在,ChatGPT有时会无缘无故地产生奇怪的声音,例如广告片段、随机噪音,甚至是背景音乐。最近有用户反映,ChatGPT在对话中突然播放了一段广告,尽管OpenAI并未投放广告。

OpenAI在2024年5月首次推出了“高级语音模式”,并于2024年10月扩大了在欧盟的可用性。该功能的目标是实现与AI的自然实时互动,包括在对话中打断和表达情感。如果用户打开摄像头,ChatGPT还可以对周围的物体或环境进行实时评论。类似的功能也出现在谷歌的Gemini应用中。

划重点:

🌟OpenAI对ChatGPT进行了语音功能升级,使其语音更加自然流畅,情感表达更丰富。

🌍新增实时翻译功能,用户可选择语言对进行连续翻译,适用于多语言场景。

⚠️仍存在一些问题,包括音频质量波动和无故生成的奇怪声音。

© 版权声明

相关文章

暂无评论

暂无评论...