9月3日,据媒体报道,通过逆向工程 ChatGPT 应用,发现 OpenAI 正在计划扩展其语音功能。未来的更新将增加 8 种新的语音选项,每种语音都有独特的代号。这些新语音将逐步推出,旨在为用户提供更自然、更富表现力的朗读体验。
新的语音功能将显著提升 ChatGPT 的文本到语音(TTS)表现。这些语音不仅在音质上更加自然,且富有表现力,还可以更真实地模拟非语言声音,如动物叫声等。例如,这些语音能够更自然地模仿狗叫声,使得用户在需要表达动物声音或其他非语言音效时更加逼真。
除了模拟非语言声音外,这些新语音还可以在朗读加粗或斜体文字时,传达或强调特定的情绪。例如,在处理强调词或表达情感变化时,新的语音能够更有效地反映这些变化,增强用户的沉浸体验。这种功能对于需要精细控制表达方式的应用场景,如有声读物、教学材料或情感计算领域,将有很大帮助。
值得注意的是,虽然这些语音增强功能显得非常先进,但它们仍然是标准的 TTS 语音,可能与目前处于 alpha 阶段的高级语音模式无关。高级语音模式可能包含更多实验性或高端的声音生成技术,而此次曝光的语音更新旨在提升日常用户的体验。
OpenAI 在语音技术方面的这些创新举措,表明其致力于持续改进和增强 ChatGPT 的交互体验。通过增加更自然、更富表现力的语音,OpenAI 不仅可以提升用户在不同场景中的体验,还能为开发者提供更多定制化的选项,从而推动 AI 在语音合成和自然语言处理领域的发展。