使用微软 TTS 录制 IVR 音频

介绍

交互式语音响应(IVR)是一项技术,它使计算机可以通过使用通过键盘输入的语音和 DTMF 来与人互动。您只须用电话即可进入服务中心,可以根据用户输入的内容播放有关的信息。

IVR 在呼叫中心和电话系统中应用非常广泛。有很多公司需要用到 IVR 但是又找不到人来录制(或是觉得找人录制太麻烦成本太高)。现今 TTS(Text To Speech)已经非常发达了,可以录制出非常接近人声的音频,也有非常多的公司采用 TTS 来转录 IVR 音频。其中微软的 TTS 效果是笔者认为最好的。

今天就给大家介绍一下如何使用微软的 TTS 将文本转录为 IVR 音频。

使用

给大家介绍 Text-to-Speech Tool 网站。支持亚马逊和微软 TTS 文字转语音。

打开网站后先选择语音供应商,目前亚马逊还不支持中文语音。我们选择 Microsoft,接下来选择语言,中文语音选择 Chinese,英文语音选择 English。也可以根据需求选择其他的语言。

填完后会跳转到 TTS 界面,可以选择 voice 的音色。经笔者测试认为 yaoyao 的声音比较自然。

在输入框中输入需要转音频的文字即可。也可以调整一下音量速率等参数。点击右上方的播放键即可试听。觉得没问题后点击右上角的下载把语音下载下来即可。

下载下来的音频还需要转换成 3CX 支持的格式。转换方法请查看:将WAV文件转换为符合3CX要求的格式