很久以前,舍得就想做这样一款软件。那是在2013年,舍得学苑开启“视频月”活动,当时要发布一连串的视频。辣么问题来了,视频好做,配音却不好搞。虽然舍得在北方呆过蛮久的时间,但普通话自认还不够标准。怎么办呢?

以前接触过TTS语音,当时便想用TTS来做,用文本直接合成语音。中文的语音合成,最牛x的自然是讯飞。2010年舍得制作视频的时候,配音用的就是科大讯飞的InterPhonic 5.0。不过最近几年讯飞发展挺快,还专门搭建了一个讯飞开放平台。InterPhonic 5.0和现在最新的语音技术相比,已经不可同日而语了。

2014年舍得注册了个讯飞的账号,下载了它的SDK,硬着头皮用其它现成的C++源代码改出一个自己用的小程序来,当时的程序是酱紫滴:

001K43yhzy6Opg1bojg02&amp

用法也很粗糙,在最上方的文本框中输入要合成的文本,然后点击开始合成就OK了。

不过这样还是不大理想……舍得做视频的时候,往往是先写好要配音的脚本,到配音的时候,能不能把这个脚本交给程序,让它自动生成一连串音频文件呢?

要不然,这样一行行往里输入,得多慢啊!

于是乎就有了今天的《配音小丫》。

从界面上讲,小丫似乎比原来的程序还退步了……因为,她根本就没有图形界面。

小丫工作时是酱紫滴:

SNAG-0138

我在她所在的文件夹下放了一个叫source.txt的文档,文档内放的正是我写的配音脚本。

然后打开小丫,她就腾腾腾开始合成,输出的文件是按1、2、3、4、5……这样的顺序来的,而且是wav格式,直接就可以用。

等小丫把脚本里每一行文本合成完毕,按个“任意键”就可以让她收工了。

虽然样子简陋了一点,但效率可不止高了一点点。

以后有时间,还是要给小丫加个图形界面滴。

最后,上个小丫的“身份证明”:

SNAG-0139

本文版权归舍得学苑所有,欢迎转载,转载请注明作者和出处。谢谢!
作者:舍得
首发:舍得新浪博客