python语音转文字库_有没有语音转文字的APP?

现在除了语音转文字的APP,还有文字转语音的工具,从技术上来说不难,只不过具体到软件的使用上,就很容易出现很多问题。

l 语音转文字的工具:

比如每天都在使用的微信,其实也是一个语音转文字工具,只不过整体来说比较简略,只支持六十秒以内的语音输入,而且也不能把录音中的语音输入到微信。

还有许多输入法也同样支持语音转文字,比如讯飞输入法、搜狗输入法和某些系统自带的输入法,如果只是日常使用可能不会觉得麻烦,但如果是用来工作,就会感受到很多不方面的地方。

也有很多专门做语音转文字的软件,但是大多数都要收费,其实这些软件都只是做了步骤的优化,节省我们一步一步转换语音的繁琐步骤而已。

一般这些软件的接入入口都是百度,所以在转换的识别率、转换速度和正确率上,基本上没有任何差别。

所以对于有Python基础的程序员来说,自己做一个语音转文字的小程序也很方便,只是可能在功能上没那么多样化。

去应用商城搜索一下“语音转文字”,各类软件基本都大同小异,挑一个自己感觉使用最方便的软件就好了。

l 文字转语音的工具

因为最近在着手做短视频号,语音转文字的功能对我来说用处倒不是很大,更需要一些便捷的文字转语音功能产品,所以就去找了一些相关的软件。

但是一开始找的软件总是不合我的心意,声音都太过于机械化了,而在在转化的过程中还会有很多方面的限制:

1. 声音过于机械化,缺少情感

2. 转化的文字内容有限,不能超过一千字

3. 导出到本地都需要收费,一条就是两块钱

要收费倒是也可以理解,但是转出来语音总给一种“两块钱,买不到吃亏,买不到上当”的感觉,如果我刷到这种视频,估计一秒钟都不想停留。

直到后面发现了标贝悦读这个插件,前面的转语音工具和这个插件比起来,简直就是弟弟。

而且还不用下载软件,可以直接登录网页版进行操作。标贝悦读_在线配音软件​yuedu.data-baker.com

而且比起其他的软件,单次合成的文字上线也很高。

普通的文字转化上限就是八千字,如果开一个会员的话,还可以达到两万字的文字上限,应对长图文简直是So easy。

而且最近还上线的情感合成和多角色合成这两个功能,让我的视频终于不再是枯燥的机械音了。

我以前还一直很好奇,某些营销号是怎么保证自己的音线维持在同一水准的,除了部分博主是真的受过专业的播音主持训练之外,估计其他的都是用的类似的文字转语音功能。

这个情感合成功能在国内的转语音软件中,还是很少见的,因为人类的语言情绪很复杂,在愤怒的情况下,我们声量会变大,而且声线会变得尖锐。

用Pr可以调高我的声量,但是调声线这种高端操作,我目前的技术还不达标。

也不是内有想过要自己尝试一下配音,但是难度实在是太高了,一旦有一个字读错了,就得从头再来。

有的时候制作一个视频总共要花十个小时,其中就有五个小时的时候耗费在配音上,请一个人来配音成本又太高。

平时除了会用这个软件做视频之外,我偶尔还会用它来读小说和调戏兄弟,毕竟看小说也是很麻烦的一件事,还需要自己手动翻页。

多角色合成功能可以做到输出不同的声音,比起单调的看小说有趣多了。

至于调戏兄弟的具体用法,我也不太好详细介绍,你们可以自己去抖音搜索一下“吱吱”这个博主。

而且这个软件里面可合成的声音种类也多,像我最讨厌的机械音、促销叫卖的声音和软萌妹子声都可以找到。

而且在之前我就一直在想,总是用系统的模板声音也不是长久之计,一个没有特色的视频号声音,是没有记忆点的。

像半佛仙人的声音就很有记忆点,再加上幽默风趣的科普文字,就可以达到很好的记忆效果;包括很多人喜欢朱一旦的视频,也是因为朱一旦的慵懒老板生意给了我们记忆点。

为此我还做过一段时间播音主持练习,但是结果并没有什么用,语速的控制方面依然不达标。

不过好在看到他们最近产品团队也准备进行“声音转换功能”的上线,这样我就可以用我自己录入的语音,来进行视频的讲解,希望这个功能可以快点上线。

毕竟“免费使用”这四个字,真香。

除此之外,还可以针对某个声音进行API接口申请调用。

交互流程:

以上是他们进行接口的一个大概流程,其实还有更多可以玩的,更多的内容,去标贝悦读官网看就行。

语音转文字的app有很多,我用过的感觉还不错的就分享一下,希望对大家又帮助。

你可能感兴趣的:(python语音转文字库)