Python 中的离线语音转文本

Python 中的离线语音转文本

一、说明

   写作、编码、写博客、办公室工作、文档、报告都需要一个人在键盘上打字。这会导致健康问题,如腕管综合症、手和手指疼痛等。我非常了解这种痛苦。这是用于创建自己的离线运行的听写程序的 Python 代码。只需对着耳机的麦克风说话,它就会将您的话转换为文本并将其保存在文本文件中。

二、安装

   您将需要安装 Python 库 — vosk、pyaudio。

   Vosk 是一个语音识别工具包,它提供用于准确语音识别和说话人识别的流式 API。它支持 20+ 种语言和方言——英语、印度英语、德语、法语、西班牙语、葡萄牙语、中文、俄语、土耳其语、越南语、意大利语、荷兰语、加泰罗尼亚语、阿拉伯语、希腊语、波斯语、菲律宾语、乌克兰语、哈萨克语、瑞典语、日语、世界语、印地语、捷克语、波兰语、乌兹别克语、韩语、布列塔尼语、古吉拉特语。更多内容即将推出。它可以离线工作。您可以在轻量级设备(Raspberry Pi)以及Android和iOS的手机上使用它。它提供了多种语言模型,大小从 40MB 到 16BG 不等。大多数小型模型都允许动态词汇重新配置。大模型是静态的,词汇表不能在运行时修改。在此处查看所有可与 vosk 一起使用的型号。

   如果要离线使用应用程序,请将相应模型的 zip 文件下载到您的计算机。解压缩文件,程序使用这个解压缩的文件夹来创建模型并生成文本。否则,如果您想在线工作,您可以在 vock 中提

你可能感兴趣的:(语音编程,人工智能综合,python,开发语言)