开源项目推荐:sherpa-onnx

开源项目推荐:sherpa-onnx

sherpa-onnx k2-fsa/sherpa-onnx: Sherpa-ONNX 项目与 ONNX 格式模型的处理有关,可能涉及将语音识别或者其他领域的模型转换为 ONNX 格式,并进行优化和部署。 项目地址: https://gitcode.com/gh_mirrors/sh/sherpa-onnx

1. 项目基础介绍和主要编程语言

sherpa-onnx 是一个基于下一代 Kaldi 和 onnxruntime 的开源项目,专注于语音识别、文本转语音、说话人识别和语音活动检测(VAD)等功能。该项目支持在没有互联网连接的情况下本地运行,适用于嵌入式系统、Android、iOS、Raspberry Pi、RISC-V 和 x86_64 服务器等多种平台。

主要编程语言

  • C++
  • C
  • Python
  • JavaScript
  • Java
  • C#
  • Kotlin
  • Swift
  • Go
  • Dart
  • Rust
  • Pascal

2. 项目的核心功能

sherpa-onnx 提供了以下核心功能:

  • 语音识别(Speech-to-Text, ASR):支持流式和非流式语音识别。
  • 文本转语音(Text-to-Speech, TTS):将文本转换为语音。
  • 说话人识别(Speaker Recognition):包括说话人验证和说话人识别。
  • 语音活动检测(Voice Activity Detection, VAD):检测语音中的活动部分。
  • 关键词检测(Keyword Spotting):识别语音中的特定关键词。
  • 语音语言识别(Spoken Language Identification):识别语音的语言。
  • 音频标签(Audio Tagging):为音频文件添加标签。

3. 项目最近更新的功能

sherpa-onnx 最近更新的功能包括:

  • 2024-07-03:增加了对 Docker 的支持,用户可以通过 Docker 轻松体验语音识别功能。
  • 2024-06-10:在 Android 平台上增加了本地 TTS 语言转文本引擎。
  • 2024-06-10:从零开始搭建 Windows 贾维斯系统的第一部分。
  • 2024-05-09:记录了 sherpa-onnx 的安装及使用方法。
  • 2024-04-09:在 rv1106、rv1109 和 rv1126 上移植了 sherpa-onnx。

这些更新进一步增强了 sherpa-onnx 的功能和适用性,使其在多种平台和场景下都能提供高效的语音处理能力。

sherpa-onnx k2-fsa/sherpa-onnx: Sherpa-ONNX 项目与 ONNX 格式模型的处理有关,可能涉及将语音识别或者其他领域的模型转换为 ONNX 格式,并进行优化和部署。 项目地址: https://gitcode.com/gh_mirrors/sh/sherpa-onnx

你可能感兴趣的:(开源项目推荐:sherpa-onnx)