AudioGPT 语音技术全覆盖:语音识别、增强、分离、风格迁移等 | 开源日报 No.114

stevearc/oil.nvim

Stars: 1.7k License: MIT

oil.nvim 是一个类似于 vim-vinegar 的文件浏览器,允许您像普通 Neovim 缓冲区一样编辑文件系统。其主要功能包括支持常见插件管理器、通过适配器抽象进行所有文件系统交互以及提供 API 来执行各种操作。该项目的关键特点和核心优势包括:

  • 通过适配器实现跨位置查看和修改文件
  • 支持 SSH 适配器,可在远程服务器上浏览文件
  • 提供丰富的 API 用于执行不同操作

unslothai/unsloth

Stars: 1.2k License: Apache-2.0

这个项目是一个本地 QLoRA 微调工具,主要功能包括手动自动微分引擎、80% 更快的速度和 50% 更少的内存占用。其核心优势和关键特性包括:

  • 所有内核都是使用 OpenAI 的 Triton 语言编写
  • 无需改变硬件支持 NVIDIA GPU (2018 年以后) 及 CUDA 7.5+,适配多种型号 GPU
  • 支持 Flash Attention via Xformers
  • 支持 4bit and 16bit LoRA finetuning
  • 在 260 小时内完全在本地训练 Slim Orca 模型 (原来需要 1301 小时)

该开源版本可以实现 5 倍加速训练或者选择 Unsloth Pro 和 Max 代码路径进行 30 倍加速训练。
同时提供了 Alpaca52K 数据集和 Slim Orca518K 数据集等 Colab 示例以及 LAION OIG Chip2 数据集的 Kaggle 示例,并且还可通过 Discord 获取帮助。

ThePrimeagen/harpoon

Stars: 4.0k License: MIT

Harpoon 是一个为了用最少的按键操作来实现你想要的目标而设计的项目。

  • 通过更改用户界面或者添加热键文件进行指定
  • 可以创建无限数量和列表项数目
  • 需要 neovim 0.8.0+ 版本支持
  • 必须调用 harpoon:setup()
  • 支持自定义 harpoon 列表行为,可以根据需要提供自己的调用函数。

psf/requests

Stars: 50.6k License: Apache-2.0

Requests 是一个简单而优雅的 HTTP 库。

  • 支持 Python 3.7+
  • 可以轻松发送 HTTP/1.1 请求
  • 不需要手动添加查询字符串到 URL,也不需要对 PUTPOST 数据进行表单编码,只需使用 json 方法即可
  • 拥有 30M 次/周的下载量,并被 100 万个以上的仓库所依赖
  • 提供了丰富功能和最佳实践支持,包括连接复用、国际域名与 URLs、会话维护、浏览器风格 TLS/SSL 验证等。

AIGC-Audio/AudioGPT

Stars: 9.4k License: NOASSERTION

AudioGPT 是一个理解和生成语音、音乐、声音和虚拟人的开源项目。

主要功能:

  • 文本转语音
  • 风格迁移
  • 语音识别
  • 语言增强 (Speech Enhancement)
  • 声学分离 (Speech Separation)

该项目具有以下核心优势:

  • 多领域支持:AudioGPT 在多个领域都提供了强大的支持,包括文本到语言合成、风格迁移以及各种与声学相关任务。无论您需要什么样的应用场景,在这个项目中都能找到满足需求的模型。
  • 先进技术实现:AudioGPT 采用最先进的基础模型来实现其功能,如 FastSpeech,SyntaSpeech 等。这些高质量模型经过训练完善调试后发布给用户使用。

TrinityCore/TrinityCore

Stars: 8.7k License: GPL-2.0

TrinityCore 是一个基于 C++ 的 MMORPG 框架,它源自 MaNGOS (Massive Network Game Object Server) 项目的代码,并经过长时间广泛修改优化、改进和清理代码库,同时提高游戏内机制和功能。其核心优势包括:

  • 完全开放源码
  • 高度鼓励社区参与
  • 提供详细的安装指南
  • 可通过 Github 提交修复程序

你可能感兴趣的:(开源日报,语音识别,人工智能)