AI全频带实时降噪

最近完成了全频带实时降噪,目前已准备在产品上了。
先大概说一下该降噪整体情况,稍后会详细讲述整个降噪方案的细节并上传demo。

降噪突出点:

  • 全频带(48k)降噪;
  • 支持实时;
  • 对音乐进行全保留;
  • 降噪前向推理不依赖任何第三方;
  • 标准c/c++编写,支持跨平台
  • 处理速度快,CPU消耗低
  • 抑制生活中各类场景噪音;

数据:
训练数据550小时

模型:
主要采用CNN+LSTM结构,采用人声分离思想,最终求mask。

测试结果:
音频以10ms一帧

机型 解码速度(ms) CPU消耗(%) 占用内存(M)
iPhone7 0.6 11 0.1
iPhone12 0.1 7 0.1

有做同类需求的欢迎交流。

你可能感兴趣的:(AI全频带实时降噪)