语音处理:常用术语及缩写整理(持续更新)

语音处理:常用术语及英文缩写整理

  • 专业术语
    • 基本
    • 通用
    • 带宽类
    • 音频音质类
    • 编解码
    • 领域
      • 音频
      • 技术
      • 开发
      • 其他
  • 待处理
  • 参考资料

专业术语


语音处理:常用术语及缩写整理(持续更新)_第1张图片

基本


简称 全称 中文 解释 备注
PCM Pulse Code Modulation 脉冲编码调制 根据采样频率得到不同时刻的信号幅值 裸流音频信号

通用


简称 全称 中文 解释 备注
TTS Text To Speech 文本合成语音 将一段自然语言文本转化为语音形式,与声码器相关
CELP Code Excited Linear Prediction 码激励线性预测
LPC Linear Prediction Coefficient/Coding 线性预测编码器
SBC Subband Coding 子带编码 断去划分频带,然后对结果进行量化、编码压缩 具体实现见QMF
TCX Transform Coded eXcitation 变换码激励
TC Transform Coding 变换域编码 从时域转到其他域编码对应信息,如FFT/MDCT/MELP

常见技术

  • ASR: Auto Speech Recognition,智能语音识别
  • AEC:Acoustic Echo Cancellation,声学回声消除
  • ANC:Active Noise Control,主动降噪

带宽类


简称 全称 中文 采样率 解释 备注
NB Narrow Band 窄带 8kHz (4 kHz audio bandwidth)
WB Wide Band 宽带 16kHz (8 kHz audio bandwidth) 人发声极限(通话够用)
SSWB Semi Super Wide Band 半超宽带 24kHz (12 kHz audio bandwidth)
SWB Super Wide Band 超宽带 32kHz (16 kHz audio bandwidth)
FB Full Band 全带 48kHz 20 kHz audio bandwidth, sample rate greater than 44.1kHz;
音频信号频率可达20k,采样率不低于44.1k
人听觉极限(音乐够用)

音频音质类


简称 全称 中文 解释 备注
HQA High Quality Audio 高清品质音乐 MP3格式的话是码率320kbps以上
SQA Super Quality Audio 超清品质音乐 一般是无损

编解码


简称 全称 中文 解释 备注
TNS Temporal Noise Shaping 时域噪声整形 根据LPC分析,将量化噪声对时域的影响进行整形
SNS Spectral Noise Shaping 频域噪声整形/谱噪声整形 将量化噪声对频域的影响进行整形
QMF Quadrature Mirror Filter 正交镜像滤波 将时域信号转成独立的各频带信号,属于SBC的一部分
AF Analysis Filters 分析滤波器 时域转成不同带的频域信号,属于QMF的编码侧子操作
SF Synthesis Filters 综合滤波器 恢复成时域信号,属于QMF的解码侧子操作
ABR Adaptive Bit Rate 自适应码率
LTP Long Time Prediction 长时预测
LTPF Long Term Postfilter 长时后处理滤波器 检测低频基音, LC3
PLC Packet Loss Concealment 丢包补偿 主要在解码侧恢复
BFI Bad Frame Indication 坏帧标识 提醒解码侧当前帧损坏,需补包或跳帧
BWE Bandwidth Extension 带宽扩展 把包含有用信息的频带,扩展到其他频带,SBR是该思想的一种具体实现
SBR Spectral Band Replication 频带复制 复制中低频谐波到高频,将高频包络作为边信息,解码用边信息减少音调成分
IGF Intelligent Gap Filling 智能带宽填充 低频补高频,补充低码率时量化引起的高频带区域大量频谱空洞
NF Noise Filling 噪声填充 随机填补噪声,让频谱更好看,不会影响音质
MS M/S Coding Sum/Difference Coding 多声道联合编码 编码侧:M = (L + R) / 2 => 解码侧:L = M + S
编码侧:S = (L - R) / 2 => 解码侧:R = M - S
M代表middle,S代表side
  • MPEGH:Moving Picture Expert Group,音视频编解码专家工作组
  • TWS:True Wireless Stereo,真无线耳机
  • JSCC:Joint source-channel coding,联合声源编码
  • SBR:Spectral Band Replication,频段复制(注意与IGF技术相区分)
  • PS:Parametric Stereo, 参数立体声

心理声学模型缩略语

  • narrowband noise masking tone (NMT),
  • tone masking tone (TMT),
  • narrowband noise masking narrowband noise (NMN),
  • tone masking narrowband noise (TMN)

常见音频编解码器

  • LHDC,全称Low-Latency Hi-Definition Audio Codec,低延迟高解析音频编解码器。台湾盛威私有。
  • LDAC,全称至今是谜,猜测是 Low Delay Audio Codec?主打高清、无损、CD音质。日本SONY私有。
  • LC3,全称Low Complexity Communication Codec,低复杂度音频编解码器
  • AAC,全称Advanced Audio Codec,高级音频编解码器
  • MP3, 全称Moving Picture Expert Group Layer 3,暂无中文简称
  • AVS,Audio Video Coding Standard,音视频编码标准
  • AVS3,The Third Generation AVS, China Working Group
  • CUVA,中国超高清视频产业联盟,China Ultra High Definition Video Association,当前已升级注册成为世界超高清视频产业联盟(UWA 联盟)

语音评价指标

  • ODG:Objective Difference Grade,客观差异等级
  • MOS:Mean Opinion Score,即平均意见分数。它是一种用于衡量语音质量的评估方法,通常用于评估电话、网络电话、视频会议等通信系统的语音质量。MOS评分通常从1到5分,分数越高表示语音质量越好。
  • PEAQ:Perceptual Evaluation of Audio Quality,音频感知质量评估,它是一种用于评估音频质量的客观测量方法,旨在模拟人类听觉系统对音频质量的感知。PEAQ是国际标准化组织(ISO)和欧洲电信标准化协会(ETSI)共同制定的标准。

领域


音频领域你需要知道的100个关键词,整理如下。

音频

  • EQ,Equalizer,均衡器,特点:本质是个数字滤波器
  • SE/AE,Sound Effecs/ Audio Effects,音效
  • THD,Total Harmonic Distortion,总谐波失真,详解:link

技术

  • FOA,First Order Ambisonics,ambisonic, full-sphere surround sound format,默认是一阶的
  • HOA,Higher Order Ambisonics

开发

  • OOB: Out of bounds, 越界
  • DTS, Defect Tracking System,缺陷跟踪系统
  • DFX,Design for X,面向产品生命周期各/某环节的设计,现多指软件的插件,即软件周期的补充
  • ARM公司的套件
    • RVDS,RealView Development Suite,实时仿真开发套件,范围:RVDS > RVCT
    • RVCT,RealView Compilation Tools,实时仿真编译工具
  • NDK,Native Development Kit,安卓原生开发套件
  • SIMD,Simple Instruction Multiple Data,单一指令多数据运算
  • A2DP,Advanced Audio Distribution Profile,蓝牙音频传输模型协定

其他

  • MWC,Mobile World Congress,世界移动通信大会,特点:一年一度的通信行业大会,在西班牙巴塞罗那举行,俗称巴展

待处理


ALU  Arithmetic Logic Unit
BEC  Bit Error Condition
BW  Bandwidth

FIR  Finite Impulse Response
IIR  Infinite Impulse Response

IDCT  Inverse DCT
DCT  Discrete Cosine Transform
LD-MDCT  Low Delay Modified Discrete Cosine Transform
MDCT  Modified Discrete Cosine Transform
LFCB  Low Frequency Code Book (part of SNS VQ)

LSB  Least Significant Bit
MSB  Most Significant Bit

VQ  Vector Quantizer
HFCB  High Frequency Code Book (part of SNS VQ)
MPVQ  Modular Pyramid Vector Quantizer index (a partial PVQ index)
PVQ  Pyramid Vector Quantizer

PDU  Protocol Data Unit

参考资料


  1. LC3 _Specification_v1.0.pdf, Page149

你可能感兴趣的:(语音处理,语音处理,编解码,音频编码解码,专业术语)