音声合成:音高、泛音、谐波、基频 到底是什么概念?

文章目录

  • 工具
  • 音高
  • 基频(基音,fundamental tone)
  • 泛音(overtones) == 谐波 (Harmonics)
  • 分音 Partials
  • 如何看音准?

工具

Kaldi,虽然非常高效,表现也好,但是忒难用,不灵活,总得改C++代码;
PyKaldi,虽然用上了机器学习界宠儿Python,但本质上跟Kaldi还是一回事嘛;
PyTorch-Kaldi,虽然灵活了一些,声学模型也易于修改,但是,跟前面一样,它也还是Kaldi呀;
ESPNET,虽然是基于Python和PyTorch的,但是只支持端到端语音识别,太不全面了;
  • mac os 软件:http://spek.cc/
  • 声音四大要素:音高、强弱、长短、音色
    • 音高:就是振动的频率不同导致的区别。
    • 强弱:就是振动的振幅不同导致的区别。
    • 长短:就是振动持续时间的不同导致的区别。
    • 音色:音色的区别是由于各种振动,其总能量在泛音各音级上能量分配不同而造成的。

音高

  • 中央区的A音符发出的频率为440Hz(表示成"A=440Hz",或是"A440"),通常被当作“标准音高”。
    • 人类对音高

你可能感兴趣的:(语音合成原理与经典论文解读,歌声合成合成实战练习,歌声合成从入门到实战)