对播放器架构演进、流媒体存储传输、视频编解码标准及图像声音信号处理,既对数学要求较高又与当时全民IT热相结合的专业——(计算机)信息安全,精妙绝伦的数论及密码学。既能应用密码学的知识技能又能和声色并茂的多媒体场景结合起来的信息隐藏和数字水印,音视频技术是互联网品质生活的连接器。连接器”的另一头则连接且聚合着信息论、最优化理论、图形图像学、声学、人类视觉系统等一众根基深厚、源远流长的学派。
-- 语音识别,语音信号
深度学习:核心技术、工具与案例解析; 解析深度学习:语音识别实践;影印版)-语音识别基本原理;解析深度学习:语音识别实践;
《语音信号处理》,语音信号的生成、处理、压缩、传输、合成、识别与理解.
-- 多媒体技术
基础知识方面推荐岗萨雷斯的《数字信号处理》,东南大学的《信息论与编码》;
编码基础方面推荐Wiley的《THE H.264 ADVANCED VIDEO COMPRESSION STANDARD》或国内毕厚杰老师的《新一代视频压缩编码标准H.264》;
最新的标准可以看相关的标准文档。
> 音视频编解码
《深入理解视频编解码技术:基于H.264标准及参考模型》《新一代视频压缩编码标准-H.264_AVC(第二版)》
《基于H.264的视频编/解码与控制技术》《Visual+C++音视频编解码技术及实践》
由“大师兄”刘歧和学而思客户端架构负责人赵文杰编写,武爱敏审校的《FFmpeg从入门到精通》;
《WebRTC权威指南》《现代电视原理》《数字电视广播原理与应用》
《FFmpeg从入门到精通 FFMPEG视音频编解码基础书籍 》《ffmpeg基础库编程开发》
《音视频开发进阶指南:基于Android与iOS平台的实践》
1)《视频编解码技术原理》,高文、赵德斌、马思伟著,科学出版社,2010.11
2)《Video Codec Design》, Iain E. G. Richardson, John Wiley & Sons, Ltd, 2002
3)《Video Processing and Communications》, Y. Wang, J. Ostermann, Y. Zhang, Prentice-Hall, 2002.
《新一代视频压缩编码标准H.264(毕厚杰)》,《h264和mpeg-4视频压缩:新一代多媒体的视频编码技术》,《H264标准中文版》。《MPEG-4_H.264视频编解码工程实践》。研究ffmpeg源码剖析.pdf ; ffmpeg源码整体分析.pdf。
《Android音视频开发》何俊林 。《音视频开发进阶指南:基于Android与iOS平台的实践》。
《Android多媒体应用开发实战详解:图像、音频、视频、2D和3D》《Android进阶解密》 《Android音视频的编解码》
《Android音视频开发》
> 研究音频编解码
--看书也是从工程入手,就是在实际工作中和个人兴趣中看了大量的标准,然后对不懂的地方找论文,再找书籍补知识。可以说这是典型的逆向学习。通常研究生是课本->看论文->做工程。
音频编解码技术是一种应用,而一般的书籍都是理论基础。
音频编解码技术分为5大技术,EQTPM,E,熵编码,Q,量化编码,T,变换编码,P,预测编码,M,音频建模(感知建模,BCC建模,正弦建模等).
--1.语音编解码书籍,因为国内讲宽带音频编解码的书籍很少,所以可以看些语音编解码的书籍,里面也有讲EQTP技术。
例如:《语音处理技术》,《语音编码》,《低码率音频编码》,《数字语音编码原理》,《变速率语音编码》《低速率语音编码》《数字语音编码》《数据压缩》《JPEG2000 图像压缩基础》
2.理论基础书籍,《信息论与编码》,《信号与系统》
3.国外的宽音频编码书籍,例如我认为很经典的ANDREAS SPANIAS的《Audio Signal Processing and Coding 》。以及他的63页的论文,《Perceptual Coding of Digital Audio》。
--其他可看的书籍包括:
MP3之父——K. Brandenburg的《Applications of Digital Signal Processing to Audio and Acoustics》
《A Digital Signal Processing Primer, with Applications to Digital Audio and Computer Music》
《Auditory Perception and the MPEG Audio Standard》
《Foundation and Evolution of Standardized Coders (Wiley,2003)(ISBN 0471373125)(578s)》
--汉堡联邦国防军大学Udo Zolzer教授的《Digital Audio Signal Processing》
《High-Fidelity Multichannel Audio Coding》《Speech Coding Algorithms》
4.其他类书籍
--专门书籍,如《自适应信号处理》,因为音频编码也好其他音频技术也好,自适应技术是经常使用的。例如无损编码的Wavpack,MPEG4 ALS,都使用了自适应技术。
-- 滤波器设计的相关书籍。《多抽样率数字信号处理理论及其应用》:讲解Transform技术。
HE-AAC和ATRAC3,使用的QMF;MP3 使用的PQF;AAC,MP3使用的MDCT;AC3使用的TDAC(MDCT);WMA和G。722.1的(MLT);
> 其他
《通信原理》《数字信号》。数字信号处理与音频处理(使用Audition),《数字信号处理》。