音频一般是采用成PCM格式,而计算PCM格式音频尺寸,就需要如下几个参数。
通道数,采样频率,采用格式。
通道数:个人理解,就是同时有个几个设备在进行音频的采样,最少为1,一般通道数越多,音质越好。
采样频率:(也称为采样速度或者采样频率)定义了每秒从连续信号中提取并组成离散信号的采样个数,它用赫兹(Hz)来表示。
采用位数:既然采样频率表示每秒采样的个数,那么如何描述每个采样点呢?用什么方法独立每个采样点值的区别呢?也就是如何度量每个采样点,而这正是采样格式出现的意义。通常使用16bit,也就是2的16次方,共有65536个不同的度量值,这样采样位数越高,音频度量化的就越精细,音质同样也就越高。
所以音频所占用字节数 = 通道数 * 采用频率(Hz) * 采用位数(byte)
而在ffmpeg里面就使用av_sample_get_buffer_size来计算音频占用的字节数。
int av_samples_get_buffer_size(int *linesize, int nb_channels, int nb_samples, enum AVSampleFormat sample_fmt, int align) { int line_size; int sample_size = av_get_bytes_per_sample(sample_fmt); int planar = av_sample_fmt_is_planar(sample_fmt); /* validate parameter ranges */ if (!sample_size || nb_samples <= 0 || nb_channels <= 0) return AVERROR(EINVAL); /* auto-select alignment if not specified */ if (!align) { if (nb_samples > INT_MAX - 31) return AVERROR(EINVAL); align = 1; nb_samples = FFALIGN(nb_samples, 32); } /* check for integer overflow */ if (nb_channels > INT_MAX / align || (int64_t)nb_channels * nb_samples > (INT_MAX - (align * nb_channels)) / sample_size) return AVERROR(EINVAL); line_size = planar ? FFALIGN(nb_samples * sample_size, align) : FFALIGN(nb_samples * sample_size * nb_channels, align); if (linesize) *linesize = line_size; return planar ? line_size * nb_channels : line_size; }
参考:
1, http://blog.csdn.net/oldmtn/article/details/7568452
2. http://blog.csdn.net/oldmtn/article/details/7743445
参考:
1, http://blog.csdn.net/oldmtn/article/details/7568452
2. http://blog.csdn.net/oldmtn/article/details/7743445