在 Qt 之 WAV文件解析 中给出了WAV文件属性的计算,具体包括文件大小、音频时长、比特率等属性,这里我们再次验证一下这些属性值的计算 。
在计算之前,我们要知道一下wav文件中的三个参数 采样频率、音频通道数、每次采样得到的样本位数 ,这三个参数用来表示声音,同时决定了wav文件的音质,大小。下面简单介绍一下这三个参数。
指每秒钟取得声音样本的次数。采样的过程就是抽取某点的频率值,很显然,在一秒中内抽取的点越多,获取得频率信息更丰富,为了复原波形,采样频率越高,声音的质量也就越好,声音的还原也就越真实,但同时它占的资源比较多。由于人耳的分辨率很有限,太高的频率并不能分辨出来。22050 的采样频率是常用的,44100已是CD音质,超过48000或96000的采样对人耳已经没有意义。
声音的通道的数目。常见的单声道和立体声(双声道),现在发展到了四声环绕(四声道)和5.1声道。如果是双声道,采样就是双份的,文件也差不多要大一倍。
采样位数可以理解为声卡处理声音的解析度。这个数值越大,解析度就越高,录制和回放的声音就越真实。 采样位数也叫采样大小或量化位数。它是用来衡量声音波动变化的一个参数,也就是声卡的分辨率或可以理解为声卡处理声音的解析度。它的数值越大,分辨率也就越高,录制和回放的声音就越真实。
波形数据传输速率(每秒平均字节数) = 采样频率 × 音频通道数 × 每次采样得到的样本位数 / 8
比特率(kbs) = 波形数据传输速率 × 8 / 1000
WAV文件所占大小(字节) = 波形数据传输速率 × 音频文件时长
音频文件时长(秒) = WAV文件所占容量 / 波形数据传输速率
关于以上几个属性我们可以右击wav文件查看文件属性看到这几个值。见下图。
从上述两幅图中我们可以知道这个wav文件的总大小为6947字节,比特率为88kbs,时间为0s,是不是很诧异,为什么这里时间为0呢?实际上windows这里只是按整数显示了音频时长,那么真正的时间怎么计算呢?
这里我们已经知道了wav文件的大小,看上述公式,我们还要知道波形数据传输速率,波形数据传输速率而又是由采样频率 、 音频通道数 、 每次采样得到的样本位数 来决定,那么这些参数怎么获取到呢?
看过Qt 之 解析wav文件的头信息(详细分析、对比不同wav文件的数据)这篇文章就应该知道如何去解析一个wav文件,并获取所有的文件头信息,如果不知道文件头信息是什么,请参考Qt 之 WAV文件解析。
好了,既然对于一个wav文件,我们能够获取到所有的头信息,那么接下来就来验证以上公式计算的结果。
上图为wav文件的头信息数据,我们可以看到波形数据传输速率(nBytesPerSecond)的值为11025,文件总大小为6947字节,音频数据大小为6903字节,文件头信息为44字节。
音频文件时长(秒) = WAV文件所占容量 / 波形数据传输速率 = 6903 / 11025 = 0.626122 s
比特率(kbs) = 波形数据传输速率 × 8 / 1000 = 11025 × 8 / 1000 = 88 kbs
这里为什么精确到小数点后六位,其实也是为了与程序记录的时间做对比,这里也要特别注意:实际上 WAV文件所占容量 为 WAV文件中 音频数据大小 ,而并非WAV文件总大小 , 但是 文件头信息所占字节非常小,所以就算是将这块大小加上进行计算,对最后的计算结果影响也非常小。下面我们就用QAudioOutput 来播放这个wav文件,同时记录播放时间 。
// 播放wav文件
void MyAudioInput::onPlay()
{
sourceFile.setFileName(WAV_RECORD_FILENAME);
sourceFile.open(QIODevice::ReadOnly);
// 设置播放音频格式;
QAudioFormat format;
format.setSampleRate(11025);
format.setChannelCount(1);
format.setSampleSize(8);
format.setCodec("audio/pcm");
// wav文件即按照这个字节存储顺序保存数据;
format.setByteOrder(QAudioFormat::LittleEndian);
format.setSampleType(QAudioFormat::UnSignedInt);
QAudioDeviceInfo info(QAudioDeviceInfo::defaultOutputDevice());
//qDebug() << info.supportedCodecs();
if (!info.isFormatSupported(format))
{
qWarning() << "Raw audio format not supported by backend, cannot play audio.";
return;
}
m_audioOutput = new QAudioOutput(format, this);
connect(m_audioOutput, SIGNAL(stateChanged(QAudio::State)), this, SLOT(handleStateChanged(QAudio::State)));
m_audioOutput->start(&sourceFile);
m_time.start();
}
// 播放状态更新;
void MyAudioInput::handleStateChanged(QAudio::State state)
{
switch (state) {
case QAudio::IdleState:
// Finished playing (no more data)
qDebug() << "elapsedUSecs:" << m_audioOutput->elapsedUSecs();
qDebug() << "time : " << m_time.elapsed();
onStopPlay();
break;
case QAudio::StoppedState:
// Stopped for other reasons
if (m_audioOutput->error() != QAudio::NoError) {
// Error handling
}
break;
default:
break;
}
}
// 关闭播放;
void MyAudioInput::onStopPlay()
{
if (m_audioOutput != NULL)
{
m_audioOutput->stop();
sourceFile.close();
delete m_audioOutput;
m_audioOutput = NULL;
}
}
代码中我分别用了QAudioOutput类的elapsedUSecs方法和QTime类的elapsed方法来记录wav文件音频时长。以下是两个方法的介绍。
elapsedUSecs() 输出为微妙
elapsed() 输出为毫秒
通过记录得到以下数据:
m_audioOutput->elapsedUSecs() : 636000
m_time.elapsed() : 635m_audioOutput->elapsedUSecs() : 639000
m_time.elapsed() : 638m_audioOutput->elapsedUSecs() : 642000
m_time.elapsed() : 641m_audioOutput->elapsedUSecs() : 639000
m_time.elapsed() : 639
而我们的计算结果为: 0.626122 s = 626.122 ms = 626122 us , 显然程序中获取的时间大于计算的时间,这也很好理解,因为程序的运行需要消耗一定的时间,所以记录的时间存在很小的误差(误差范围大致在0.009s ~ 0.016s),如果电脑性能更好这个误差就越小。
这里我们用QAudioOutput类来计算wav文件时长,这里我们要给QAudioOutput类对象设置播放格式QAudioFormat ,设置的格式必须与解析出来的文件头信息中的 采样频率、音频通道数、每次采样得到的样本位数、编码格式等严格保持一致,否则不仅播放出来的声音不清楚,记录的音频时长也有问题。
通过以上发现,我们的计算公式是成立的。基本上我们可以在wav文件头信息中获取wav文件的全部信息,唯一就是wav**文件时长**需要通过文件头中的信息进行计算得到。所以如果我们想要做一个播放器,在播放器上显示一个wav文件的时长,我们就需要先解析wav文件的头信息,通过计算得到文件时长。
Qt 之 WAV文件解析
Qt之实现录音播放及raw(pcm)转wav格式
Qt 之 解析wav文件的头信息(详细分析、对比不同wav文件的数据)