解决Android 音频Xrun问题

音频文件在播放时出现声音断断续续,一卡一卡的或类似“爆破”(Pop-Click)杂音的现象,称之为 Xrun(可以是 underrun,也可以是 overrun)。

分析:

alsa driver使用了环形缓冲区对dma buffer进行管理,如下图。

播放时,应用程序把音频数据源源不断地写入dma buffer中,然后相应platform的dma操作则不停地从该buffer中取出数据,经dai送往codec中,当写入的数据慢,播放的数据快时声音会出现断断续续,一卡一卡的现象。

录音时,codec源源不断地把A/D转换好的音频数据经过dai送入dma buffer中,而应用程序则不断地从该buffer中读走音频数据,当写入的数据快,播放的数据慢时,当数据量较多buffer有可能被冲掉,声音会出现类似“爆破”(Pop-Click)杂音的现象。

[RK3288][Android5.1] 调试如下:

1、播放的数据快,写入的数据慢时,触发DMA中断,将音频数据写入dma buffer中,出现一卡一卡的现象!检查codec和machine的采样频率,设置ASoc框架的Codec驱动和Machine驱动的输出freq = 12288000。

//设置codec dai的主时钟,采样率
static int xvf3500_set_dai_sysclk(struct snd_soc_dai *codec_dai,int clk_id, unsigned int freq, int dir)
{
...
	freq = 12288000;

	switch (freq) {
...
		case 12288000:
		case 16934400:
		case 24576000:
		case 33868800:
			xvf3500->sysclk_constraints = &constraints_12288;
			xvf3500->sysclk = freq;
			return 0;
...
	}

	return -EINVAL;
}	
//在machine设置codec dai采样率,保持codec驱动采样率一致
static int rk29_xvf3500_init(struct snd_soc_pcm_runtime *rtd)
{
...
    
    ret = snd_soc_dai_set_sysclk(codec_dai, 0,12288000, SND_SOC_CLOCK_IN);
	if (ret < 0) {
		printk(KERN_ERR "Failed to set xvf3500 SYSCLK: %d\n", ret);
		return ret;
	}
...
    return 0;
}

2、当写入的数据快,播放的数据慢时,当数据量较多buffer有可能被冲掉,声音会出现类似“爆破”或“呲呲”杂音的现象。通过调整硬件抽象层的period_size和period_count,来改变dma的传输数据量。


struct pcm_config {
    unsigned int channels;
    unsigned int rate;
    unsigned int period_size;
    unsigned int period_count;
    enum pcm_format format;
    unsigned int start_threshold;
    unsigned int stop_threshold;
    unsigned int silence_threshold;
    int avail_min;
};

合理的pcm_config可以做到更好的低时延和功耗。解释一下结构中的各个参数,每个参数的单位都是frame(1帧 = 通道*采样位深):

  • period_size. 每次传输的数据长度。值越小,时延越小,cpu占用就越高。
  • period_count. 缓之冲区period的个数。缓冲区越大,发生XRUN的机会就越少。
  • format. 定义数据格式,如采样位深,大小端。
  • start_threshold. 缓冲区的数据超过该值时,硬件开始启动数据传输。如果太大, 从开始播放到声音出来时延太长,甚至可导致太短促的声音根本播不出来;如果太小, 又可能容易导致XRUN.
  • stop_threshold. 缓冲区空闲区大于该值时,硬件停止传输。默认情况下,这个数 为整个缓冲区的大小,即整个缓冲区空了,就停止传输。但偶尔的原因导致缓冲区空, 如CPU忙,增大该值,继续播放缓冲区的历史数据,而不关闭再启动硬件传输(一般此 时有明显的声音卡顿),可以达到更好的体验。
  • silence_threshold. 这个值本来是配合stop_threshold使用,往缓冲区填充静音 数据,这样就不会重播历史数据了。但如果没有设定silence_size,
  • avail_min. 缓冲区空闲区大于该值时,pcm_mmap_write()才往缓冲写数据。这个 值越大,往缓冲区写入数据的次数就越少,面临XRUN的机会就越大。Android samsung tuna 设备在screen_off时增大该值以减小功耗,在screen_on时减小该 值以减小XRUN的机会。

在不同的场景下,合理的参数就是在性能、时延、功耗等之间达到较好的平衡。

//修改HAL层的period_size 和 period_count路径...hardware/rockchip/audio/tinyalsa_hal/audio_hw.h
//播放
struct pcm_config pcm_config = {
     .channels = 2,
     .rate = 48000,
     .period_size = 2048,
     .period_count = 4,
     .format = PCM_FORMAT_S16_LE,
 };
//录音
struct pcm_config pcm_config_in = {
     .channels = 2,
     .rate = 48000,
     .period_size = 128,//1024
     .period_count = 32,//4
     .format = PCM_FORMAT_S16_LE,
 };

调试技巧:实时录音会有呲呲噪音问题,修改pcm_config_in的period size和period_count大小,使其period_size * period_count的乘积为4096不变。

总结:

这种方法通过增加或减少音频数据的 period_count或period_size来进行补偿。但这样也会使音频播放/录音的数据准备时间变长,增加音频操作的延迟。

你可能感兴趣的:(Linux内核与驱动,Android系统架构)