PCM数据的采集和播放

一、初识PCM

以下介绍来自百度百科

PCM 脉冲编码调制是Pulse Code Modulation的缩写。脉冲编码调制是数字通信的编码方式之一。主要过程是将话音、图像等模拟信号每隔一定时间进行取样,使其离散化,同时将抽样值按分层单位四舍五入取整量化,同时将抽样值按一组二进制码来表示抽样脉冲的幅值。

简而言之,语音、图像经过采样、量化之后进行二进制编码,最后得到的二进制码即为PCM数据。

二、Android平台上的实现

1、采集

对于音频的采集使用AudioRecord:

The AudioRecord class manages the audio resources for Java applications
to record audio from the audio input hardware of the platform

AudioRecord用于管理音频源,从音频输入硬件记录音频。
下面开始一步步来实现:

权限



创建文件

audioFile = new File(Environment.getExternalStorageDirectory().getAbsolutePath() +
                "/test.pcm");
if (audioFile.exists()) {
    audioFile.delete();
}
audioFile.createNewFile();
OutputStream os = new FileOutputStream(audioFile);

创建的PCM文件用于存储采集的音频,输出流用于将音频数据写入到文件。

创建AudioRecord对象

AudioRecord有两个构造方法,其中一个被@SystemApi标记,故一般使用另外一个:

public AudioRecord(int audioSource, int sampleRateInHz, 
    int channelConfig, int audioFormat,int bufferSizeInBytes)
  • audioSource
    记录源,在 MediaRecorder.AudioSource中可看到所有类型,此处传入MediaRecorder.AudioSource.MIC。
  • sampleRateInHz
    采样频率,单位Hz,常见的有44100,22050、16000,、和11025 ,其中44100可以保证在所有设备上正常工作,此处取该值。
  • channelConfig
    音频通道设置,有AudioFormat.CHANNEL_IN_MONOAudioFormat.CHANNEL_IN_STEREO,前者可以保证在所有设备上正常工作,此处取该值。
  • audioFormat
    音频格式,有AudioFormat.ENCODING_PCM_8BIT、AudioFormat.ENCODING_PCM_16BIT和AudioFormat.ENCODING_PCM_FLOAT,精度依次递增,此处取16bit。
  • bufferSizeInBytes
    缓冲区大小,单位是byte,可调用以下方法获取:
getMinBufferSize(int sampleRateInHz, int channelConfig, int audioFormat)

开始记录

audioRecord.startRecording();
byte bytes[] = new byte[minBufferSize];
while (isRecord) {
    int length = audioRecord.read(bytes, 0, minBufferSize);
    if (length > 0) {
         os.write(bytes);
    }
}

停止记录

audioRecord.stop();
audioRecord.release();

2、播放

创建播放器

使用AudioTrack播放PCM,在SDK23前后,创建的方法不一样:

int sampleRateInHz = 44100;
int channelConfig = AudioFormat.CHANNEL_OUT_MONO;
int audioFormat = AudioFormat.ENCODING_PCM_16BIT;
int minBufferSize = AudioTrack.getMinBufferSize(sampleRateInHz , channelConfig , audioFormat);
int length = minBufferSize + 1024;
if (Build.VERSION.SDK_INT >= 23) {
    player = new AudioTrack.Builder()
    .setAudioFormat(new AudioFormat.Builder()
    .setEncoding(audioFormat)
    .setSampleRate(sampleRateInHz)
    .setChannelMask(channelConfig)
    .build())
    .setBufferSizeInBytes(length)
    .build();
} else {
    player = new AudioTrack(AudioManager.STREAM_MUSIC, sampleRateInHz,
                            channelConfig, audioFormat,
                            length, MODE_STREAM);
}

上面的几个参数与创建AudioRecord时是相似且对应的,但是注意channelConfig有in和out的区别。
关于length这个参数,最初使用的如下方式:

int length = (int) audioFile.length();

实测发现过大或者过小都有可能引发“play() called on uninitialized AudioTrack”的异常,现在的写法是借鉴了stackoverflow的解决方法。

给播放器写入数据

InputStream is = new FileInputStream(audioFile);
int read;
while ((read = is.read(bytes)) > 0) {
     player.write(bytes, 0, read);
}

很眼熟吧,其实就是Java输入流的基本用法。

播放

调用player.play();

停止播放

if (player != null && player.getPlayState() == AudioTrack.PLAYSTATE_PLAYING) {
    player.stop();
    player.release();
}

把与停止无关的判断也一并写在这里了,因为实际开发时是很有必要进行这样的判断的。

后记

一直以来都对音视频领域比较感兴趣,奈何工作上一直没有机会基础,无意间看见Jhuster大神的Android 音视频开发入门指南,决定利用闲暇时间入坑,在此表示感谢。

源码
Thanks
Android 音视频开发入门指南
Android音频处理

你可能感兴趣的:(PCM数据的采集和播放)