FFMPEG工程浩大,可以参考的书籍又不是很多,因此很多刚学习FFMPEG的人常常感觉到无从下手。
在此我把自己做项目过程中实现的一个非常简单的音频播放器(大约200行代码)源代码传上来,以作备忘,同时方便新手学习FFMPEG。
该播放器虽然简单,但是几乎包含了使用FFMPEG播放一个音频所有必备的API,并且使用SDL输出解码出来的音频。
并且支持流媒体等多种音频输入。
程序使用了新的FFMPEG类库,和早期版本的FFMPEG类库的API函数略有不同。
平台使用VC2010
注意:
1.程序输出的解码后PCM音频数据可以使用Audition打开播放
2.m4a,aac文件可以直接播放。mp3文件需要调整SDL音频帧大小为4608(默认是4096),否则播放会不流畅
3.也可以播放视频中的音频
贴上程序代码:
-
-
-
-
-
-
-
- #include <stdlib.h>
- #include <string.h>
- extern "C"
- {
- #include "libavcodec/avcodec.h"
- #include "libavformat/avformat.h"
-
- #include "sdl/SDL.h"
- #include "sdl/SDL_thread.h"
- };
- #include "decoder.h"
-
-
-
-
-
- static Uint8 *audio_chunk;
- static Uint32 audio_len;
- static Uint8 *audio_pos;
-
-
-
-
-
-
-
-
-
- void fill_audio(void *udata,Uint8 *stream,int len){
-
- if(audio_len==0)
- return;
-
- len=(len>audio_len?audio_len:len);
- SDL_MixAudio(stream,audio_pos,len,SDL_MIX_MAXVOLUME);
- audio_pos += len;
- audio_len -= len;
- }
-
-
-
- int decode_audio(char* no_use)
- {
- AVFormatContext *pFormatCtx;
- int i, audioStream;
- AVCodecContext *pCodecCtx;
- AVCodec *pCodec;
-
- char url[300]={0};
- strcpy(url,no_use);
-
- av_register_all();
-
-
- avformat_network_init();
-
- pFormatCtx = avformat_alloc_context();
-
-
- if(avformat_open_input(&pFormatCtx,url,NULL,NULL)!=0){
- printf("Couldn't open file.\n");
- return -1;
- }
-
-
- if(av_find_stream_info(pFormatCtx)<0)
- {
- printf("Couldn't find stream information.\n");
- return -1;
- }
-
- av_dump_format(pFormatCtx, 0, url, false);
-
-
- audioStream=-1;
- for(i=0; i < pFormatCtx->nb_streams; i++)
-
- if(pFormatCtx->streams[i]->codec->codec_type==AVMEDIA_TYPE_AUDIO)
- {
- audioStream=i;
- break;
- }
-
- if(audioStream==-1)
- {
- printf("Didn't find a audio stream.\n");
- return -1;
- }
-
-
- pCodecCtx=pFormatCtx->streams[audioStream]->codec;
-
-
- pCodec=avcodec_find_decoder(pCodecCtx->codec_id);
- if(pCodec==NULL)
- {
- printf("Codec not found.\n");
- return -1;
- }
-
-
- if(avcodec_open(pCodecCtx, pCodec)<0)
- {
- printf("Could not open codec.\n");
- return -1;
- }
-
-
- FILE *pFile;
- #ifdef _WAVE_
- pFile=fopen("output.wav", "wb");
- fseek(pFile, 44, SEEK_SET);
- #else
- pFile=fopen("output.pcm", "wb");
- #endif
-
-
- FILE *pTSFile;
- pTSFile=fopen("audio_time_stamp.txt", "wb");
- if(pTSFile==NULL)
- {
- printf("Could not open output file.\n");
- return -1;
- }
- fprintf(pTSFile, "Time Base: %d/%d\n", pCodecCtx->time_base.num, pCodecCtx->time_base.den);
-
-
-
- AVPacket *packet=(AVPacket *)malloc(sizeof(AVPacket));
- av_init_packet(packet);
-
-
-
- AVFrame *pFrame;
- pFrame=avcodec_alloc_frame();
-
-
-
- if(SDL_Init(SDL_INIT_VIDEO | SDL_INIT_AUDIO | SDL_INIT_TIMER)) {
- printf( "Could not initialize SDL - %s\n", SDL_GetError());
- exit(1);
- }
-
-
- SDL_AudioSpec wanted_spec;
- wanted_spec.freq = pCodecCtx->sample_rate;
- wanted_spec.format = AUDIO_S16SYS;
- wanted_spec.channels = pCodecCtx->channels;
- wanted_spec.silence = 0;
- wanted_spec.samples = 1024;
-
- wanted_spec.callback = fill_audio;
- wanted_spec.userdata = pCodecCtx;
-
- if (SDL_OpenAudio(&wanted_spec, NULL)<0)
- {
- printf("can't open audio.\n");
- return 0;
- }
-
- printf("比特率 %3d\n", pFormatCtx->bit_rate);
- printf("解码器名称 %s\n", pCodecCtx->codec->long_name);
- printf("time_base %d \n", pCodecCtx->time_base);
- printf("声道数 %d \n", pCodecCtx->channels);
- printf("sample per second %d \n", pCodecCtx->sample_rate);
-
-
-
- uint32_t ret,len = 0;
- int got_picture;
- int index = 0;
- while(av_read_frame(pFormatCtx, packet)>=0)
- {
- if(packet->stream_index==audioStream)
- {
-
-
-
-
-
- ret = avcodec_decode_audio4( pCodecCtx, pFrame,
- &got_picture, packet);
- if ( ret < 0 )
- {
- printf("Error in decoding audio frame.\n");
- exit(0);
- }
- if ( got_picture > 0 )
- {
- #if 1
- printf("index %3d\n", index);
- printf("pts %5d\n", packet->pts);
- printf("dts %5d\n", packet->dts);
- printf("packet_size %5d\n", packet->size);
-
-
- #endif
-
-
- #if 1
- fwrite(pFrame->data[0], 1, pFrame->linesize[0], pFile);
-
-
- index++;
-
- #endif
- }
- #if 1
-
-
-
- audio_chunk = (Uint8*) pFrame->data[0];
-
- audio_len = pFrame->linesize[0];
-
-
-
-
-
- audio_pos = audio_chunk;
-
- SDL_PauseAudio(0);
-
- while(audio_len>0)
- SDL_Delay(1);
-
- #endif
- }
-
-
- av_free_packet(packet);
- }
-
-
- #ifdef _WAVE_
- fseek(pFile, 0, SEEK_SET);
- struct WAVE_HEADER wh;
-
- memcpy(wh.header.RiffID, "RIFF", 4);
- wh.header.RiffSize = 36 + len;
- memcpy(wh.header.RiffFormat, "WAVE", 4);
-
- memcpy(wh.format.FmtID, "fmt ", 4);
- wh.format.FmtSize = 16;
- wh.format.wavFormat.FormatTag = 1;
- wh.format.wavFormat.Channels = pCodecCtx->channels;
- wh.format.wavFormat.SamplesRate = pCodecCtx->sample_rate;
- wh.format.wavFormat.BitsPerSample = 16;
- calformat(wh.format.wavFormat);
-
- memcpy(wh.data.DataID, "data", 4);
- wh.data.DataSize = len;
-
- fwrite(&wh, 1, sizeof(wh), pFile);
- #endif
- SDL_CloseAudio();
-
- fclose(pFile);
-
- avcodec_close(pCodecCtx);
-
- av_close_input_file(pFormatCtx);
-
- return 0;
- }
程序会打印每一帧的信息
运行截图:
完整工程下载地址:
http://download.csdn.net/detail/leixiaohua1020/6033893
完整工程(更新版)下载地址:
http://download.csdn.net/detail/leixiaohua1020/7319225
新版本中使用了最新版本的FFMPEG类库(2014.5.7)。FFMPEG在新版本中的音频解码方面发生了比较大的变化。如果将旧版的主程序和新版的类库组合使用的话,会出现听到的都是杂音这一现象。经过研究发现,新版中avcodec_decode_audio4()解码后输出的音频采样数据格式为AV_SAMPLE_FMT_FLTP(float, planar)而不再是AV_SAMPLE_FMT_S16(signed 16 bits)。因此无法直接使用SDL进行播放。
最后的解决方法是使用SwrContext对音频采样数据进行转换之后,再进行输出播放,问题就可以得到解决了。转换方面的代码如下示例:
-
- int out_linesize;
-
- int out_buffer_size=av_samples_get_buffer_size(&out_linesize, pCodecCtx->channels,pCodecCtx->frame_size,pCodecCtx->sample_fmt, 1);
- uint8_t *out_buffer=new uint8_t[out_buffer_size];
- ...
- au_convert_ctx = swr_alloc();
- au_convert_ctx=swr_alloc_set_opts(au_convert_ctx,AV_CH_LAYOUT_STEREO, AV_SAMPLE_FMT_S16, 44100,
- pCodecCtx->channel_layout,pCodecCtx->sample_fmt , pCodecCtx->sample_rate,0, NULL);
- swr_init(au_convert_ctx);
-
- while(av_read_frame(pFormatCtx, packet)>=0){
- ......
- swr_convert(au_convert_ctx,&out_buffer, out_linesize,(const uint8_t **)pFrame->data , pFrame->nb_samples);
-
- ......
- }