ffmpeg中MPEG2 TS 流解码的流程分析

一、FFMPEG 中MPEG2 TS 流解码的流程分析

    说道具体的音频或者视频格式,一上来就是理论,那是国内混资历的所谓教授的做为, 
对于我们,不合适,还是用自己的方式理解这些晦涩不已的理论吧。 
    其实MPEG2 是一族协议,至少已经成为ISO 标准的就有以下几部分: 
    ISO/IEC-13818-1:系统部分; 
    ISO/IEC-13818-2:视频编码格式; 
    ISO/IEC-13818-3:音频编码格式; 
    ISO/IEC-13818-4:一致性测试; 
    ISO/IEC-13818-5:软件部分; 
    ISO/IEC-13818-6:数字存储媒体命令与控制; 
    ISO/IEC-13818-7:高级音频编码; 
    ISO/IEC-13818-8:系统解码实时接口; 
    我不是很想说实际的音视频编码格式,毕竟协议已经很清楚了,我主要想说说这些部分 
怎么组合起来在实际应用中工作的。 
    第一部分(系统部分)很重要,是构成以MPEG2  为基础的应用的基础.  很绕口,是吧, 
我简单解释一下:比如DVD  实际上是以系统部分定义 的PS  流为基础,加上版权管理等其 
他技术构成的。而我们的故事主角,则是另外 种流格式,TS  流,它在现阶段最大的应用 
是在数字电视节目 的传输 存储上,因此,你可以理解TS  实际上是 种传输协议, 实 
际传输的负载关系不大,只是在TS 中传输了音频,视频或者其他数据。先说一下为什么会 
有这两种格式的出现,PS 适用于没有损耗的环境下面存储,而TS 则适用于可能出现损耗或 
者错误的各种物理网络环境,比如你在公交上看 的电视,很有可能就是基于TS 的DVB-T 
的应用:) 
    我们再来看MPEG2 协议中的一些概念,为理解代码做好功课: 
    l ES(Elementary Stream): 
    wiki 上说An elementary stream (ES) is defined by MPEG communication protocol is
usually the output of an audio or video encoder” 
    恩,很简单吧,就是编码器编出的 组数据,可能是音频的,视频的,或者其他数据。 
说到着,其实可以对编码器的流程思考一下,无非是执行:采样,量化,编码这3个步骤中 
的编码而已(有些设备可能会包含前面的采样和量化) 。关于视频编码的基本理论,还是请 
参考其它的资料。 
    l PES(Packetized Elementary Stream): 
    wiki 上说allows an Elementary stream to be divided into packets” 
    其实可以理解成,把 个源源不断的数据(音频,视频或者其他)流,打断成 段 段, 
以便处理. 
    l TS(Transport Stream): 
    l PS(Program Stream): 
    这两个上面已经有所提及,后面会详细分析TS,我对PS 格式兴趣不大. 
    步入正题 
    才进入正题,恩,看来闲话太多了:(,直接看Code. 
    前面说过,TS  是 种传输协议,因此,对应 FFmpeg,可以认为他是 种封装格式。

因此,对应的代码应该先去libavformat 里面找,很容易找 ,就是mpegts.c:)。还是逐步看 
过来:

[libavformat/utils.c] 

int av_open_input_file(AVFormatContext **ic_ptr, const char *filename,   
                    AVInputFormat *fmt,   
                    int buf_size,   
                    AVFormatParameters *ap)   
{  
    int err, probe_size;   
    AVProbeData probe_data, *pd = &probe_data;   
    ByteIOContext *pb = NULL;   
    pd->filename = "";   
    if (filename)   
        pd->filename = filename;   
    pd->buf = NULL;   
    pd->buf_size = 0;   
    ################################################################################  
    【1】这段代码其实是为了针对不需要Open文件的容器Format 的探测,其实就是使用   
     AVFMT_NOFILE标记的容器格式单独处理,现在只有使用了该标记的Demuxer很少,   
     只有image2_demuxer,rtsp_demuxer,因此我们分析TS时候可以不考虑这部分   
    ################################################################################   
    if (!fmt) {   
       /* guess format if no file can be opened */   
        fmt = av_probe_input_format(pd, 0);   
    }   
    /* Do not open file if the format does not need it. XXX: specific  
        hack needed to handle RTSP/TCP */   
    if (!fmt || !(fmt->flags & AVFMT_NOFILE)) {   
        /* if no file needed do not try to open one */   
        #########################################################################   
        【2】这个函数似乎很好理解,无非是带缓冲的IO的封装,不过我们既然此了,         
        不妨跟踪下去,看看别人对带缓冲的IO 操作封装的实现:)   
        #########################################################################   
        if ((err=url_fopen(&pb, filename, URL_RDONLY)) < 0) {   
            goto fail;   
        }   
        if (buf_size > 0) {   
            url_setbufsize(pb, buf_size);   
        }   
        for(probe_size= PROBE_BUF_MIN; probe_size<=PROBE_BUF_MAX && !fmt; probe_size<<=1){  
            int score= probe_size < PROBE_BUF_MAX ? AVPROBE_SCORE_MAX/4 : 0;   
            /* read probe data */   
            pd->buf= av_realloc(pd->buf, probe_size + AVPROBE_PADDING_SIZE);   
            #######################################################################   
            【3】真正将文件读入 pd 的buffer的地方,实际上最终调用FILE protocol   
             的file_read(),将内容读入 pd 的buf,具体代码如果有兴趣可以自己跟踪   
            #######################################################################   
            pd->buf_size = get_buffer(pb, pd->buf, probe_size);   
            memset(pd->buf+pd->buf_size, 0, AVPROBE_PADDING_SIZE);   
            if (url_fseek(pb, 0, SEEK_SET) < 0) {   
                url_fclose(pb);   
                if (url_fopen(&pb, filename, URL_RDONLY) < 0) {   
                    pb = NULL;   
                    err = AVERROR(EIO);   
                    goto fail;   
                }   
            }   
            #####################################################################   
            【4】此时的pd已经有了需要分析的原始文件,只需要查找相应容器format   
             的Tag 比较,以判断读入的究竟为什么容器格式,这里   
            #####################################################################   
            /* guess file format */   
            fmt = av_probe_input_format2(pd, 1, &score);   
        }   
        av_freep(&pd->buf);   
    }   
    /* if still no format found, error */   
    if (!fmt) {   
        err = AVERROR_NOFMT;   
        goto fail;   
    }   
    /* check filename in case an image number is expected */   
    if (fmt->flags & AVFMT_NEEDNUMBER) {   
        if (!av_filename_number_test(filename)) {   
            err = AVERROR_NUMEXPECTED;   
            goto fail;   
        }   
    }   
    err = av_open_input_stream(ic_ptr, pb, filename, fmt, ap);   
    if (err)   
        goto fail;   
    return 0;   
fail:   
    av_freep(&pd->buf);   
    if (pb)   
        url_fclose(pb);   
    *ic_ptr = NULL;   
    return err;   
}  
【2】带缓冲IO的封装的实现 [liavformat/aviobuf.c] 
int url_fopen(ByteIOContext **s, const char *filename, int flags)   
{   
    URLContext *h;   
    int err;   
    err = url_open(&h, filename, flags);   
    if (err < 0)   
        return err;   
    err = url_fdopen(s, h);   
    if (err < 0) {   
        url_close(h);   
        return err;   
    }   
    return 0;   
}  
  

可以看 ,下面的这个函数,先查找是否是FFmpeg支持的protocol的格式,如果文件 
名不符合,则默认是FILE protocol 格式,很显然,这里protocol判断是以URL的方式判读 
的,因此基本上所有的IO接口函数都是url_xxx的形式。 
    在这也可以看 ,FFmpeg 支持的protocol 有: 
        /* protocols */ 
        REGISTER_PROTOCOL (FILE, file); 
        REGISTER_PROTOCOL (HTTP, http); 
        REGISTER_PROTOCOL (PIPE, pipe); 
        REGISTER_PROTOCOL (RTP, rtp); 
        REGISTER_PROTOCOL (TCP, tcp); 
        REGISTER_PROTOCOL (UDP, udp); 
    而大部分情况下,如果你不指明类似file://xxx,http://xxx  格 式,它都以FILE  protocol
来处理。

[liavformat/avio.c]

int url_open(URLContext **puc, const char *filename, int flags)   
{  
    URLProtocol *up;   
    const char *p;   
    char proto_str[128], *q;   
    p = filename;   
    q = proto_str;   
    while (*p  != '\0' && *p  != ':') {   
        /* protocols can only contain alphabetic chars */   
        if (!isalpha(*p))   
            goto file_proto;   
        if ((q - proto_str) < sizeof(proto_str) - 1)   
            *q++ = *p;   
        p++;   
    }   
    /* if the protocol has length 1, we consider it is a dos drive */   
    if (*p == '\0' || (q - proto_str) <= 1) {   
    file_proto:   
        strcpy(proto_str, "file");   
    } else {   
        *q = '\0';   
    }   
    up = first_protocol;   
    while (up  != NULL) {   
        if (!strcmp(proto_str, up->name))   
            #################################################################   
            很显然,此时已经知道up,filename,flags   
            #################################################################   
            return url_open_protocol (puc, up, filename, flags);   
        up = up->next;   
    }   
    *puc = NULL;   
    return AVERROR(ENOENT);   
}  
[libavformat/avio.c] 
int url_open_protocol (URLContext **puc, struct URLProtocol *up,   
                     const char *filename, int flags)   
{   
    URLContext *uc;   
    int err;   
  
    ##########################################################################   
     【a】? 为什么这样分配空间   
    ##########################################################################   
    uc = av_malloc(sizeof(URLContext) + strlen(filename) + 1);   
    if (!uc) {   
        err = AVERROR(ENOMEM);   
        goto fail;   
    }   
#if LIBAVFORMAT_VERSION_MAJOR >= 53   
    uc->av_class = &urlcontext_class;   
#endif   
    ##########################################################################   
     【b】? 这样的用意又是为什么   
    ##########################################################################   
    uc->filename = (char *) &uc[1];   
    strcpy(uc->filename, filename);   
    uc->prot = up;   
    uc->flags = flags;   
    uc->is_streamed = 0; /* default = not streamed */   
    uc->max_packet_size = 0; /* default: stream file */   
    err = up->url_open(uc, filename, flags);   
    if (err < 0) {   
        av_free(uc);   
        *puc = NULL;   
        return err;   
    }   
    //We must be carefull here as url_seek() could be slow, for example for   
    //http   
    if((flags & (URL_WRONLY | URL_RDWR)) || !strcmp(up->name, "file"))   
        if(!uc->is_streamed && url_seek(uc, 0, SEEK_SET) < 0)   
            uc->is_streamed= 1;   
        *puc = uc;   
    return 0;   
 fail:   
    *puc = NULL;   
    return err;   
}  

上面这个函数不难理解,但有些地方颇值得玩味,比如上面给出问号的地方,你明白 
为什么这样Coding么?很显然,此时up->url_open()实际上调用的是 file_open()
[libavformat/file.c],看完这个函数,对上面的内存分配,是否恍然大悟:) 
    上面只是分析了url_open(),还没有分析url_fdopen(s, h);这部分代码,也留给有好
奇心的你了:)恩,为了追踪这个流程,走得有些远,但不是全然无用:) 
    于来了【4】,我们来看MPEG TS格式的侦测过程,这其实才是我们今天的主角 
    
4. MPEG TS格式的探测过程

[liavformat/mpegts.c] 

static int mpegts_probe(AVProbeData *p)   
{   
#if 1   
    const int size= p->buf_size;   
    int score, fec_score, dvhs_score;   
#define CHECK_COUNT 10   
    if (size < (TS_FEC_PACKET_SIZE * CHECK_COUNT))   
        return -1;   
    score = analyze(p->buf, TS_PACKET_SIZE * CHECK_COUNT, TS_PACKET_SIZE, NULL);  
    dvhs_score = analyze(p->buf, TS_DVHS_PACKET_SIZE *CHECK_COUNT, TS_DVHS_PACKET_SIZE, NULL);  
    fec_score= analyze(p->buf, TS_FEC_PACKET_SIZE*CHECK_COUNT, TS_FEC_PACKET_SIZE, NULL);  
//  av_log(NULL, AV_LOG_DEBUG, "score: %d, dvhs_score: %d, fec_score: %d \n", score, dvhs_score, fec_score);  
//  we need a clear definition for the returned score otherwise things will become messy sooner or later  
    if(score > fec_score && score > dvhs_score && score > 6)  
        return AVPROBE_SCORE_MAX + score - CHECK_COUNT;  
    else if(dvhs_score > score && dvhs_score > fec_score && dvhs_score > 6)  
        return AVPROBE_SCORE_MAX + dvhs_score - CHECK_COUNT;   
    else if(fec_score > 6)  
        return AVPROBE_SCORE_MAX + fec_score - CHECK_COUNT;  
    else  
        return -1;   
#else   
   /* only use the extension for safer guess */   
    if (match_ext(p->filename, "ts"))   
        return AVPROBE_SCORE_MAX;   
    else   
        return 0;   
#endif   
}  
 之所以会出现3种格式,主要原因是:TS标准是188Bytes,而小日本自己又弄了个 
192Bytes的DVH-S格式,第三种的204Bytes则是在188Bytes的基础上,加上16Bytes的 
FEC(前向纠错).
static int analyze(const uint8_t *buf, int size, int packet_size, int *index)   
{   
    int stat[packet_size];   
    int i;   
    int x=0;   
    int best_score=0;   
    memset(stat, 0, packet_size*sizeof(int));   
  
    ##########################################################################   
    由于查找的特定格式至少3 个Bytes,因此,至少最后3 个Bytes 不用查找   
    ##########################################################################   
    for(x=i=0; i<size-3; i++){   
        ######################################################################   
        参看后面的协议说明   
        ######################################################################   
        if(buf[i] == 0x47 && !(buf[i+1] & 0x80) && (buf[i+3] & 0x30)){   
            stat[x]++;   
            if(stat[x] > best_score){   
                best_score= stat[x];   
                if(index)  
                    *index= x;   
            }   
        }  
        x++;   
        if(x == packet_size)  
            x= 0;   
    }   
    return best_score;   
}   
  这个函数简单说来,是在size大小的buf中,寻找满足特定格式,长度为packet_size
的packet的个数,显然,返回的值越大越可能是相应的格式(188/192/204),其中的这个特
定格式,其实就是协议的规定格式:
Syntax                            No. of bits                 Mnemonic  
transport_packet(){   
    sync_byte                              8                     bslbf  
    transport_error_indicator              1                     bslbf  
    payload_unit_start_indicator           1                     bslbf  
    transport_priority                     1                     bslbf  
    PID                                    13                    uimsbf  
    transport_scrambling_control           2                     bslbf  
    adaptation_field_control               2                     bslbf  
    continuity_counter                     4                     uimsbf  
    if(adaptation_field_control=='10' || adaptation_field_control=='11'){  
        adaptation_field()   
    }   
    if(adaptation_field_control=='01' || adaptation_field_control=='11') {  
        for (i=0;i<N;i++){   
            data_byte                      8                     bslbf  
        }   
    }  
}      
其中的sync_byte 固定为0x47,即上面的:    buf[i] == 0x47 
    由于transport_error_indicator 为1 的TS Packet 实际有错误,表示携带的数据无意义,
这样的Packet 显然没什么意义,因此:        !(buf[i+1] & 0x80) 
    对于adaptation_field_control,如果为取值为0x00,则表示为未来保留,现在不用,因此:
buf[i+3] & 0x30 
    这就是MPEG TS的侦测过程,很简单吧:) 
    后面我们分析如何从mpegts文件中获取stream 的过程。
      
5.渐入佳境 
    恩,前面的基础因该已近够了,有点像手剥洋葱头的感 ,我们来看看针对MPEG TS 
的相应解析过程。我们后面的代码,主要集中在[libavformat/mpegts.c]里面,毛爷爷说:集
中优势兵力打围歼,恩,开始吧,蚂蚁啃骨头。
static int mpegts_read_header(AVFormatContext *s,   
                            AVFormatParameters *ap)   
{   
    MpegTSContext *ts = s->priv_data;   
    ByteIOContext *pb = s->pb;   
    uint8_t buf[1024];   
    int len;   
    int64_t pos;   
    ......   
    /* read the first  1024 bytes to get packet size */   
    #####################################################################   
    【1】有了前面分析缓冲IO 的经历,下面的代码就不是什么问题了:)   
    #####################################################################   
    pos = url_ftell(pb);   
    len = get_buffer(pb, buf, sizeof(buf));   
    if (len != sizeof(buf))   
        goto fail;   
    #####################################################################   
    【2】前面侦测文件格式时候其实已经知道TS 包的大小了,这里又侦测 次,其实   
     有些多余,估计是因为解码框架的原因,已近侦测的包大小没能从前面被带过来,   
     可见框架虽好,却也会带来或多或少的 些不利影响   
    #####################################################################   
    ts->raw_packet_size = get_packet_size(buf, sizeof(buf));   
    if (ts->raw_packet_size <= 0)   
        goto fail;   
    ts->stream = s;   
    ts->auto_guess = 0;   
  
    if (s->iformat == &mpegts_demuxer)  {   
        /* normal demux */   
        /* first do a scaning to get all the services */   
        url_fseek(pb, pos, SEEK_SET);   
        #########  
        【3】   
        #########  
        mpegts_scan_sdt(ts);   
        #########  
        【4 】   
        #########  
        mpegts_set_service(ts);   
        #########  
        【5】   
        #########  
        handle_packets(ts, s->probesize);   
        /* if could not find service, enable auto_guess */   
        ts->auto_guess = 1;   
#ifdef DEBUG_SI   
        av_log(ts->stream, AV_LOG_DEBUG, "tuning done\n");   
#endif   
        s->ctx_flags |= AVFMTCTX_NOHEADER;   
    } else {   
      ......   
    }   
    url_fseek(pb, pos, SEEK_SET);   
    return 0;   
fail:   
    return -1;   
}  
这里简单说一下MpegTSContext *ts,从上面可以看 ,其实这是为了解码不同容器格式所使用的私有数据,
只有在相应的诸如mpegts.c文件才可以使用的,这样,增加了这个库的模块化,而模块化的最大好处,
则在于把问题集中了个很小的有限区域里面,如果你自己构造程序时候,不妨多参考其基本思想--这样的化,
你之后的代码,还有你之后的生活,都将轻松许多。
    【3】【4】其实调用的是同个函数:mpegts_open_section_filter() 我们来看看意欲何为。
static MpegTSFilter *mpegts_open_section_filter(MpegTSContext *ts, unsigned int pid,   
                                           SectionCallback *section_cb,   
                                           void *opaque,   
                                           int check_crc)   
{   
    MpegTSFilter *filter;   
    MpegTSSectionFilter *sec;   
#ifdef DEBUG_SI   
    av_log(ts->stream, AV_LOG_DEBUG, "Filter: pid=0x%x\n", pid);   
#endif   
    if (pid >= NB_PID_MAX || ts->pids[pid])   
        return NULL;   
    filter = av_mallocz(sizeof(MpegTSFilter));   
    if (!filter)   
        return NULL;   
    ts->pids[pid] = filter;   
    filter->type = MPEGTS_SECTION;   
    filter->pid = pid;   
    filter->last_cc = -1;   
    sec = &filter->u.section_filter;   
    sec->section_cb = section_cb;   
    sec->opaque = opaque;   
    sec->section_buf = av_malloc(MAX_SECTION_SIZE);   
    sec->check_crc = check_crc;   
    if (!sec->section_buf) {   
        av_free(filter);   
        return NULL;   
    }   
    return filter;   

 要完全明白这部分代码,其实需要分析作者对数据结构的定义: 
    依次为: 
            struct MpegTSContext; 
                     | 
                     V 
            struct MpegTSFilter; 
                     | 
                     V 
       +---------------+---------------+ 
       |                                    | 
       V                                   V 
       MpegTSPESFilter              MpegTSSectionFilter

    其实很简单,就是struct MpegTSContext;中有NB_PID_MAX(8192)个TS 的Filter,而 
每个struct MpegTSFilter 可能是PES 的Filter 或者Section 的Filter。 
    我们先说为什么是8192,在前面的分析中: 
    给出过TS 的语法结构: 

Syntax                       No. of bits       Mnemonic   
    transport_packet(){   
        sync_byte                     8            bslbf   
        transport_error_indicator     1            bslbf   
        payload_unit_start_indicator  1            bslbf   
        transport_priority            1            bslbf   
        PID                           13           uimsbf   
        transport_scrambling_control  2            bslbf   
        adaptation_field_control      2            bslbf   
        continuity_counter            4            uimsbf   
        if(adaptation_field_control=='10' || adaptation_field_control=='11'){  
            adaptation_field()   
        }   
        if(adaptation_field_control=='01' || adaptation_field_control=='11') {   
            for (i=0;i<N;i++){   
                data_byte             8            bslbf   
            }   
        }   
    }   

而8192,则是2^13=8192(PID)的最大数目,而为什么会有PES 和Section 的区分,请参 
考ISO/IEC-13818-1,我实在不太喜欢重复已有的东西. 
    可见【3】【4】,就是挂载了两个Section 类型的过滤器,其实在TS 的两种负载中,section 
是PES 的元数据,只有先解析了section,才能进 步解析PES 数据,因此先挂上section 的 
过滤器。 
    挂载上了两种 section 过滤器,如下: 
    ================================================================== 
    PID                     Section Name                        Callback 
    ================================================================== 
    SDT_PID(0x0011)       ServiceDescriptionTable                  sdt_cb 
    PAT_PID(0x0000)       ProgramAssociationTable                  pat_cb

    既然自是挂上Callback,自然是在后面的地方使用,因此,我们还是继续 
    【5】处的代码看看是最重要的地方了,简单看来: 
    handle_packets() 
        | 
        +->read_packet() 
        | 
        +->handle_packet() 
            | 
            +->write_section_data() 
    read_packet()很简单,就是去找sync_byte(0x47),而看来handle_packet()才会是我们真正 
因该关注的地方了:) 
    这个函数很重要,我们贴出代码,以备分析:

/* handle one TS packet */   
static void handle_packet(MpegTSContext *ts, const uint8_t *packet)   
{   
    AVFormatContext *s = ts->stream;   
    MpegTSFilter *tss;   
    int len, pid, cc, cc_ok, afc, is_start;   
    const uint8_t *p, *p_end;   
  
    ##########################################################   
    获取该包的PID   
    ##########################################################   
    pid = AV_RB16(packet + 1) & 0x1fff;   
    if(pid && discard_pid(ts, pid))   
        return;   
    ##########################################################   
    是否是PES 或者Section 的开头(payload_unit_start_indicator)   
    ##########################################################   
  
    is_start = packet[1] & 0x40;   
    tss = ts->pids[pid];   
  
    ##########################################################   
    ts->auto_guess 此时为0,因此不考虑下面的代码   
     ##########################################################   
    if (ts->auto_guess && tss == NULL && is_start) {   
       add_pes_stream(ts, pid, -1, 0);   
       tss = ts->pids[pid];   
    }   
    if (!tss)   
       return;   
  
    ##########################################################   
    代码说的很清楚,虽然检查,但不利用检查的结果   
    ##########################################################   
    /* continuity check (currently not used) */   
    cc = (packet[3] & 0xf);   
    cc_ok = (tss->last_cc < 0) || ((((tss->last_cc + 1) & 0x0f) == cc));   
    tss->last_cc = cc;   
  
    ##########################################################   
    跳 adaptation_field_control   
    ##########################################################   
    /* skip adaptation field */   
    afc = (packet[3] >> 4) & 3;   
    p = packet + 4;   
    if (afc == 0) /* reserved value */   
       return;   
    if (afc == 2) /* adaptation field only */   
       return;   
    if (afc == 3) {   
       /* skip adapation field */   
       p += p[0] + 1;   
    }   
  
    ##########################################################   
    p已近 达TS 包中的有效负载的地方   
    ##########################################################   
    /* if past the end of packet, ignore */   
    p_end = packet + TS_PACKET_SIZE;   
    if (p >= p_end)   
       return;   
  
    ts->pos47= url_ftell(ts->stream->pb) % ts->raw_packet_size;   
  
    if (tss->type == MPEGTS_SECTION)  {   
        if (is_start) {   
        ###############################################################   
        针对Section,符合部分第 个字节为pointer field,该字段如果为0,   
        则表示后面紧跟着的是Section的开头,否则是某Section的End部分和   
         另 Section 的开头,因此,这里的流程实际上由两个值is_start   
        (payload_unit_start_indicator)和len(pointer field)起来决定   
         ###############################################################   
        /* pointer field present */   
        len = *p++;   
        if (p + len > p_end)   
            return;   
        if (len && cc_ok) {   
            ########################################################   
            1).is_start == 1   
            len > 0   
            负载部分由A Section 的End 部分和B Section 的Start 组成,把A 的   
              End 部分写入   
              ########################################################   
            /* write remaining section bytes */   
            write_section_data(s, tss, p, len, 0);   
            /* check whether filter has been closed */   
            if (!ts->pids[pid])   
                return;   
        }   
        p += len;   
        if (p < p_end) {   
            ########################################################   
            2).is_start == 1   
            len > 0   
            负载部分由A Section 的End 部分和B Section 的Start 组成,把B  的   
              Start 部分写入   
              或者:   
              3).   
            is_start == 1   
            len == 0   
            负载部分仅是 个Section 的Start 部分,将其写入   
              ########################################################   
            write_section_data(s, tss, p, p_end - p, 1);   
        }   
    } else if (cc_ok) {   
        ########################################################   
        4).is_start == 0   
        负载部分仅是 个Section 的中间部分部分,将其写入  
         ########################################################   
        write_section_data(s, tss, p, p_end - p, 0);   
    } else {   
        ##########################################################   
        如果是PES 类型,直接调用其Callback,但显然,只有Section 部分   
         解析完成后才可能解析PES   
        ##########################################################   
        tss->u.pes_filter.pes_cb(tss, p, p_end - p, is_start);   
    }   
}  

 write_section_data()函数则反复收集buffer中的数据,指导完成相关Section的重组过 
程,然后调用之前注册的两个section_cb: 
    后面我们将分析之前挂在的两个section_cb

二、mpegts.c文件分析

1 综述 
    ffmpeg 框架对应MPEG-2 TS 流的解析的代码在mpegts.c 文件中,该文件有两个解复 
用的实例:mpegts_demuxer 和mpegtsraw_demuxer,mpegts_demuxer 对应的真实的TS 流格 
式,也就是机顶盒直接处理的 TS 流,本文主要分析和该种格式相关 的代码; 
mpegtsraw_demuxer 这个格式我没有遇见过,本文中不做分析。本文针对的ffmpeg 的版本是 
0.5 版本。 
2 mpegts_demuxer 结构分析 

AVInputFormat mpegts_demuxer = {au   
       "mpegts", //demux 的名称   
       NULL_IF_CONFIG_SMALL("MPEG-2 transport stream format"),// 如果定义了   
ONFIG_SMALL 宏,该域返回NULL,也就是取消long_name 域的定义。  
       sizeof(MpegTSContext),//每个demuxer 的结构的私有域的大小   
       mpegts_probe,//检测是否是TS 流格式   
       mpegts_read_header,//下文介绍   
       mpegts_read_packet,//下文介绍   
       mpegts_read_close,//关闭demuxer   
       read_seek,//下文介绍   
       mpegts_get_pcr,//下文介绍   
       .flags = AVFMT_SHOW_IDS|AVFMT_TS_DISCONT,//下文介绍   
   };   

  该结构通过av_register_all 函数注册 ffmpeg 的主框架中,通过mpegts_probe 函数来 
检测是否是TS 流格式,然后通过mpegts_read_header 函数找路音频流和路视频流(注 
意:在该函数中没有找全所有的音频流和视频流),最后调用mpegts_read_packet函数将找 
的音频流和视频流数据提取出来,通过主框架推入解码器。

3 mpegts_probe 函数分析 
    mpegts_probe被av_probe_input_format2调用,根据返回的score来判断那种格式的可 
能性最大。mpegts_probe调用了analyze函数,我们先分析一下analyze函数。

static int analyze(const uint8_t *buf, int size, int packet_size, int *index)  
{      
    int stat[TS_MAX_PACKET_SIZE];//积分统计结果   
    int i;   
    int x=0;   
    int best_score=0;   
    memset(stat, 0, packet_size*sizeof(int));   
    for(x=i=0; i<size-3; i++){   
        if(buf[i] == 0x47 && !(buf[i+1] & 0x80) && (buf[i+3] & 0x30)){   
            stat[x]++;   
            if(stat[x] > best_score){   
                best_score= stat[x];   
                if(index)  
                    *index= x;   
            }   
        }   
        x++;   
        if(x == packet_size)  
            x= 0;   
    }   
    return best_score;   
}  
analyze 函数的思路: 
    buf[i] == 0x47 && !(buf[i+1] & 0x80) && (buf[i+3] & 0x30)是TS 流同步开始的模式, 
0x47 是TS 流同步的标志,(buf[i+1] & 0x80 是传输错误标志,buf[i+3] & 0x30 为0 时表示为 
ISO/IEC 未来使用保留,目前不存在这样的值。记该模式为TS 流同步模式” 
    stat 数组变量存储的是TS 流同步模式”在某个位置出现的次数。 
    analyze 函数扫描检测数据,如果发现该模式,则stat[i%packet_size]++(函数中的x 变 
量就是用来取模运算的,因为当x==packet_size时,x就被归零),扫描完后,自然是同步 
位置的累加值最大。 
    mpegts_probe函数通过调用analyze函数来得 相应的分数,ffmpeg框架会根据该分 
数判断是否是对应的格式,返回对应的AVInputFormat 实例。
 
4 mpegts_read_header函数分析 
    下文中省略号代表的是和mpegtsraw_demuxer相关的代码,暂不涉及。 
<pre class="cpp" name="code">static int mpegts_read_header(AVFormatContext *s,   
                           AVFormatParameters *ap)   
{   
    MpegTSContext *ts = s->priv_data;   
    ByteIOContext *pb = s->pb;   
    uint8_t buf[5*1024];   
    int len;   
    int64_t pos;   
    ......   
    //保存流的当前位置,便于检测操作完成后恢复 原来的位置,   
    //这样在播放的时候就不会浪费 段流。   
    pos = url_ftell(pb);   
    //读取 段流来检测TS 包的大小   
    len = get_buffer(pb, buf, sizeof(buf));   
    if (len != sizeof(buf))   
        goto fail;   
    //得 TS 流包的大小,通常是188bytes,我目前见过的都是188 个字节的。   
    //TS 包的大小有三种:   
    //1) 通常情况下的188 字节   
    //2) 日本弄了个192Bytes 的DVH-S 格式   
    //3)在188Bytes 的基础上,加上16Bytes 的FEC(前向纠错),也就是204bytes   
    ts->raw_packet_size = get_packet_size(buf, sizeof(buf));   
    if (ts->raw_packet_size <= 0)   
        goto fail;   
    ts->stream = s;   
  
    //auto_guess = 1,  则在handle_packet 的函数中只要发现 个PES 的pid 就   
    //建立该PES 的stream   
    //auto_guess = 0,  则忽略。   
    //auto_guess 主要作用是用来在TS 流中没有业务信息时,如果被设置成了1 的话,   
    //那么就会将任何 个PID 的流当做媒体流建立对应的PES 数据结构。   
    //在mpegts_read_header 函数的过程中发现了PES 的pid,但   
    //是不建立对应的流,只是分析PSI 信息。   
    //相关的代码见handle_packet 函数的下面的代码:   
     //tss = ts->pids[pid];   
    //if (ts->auto_guess && tss == NULL && is_start) {   
    //   add_pes_stream(ts, pid, -1, 0);   
    //   tss = ts->pids[pid];   
    //}   
    ts->auto_guess = 0;   
    if (s->iformat == &mpegts_demuxer)  {   
        /* normal demux */   
        /* first do a scaning to get all the services */   
        url_fseek(pb, pos, SEEK_SET);   
        //挂载解析SDT 表的回调函数 ts->pids 变量上,     //这样在handle_packet 函数中根据对应的pid 找 对应处理回调函数。   
         mpegts_open_section_filter(ts, SDT_PID, sdt_cb, ts, 1);   
        //同上,只是挂上PAT 表解析的回调函数   
         mpegts_open_section_filter(ts, PAT_PID, pat_cb, ts, 1);   
        //探测 段流,便于检测出SDT,PAT,PMT 表   
         handle_packets(ts, s->probesize);   
        /* if could not find service, enable auto_guess */   
  
        //打开add pes stream 的标志,这样在handle_packet 函数中发现了pes 的   
         //pid,就会自动建立该pes 的stream。   
         ts->auto_guess = 1;   
        dprintf(ts->stream, "tuning done\n");   
        s->ctx_flags |= AVFMTCTX_NOHEADER;   
    } else {   
       ......   
    }    
    //恢复检测前的位置。  
     url_fseek(pb, pos, SEEK_SET);  
    return 0;   
fail:   
    return -1;   
}  
</pre>  
<pre></pre>  
<p> </p>  
<p>    下面介绍被 mpegts_read_header直接或者间接调用的几个函数: mpegts_open_section_filter,     handle_packets,handle_packet     5 mpegts_open_section_filter 函数分析     这个函数可以解释mpegts.c 代码结构的精妙之处,PSI 业务信 息表的处理 都是通过该函数挂载 MpegTSContext 结构的pids 字段上的。这样如果你 想增加别的业务信息的表处理函数只要通过这个函数来挂载即可,体现了  
 软件设计的著名的开闭”原则。下面分析一下他的代码。        </p>  
<pre class="cpp" name="code">static MpegTSFilter *mpegts_open_section_filter(MpegTSContext *ts, unsigned int pid,  
                                           SectionCallback *section_cb, void *opaque,   
                                           int check_crc)   
{   
    MpegTSFilter *filter;   
    MpegTSSectionFilter *sec;   
    dprintf(ts->stream, "Filter: pid=0x%x\n", pid);   
    if (pid >= NB_PID_MAX || ts->pids[pid])   
        return NULL;   
    //给filter 分配空间,挂载 MpegTSContext  的pids 上   
    //就是该实例   
    filter = av_mallocz(sizeof(MpegTSFilter));   
    if (!filter)   
        return NULL;   
    //挂载filter 实例   
    ts->pids[pid] = filter;   
    //设置filter 相关的参数,因为业务信息表的分析的单 是段,   
    //所以该filter 的类型是MPEGTS_SECTION   
    filter->type = MPEGTS_SECTION;   
  
    //设置pid   
    filter->pid = pid;   
    filter->last_cc = -1;   
    //设置filter 回调处理函数   
    sec = &filter->u.section_filter;   
    sec->section_cb = section_cb;   
    sec->opaque = opaque;   
    //分配段数据处理的缓冲区,调用handle_packet 函数后会调用   
    //write_section_data 将ts 包中的业务信息表的数据存储在这儿,   
    //直  个段收集完成才交付上面注册的回调函数处理。   
    sec->section_buf = av_malloc(MAX_SECTION_SIZE);   
    sec->check_crc = check_crc;   
    if (!sec->section_buf) {   
        av_free(filter);   
        return NULL;   
    }   
    return filter;   
}  
  
</pre>  
<p><br>  
6 handle_packets 函数分析 <br>  
    handle_packets 函数在两个地方被调用, 个是mpegts_read_header 函数中, <br>  
另外 个是mpegts_read_packet 函数中,被mpegts_read_header 函数调用是用 <br>  
来搜索PSI 业务信息,nb_packets  参数为探测的ts 包的个数;在mpegts_read_packet <br>  
函数中被调用用来搜索补充PSI 业务信息和demux PES 流,nb_packets 为0,0 不 <br>  
是表示处理的包的个数为0。 </p>  
<pre class="cpp" name="code">static int handle_packets(MpegTSContext *ts, int nb_packets)   
{   
    AVFormatContext *s = ts->stream;   
    ByteIOContext *pb = s->pb;   
    uint8_t packet[TS_PACKET_SIZE];   
    int packet_num, ret;   
    //该变量指示 次handle_packets 处理的结束。   
    //在mpegts_read_packet 被调用的时候,如果发现完 个PES 的包,则   
    // ts->stop_parse = 1 ,则当前分析结束。   
    ts->stop_parse = 0;   
    packet_num = 0;   
    for(;;) {   
        if (ts->stop_parse>0)   
            break;   
        packet_num++;   
        if (nb_packets != 0 && packet_num >= nb_packets)   
            break;   
        //读取 个ts 包,通常是188bytes   
        ret = read_packet(pb, packet, ts->raw_packet_size);   
        if (ret != 0)   
            return ret;   
        handle_packet(ts, packet);   
    }   
    return 0;   
}   
  
</pre>  
<p><br>  
 </p>  
<p>7 handle_packet 函数分析 <br>  
    可以说handle_packet 是mpegts.c 代码的核心,所有的其他代码都是为 <br>  
这个函数准备的。 <br>  
    在调用该函数之前先调用read_packet 函数获得个ts包(通常是188bytes), <br>  
然后传给该函数,packet参数就是TS包。</p>  
<pre class="cpp" name="code">static int handle_packet(MpegTSContext *ts, const uint8_t *packet)   
{   
    AVFormatContext *s = ts->stream;   
    MpegTSFilter *tss;   
    int len, pid, cc, cc_ok, afc, is_start;   
    const uint8_t *p, *p_end;   
    int64_t pos;   
    //从TS 包获得包的PID。   
    pid = AV_RB16(packet + 1) & 0x1fff;   
    if(pid && discard_pid(ts, pid))   
        return 0;   
    is_start = packet[1] & 0x40;   
    tss = ts->pids[pid];   
    //ts->auto_guess 在mpegts_read_header 函数中被设置为0,   
    //也就是说在ts 检测过程中是不建立pes stream 的。   
    if (ts->auto_guess && tss == NULL && is_start) {   
        add_pes_stream(ts, pid, -1, 0);   
        tss = ts->pids[pid];   
    }   
    //mpegts_read_header 函数调用handle_packet 函数只是处理TS 流的   
    //业务信息,因为并没有为对应的PES 建立tss,所以tss 为空,直接返回。   
    if (!tss)   
        return 0;   
    /* continuity check (currently not used) */   
    cc = (packet[3] & 0xf);   
    cc_ok = (tss->last_cc < 0) || ((((tss->last_cc + 1) & 0x0f) == cc));   
    tss->last_cc = cc;   
    /* skip adaptation field */   
    afc = (packet[3] >> 4) & 3;   
    p = packet + 4;   
    if (afc == 0) /* reserved value */   
        return 0;   
    if (afc == 2) /* adaptation field only */   
        return 0;   
    if (afc == 3) {   
        /* skip adapation field */   
        p += p[0] + 1;   
    }   
    /* if past the end of packet, ignore */   
    p_end = packet + TS_PACKET_SIZE;   
    if (p >= p_end)   
        return 0;   
    pos = url_ftell(ts->stream->pb);   
    ts->pos47= pos % ts->raw_packet_size;   
    if (tss->type == MPEGTS_SECTION)  {   
        //表示当前的TS 包包含 个新的业务信息段   
        if (is_start) {  
            //获取pointer field 字段,   
            //新的段从pointer field 字段指示的位置开始   
              len = *p++;   
            if (p + len > p_end)   
                return 0;   
            if (len && cc_ok) {   
                //这个时候TS 的负载有两个部分构成:   
                   //1)从TS 负载开始 pointer field 字段指示的位置;   
                //2)从pointer field 字段指示的位置 TS 包结束   
  
                //1)位置代表的是上 个段的末尾部分。   
                //2)位置代表的新的段开始的部分。   
                //下面的代码是保存上 个段末尾部分数据,也就是   
                //1)位置的数据。   
                write_section_data(s, tss, p, len, 0);   
                /* check whether filter has been closed */   
                if (!ts->pids[pid])   
                    return 0;   
            }   
            p += len;   
            //保留新的段数据,也就是2)位置的数据。   
              if (p < p_end) {   
                write_section_data(s, tss, p, p_end - p, 1);   
            }   
        } else {   
           //保存段中间的数据。   
            if (cc_ok) {   
                write_section_data(s, tss, p, p_end - p, 0);   
            }   
        }   
    } else {   
        int ret;   
        //正常的PES 数据的处理   
        // Note: The position here points actually behind the current packet.   
        if ((ret = tss->u.pes_filter.pes_cb(tss, p, p_end - p, is_start,   
                             pos - ts->raw_packet_size)) < 0)   
            return ret;   
    }   
    return 0;   
}  
  
</pre>  
<p><br>  
8 write_section_data 函数分析 <br>  
    PSI 业务信息表在TS流中是以段为单传输的。 </p>  
<pre class="cpp" name="code">static void write_section_data(AVFormatContext *s, MpegTSFilter *tss1,   
                     const uint8_t *buf, int buf_size, int is_start)   
{   
    MpegTSSectionFilter *tss = &tss1->u.section_filter;   
    int len;   
    //buf 中是 个段的开始部分。   
    if (is_start) {   
        //将内容复制 tss->section_buf 中保存   
        memcpy(tss->section_buf, buf, buf_size);   
        //tss->section_index 段索引。   
        tss->section_index = buf_size;   
        //段的长度,现在还不知道,设置为-1   
        tss->section_h_size = -1;   
        //是否 达段的结尾。   
        tss->end_of_section_reached = 0;   
    } else {   
        //buf 中是段中间的数据。   
        if (tss->end_of_section_reached)   
            return;   
        len = 4096 - tss->section_index;   
        if (buf_size < len)   
            len = buf_size;  
        memcpy(tss->section_buf + tss->section_index, buf, len);   
        tss->section_index += len;   
    }   
    //如果条件满足,计算段的长度   
    if (tss->section_h_size == -1 && tss->section_index >= 3) {   
        len = (AV_RB16(tss->section_buf + 1) & 0xfff) + 3;   
        if (len > 4096)   
            return;   
        tss->section_h_size = len;   
    }   
    //判断段数据是否收集完毕,如果收集完毕,调用相应的回调函数处理该段。   
    if (tss->section_h_size  != -1 && tss->section_index >= tss->section_h_size) {   
        tss->end_of_section_reached = 1;   
        if (!tss->check_crc ||   
            av_crc(av_crc_get_table(AV_CRC_32_IEEE), -1,   
                  tss->section_buf, tss->section_h_size) == 0)   
            tss->section_cb(tss1, tss->section_buf, tss->section_h_size);   
    }   
}   
  
</pre>  
<p><br>  
 </p>  
<pre></pre>  
<pre></pre>  

你可能感兴趣的:(ts,ffmpeg解码)