郭风朴

android多媒体框架学习详解最新版本

http://blog.csdn.net/trust555/article/details/18962035

一：多媒体框架概述

jellybean 的多媒体跟以前的版本，通过对比没啥变化，最大的变化是google终于舍得给multimedia建个独立的git了（framework/av），等你好久了！也体现了media 在整个android系统中的重要性！framework/av下都是些C/C++代码（libmedia，libmediaplayerservice，libstagefright），jni和 java api 还是保留在原来的位置，改革还不够彻底，但还是迈出了这一步，以后维护能更好的进行了！但是对于从ics往jellybean升级就得费点劲了，打patch不好打了！还有一个大的变化时增加了可以直接调用codec的API，不需要通过stagefrigh引擎去调用，就像我们直接调用FFMPEG的codec一样，方便简单，不用绕那么多弯。具体的往后我们再具体了解吧，毕竟刚有的！
android multimedia Framework 整体架构是一个很庞大的系统，我们该如何划分和去研究呢？大的分法就是video和audio。往细的分呢？也是我接下来要按顺序讲的：
video 部分：
1：video playback
2：video streaming
3：video recorder
audio部分：
1：audio playback
2：audio streaming
3：sound recorder
4：audio flinger

二：多媒体简介

我们学习一种新事物必然首先都要对该事物要有个大体的了解，熟悉它的整体架构，然后进行划分归类，接下来才是各个击破，逐步学习乃至掌握。对于要学习android Multimedia的人来说也是如此，先来个总括吧！我打算分三部分来讲解，请听我娓娓道来....
1、多媒体简介
为啥要讲多媒体的概念呢？可能很多人都对这个名称解释不怎么了解，所以在这普及普及。
媒体（Media）就是人与人之间实现信息交流的中介，简单地说，就是信息的载体，也称为媒介。多媒体是计算机和视频技术的结合，实际上它是两个媒体；声音和图像，或者用现在的术语：音响和电视。多媒体本身有两个方面，和所有现代技术一样它是由硬件和软件，或机器和思想混合组成。可以将多媒体技术和功能在概念上区分为控制系统和信息。多媒体之所以能够实现是依靠数字技术。多媒体代表数

字控制和数字媒体的汇合，电脑是数字控制系统，而数字媒体是当今音频和视频最先进的存储和传播形式。事实上有人就简单地认为多媒体是电脑和电视的结合。电脑的能力达到实时处理电视和声音数据流的水平，这时多媒体就诞生了。
2、android多媒体框架演变历史
android 的多媒体框架从android诞生以来，发生了天翻地覆的变化，包括引擎的更改，单独处理流媒体的播放器nuplayer的加入，到最新jellybean（android4.1）nuplayer逐步加入stagefrightplayer的功能，可能以后stagefight引擎会被nuplayer取代，那都是后话了。但是openomx（即引擎连接codec的纽带）一直都得到了保持。
在Froyo2.2 以前，multimedia framework 的引擎是一直都是opencore，但为啥用stagefright替代呢，由于我没有开发过opencore，不便下结论，但从网上一些言论来看，估计是opencore太过庞大，不太好维护，具体真正原因就得问google了，如果你知道具体原因，可以给我留言，在此多谢了！
Gingerbread android2.3，加入了真正的支持流媒体的播发器nuplayer，如果你下有源码，可以用gitk \nuplayer，从gitk可以看到如下提交：Initial support for a true streaming player for mpeg2 transport streams. 2010.12。
android 3.0 到android 4.0 ，总体框架没有多大变化。
android4.1 (jellybean) 最大的变化是给c/c++部分的多媒体框架单独设立了一个framework/av的目录，给它开辟了一个git库，即从framework/base下的git库分离了出来，总算给多媒体找了个港湾。
3、jellybean多媒体架构
multimedia framework 架构由三大部分构成：供上层程序调用的java API，连接java和C/C++的jni部分，多媒体引擎（stagefright）和codec接口（openmax interface）。前面两部代码在framework/base/media 下，后一部分在framework/av文件夹下。如果你修改的是java API接口或加LOG后编译可以用如下命令：make framework ，JNI 部分 make media_jni，第三部分有三个libs组成：libmedia ，libmediaplayerservice, libstagefright,命令如下 make media ，make stagefright ， make mediaplayerservice. 生成各自的.so文件，用adb push 到system/下就可以调试了。记得重启！讲了好多废话，还是没有看到总体架构，罪过，好吧，上图，更直观。

从上两图，我们可以发现上层APK要播放视频，首先得获得一个player，而这个player的类型根据你媒体文件的类型来决定的，分配的任务由mediaplayerservice来完成，除了获得player外最主要的是到底选用哪种编码器进行编解码，这个过程由awesomeplayer和omxcodec来完成，至于声音和图像就交由audioflinger和surfaceflinger来完成了。具体的调用实现，下一篇videoplayerback将会慢慢讨论和学习。

三：播放流程video playback（一）

上一篇我们讲了多媒体的总体框架，本章我们先来讨论媒体文件的本地播放，也是手机的基本功能。现在市面上的手机配置越来越高，支持高清视频（1920x1080P）已不在话下。那现在Android主流播放器都支持哪些媒体格式呢？一般来说mp3,mp4,m4a,m4v,amr等大众格式都是支持的，具体支持成什么样这得看手机厂商和芯片厂商了。具体格式大全可以看framework/base/media/Java/Android/media/MediaFile.java。

      我们下面进入正题研究多媒体文件的本地播放（video playback），具体用到的工具有source insight，astah（免费的画流程图工具），android 4.1代码。代码如何获取可以到google source下下载：http://source.android.com/source/downloading.html。

      一般上层应用要本地播放播放一个媒体文件，需要经过如下过程：



MediaPlayer mMediaPlayer = new MediaPlayer( );

mMediaPlayer.setDataSource(mContext, mUri);-

mMediaPlayer.setDisplay(mSurfaceHolder);

mMediaPlayer.setAudioStreamType(AudioManager.STREAM_MUSIC);

mMediaPlayer.prepareAsync();

mMediaPlayer.start();



    首先我们先来分析setDataSource方法，这个方法有两个功能：一个是根据文件类型获得相应的player，一个是创建相应文件类型的mediaExtractor,解析媒体文件，记录metadata的主要信息。

代码如下：

framework/av/media/libmedia/ MediaPlayer.cpp

status_t MediaPlayer::setDataSource(

        const char url, const KeyedVector headers)

{

    ALOGV("setDataSource(%s)", url);

    status_t err = BAD_VALUE;

    if (url != NULL) {

        const sp& service(getMediaPlayerService());

        if (service != 0) {

            sp player(service->create(getpid(), this, mAudioSessionId));

            if ((NO_ERROR != doSetRetransmitEndpoint(player)) ||

                (NO_ERROR != player->setDataSource(url, headers))) {

                player.clear();

            }

            err = attachNewPlayer(player);

        }

    }

    return err;

}

我们先来看下setDataSource方法中如何获取player。大体的流程图如下图：

    我们知道MediaplayerService是负责外部请求，针对每个APP player ，mediaplayerservice都会开辟一个client端来专门处理。

client 定义如下：

framework/av/media/libmediaplayerservice/ MediaPlayerService.h

class Client : public BnMediaPlayer {...

private:

        friend class MediaPlayerService;

                                Client( const sp& service,

                                        pid_t pid,

                                        int32_t connId,

                                        const sp& client,

                                        int audioSessionId,

                                        uid_t uid);

}

}

从代码看就是一个BnMediaplayer的子类（即local binder）。既然有了BnMediaplayer，客户端也应该有相应的BpMediaplayer。获取这个BpMediaplayer要分两步骤走：第一，获取BpMediaplayerService；第二就是在setDataSource方法中的：

    sp player(service->create(getpid(), this, mAudioSessionId)); 这个函数会返回一个BpMediaplayer。

获取BpMediaplayerService，首先要去ServiceManager获取相应的服务Mediaplayer，里面的流程是这样检查是否存在要找的service，没有就创建，有就返回BpXX。

  有了BpMediaplayerService，我们就可以跟MediaplayerService通信了，自然就可以创建对应的client端来服务对应的BpMediaplayer（客户端）：

framework/av/media/libmediaplayerservice/ MediaPlayerService.cpp

sp MediaPlayerService::create(pid_t pid, const sp& client,

        int audioSessionId)

{

    int32_t connId = android_atomic_inc(&mNextConnId);

    sp c = new Client(

            this, pid, connId, client, audioSessionId,

            IPCThreadState::self()->getCallingUid());

    ALOGV("Create new client(%d) from pid %d, uid %d, ", connId, pid,

         IPCThreadState::self()->getCallingUid());

    wp w = c;

    {

        Mutex::Autolock lock(mLock);

        mClients.add(w);

    }

    return c;

}

到此我们的sp player(service->create(getpid(), this, mAudioSessionId));

变成了：sp player(Client); 那它是如何变成我们需要的BpMediaplayer呢，请看下面的定义原型，INTERFACE就是mediaplayer，大伙把宏取代下就知道了：

frameworks/av/media/include/IMediapalyer.h

class IMediaPlayer: public IInterface

{

public:

    DECLARE_META_INTERFACE(MediaPlayer);

DECLARE_META_INTERFACE宏定义如下：

    #define DECLARE_META_INTERFACE(INTERFACE)                               \

    static const android::String16 descriptor;                          \

    static android::sp asInterface(                       \

            const android::sp& obj);                  \

    virtual const android::String16& getInterfaceDescriptor() const;    \

    I##INTERFACE();                                                     \

    virtual ~I##INTERFACE();

有了DECLARE IMediaplayer.cpp 必有 IMPLEMENT

#define IMPLEMENT_META_INTERFACE(INTERFACE, NAME)                       \

    const android::String16 I##INTERFACE::descriptor(NAME);             \

    const android::String16&                                            \

            I##INTERFACE::getInterfaceDescriptor() const {              \

        return I##INTERFACE::descriptor;                                \

    }                                                                   \

    android::sp I##INTERFACE::asInterface(                \

            const android::sp& obj)                   \

    {                                                                   \

        android::sp intr;                                 \

        if (obj != NULL) {                                              \

            intr = static_cast(                          \

                obj->queryLocalInterface(                               \

                        I##INTERFACE::descriptor).get());               \

            if (intr == NULL) {                                         \

                intr = new Bp##INTERFACE(obj);                          \

            }                                                           \

        }                                                               \

        return intr;                                                    \

    }                                                                   \

    I##INTERFACE::I##INTERFACE() { }                                    \

    I##INTERFACE::~I##INTERFACE() { }                                   \

   通过如上方法，我们获得了BpMediaplayer（remoteBinder），我们就可以通过BpMediaplayer 跟BnMediaplayer通信了。两者的交互是IBinder。

BpMediaplayer具体实现在哪呢？

frameworks/av/media/libmedia/IMediaplayer.cpp:

class BpMediaPlayer: public BpInterface

{

public:

    BpMediaPlayer(const sp& impl)

        : BpInterface(impl)

    {

    }

    // disconnect from media player service

    void disconnect()

    {

        Parcel data, reply;

        data.writeInterfaceToken(IMediaPlayer::getInterfaceDescriptor());

        remote()->transact(DISCONNECT, data, &reply);

    }

    status_t setDataSource(const char* url,

            const KeyedVector* headers)

    {

        Parcel data, reply;

        data.writeInterfaceToken(IMediaPlayer::getInterfaceDescriptor());

        data.writeCString(url);

        if (headers == NULL) {

            data.writeInt32(0);

        } else {

            // serialize the headers

            data.writeInt32(headers->size());

            for (size_t i = 0; i < headers->size(); ++i) {

                data.writeString8(headers->keyAt(i));

                data.writeString8(headers->valueAt(i));

            }

        }

        remote()->transact(SET_DATA_SOURCE_URL, data, &reply);

        return reply.readInt32();

    }

remote 就是一个IBinder， IBinder 通过transact 方法中的

IPCThreadState::self()->transact(

            mHandle, code, data, reply, flags);

通知相应BnMediaplayer（client）进行相应的处理。里面的如何打开binder，如何传到MediaplayerService::client就不具体说了，有兴趣可以跟下去看看。

以上我们运用到了Binder的通信机制，如果大家对此不太了解可以看：

Android系统进程间通信（IPC）机制Binder中的Server和Client获得Service Manager接口之路 .

获得了BpMediaplayer ，我们就可以通过调用client端的setDataSource创建 player了：

status_t MediaPlayerService::Client::setDataSource(

        const char url, const KeyedVector headers)

{….

如果是url 以content://开头要转换为file descriptor

    if (strncmp(url, "content://", 10) == 0) {…

        int fd = android::openContentProviderFile(url16);

……….

        setDataSource(fd, 0, 0x7fffffffffLL); // this sets mStatus

        close(fd);

        return mStatus;

    } else {

        player_type playerType = getPlayerType(url);…. createplayer前要判断是哪种类型

        LOGV("player type = %d", playerType);

        // create the right type of player

        sp p = createPlayer(playerType);

        mStatus = p->setDataSource(url, headers);

…

return mStatus;

    }

}

player_type getPlayerType(const char* url) ……………. 根据url的后缀名判断属于哪种playerType，默认是stagefright，我们现在研究的是本地播放，自然是stagefrightPlayer了

{

    if (TestPlayerStub::canBeUsed(url)) {

        return TEST_PLAYER;

    }

    // use MidiFile for MIDI extensions

    int lenURL = strlen(url);

    for (int i = 0; i < NELEM(FILE_EXTS); ++i) {

        int len = strlen(FILE_EXTS[i].extension);

        int start = lenURL - len;

        if (start > 0) {

            if (!strncasecmp(url + start, FILE_EXTS[i].extension, len)) {

              return FILE_EXTS[i].playertype;

            }

        }

    }

……………….

    return getDefaultPlayerType();

}

自此我们获得了想要的player了。这里最主要的知识点就是Binder的通信了，Binder的流程我们可以用下图来解释，大家可以好好琢磨：

player已经取得，接下来就是setDataSource的第二步：获取相应的MediaExtractor并储存相应的数据。

关于这一步，我也画了个时序图：



    紧接刚才我们获得player的步骤，我们实例话一个stagefrightPlayer的同时也实例话了一个AwesomePlayer，其实真正干实事的AwesomePlayer，stagefrightPlayer只是个对外的接口，

代码如下：framework/av/media/libmediaplayerservice/ StagefrightPlayer.cpp

static sp createPlayer(player_type playerType, void* cookie,

        notify_callback_f notifyFunc) {

…..

           case STAGEFRIGHT_PLAYER:

            ALOGV(" create StagefrightPlayer");

            p = new StagefrightPlayer;

            break;

…….

}

创建stagefrightplayer实例也new了个AwesomePlayer(mPlayer)

StagefrightPlayer::StagefrightPlayer()

    : mPlayer(new AwesomePlayer) {

    LOGV("StagefrightPlayer");

    mPlayer->setListener(this);

}

既然Awesomeplayer是干实事的，我们直接进去看看吧：

frameworks/av/media/libstagefright/AwesomePlayer.cpp

status_t AwesomePlayer::setDataSource_l(

        const sp &dataSource) {

    sp extractor = MediaExtractor::Create(dataSource);…….创建对应的extractor

…..

    return setDataSource_l(extractor);

}

status_t AwesomePlayer::setDataSource_l(const sp &extractor) {

…

for (size_t i = 0; i < extractor->countTracks(); ++i) {

        sp meta = extractor->getTrackMetaData(i);.......获取相应track的元数据

        int32_t bitrate;

        if (!meta->findInt32(kKeyBitRate, &bitrate)) {

            const char *mime;

            CHECK(meta->findCString(kKeyMIMEType, &mime));

            ALOGV("track of type '%s' does not publish bitrate", mime);

            totalBitRate = -1;

            break;

        }

        totalBitRate += bitrate;

    }

.........

        if (!haveVideo && !strncasecmp(mime, "video/", 6)) {

            setVideoSource(extractor->getTrack(i)); ………>mVideoTrack

            haveVideo = true;

        } else if (!haveAudio && !strncasecmp(mime, "audio/", 6)) {

            setAudioSource(extractor->getTrack(i));……….>mAudioTrack

            haveAudio = true;

    return OK;

}

      关于MediaExtractor里面涉及到媒体文件格式的很多内容，比如track的构成，有几种track等等，我们将来在videoRecorder中再详细讲解。这里只有知道提取相关信息就行了。

   此方法调用完成意味着player进入了MEDIA_PLAYER_INITIALIZED状态。Player的状态有如下几种：

    MEDIA_PLAYER_STATE_ERROR
    MEDIA_PLAYER_IDLE
    MEDIA_PLAYER_INITIALIZED
    MEDIA_PLAYER_PREPARING
    MEDIA_PLAYER_PREPARED
    MEDIA_PLAYER_STARTED
    MEDIA_PLAYER_PAUSED
    MEDIA_PLAYER_STOPPED
    MEDIA_PLAYER_PLAYBACK_COMPLETE

     setDataSource我们已经讲完了，讲流程我们的目的是熟悉它的架构，希望大家很好好熟悉熟悉，在项目需要的时候根据我们自己的媒体格式，依葫芦画瓢进行改造，比如说支持多track，切换track，以达到KTV的功能等等。。。

    下一篇我们将讲解prepare的过程，这个工程主要是匹配codec，初始化codec等。

  码率：也叫比特率，表示经过压缩编码后的视音频数据每秒需要用多少个比特来表示，即把每秒显示的图像进行压缩后的数据量，一般采用的单位是kbps即千位每秒。一般来说码率越大，处理出来的文件就越接近原始文件，但文件体积与码率是成正比的，所以几乎所有的编码格式重视的都是如何用最低的码率达到最少的失真，围绕这个核心衍生出来的CBR（固定码率）与VBR（动态码率）。

         固定码率CBR（Constant Bitrate）：指文件从头高位都是一种码率，这是以固定文件大小为前提的压缩方式。

　动态码率VBR（Variable Bitrate）：指没有固定的码率，压缩时根据视音频数据即时确定使用什么码率，这是以质量为前提兼顾文件大小的压缩方式。

       【文件大小】（Byte字节）=【码率】（kbps）/8X【时间】（秒）

      1 byte (B) = 8 bits (b)，我们计算机上文件的容量K/M，都是指B；

　  1 Kilobyte(K/KB)=2^10 bytes=1,024 bytes 千字节；

　  1 Megabyte(M/MB)=2^20 bytes=1,048,576 bytes 兆字节；

　所以如果用的bits/s的码流计算容量记得要乘8。

      视频分辨率：我们常说的视频多少乘多少，严格来说不是分辨率，而是视频的高/宽像素值。常见的屏幕比例其实只有三种：4:3、16:9和 16:10。

       采样率：（也称为采样速度或者采样频率）定义了每秒从连续信号中提取并组成离散信号的采样个数，单位用赫兹（Hz）来表示。采样频率的倒数是采样周期（也称为采样时间），它表示采样之间的时间间隔。



        帧率（Frame rate）：是用于测量显示帧数的量度。所谓的测量单位为每秒显示帧数(Frames per Second，简称：FPS）或“赫兹”（Hz）。高的帧率可以得到更流畅、更逼真的动画。一般来说30fps就是可以接受的，但是将性能提升至60fps则可以明显提升交互感和逼真感，但是一般来说超过75fps一般就不容易察觉到有明显的流畅度提升了。

         刷新频率：即屏幕刷新的速度。刷新频率越低，图像闪烁和抖动的就越厉害，眼睛疲劳得就越快。

　　采用70Hz以上的刷新频率时才能基本消除闪烁，显示器最好稳定工作在允许的最高频率下，一般是85Hz。

四：播放流程video playback(二)

上一篇我们讲了mediaplayer播放的第一步骤setdataSource，下面我们来讲解preparesync的流程，在prepare前我们还有setDisplay这一步，即获取surfacetexture来进行画面的展示

setVideoSurface(JNIEnv env, jobject thiz, jobject jsurface, jboolean mediaPlayerMustBeAlive)

{

    sp mp = getMediaPlayer(env, thiz);

………

    sp new_st;

    if (jsurface) {

        sp surface(Surface_getSurface(env, jsurface));

        if (surface != NULL) {

            new_st = surface->getSurfaceTexture();

            ---通过surface获取surfaceTexture

            new_st->incStrong(thiz);

……….

    }………….

    mp->setVideoSurfaceTexture(new_st);

}

为什么用surfaceTexture不用surface来展示呢？ICS之前都用的是surfaceview来展示video或者openGL的内容，surfacaview render在surface上，textureview render在surfaceTexture，textureview和surfaceview 这两者有什么区别呢？surfaceview跟应用的视窗不是同一个视窗，它自己new了一个window来展示openGL或者video的内容，这样做有一个好处就是不用重绘应用的视窗，本身就可以不停的更新，但这也带来一些局限性，surfaceview不是依附在应用视窗中，也就不能移动、缩放、旋转，应用ListView或者 ScrollView就比较费劲。Textureview就很好的解决了这些问题。它拥有surfaceview的一切特性外，它也拥有view的一切行为，可以当个view使用。

获取完surfaceTexture，我们就可以prepare/prepareAsync了，先给大伙看个大体时序图吧：

JNI的部分我们跳过，直接进入libmedia下的mediaplayer.cpp的 prepareAsync_l方法，prepare是个同步的过程，所以要加锁，prepareAsync_l后缀加_l就是表面是同步的过程。

status_t MediaPlayer::prepareAsync_l()

{

    if ( (mPlayer != 0) && ( mCurrentState & ( MEDIA_PLAYER_INITIALIZED | MEDIA_PLAYER_STOPPED) ) ) {

        mPlayer->setAudioStreamType(mStreamType);

        mCurrentState = MEDIA_PLAYER_PREPARING;

        return mPlayer->prepareAsync();

    }

    ALOGE("prepareAsync called in state %d", mCurrentState);

    return INVALID_OPERATION;

}

在上面的代码中，我们看到有个mPlayer，看过前一章的朋友都会记得，就是我们从Mediaplayerservice获得的BpMediaplayer.通过BpMediaplayer我们就可以长驱直入，直捣Awesomeplayer这条干实事的黄龙，前方的mediaplayerservice：client和stagefrightplayer都是些通风报信的料，不值得我们去深入研究，无非是些接口而已。进入了prepareAsync_l方法，我们的播放器所处的状态就是MEDIA_PLAYER_PREPARING了。好了，我们就来看看Awesomeplayer到底做了啥吧.

代码定位于：frameworks/av/media/libstagefright/Awesomeplayer.cpp

先看下prepareAsync_l吧：

status_t AwesomePlayer::prepareAsync_l() {

    if (mFlags & PREPARING) {

        return UNKNOWN_ERROR; // async prepare already pending

    }

    if (!mQueueStarted) {

        mQueue.start();

        mQueueStarted = true;

    }

    modifyFlags(PREPARING, SET);

    mAsyncPrepareEvent = new AwesomeEvent(

            this, &AwesomePlayer::onPrepareAsyncEvent);

    mQueue.postEvent(mAsyncPrepareEvent);

    return OK;

}

这里我们涉及到了TimeEventQueue，即时间事件队列模型，Awesomeplayer里面类似Handler的东西，它的实现方式是把事件响应时间和事件本身封装成一个queueItem,通过postEvent 插入队列，时间到了就会根据事件id进行相应的处理。

首先我们来看下TimeEventQueue的start（mQueue.start();）方法都干了什么：

frameworks/av/media/libstagefright/TimedEventQueue.cpp

void TimedEventQueue::start() {

    if (mRunning) {

        return;

    }

……..

    pthread_create(&mThread, &attr, ThreadWrapper, this);

………

}

目的很明显就是在主线程创建一个子线程，可能很多没有写过C/C++的人对ptread_create这个创建线程的方法有点陌生，我们就来分析下：

int pthread_create(pthread_t thread, pthread_addr_t arr,

　　　　　　　　　　　void (start_routine)(void ), void arg);

thread　　　：用于返回创建的线程的ID

arr　　　　　: 用于指定的被创建的线程的属性

start_routine   : 这是一个函数指针，指向线程被创建后要调用的函数

arg　　　　　 : 用于给线程传递参数

分析完了，我们就看下创建线程后调用的函数ThreadWrapper吧：

// static

void TimedEventQueue::ThreadWrapper(void me) {

……

    static_cast(me)->threadEntry();

    return NULL;

}

跟踪到threadEntry：

frameworks/av/media/libstagefright/TimedEventQueue.cpp

void TimedEventQueue::threadEntry() {

    prctl(PR_SET_NAME, (unsigned long)"TimedEventQueue", 0, 0, 0);

    for (;;) {

        int64_t now_us = 0;

        sp event;

        {

            Mutex::Autolock autoLock(mLock);

            if (mStopped) {

                break;

            }

            while (mQueue.empty()) {

                mQueueNotEmptyCondition.wait(mLock);

            }

            event_id eventID = 0;

            for (;;) {

                if (mQueue.empty()) {

                    // The only event in the queue could have been cancelled

                    // while we were waiting for its scheduled time.

                    break;

                }

                List::iterator it = mQueue.begin();

                eventID = (it).event->eventID();

……………………………

                static int64_t kMaxTimeoutUs = 10000000ll; // 10 secs

                ……………..

                status_t err = mQueueHeadChangedCondition.waitRelative(

                        mLock, delay_us * 1000ll);

                if (!timeoutCapped && err == -ETIMEDOUT) {

                    // We finally hit the time this event is supposed to

                    // trigger.

                    now_us = getRealTimeUs();

                    break;

                }

            }

……………………….

            event = removeEventFromQueue_l(eventID);

        }

        if (event != NULL) {

            // Fire event with the lock NOT held.

            event->fire(this, now_us);

        }

    }

}

从代码我们可以了解到，主要目的是检查queue是否为空，刚开始肯定是为空了，等待队列不为空时的条件成立，即有queueIten进入进入队列中。这个事件应该就是

    mQueue.postEvent(mAsyncPrepareEvent);

在讲postEvent前，我们先来看看mAsyncPrepareEvent这个封装成AwesomeEvent的Event。

struct AwesomeEvent : public TimedEventQueue::Event {

    AwesomeEvent(

            AwesomePlayer player,

            void (AwesomePlayer::method)())

        : mPlayer(player),

          mMethod(method) {

    }

从这个结构体我们可以知道当这个event被触发时将会执行Awesomeplayer的某个方法，我们看下mAsyncPrepareEvent：

mAsyncPrepareEvent = new AwesomeEvent(

            this, &AwesomePlayer::onPrepareAsyncEvent);

mAsyncPrepareEvent被触发时也就触发了onPrepareAsyncEvent方法。

好了，回到我们的postEvent事件，我们开始说的TimeEventQueue，即时间事件队列模型，刚刚我们说了Event，但是没有看到delay time啊？会不会在postEvent中加入呢？跟下去看看：

TimedEventQueue::event_id TimedEventQueue::postEvent(const sp &event) {

    // Reserve an earlier timeslot an INT64_MIN to be able to post

    // the StopEvent to the absolute head of the queue.

    return postTimedEvent(event, INT64_MIN + 1);

}

终于看到delay时间了INT64_MIN + 1。重点在postTimedEvent，它把post过来的event和时间封装成queueItem加入队列中，并通知Queue为空的条件不成立，线程解锁，允许thread继续进行，经过delay time后pull event_id所对应的event。

frameworks/av/media/libstagefright/TimedEventQueue.cpp

TimedEventQueue::event_id TimedEventQueue::postTimedEvent(

        const sp &event, int64_t realtime_us) {

    Mutex::Autolock autoLock(mLock);

    event->setEventID(mNextEventID++);

    ………………….

    QueueItem item;

    item.event = event;

    item.realtime_us = realtime_us;

    if (it == mQueue.begin()) {

        mQueueHeadChangedCondition.signal();

    }

    mQueue.insert(it, item);

    mQueueNotEmptyCondition.signal();

    return event->eventID();

}

到此，我们的TimeEventQueue，即时间事件队列模型讲完了。实现机制跟handle的C/C++部分类似。

在我们setdataSource实例化Awesomeplayer的时候，我们还顺带创建了如下几个event

   sp mVideoEvent;

    sp mStreamDoneEvent;

    sp mBufferingEvent;

    sp mCheckAudioStatusEvent;

    sp mVideoLagEvent;

具体都是实现了什么功能呢？我们在具体调用的时候再深入讲解。

接下来我们就来讲讲onPrepareAsyncEvent方法了。

frameworks/av/media/libstagefight/AwesomePlayer.cpp

void AwesomePlayer::onPrepareAsyncEvent() {

    Mutex::Autolock autoLock(mLock);

…………………………

    if (mUri.size() > 0) {

        status_t err = finishSetDataSource_l();----这个不会走了，如果是本地文件的话

…………………………

    if (mVideoTrack != NULL && mVideoSource == NULL) {

        status_t err = initVideoDecoder();-----------如果有videotrack初始化video的解码器

…………………………

    if (mAudioTrack != NULL && mAudioSource == NULL) {

        status_t err = initAudioDecoder();---------------如果有audiotrack初始化audio解码器

……………………..

    modifyFlags(PREPARING_CONNECTED, SET);

    if (isStreamingHTTP()) {

        postBufferingEvent_l(); ------一般不会走了

    } else {

        finishAsyncPrepare_l();----------对外宣布prepare完成，并从timeeventqueue中移除该queueitem，mAsyncPrepareEvent=null

    }

}

我们终于知道prepare主要目的了，根据类型找到解码器并初始化对应的解码器。那我们首先就来看看有videotrack的媒体文件是如何找到并初始化解码器吧。

先看图吧，了解大概步骤：

看完图就开讲了：

iniVideoDecoder目的是初始化解码器，取得已解码器的联系，解码数据输出格式等等。

frameworks/av/media/libstagefright/Awesomeplayer.cpp

status_t AwesomePlayer::initVideoDecoder(uint32_t flags) {

…………

mVideoSource = OMXCodec::Create(

            mClient.interface(), mVideoTrack->getFormat(),

            false, // createEncoder

            mVideoTrack,

            NULL, flags, USE_SURFACE_ALLOC ? mNativeWindow : NULL);

…………..

status_t err = mVideoSource->start();

}

我们先来看create函数到底干了啥吧：

frameworks/av/media/libstagefright/OMXCodec.cpp

sp OMXCodec::Create(

        const sp &omx,

        const sp &meta, bool createEncoder,

        const sp &source,

        const char matchComponentName,

        uint32_t flags,

        const sp &nativeWindow) {

…………..

bool success = meta->findCString(kKeyMIMEType, &mime);

    ……………

   (1) findMatchingCodecs(

            mime, createEncoder, matchComponentName, flags,

            &matchingCodecs, &matchingCodecQuirks);

……….

(2) sp observer = new OMXCodecObserver;

   （3） status_t err = omx->allocateNode(componentName, observer, &node);

……….

   (4) sp codec = new OMXCodec(

                    omx, node, quirks, flags,

                    createEncoder, mime, componentName,

                    source, nativeWindow);

          (5)  observer->setCodec(codec);

            (6)err = codec->configureCodec(meta);

…………

}

首先看下findMatchingCodecs，原来是根据mimetype找到匹配的解码组件，android4.1的寻找组件有了很大的变化，以前都是把codecinfo都写在代码上了，现在把他们都放到media_codec.xml文件中，full build 后会保存在“/etc/media_codecs.xml”,这个xml由各个芯片厂商来提供，这样以后添加起来就很方便，不用改代码了。一般是原生态的代码都是软解码。解码器的匹配方式是排名制，因为一般厂商的配置文件都有很多的同类型的编码器，谁排前面就用谁的。

frameworks/av/media/libstagefright/OMXCodec.cpp

void OMXCodec::findMatchingCodecs(

        const char mime,

        bool createEncoder, const char matchComponentName,

        uint32_t flags,

        Vector matchingCodecs,

        Vector matchingCodecQuirks) {

…………

const MediaCodecList list = MediaCodecList::getInstance();

………

for (;;) {

        ssize_t matchIndex =

            list->findCodecByType(mime, createEncoder, index);

………………..

        matchingCodecs->push(String8(componentName));

…………….

}

frameworks/av/media/libstagefright/MediaCodecList.cpp

onst MediaCodecList MediaCodecList::getInstance() {

   ..

    if (sCodecList == NULL) {

        sCodecList = new MediaCodecList;

    }

    return sCodecList->initCheck() == OK ? sCodecList : NULL;

}

MediaCodecList::MediaCodecList()

    : mInitCheck(NO_INIT) {

    FILE file = fopen("/etc/media_codecs.xml", "r");

    if (file == NULL) {

        ALOGW("unable to open media codecs configuration xml file.");

        return;

    }

    parseXMLFile(file);

}

有了匹配的componentName，我们就可以创建ComponentInstance，这由allocateNode方法来实现。

frameworks/av/media/libstagefright/omx/OMX.cpp

status_t OMX::allocateNode(

        const char name, const sp &observer, node_id node) {

   ……………………

    OMXNodeInstance instance = new OMXNodeInstance(this, observer);

    OMX_COMPONENTTYPE handle;

    OMX_ERRORTYPE err = mMaster->makeComponentInstance(

            name, &OMXNodeInstance::kCallbacks,

            instance, &handle);

……………………………

    node = makeNodeID(instance);

    mDispatchers.add(node, new CallbackDispatcher(instance));

    instance->setHandle(node, handle);

    mLiveNodes.add(observer->asBinder(), instance);

    observer->asBinder()->linkToDeath(this);

    return OK;

}

在allocateNode，我们要用到mMaster来创建component，但是这个mMaster什么时候初始化了呢？我们看下OMX的构造函数：

OMX::OMX()

    : mMaster(new OMXMaster),-----------原来在这呢！

      mNodeCounter(0) {

}

但是我们前面没有讲到OMX什么时候构造的啊？我们只能往回找了，原来我们在初始化Awesomeplayer的时候忽略掉了，罪过啊：

AwesomePlayer::AwesomePlayer()

    : mQueueStarted(false),

      mUIDValid(false),

      mTimeSource(NULL),

      mVideoRendererIsPreview(false),

      mAudioPlayer(NULL),

      mDisplayWidth(0),

      mDisplayHeight(0),

      mVideoScalingMode(NATIVE_WINDOW_SCALING_MODE_SCALE_TO_WINDOW),

      mFlags(0),

      mExtractorFlags(0),

      mVideoBuffer(NULL),

      mDecryptHandle(NULL),

      mLastVideoTimeUs(-1),

      mTextDriver(NULL) {

    CHECK_EQ(mClient.connect(), (status_t)OK) 这个就是创建的地方

mClient是OMXClient，

status_t OMXClient::connect() {

    sp sm = defaultServiceManager();

    sp binder = sm->getService(String16("media.player"));

    sp service = interface_cast(binder);---很熟悉吧，获得BpMediaplayerservice

    CHECK(service.get() != NULL);

    mOMX = service->getOMX();

    CHECK(mOMX.get() != NULL);

    if (!mOMX->livesLocally(NULL / node /, getpid())) {

        ALOGI("Using client-side OMX mux.");

        mOMX = new MuxOMX(mOMX);

    }

    return OK;

}

好了，我们直接进入mediaplayerservice.cpp看个究竟吧：

sp MediaPlayerService::getOMX() {

    Mutex::Autolock autoLock(mLock);

    if (mOMX.get() == NULL) {

        mOMX = new OMX;

    }

    return mOMX;

}

终于看到了OMX的创建了，哎以后得注意看代码才行！！！

我们搞了那么多探究OMXMaster由来有什么用呢？

OMXMaster::OMXMaster()

    : mVendorLibHandle(NULL) {

    addVendorPlugin();

    addPlugin(new SoftOMXPlugin);

}

void OMXMaster::addVendorPlugin() {

    addPlugin("libstagefrighthw.so");

}

原来是用来加载各个厂商的解码器（libstagefrighthw.so），还有就是把google本身的软解码器（SoftOMXPlugin）也加载了进来。那么这个libstagefrighthw.so在哪？我找了半天终于找到了，每个芯片厂商对应自己的libstagefrighthw

hardware/XX/media/libstagefrighthw/xxOMXPlugin

如何实例化自己解码器的component？我们以高通为例：

void OMXMaster::addPlugin(const char libname) {

    mVendorLibHandle = dlopen(libname, RTLD_NOW);

…………………………….

    if (createOMXPlugin) {

        addPlugin((createOMXPlugin)());-----创建OMXPlugin，并添加进我们的列表里

    }

}

hardware/qcom/media/libstagefrighthw/QComOMXPlugin.cpp

OMXPluginBase createOMXPlugin() {

    return new QComOMXPlugin;

}

QComOMXPlugin::QComOMXPlugin()

    : mLibHandle(dlopen("libOmxCore.so", RTLD_NOW)),----载入自己的omx API

      mInit(NULL),

      mDeinit(NULL),

      mComponentNameEnum(NULL),

      mGetHandle(NULL),

      mFreeHandle(NULL),

      mGetRolesOfComponentHandle(NULL) {

    if (mLibHandle != NULL) {

        mInit = (InitFunc)dlsym(mLibHandle, "OMX_Init");

        mDeinit = (DeinitFunc)dlsym(mLibHandle, "OMX_DeInit");

        mComponentNameEnum =

            (ComponentNameEnumFunc)dlsym(mLibHandle, "OMX_ComponentNameEnum");

        mGetHandle = (GetHandleFunc)dlsym(mLibHandle, "OMX_GetHandle");

        mFreeHandle = (FreeHandleFunc)dlsym(mLibHandle, "OMX_FreeHandle");

        mGetRolesOfComponentHandle =

            (GetRolesOfComponentFunc)dlsym(

                    mLibHandle, "OMX_GetRolesOfComponent");

        (mInit)();

    }

}

以上我们就可以用高通的解码器了。我们在创建component的时候就可以创建高通相应的component实例了：

OMX_ERRORTYPE OMXMaster::makeComponentInstance(

        const char name,

        const OMX_CALLBACKTYPE *callbacks,

        OMX_PTR appData,

        OMX_COMPONENTTYPE **component) {

    Mutex::Autolock autoLock(mLock);

    component = NULL;

    ssize_t index = mPluginByComponentName.indexOfKey(String8(name)); ----根据我们在media_codec.xml的解码器名字，在插件列表找到其索引

    OMXPluginBase plugin = mPluginByComponentName.valueAt(index); --根据索引找到XXOMXPlugin

    OMX_ERRORTYPE err =

        plugin->makeComponentInstance(name, callbacks, appData, component);

-----创建组件



    mPluginByInstance.add(component, plugin);

    return err;

}

hardware/qcom/media/libstagefrighthw/QComOMXPlugin.cpp

OMX_ERRORTYPE QComOMXPlugin::makeComponentInstance(

        const char name,

        const OMX_CALLBACKTYPE *callbacks,

        OMX_PTR appData,

        OMX_COMPONENTTYPE **component) {

    if (mLibHandle == NULL) {

        return OMX_ErrorUndefined;

    }

    String8 tmp;

    RemovePrefix(name, &tmp);

    name = tmp.string();

    return (mGetHandle)(

            reinterpret_cast(component),

            const_cast(name),

            appData, const_cast(callbacks));

}

哈哈，我们终于完成了app到寻找到正确解码器的工程了！！！

ComponentInstance, OMXCodecObserver，omxcodec，omx的关系和联系，我写了篇文章，可以到链接进去看看：

http://blog.csdn.net/tjy1985/article/details/7397752

OMXcodec通过binder（IOMX）跟omx建立了联系，解码器则通过注册的几个回调事件OMX_CALLBACKTYPE OMXNodeInstance::kCallbacks = {

    &OnEvent, &OnEmptyBufferDone, &OnFillBufferDone

}往OMXNodeInstance这个接口上报消息，OMX通过消息分发机制往OMXCodecObserver发消息，它再给注册进observer的omxcodec（observer->setCodec(codec);）进行最后的处理！

stagefright 通过OpenOMX联通解码器的过程至此完毕。

create最后一步就剩下configureCodec(meta)，主要是设置下输出的宽高和initNativeWindow。

忘了个事，就是OMXCOdec的状态：

enum State {

        DEAD,

        LOADED,

        LOADED_TO_IDLE,

        IDLE_TO_EXECUTING,

        EXECUTING,

        EXECUTING_TO_IDLE,

        IDLE_TO_LOADED,

        RECONFIGURING,

        ERROR

    };

在我们实例化omxcodec的时候该状态处于LOADED状态。

LOADER后应该就是LOADER_TO_IDLE，那什么时候进入该状态呢，就是我们下面讲的start方法：

status_t err = mVideoSource->start();

mVideoSource就是omxcodec，我们进入omxcodec.cpp探个究竟：

status_t OMXCodec::start(MetaData meta) {

….

return init();

}

status_t OMXCodec::init() {

……..

        err = allocateBuffers();

        err = mOMX->sendCommand(mNode, OMX_CommandStateSet, OMX_StateIdle);

        setState(LOADED_TO_IDLE);

……………………

}

start原来做了三件事啊，

1:allocateBuffers给输入端放入缓存的数据，给输出端准备匹配的native window

status_t OMXCodec::allocateBuffers() {

    status_t err = allocateBuffersOnPort(kPortIndexInput);

    if (err != OK) {

        return err;

    }

    return allocateBuffersOnPort(kPortIndexOutput);

}

2:分配完后通知解码器器端进入idle状态,sendCommand的流程可以参考http://blog.csdn.net/tjy1985/article/details/7397752

emptyBuffer过程

3:本身也处于IDLE。

到此我们的initVideoDecoder就完成了，initAudioDecoder流程也差不多一致，这里就不介绍了，有兴趣的可以自己跟进去看看。

prepare的最后一步finishAsyncPrepare_l()，对外宣布prepare完成，并从timeeventqueue中移除该queueitem，mAsyncPrepareEvent=null。

费了很多的口舌和时间，我们终于完成了prepare的过程，各路信息通道都打开了，往下就是播放的过程了。

五：播放流程video playback（三）

前面两篇文章，我们分别讲了setdataSource和prepare的过程，获得了mVideoTrack，mAudioTrack，mVideoSourc，mAudioSource，前两个来自于setdataSource过程，后面两是prepare。

status_t AwesomePlayer::setDataSource_l(const sp &extractor) {…

if (!haveVideo && !strncasecmp(mime.string(), "video/", 6)) {

          setVideoSource(extractor->getTrack(i));}

else if (!haveAudio && !strncasecmp(mime.string(), "audio/", 6)) {

            setAudioSource(extractor->getTrack(i));

……………..

}

}

void AwesomePlayer::setVideoSource(sp source) {

    CHECK(source != NULL);

    mVideoTrack = source;

}

void AwesomePlayer::setAudioSource(sp source) {

    CHECK(source != NULL);

    mAudioTrack = source;

}

mVideoSource = OMXCodec::Create(

            mClient.interface(), mVideoTrack->getFormat(),

            false, // createEncoder

            mVideoTrack,

            NULL, flags, USE_SURFACE_ALLOC ? mNativeWindow : NULL);

mAudioSource = OMXCodec::Create(

                mClient.interface(), mAudioTrack->getFormat(),

                false, // createEncoder

                mAudioTrack);

通过mVideoTrack，mAudioTrack我们找到了相应的解码器，并初始化了，下面我们就开讲mediaplayer如何播放了。前面的一些接口实现，我们就不讲了，不懂的可以回到setdataSource这一篇继续研究，我们直接看Awesomeplayer的实现。先看大体的时序图吧：

status_t AwesomePlayer::play_l() {

    modifyFlags(SEEK_PREVIEW, CLEAR);

…………

    modifyFlags(PLAYING, SET);

    modifyFlags(FIRST_FRAME, SET); ---设置PLAYING和FIRST_FRAME的标志位

…………………..

    if (mAudioSource != NULL) {-----mAudioSource不为空时初始化Audioplayer

        if (mAudioPlayer == NULL) {

            if (mAudioSink != NULL) {

      （1）        mAudioPlayer = new AudioPlayer(mAudioSink, allowDeepBuffering, this);

                mAudioPlayer->setSource(mAudioSource);

                seekAudioIfNecessary_l();

            }

        }

        CHECK(!(mFlags & AUDIO_RUNNING));

        if (mVideoSource == NULL) {-----如果单是音频，直接播放

….

     (2)       status_t err = startAudioPlayer_l(

                    false /* sendErrorNotification */);

                modifyFlags((PLAYING | FIRST_FRAME), CLEAR);

…………..

                return err;

            }

        }

    }

   ……

    if (mVideoSource != NULL) {-----有视频时，发送event到queue，等待处理

        // Kick off video playback

       (3) postVideoEvent_l();

        if (mAudioSource != NULL && mVideoSource != NULL) {----有视频，音频时，检查他们是否同步

       (4)     postVideoLagEvent_l();

        }

    }

    }

…………..

    return OK;

}

在playe_l方法里，我们可以看到首先是实例化一个audioplayer来播放音频，如果单单是音频直接就播放，现在我们是本地视频播放，将不会走第二步，直接走第三和第四步。我们看下postVideoEvent_l()方法，跟我们在讲prepareAsync_l的类似：

void AwesomePlayer::postVideoEvent_l(int64_t delayUs) {

……………

    mVideoEventPending = true;

    mQueue.postEventWithDelay(mVideoEvent, delayUs < 0 ? 10000 : delayUs);

}

mVideoEvent在我们构造awesomeplayer时已经定义：

mVideoEvent = new AwesomeEvent(this, &AwesomePlayer::onVideoEvent);

所以我们看onVideoEvent方法：

void AwesomePlayer::onVideoEvent() {

if (!mVideoBuffer) {

for (;;) {

         (1)   status_t err = mVideoSource->read(&mVideoBuffer, &options); ---mVideoSource(omxcodec)

            options.clearSeekTo();

            ++mStats.mNumVideoFramesDecoded;

}

(2)  status_t err = startAudioPlayer_l();

if ((mNativeWindow != NULL)

            && (mVideoRendererIsPreview || mVideoRenderer == NULL)) {

        mVideoRendererIsPreview = false;

     (3)   initRenderer_l();

    }

    if (mVideoRenderer != NULL) {

      mSinceLastDropped++;

     (4)   mVideoRenderer->render(mVideoBuffer);

    }

(5)   postVideoEvent_l();

}

我们看到通过read方法去解码一个个sample，获取videobuffer，然后render到surfaceTexture。

read 方法：

status_t OMXCodec::read(

        MediaBuffer **buffer, const ReadOptions options) {

if (mInitialBufferSubmit) {

        mInitialBufferSubmit = false;

        if (seeking) {

            CHECK(seekTimeUs >= 0);

            mSeekTimeUs = seekTimeUs;

            mSeekMode = seekMode;

            // There's no reason to trigger the code below, there's

            // nothing to flush yet.

            seeking = false;

            mPaused = false;

        }

        drainInputBuffers();---对应emptybuffer，输入端

        if (mState == EXECUTING) {

            // Otherwise mState == RECONFIGURING and this code will trigger

            // after the output port is reenabled.

            fillOutputBuffers();--对应fillbuffer，输出端

        }

    }

….

size_t index = mFilledBuffers.begin();

    mFilledBuffers.erase(mFilledBuffers.begin());

    BufferInfo info = &mPortBuffers[kPortIndexOutput].editItemAt(index);

    CHECK_EQ((int)info->mStatus, (int)OWNED_BY_US);

    info->mStatus = OWNED_BY_CLIENT;

    info->mMediaBuffer->add_ref();

    if (mSkipCutBuffer != NULL) {

        mSkipCutBuffer->submit(info->mMediaBuffer);

    }

    buffer = info->mMediaBuffer;

}

在讲read之前我们先来回顾下prepare时候的omxcodec::start方法，因为跟我们讲read有千丝万缕的关系，start方法：

status_t OMXCodec::start(MetaData meta) {

    Mutex::Autolock autoLock(mLock);

……….

    sp params = new MetaData;

    if (mQuirks & kWantsNALFragments) {

        params->setInt32(kKeyWantsNALFragments, true);

    }

    if (meta) {

        int64_t startTimeUs = 0;

        int64_t timeUs;

        if (meta->findInt64(kKeyTime, &timeUs)) {

            startTimeUs = timeUs;

        }

        params->setInt64(kKeyTime, startTimeUs);

    }

    status_t err = mSource->start(params.get()); ---我们以mp4为例，就是mpeg4source

    if (err != OK) {

        return err;

    }

    mCodecSpecificDataIndex = 0;

    mInitialBufferSubmit = true;

    mSignalledEOS = false;

   mNoMoreOutputData = false;

    mOutputPortSettingsHaveChanged = false;

    mSeekTimeUs = -1;

    mSeekMode = ReadOptions::SEEK_CLOSEST_SYNC;

    mTargetTimeUs = -1;

    mFilledBuffers.clear();

    mPaused = false;

    return init();

}

status_t OMXCodec::init() {

….

     err = allocateBuffers();

if (mQuirks & kRequiresLoadedToIdleAfterAllocation) {

        err = mOMX->sendCommand(mNode, OMX_CommandStateSet, OMX_StateIdle);

        CHECK_EQ(err, (status_t)OK);

        setState(LOADED_TO_IDLE); -------发送命令到component，让component处于Idle状态，经过两次回调后使component处于OMX_StateExecuting

    }

….

}

由于我们以MP4为例，所以mSource就是MPEG4Source，MPEG4Source在MPEG4Extractor.cpp,我们看下start方法做了什么：

status_t MPEG4Source::start(MetaData params) {

    Mutex::Autolock autoLock(mLock);

…………..

   mGroup = new MediaBufferGroup;

    int32_t max_size;

    CHECK(mFormat->findInt32(kKeyMaxInputSize, &max_size));

    mGroup->add_buffer(new MediaBuffer(max_size));

    mSrcBuffer = new uint8_t[max_size];

    mStarted = true;

    return OK;

}

原来是设定输入的最大buffer.

我再看看allocateBuffers();

status_t OMXCodec::allocateBuffers() {

    status_t err = allocateBuffersOnPort(kPortIndexInput);----配置输入端的buffer总量，大小等OMX_PARAM_PORTDEFINITIONTYPE

    if (err != OK) {

        return err;

    }

    return allocateBuffersOnPort(kPortIndexOutput);---配置输出端，并dequeuebuffer到OMX端

}

OMX_PARAM_PORTDEFINITIONTYPE 是component的配置信息。

typedef struct OMX_PARAM_PORTDEFINITIONTYPE {

    OMX_U32 nSize;                 /**< Size of the structure in bytes */

    OMX_VERSIONTYPE nVersion;     /**< OMX specification version information */

    OMX_U32 nPortIndex;            /**< Port number the structure applies to */

    OMX_DIRTYPE eDir;              /**< Direction (input or output) of this port */

    OMX_U32 nBufferCountActual;    /**< The actual number of buffers allocated on this port */

    OMX_U32 nBufferCountMin;       /**< The minimum number of buffers this port requires */

    OMX_U32 nBufferSize;           /**< Size, in bytes, for buffers to be used for this channel */

    OMX_BOOL bEnabled;             /**< Ports default to enabled and are enabled/disabled by

                                        OMX_CommandPortEnable/OMX_CommandPortDisable.

                                        When disabled a port is unpopulated. A disabled port

                                        is not populated with buffers on a transition to IDLE. */

    OMX_BOOL bPopulated;           /**< Port is populated with all of its buffers as indicated by

                                        nBufferCountActual. A disabled port is always unpopulated.

                                        An enabled port is populated on a transition to OMX_StateIdle

                                        and unpopulated on a transition to loaded. */

    OMX_PORTDOMAINTYPE eDomain;    /**< Domain of the port. Determines the contents of metadata below. /

    union {

        OMX_AUDIO_PORTDEFINITIONTYPE audio;

        OMX_VIDEO_PORTDEFINITIONTYPE video;

        OMX_IMAGE_PORTDEFINITIONTYPE image;

        OMX_OTHER_PORTDEFINITIONTYPE other;

    } format;

    OMX_BOOL bBuffersContiguous;

    OMX_U32 nBufferAlignment;

} OMX_PARAM_PORTDEFINITIONTYPE;

OMX_PARAM_PORTDEFINITIONTYPE的参数从哪里来呢？原来来自解码器端，包括输入输出端的buffer大小，总数等信息。

status_t OMXCodec::allocateBuffersOnPort(OMX_U32 portIndex) {

    if (mNativeWindow != NULL && portIndex == kPortIndexOutput) {

        return allocateOutputBuffersFromNativeWindow();------当输出的时候走这里，给输出端分配内存空间，并dequeue buffer 到OMX。

    }

    OMX_PARAM_PORTDEFINITIONTYPE def;

    InitOMXParams(&def);

    def.nPortIndex = portIndex;

    err = mOMX->getParameter(

            mNode, OMX_IndexParamPortDefinition, &def, sizeof(def));---从component获取OMX_PARAM_PORTDEFINITIONTYPE相关配置，具体哪些可以看上面的结构体

    if (err != OK) {

        return err;

    }

    size_t totalSize = def.nBufferCountActual def.nBufferSize; ---从getParameter获得的每个输入/输出端的buffer大小和总数

    mDealer[portIndex] = new MemoryDealer(totalSize, "OMXCodec");

    for (OMX_U32 i = 0; i < def.nBufferCountActual; ++i) {

        sp mem = mDealer[portIndex]->allocate(def.nBufferSize);

        CHECK(mem.get() != NULL);

        BufferInfo info;

        info.mData = NULL;

        info.mSize = def.nBufferSize;

        IOMX::buffer_id buffer;

        if (portIndex == kPortIndexInput

                && ((mQuirks & kRequiresAllocateBufferOnInputPorts)

                    || (mFlags & kUseSecureInputBuffers))) {

            if (mOMXLivesLocally) {

                mem.clear();

                err = mOMX->allocateBuffer(

                        mNode, portIndex, def.nBufferSize, &buffer,

                        &info.mData);-----给输入端分配内存空间，并使info.mData指向mNode的header

…………….

        info.mBuffer = buffer;

        info.mStatus = OWNED_BY_US;

        info.mMem = mem;

        info.mMediaBuffer = NULL;

      mPortBuffers[portIndex].push(info); ---BufferInfo 放到Vector mPortBuffers[2] mPortBuffers进行管理，到read的时候用，0是输入，1是输出。

………………………….

}

复习完start方法，我们就来讲reader方法了：

status_t OMXCodec::read(

        MediaBuffer **buffer, const ReadOptions options) {

if (mInitialBufferSubmit) {

        mInitialBufferSubmit = false;

………….

  drainInputBuffers();

        if (mState == EXECUTING) {

            // Otherwise mState == RECONFIGURING and this code will trigger

            // after the output port is reenabled.

            fillOutputBuffers();

        }

…………………..

    size_t index = mFilledBuffers.begin();

    mFilledBuffers.erase(mFilledBuffers.begin());

    BufferInfo info = &mPortBuffers[kPortIndexOutput].editItemAt(index);

    CHECK_EQ((int)info->mStatus, (int)OWNED_BY_US);

    info->mStatus = OWNED_BY_CLIENT;

    info->mMediaBuffer->add_ref();

    if (mSkipCutBuffer != NULL) {

        mSkipCutBuffer->submit(info->mMediaBuffer);

    }

    buffer = info->mMediaBuffer;

}

先看drainInputBuffers方法，主要是从mediasource读取数据元，

void OMXCodec::drainInputBuffers() {

    CHECK(mState == EXECUTING || mState == RECONFIGURING);

    if (mFlags & kUseSecureInputBuffers) {

        Vector buffers = &mPortBuffers[kPortIndexInput];---mPortBuffers是我们allocateBuffersOnPort方法存下来的对应的输入/输出bufferinfo数据

       for (size_t i = 0; i < buffers->size(); ++i) {---循环每次输入端能填充数据的buffer总数，这是由component的结构决定的，各个厂商的解码器配置不一样

            if (!drainAnyInputBuffer()-----往buffer里面填元数据，给解码器解码

                    || (mFlags & kOnlySubmitOneInputBufferAtOneTime)) {

               break;

            }

        }

    }

………………

}

bool OMXCodec::drainAnyInputBuffer() {

    return drainInputBuffer((BufferInfo )NULL);

}

bool OMXCodec::drainInputBuffer(BufferInfo info) {

for (;;) {

        MediaBuffer srcBuffer;

        if (mSeekTimeUs >= 0) {

            if (mLeftOverBuffer) {

                mLeftOverBuffer->release();

                mLeftOverBuffer = NULL;

            }

            MediaSource::ReadOptions options;

            options.setSeekTo(mSeekTimeUs, mSeekMode);

            mSeekTimeUs = -1;

            mSeekMode = ReadOptions::SEEK_CLOSEST_SYNC;---seek模式

            mBufferFilled.signal();

            err = mSource->read(&srcBuffer, &options);---读mediasource，我们以mpeg4为例，它的实现就在MPEG4Extrator.cpp(),根据seek模式和seek时间从sampletable里面找到meta_data。存到srcBuffer。

if (mFlags & kUseSecureInputBuffers) {

            info = findInputBufferByDataPointer(srcBuffer->data());---让bufferinfo的mData指向元数据的data

            CHECK(info != NULL);

        }

      err = mOMX->emptyBuffer(

            mNode, info->mBuffer, 0, offset,

            flags, timestampUs); ----对应component的方法是OMX_EmptyThisBuffer，回调消息为：EmptyBufferDone。

    if (err != OK) {

        setState(ERROR);

        return false;

    }

    info->mStatus = OWNED_BY_COMPONENT;----设置状态为OWNED_BY_COMPONENT

}

从上面的分析，我们得知emtyBuffer后在5msec之内会有个EmptyBufferDone回调，我们看下omxcodec对该回调的处理：

void OMXCodec::on_message(const omx_message &msg) {

case omx_message::EMPTY_BUFFER_DONE:

………………

IOMX::buffer_id buffer = msg.u.extended_buffer_data.buffer;

            CODEC_LOGV("EMPTY_BUFFER_DONE(buffer: %p)", buffer);

            Vector buffers = &mPortBuffers[kPortIndexInput];

            size_t i = 0;

            while (i < buffers->size() && (buffers)[i].mBuffer != buffer) {

                ++i;

            }

        BufferInfo* info = &buffers->editItemAt(i);

-------------通过buffer_id找到Vector bufferInfo

            info->mStatus = OWNED_BY_US;-------设置info的状态为OWNED_BY_US

           info->mMediaBuffer->release();-----释放mediabuffer

           info->mMediaBuffer = NULL;



…………….

if (mState != ERROR

                    && mPortStatus[kPortIndexInput] != SHUTTING_DOWN) {

                CHECK_EQ((int)mPortStatus[kPortIndexInput], (int)ENABLED);

                if (mFlags & kUseSecureInputBuffers) {

                    drainAnyInputBuffer();----下一片段buffer移交给component

                } else {

                    drainInputBuffer(&buffers->editItemAt(i));

                }

}

emptybuffer后应该就是fillOutputBuffer：

void OMXCodec::fillOutputBuffer(BufferInfo info) {

    CHECK_EQ((int)info->mStatus, (int)OWNED_BY_US);

    if (mNoMoreOutputData) {

        CODEC_LOGV("There is no more output data available, not "

             "calling fillOutputBuffer");--------------没有数据了退出

        return;

    }

    if (info->mMediaBuffer != NULL) {

        sp graphicBuffer = info->mMediaBuffer->graphicBuffer();

        if (graphicBuffer != 0) {

            // When using a native buffer we need to lock the buffer before

            // giving it to OMX.

            CODEC_LOGV("Calling lockBuffer on %p", info->mBuffer);

            int err = mNativeWindow->lockBuffer(mNativeWindow.get(),

                    graphicBuffer.get()); -------锁定该buffer，准备render图像

            if (err != 0) {

               CODEC_LOGE("lockBuffer failed w/ error 0x%08x", err);

                setState(ERROR);

                return;

            }

        }

    }

    CODEC_LOGV("Calling fillBuffer on buffer %p", info->mBuffer);

    status_t err = mOMX->fillBuffer(mNode, info->mBuffer);---------填充输出端buffer

……….

    info->mStatus = OWNED_BY_COMPONENT;

}

fillbuffer后获得mVideoBuffer就可以在Awesomeplayer的onvideoEvent方法中的mVideoRenderer->render(mVideoBuffer);进行图像的显示了。
以上我们就是播放的过程了。到此多媒体本地播放流程全部讲完了，里面很多细节的东西，还得大伙自己深入理解，往后有什么需要补充和添加的，我会再次补充上。

六：MP4分析

我们讲多媒体，涉及到的最多的就是MP4文件和MP3文件了，但是我们对这两个文件的格式了解多少呢，它的由有哪些部分部分组成呢？它的核心部件是哪些？它哪些部分是供解码器去解析的呢？带着这些疑问，我们首先来探索下MP4文件。

我们首先用MP4Info这个工具来看下MP4的大貌：

从上图我们可以看到MP4文件中的所有数据都装在box中，也就是说MP4文件由若干个box组成，每个box有类型和长度，可以将box理解为一个数据对象块。box中可以包含另一个box，这种box称为Container box。一个MP4文件首先会有且只有一个“ftyp”类型的box，作为MP4格式的标志并包含关于文件的一些信息；之后会有且只有一个“moov”类型的box（Movie Box），它是一种container box，子box包含了媒体的metadata信息；一个moov可以由多个tracks组成。每个track就是一个随时间变化的媒体序列，例如，视频帧序列。track里的每个时间单位是一个sample，它可以是一帧视频，或者音频。sample按照时间顺序排列。注意，一帧音频可以分解成多个音频sample，所以音频一般用sample作为单位，而不用帧。MP4文件的媒体数据包含在“mdat”类型的box（Midia Data Box）中，该类型的box也是container box，可以有多个，也可以没有（当媒体数据全部引用其他文件时），媒体数据的结构由metadata进行描述。“free”类型的box，就是一些自由的信息，可以写，也可以不写。

box中的字节序为网络字节序，也就是大端字节序（Big-Endian），简单的说，就是一个32位的4字节整数存储方式为高位字节在内存的低端。Box由header和body组成，其中header统一指明box的大小和类型，body根据类型有不同的意义和格式。

BOX

标准的box开头的4个字节（32位）为box size，该大小包括box header和box body整个box的大小，这样我们就可以在文件中定位各个box。如果size为1，则表示这个box的大小为large size，真正的size值要在largesize域上得到。（实际上只有“mdat”类型的box才有可能用到large size。）如果size为0，表示该box为文件的最后一个box，文件结尾即为该box结尾。（同样只存在于“mdat”类型的box中。）

size后面紧跟的32位为box type，一般是4个字符，如“ftyp”、“moov”等，这些box type都是已经预定义好的，分别表示固定的意义。如果是“uuid”，表示该box为用户扩展类型。如果box type是未定义的，应该将其忽略。

对应的代码片段为：framework/av/media/libstagefright/MPEG4Extrator.cpp

status_t MPEG4Extractor::parseChunk(off64_t offset, int depth) {

    ALOGV("entering parseChunk %lld/%d", offset, depth);

    uint32_t hdr[2];

    static const char mQTMajorBrand = "qt ";

    if (mDataSource->readAt(offset, hdr, 8) < 8) {

        return ERROR_IO;

    }

    uint64_t chunk_size = ntohl(hdr[0]);---box size

    uint32_t chunk_type = ntohl(hdr[1]);---box type

    off64_t data_offset = offset + 8;

    if (chunk_size == 1) {

        if (mDataSource->readAt(offset + 8, &chunk_size, 8) < 8) {---读取box size的大小

            return ERROR_IO;

        }

        chunk_size = ntoh64(chunk_size); ---将64位的网络字节转换为主机字节

        data_offset += 8;

……….

    char chunk[5];

    MakeFourCCString(chunk_type, chunk); ----FOURCC全称Four-Character Codes，是在编程

中非常常用的东西，一般用作标示符。它是一个32位的标示符，其实就是typedef unsigned long FOURCC

}

…………

}

static void MakeFourCCString(uint32_t x, char s) {

    s[0] = x >> 24;

    s[1] = (x >> 16) & 0xff;

    s[2] = (x >> 8) & 0xff;

    s[3] = x & 0xff;

    s[4] = '\0';

}

File Type Box(ftyp)

File Type Box（ftyp）：该box有且只有1个，并且只能被包含在文件层，而不能被其他box包含。该box应该被放在文件的最开始，指示该MP4文件应用的相关信息。 “ftyp” body依次包括1个32位的major brand（4个字符），1个32位的minor version（整数）和1个以32位（4个字符）为单位元素的数组compatible brands。这些都是用来指示文件应用级别的信息。该box的字节实例如下：

对应的的代码如下：

framework/av/media/libstagefright/MPEG4Extrator.cpp

status_t MPEG4Extractor::parseChunk(off64_t offset, int depth) {

switch(chunk_type) {

        case FOURCC('f', 't', 'y', 'p'):

        {

            if (chunk_data_size < 4) {

                return ERROR_MALFORMED;

            }

            uint32_t ftype;

            if (mDataSource->readAt(data_offset, &ftype, 4) < 4) {

                return ERROR_IO;

            }

            MakeFourCCString(ntohl(ftype), mMajorBrand); -----major brand

            offset += chunk_size;

            break;

        }

}

Movie Box（moov）

该box包含了文件媒体的metadata信息，“moov”是一个container box，具体内容信息由子box诠释。同File Type Box一样，该box有且只有一个，且只被包含在文件层。一般情况下，
“moov”会紧随“ftyp”出现。一般情况下， “moov”中会包含1个“mvhd”和若干个“trak”。其中“mvhd”为header box，一般作为“moov”的第一个子box出现（对于其他container box来说，header box都应作为首个子box出现）。“trak”包含了一个track的相关信息，是一个container box。结构如下图：

Movie Header Box（mvhd）

字段

字节数

意义

box size

4

box大小

box type

4

box类型

version

1

box版本，0或1，一般为0。（以下字节数均按version=0）

flags

3

creation time

4

创建时间（相对于UTC时间1904-01-01零点的秒数）

modification time

4

修改时间

time scale

4

文件媒体在1秒时间内的刻度值，可以理解为1秒长度的时间单元数

duration

4

该track的时间长度，用duration和time scale值可以计算track时长，比如audio track的time scale = 8000, duration = 560128，时长为70.016，video track的time scale = 600, duration = 42000，时长为70

rate

4

推荐播放速率，高16位和低16位分别为小数点整数部分和小数部分，即[16.16] 格式，该值为1.0（0x00010000）表示正常前向播放

volume

2

与rate类似，[8.8] 格式，1.0（0x0100）表示最大音量

reserved

10

保留位

matrix

36

视频变换矩阵

pre-defined

24

next track id

4

下一个track使用的id号

status_t MPEG4Extractor::parseChunk(off64_t offset, int depth) {

    ALOGV("entering parseChunk %lld/%d", offset, depth);

    uint32_t hdr[2];

    static const char* mQTMajorBrand = "qt ";

    if (mDataSource->readAt(offset, hdr, 8) < 8) {

        return ERROR_IO;

    }

    uint64_t chunk_size = ntohl(hdr[0]);---box size

    uint32_t chunk_type = ntohl(hdr[1]);---box type

………………….

case FOURCC('m', 'v', 'h', 'd'):

        {

            if (chunk_data_size < 12) { //increase to 16?---

                return ERROR_MALFORMED;

            }

            uint8_t header[16];

            if (mDataSource->readAt(

                        data_offset, header, sizeof(header))

                    < (ssize_t)sizeof(header)) {

                return ERROR_IO;

            }

            int64_t creationTime;

            if (header[0] == 1) {

                creationTime = U64_AT(&header[4]);

                mFileMetaData->setInt64(kKeyEditOffset, 0 );

            } else if (header[0] != 0) {

                return ERROR_MALFORMED;

            } else {

                creationTime = U32_AT(&header[4]);-------创建时间，4个字节

                int32_t mvTimeScale = U32_AT(&header[12]);---时间刻度，4个字节

                mFileMetaData->setInt32(kKeyEditOffset, mvTimeScale );

            }

            String8 s;

            convertTimeToDate(creationTime, &s);

            mFileMetaData->setCString(kKeyDate, s.string());

            offset += chunk_size;

            break;

        }

Track Box（trak）

“trak”也是一个container box，其子box包含了该track的媒体数据引用和描述（hint track除外）。一个MP4文件中的媒体可以包含多个track，且至少有一个track，这些track之间彼此独立，有自己的时间和空间信息。“trak”必须包含一个“tkhd”和一个“mdia”，此外还有很多可选的box其中“tkhd”为track header box，“mdia”为media box，该box是一个包含一些track媒体数据信息box的container box。

status_t MPEG4Extractor::parseChunk(off64_t offset, int depth) {

    ALOGV("entering parseChunk %lld/%d", offset, depth);

    uint32_t hdr[2];

    static const char* mQTMajorBrand = "qt ";

    if (mDataSource->readAt(offset, hdr, 8) < 8) {

        return ERROR_IO;

    }

    uint64_t chunk_size = ntohl(hdr[0]);---box size

    uint32_t chunk_type = ntohl(hdr[1]);---box type

……………………..

if (chunk_type == FOURCC('t', 'r', 'a', 'k')) {

                isTrack = true;

                Track track = new Track; --- 如果是Track，new 个track

                track->next = NULL;

                if (mLastTrack) {

                    mLastTrack->next = track;

                } else {

                    mFirstTrack = track;

                }

                mLastTrack = track;

                track->meta = new MetaData;

                track->includes_expensive_metadata = false;

                track->skipTrack = false;

                track->timescale = 0;

                track->meta->setCString(kKeyMIMEType, "application/octet-stream");

            }

            off64_t stop_offset = offset + chunk_size;

            offset = data_offset;

            while (offset < stop_offset) {

                if (stop_offset - offset >= 8) {

                    status_t err = parseChunk(offset, depth + 1);

                    if (err != OK) {

                        if(chunk_type == FOURCC('u', 'd', 't', 'a')){

                            ALOGW("error in udta atom, ignoring %llu bytes",stop_offset - offset);

                            offset = stop_offset;

                        } else {

                            return err;

                        }

                    }

                }

………….

}

七、MP4分析（二）

Sample Table Box（stbl）

“stbl”几乎是普通的MP4文件中最复杂的一个box了。sample是媒体数据存储的单位，存储在media的chunk中，chunk和sample的长度均可互不相同。chunk是几个sample的集合。“stbl”包含了关于track中sample所有时间和位置的信息，以及sample的编解码等信息。利用这个表，可以解释sample的时序、类型、大小以及在各自存储容器中的位置。“stbl”是一个container box，其子box包括：sample description box（stsd）、time to sample box（stts）、sample size box（stsz或stz2）、sample to chunk box（stsc）、chunk offset box（stco或co64）、composition time to sample box（ctts）、sync sample box（stss）等。“stsd”必不可少，且至少包含一个条目，该box包含了data reference box进行sample数据检索的信息。没有“stsd”就无法计算media sample的存储位置。“stsd”包含了编码的信息，其存储的信息随媒体类型不同而不同。

if (chunk_type == FOURCC('s', 't', 'b', 'l')) {

                ALOGV("sampleTable chunk is %d bytes long.", (size_t)chunk_size);

                if (mDataSource->flags()

                        & (DataSource::kWantsPrefetching

                            | DataSource::kIsCachingDataSource)) {

                    sp cachedSource =

                        new MPEG4DataSource(mDataSource);

                    if (cachedSource->setCachedRange(offset, chunk_size) == OK) {

                        mDataSource = cachedSource;

                    }

                }

                mLastTrack->sampleTable = new SampleTable(mDataSource);----创建sampletable，每个track对应一个sampletable

            }

Sample Description Box（stsd）

box header和version字段后会有一个entry count字段，根据entry的个数，每个entry会有type信息，如“vide”、“sund”等，根据type不同sample description会提供不同的信息，例如对于video track，会有“VisualSampleEntry”类型信息，对于audio track会有“AudioSampleEntry”类型信息。视频的编码类型、宽高、长度，音频的声道、采样等信息都会出现在这个box中。

case FOURCC('s', 't', 's', 'd'):

        {

,…………………………….

            uint32_t entry_count = U32_AT(&buffer[4]);

            off64_t stop_offset = offset + chunk_size;

            offset = data_offset + 8;

            if (entry_count > 1) {----针对3GPP，有可能有多个entry_count，但目前我们每个track支持单类型的media

                // For 3GPP timed text, there could be multiple tx3g boxes contain

                // multiple text display formats. These formats will be used to

                // display the timed text.

                const char mime;

                CHECK(mLastTrack->meta->findCString(kKeyMIMEType, &mime));

                if (!strcasecmp(mime, MEDIA_MIMETYPE_TEXT_3GPP)) {

                     ALOGV("Text track found");

                     for (uint32_t i = 0; i < entry_count; ++i) {

                     status_t err = parseChunk(offset, depth + 1);

                        if (err != OK) {

                            return err;

                        }

                     }

                    // For now we only support a single type of media per track.

                }

                else {

                     status_t err = mLastTrack->sampleTable->setSampleDescParams(entry_count, offset, chunk_data_size);

                     if (err != OK) {

                         return ERROR_IO;

                     }

                     //视频的编码类型、宽高、长度，音频的声道、采样等信息

                     mHasVideo = true;

                     uint8_t avc1[86];//(avc1-avcc) which is fixed

                     if (mDataSource->readAt(offset, avc1, sizeof(avc1)) < (ssize_t)sizeof(avc1)) {

                         return ERROR_IO;

                     }

                     uint32_t chunk_type = U32_AT(&avc1[4]);

                     uint16_t data_ref_index = U16_AT(&avc1[14]);

                     uint16_t width = U16_AT(&avc1[32]);

                     uint16_t height = U16_AT(&avc1[34]);

                     mLastTrack->meta->setCString(kKeyMIMEType, FourCC2MIME(chunk_type));

                     mLastTrack->meta->setInt32(kKeyWidth, width);

                     mLastTrack->meta->setInt32(kKeyHeight, height);

                     uint8_t avcc;

                     uint32_t avccSize;

                     mLastTrack->sampleTable->getSampleDescAtIndex(1, &avcc, &avccSize);

                     mLastTrack->meta->setData(kKeyAVCC, kTypeAVCC, avcc, avccSize);

                     offset = stop_offset;

                }

            } else {

                 for (uint32_t i = 0; i < entry_count; ++i) {

                     status_t err = parseChunk(offset, depth + 1);

                     if (err != OK) {

                        return err;

                     }

                 } // end of for

            }//end of entry count 1

            if (offset != stop_offset) {

                return ERROR_MALFORMED;

            }

            break;

        }

Time To Sample Box（stts）

“stts”存储了sample的duration，描述了sample时序的映射方法，我们通过它可以找到任何时间的sample。“stts”可以包含一个压缩的表来映射时间和sample序号，用其他的表来提供每个sample的长度和指针。表中每个条目提供了在同一个时间偏移量里面连续的sample序号，以及samples的偏移量。递增这些偏移量，就可以建立一个完整的time to sample表。

case FOURCC('s', 't', 't', 's'):

        {

            status_t err =

                mLastTrack->sampleTable->setTimeToSampleParams(---该方法在SampleTable.cpp，映射时间和sample序号

                        data_offset, chunk_data_size);

            if (err != OK) {

                return err;

            }

            offset += chunk_size;

            break;

        }

Sample Size Box（stsz）

“stsz” 定义了每个sample的大小，包含了媒体中全部sample的数目和一张给出每个sample大小的表。这个box相对来说体积是比较大的。

case FOURCC('s', 't', 's', 'z'):

        case FOURCC('s', 't', 'z', '2'):

        {

            status_t err =

                mLastTrack->sampleTable->setSampleSizeParams(-----该方法在SampleTable.cpp，设置sample大小

                     chunk_type, data_offset, chunk_data_size);

            if (err != OK) {

                return err;

            }

            size_t max_size;

            err = mLastTrack->sampleTable->getMaxSampleSize(&max_size);

            if (err != OK) {

                return err;

            }

            // Assume that a given buffer only contains at most 10 fragments,

            // each fragment originally prefixed with a 2 byte length will

            // have a 4 byte header (0x00 0x00 0x00 0x01) after conversion,

            // and thus will grow by 2 bytes per fragment.

            mLastTrack->meta->setInt32(kKeyMaxInputSize, max_size + 10 * 2);

            offset += chunk_size;

            // Calculate average frame rate.

            const char mime;

            CHECK(mLastTrack->meta->findCString(kKeyMIMEType, &mime));

            if (!strncasecmp("video/", mime, 6)) {

                size_t nSamples = mLastTrack->sampleTable->countSamples();

                int64_t durationUs;

                if (mLastTrack->meta->findInt64(kKeyDuration, &durationUs)) {

                    if (durationUs > 0) {

                        int32_t frameRate = (nSamples * 1000000LL +

                                    (durationUs >> 1)) / durationUs;

                        mLastTrack->meta->setInt32(kKeyFrameRate, frameRate);

                    }

                }

            }

            break;

        }

Sample To Chunk Box（stsc）

用chunk组织sample可以方便优化数据获取，一个chunk包含一个或多个sample。“stsc”中用一个表描述了sample与chunk的映射关系，查看这张表就可以找到包含指定sample的chunk，从而找到这个sample。

case FOURCC('s', 't', 's', 'c'):

        {

            status_t err =

                mLastTrack->sampleTable->setSampleToChunkParams(该方法在SampleTable.cpp，映射sample和chunk的关系，一个或多个sample组成一个chunk

                        data_offset, chunk_data_size);

            if (err != OK) {

                return err;

            }

            offset += chunk_size;

            break;

        }

Sync Sample Box（stss）

“stss”确定media中的关键帧。对于压缩媒体数据，关键帧是一系列压缩序列的开始帧，其解压缩时不依赖以前的帧，而后续帧的解压缩将依赖于这个关键帧。“stss”可以非常紧凑的标记媒体内的随机存取点，它包含一个sample序号表，表内的每一项严格按照sample的序号排列，说明了媒体中的哪一个sample是关键帧。如果此表不存在，说明每一个sample都是一个关键帧，是一个随机存取点。

如何查找关键帧呢？

1：确定给定时间的sample序号检查sync sample atom来发现这个sample序号之后的key frame

2：检查sample-to-chunk atom来发现对应该sample的chunk

3：从chunk offset atom中提取该chunk的偏移量

4：利用sample size atom找到sample在trunk内的偏移量和sample的大小

case FOURCC('s', 't', 's', 's'):

        {

            status_t err =

                mLastTrack->sampleTable->setSyncSampleParams(----设置关键帧

                        data_offset, chunk_data_size);

            if (err != OK) {

                return err;

            }

            offset += chunk_size;

            break;

        }

Chunk Offset Box（stco）

“stco”定义了每个chunk在媒体流中的位置。位置有两种可能，32位的和64位的，后者对非常大的电影很有用。在一个表中只会有一种可能，这个位置是在整个文件中的，而不是在任何box中的，这样做就可以直接在文件中找到媒体数据，而不用解释 box。需要注意的是一旦前面的box有了任何改变，这张表都要重新建立，因为位置信息已经改变了。

case FOURCC('s', 't', 'c', 'o'):

        case FOURCC('c', 'o', '6', '4'):

        {

            status_t err =

                mLastTrack->sampleTable->setChunkOffsetParams(---设置chunk的偏移量

                        chunk_type, data_offset, chunk_data_size);

            if (err != OK) {

                return err;

            }

            *offset += chunk_size;

            break;

        }

Free Space Box（free或skip）

“free”中的内容是无关紧要的，可以被忽略。该box被删除后，不会对播放产生任何影响。

Meida Data Box（mdat）

该box包含于文件层，可以有多个，也可以没有（当媒体数据全部为外部文件引用时），用来存储媒体数据。

下图为总的概括：

参考资料：http://mpeg.chiariglione.org/standards/mpeg-4/mpeg-4.htm

具体源码：frameworks/av/media/libstagefright/MPEG4Extractor.cpp

                      frameworks/av/media/libstagefright/sampletable.cpp

好了，MP4文件格式已经介绍完了，video recoder也会用到这些知识，望大家好好研究研究。

八、流媒体

  从这篇开始我们将进入流媒体的环节，流媒体在android中有nuplayer来实现的，在开始讲解android流媒体前，我们先来讲讲流媒体传输协议，了解了基本协议，我们在看代码的过程中，就会有事半功倍的效果。我们将主要讲解RTSP，HTTP,HTTPS, SDP四种协议。

一：RTSP协议简介
　　实时流协议RTSP是一个应用层协议，用于控制具有实时特性的数据（例如多媒体流）的传送。

    RTSP协议一般与RTP/RTCP和RSVP等底层协议一起协同工作，提供基于Internet的整套的流服务。它可以选择发送通道（例如：UDP、组播UDP和TCP）和基于RTP的发送机制。它可以应用于组播和点播。RTP, RTCP,RSVP 定义如下：

　　1. 实时传输协议RTP(Real-time Transport protocol)

　　2. 实时传输控制协议RTCP(Real-time Transport Control protocol)

　　3. 实时流协议RTSP(Real Time Streaming protocol)

　　4. 资源预留协议RSVP(Resource Reserve Protocol)

RTSP协议机理：

   客户机在向视频服务器请求视频服务之前，首先通过HTTP协议从Web服务器获取所请求视频服务的演示描述（Presentation description ）文件，在RTSP中，每个演示（Presentation）及其所对应的媒体流都由一个RTSP URL标识。整个演示及媒体特性都在一个演示描述（Presentation description ）文件中定义，该文件可能包括媒体编码方式、语言、RTSP URLs、目标地址、端口及其它参数。用户在向服务器请求某个连续媒体流的服务之前，必须首先从服务器获得该媒体流的演示描述（Presentation description ）文件以得到必需的参数，演示描述文件的获取可采用HTTP、email或其他方法。利用该文件提供的信息定位视频服务地址（包括视频服务器地址和端口号）及视频服务的编码方式等信息。然后客户机根据上述信息向视频服务器请求视频服务。视频服务初始化完毕，视频服务器为该客户建立一个新的视频服务流，客户端与服务器运行实时流控制协议RTSP，以对该流进行各种VCR控制信号的交换，如播放（PLAY）、停止（PAUSE）、快进、快退等。当服务完毕，客户端提出拆线（TEARDOWN）请求。服务器使用RTP/UDP协议将媒体数据传输给客户端，一旦数据抵达客户端，客户端应用程序即可播放输出。在流式传输中，使用RTP/RTCP/UDP和RTSP/TCP两种不同的通信协议在客户端和服务器间建立联系。如下图：

     RTSP中的所有的操作都是通过服务器和客户方的消息应答来完成的，其消息包括请求（Request）和响应（Response）两种，RTSP正是通过服务器和客户端的消息应答来完成媒体流的创建、初始化（SETUP）、VCR控制（PLAY、PAUSE）以及拆线（TEARDOWN）等操作的。如下图：

RSTP 一些基本方法及用途：

OPTIONS  获得有效方法

SETUP    建立传输

ANNOUNCE 改变媒体文件的类型

DESCRIBE 获得媒体文件的类型

PLAY     播放

RECORD   刻录

REDIRECT  转换客户端到新的服务器

PAUSE     暂停

SET PARAMETER 设置设备，编码等参数

TEARDOWN  移除状态

完整的播放过程：

GET 过程：

C->W: GET /twister.sdp HTTP/1.1

Host: www.example.com

Accept: application/sdp

W->C: HTTP/1.0 200 OK

Content-Type: application/sdp

v=0

o=- 2890844526 2890842807 IN IP4 192.16.24.202

s=RTSP Session

m=audio 0 RTP/AVP 0

a=control:rtsp://audio.com/twister/audio.en

m=video 0 RTP/AVP 31

a=control:rtsp://video.com/twister/video

SETUP过程：

C->A（audio）: SETUP rtsp://audio.com/twister/audio.en RTSP/1.0

CSeq: 1

Transport: RTP/AVP/UDP;unicast

;client_port=3056-3057

A->C: RTSP/1.0 200 OK

CSeq: 1

Session: 12345678

Transport: RTP/AVP/UDP;unicast

;client_port=3056-3057;

;server_port=5000-5001

C->V（video）: SETUP rtsp://video.com/twister/video RTSP/1.0

CSeq: 1

Transport: RTP/AVP/UDP;unicast

;client_port=3058-3059

V->C: RTSP/1.0 200 OK

CSeq: 1

Session: 23456789

Transport: RTP/AVP/UDP;unicast

;client_port=3058-3059

;server_port=5002-5003

PLAY 过程：

C->V: PLAY rtsp://video.com/twister/video RTSP/1.0

CSeq: 2

Session: 23456789

Range: smpte=0:10:00-

V->C: RTSP/1.0 200 OK

CSeq: 2

Session: 23456789

Range: smpte=0:10:00-0:20:00

RTP-Info: url=rtsp://video.com/twister/video

;seq=12312232;rtptime=78712811

C->A: PLAY rtsp://audio.com/twister/audio.en RTSP/1.0

CSeq: 2

Session: 12345678

Range: smpte=0:10:00-

A->C: RTSP/1.0 200 OK

CSeq: 2

Session: 12345678

Range: smpte=0:10:00-0:20:00

RTP-Info: url=rtsp://audio.com/twister/audio.en

;seq=876655;rtptime=1032181

close 过程：

C->A: TEARDOWN rtsp://audio.com/twister/audio.en RTSP/1.0

CSeq: 3

Session: 12345678

A->C: RTSP/1.0 200 OK

CSeq: 3

C->V: TEARDOWN rtsp://video.com/twister/video RTSP/1.0

CSeq: 3

Session: 23456789

V->C: RTSP/1.0 200 OK

CSeq: 3

关于RTSP的一些时间概念：

normal play time (NPT): seconds, microseconds

MPTE timestamps (seconds, frames)

absolute time (for live events)

二　HTTP协议简介

　　HTTP是一个属于应用层的面向对象的协议，由于其简捷、快速的方式，适用于分布式超媒体信息系统。它于1990年提出，经过几年的使用与发展，得到不断地完善和扩展。目前在WWW中使用的是HTTP/1.0的第六版，HTTP/1.1的规范化工作正在进行之中，而且HTTP-NG(Next Generation of HTTP)的建议已经提出。

1：HTTP协议的主要特点可概括如下：

　　1.支持客户/服务器模式。

　　2.简单快速：客户向服务器请求服务时，只需传送请求方法和路径。请求方法常用的有GET、HEAD、POST。每种方法规定了客户与服务器联系的类型不同。

　　由于HTTP协议简单，使得HTTP服务器的程序规模小，因而通信速度很快。

　　3.灵活：HTTP允许传输任意类型的数据对象。正在传输的类型由Content-Type加以标记。

　　4.无连接：无连接的含义是限制每次连接只处理一个请求。服务器处理完客户的请求，并收到客户的应答后，即断开连接。采用这种方式可以节省传输时间。

　　5.无状态：HTTP协议是无状态协议。无状态是指协议对于事务处理没有记忆能力。缺少状态意味着如果后续处理需要前面的信息，则它必须重传，这样可能导致每次连接传送的数据量增大。另一方面，在服务器不需要先前信息时它的应答就较快。

2：HTTP协议的几个重要概念

　　1.连接(Connection)：一个传输层的实际环流，它是建立在两个相互通讯的应用程序之间。

　　2.消息(Message)：HTTP通讯的基本单位，包括一个结构化的八元组序列并通过连接传输。

　　3.请求(Request)：一个从客户端到服务器的请求信息包括应用于资源的方法、资源的标识符和协议的版本号

　　4.响应(Response)：一个从服务器返回的信息包括HTTP协议的版本号、请求的状态(例如“成功”或“没找到”)和文档的MIME类型。

　　5.资源(Resource)：由URI标识的网络数据对象或服务。

　　6.实体(Entity)：数据资源或来自服务资源的回映的一种特殊表示方法，它可能被包围在一个请求或响应信息中。一个实体包括实体头信息和实体的本身内容。

　　7.客户机(Client)：一个为发送请求目的而建立连接的应用程序。

　　8.用户代理(User agent)：初始化一个请求的客户机。它们是浏览器、编辑器或其它用户工具。

　　9.服务器(Server)：一个接受连接并对请求返回信息的应用程序。

　　10.源服务器(Origin server)：是一个给定资源可以在其上驻留或被创建的服务器。

　　11.代理(Proxy)：一个中间程序，它可以充当一个服务器，也可以充当一个客户机，为其它客户机建立请求。请求是通过可能的翻译在内部或经过传递到其它的服务器中。一个代理在发送请求信息之前，必须解释并且如果可能重写它。

　　代理经常作为通过防火墙的客户机端的门户，代理还可以作为一个帮助应用来通过协议处理没有被用户代理完成的请求。

　　12.网关(Gateway)：一个作为其它服务器中间媒介的服务器。与代理不同的是，网关接受请求就好象对被请求的资源来说它就是源服务器；发出请求的客户机并没有意识到它在同网关打交道。
　　网关经常作为通过防火墙的服务器端的门户，网关还可以作为一个协议翻译器以便存取那些存储在非HTTP系统中的资源。

　　13.通道(Tunnel)：是作为两个连接中继的中介程序。一旦激活，通道便被认为不属于HTTP通讯，尽管通道可能是被一个HTTP请求初始化的。当被中继的连接两端关闭时，通道便消失。当一个门户(Portal)必须存在或中介(Intermediary)不能解释中继的通讯时通道被经常使用。

　　14.缓存(Cache)：反应信息的局域存储。

3：建立连接的方式

HTTP支持2中建立连接的方式：非持久连接和持久连接(HTTP1.1默认的连接方式为持久连接)。

1) 非持久连接

让我们查看一下非持久连接情况下从服务器到客户传送一个Web页面的步骤。假设该贝面由1个基本HTML文件和10个JPEG图像构成，而且所有这些对象都存放在同一台服务器主机中。再假设该基本HTML文件的URL为：gpcuster.cnblogs.com/index.html。

下面是具体步骡:

1.HTTP客户初始化一个与服务器主机gpcuster.cnblogs.com中的HTTP服务器的TCP连接。HTTP服务器使用默认端口号80监听来自HTTP客户的连接建立请求。

2.HTTP客户经由与TCP连接相关联的本地套接字发出—个HTTP请求消息。这个消息中包含路径名/somepath/index.html。

3.HTTP服务器经由与TCP连接相关联的本地套接字接收这个请求消息，再从服务器主机的内存或硬盘中取出对象/somepath/index.html，经由同一个套接字发出包含该对象的响应消息。

4.HTTP服务器告知TCP关闭这个TCP连接(不过TCP要到客户收到刚才这个响应消息之后才会真正终止这个连接)。

5.HTTP客户经由同一个套接字接收这个响应消息。TCP连接随后终止。该消息标明所封装的对象是一个HTML文件。客户从中取出这个文件，加以分析后发现其中有10个JPEG对象的引用。

6.给每一个引用到的JPEG对象重复步骡1-4。

上述步骤之所以称为使用非持久连接，原因是每次服务器发出一个对象后，相应的TCP连接就被关闭，也就是说每个连接都没有持续到可用于传送其他对象。每个TCP连接只用于传输一个请求消息和一个响应消息。就上述例子而言，用户每请求一次那个web页面，就产生11个TCP连接。

2) 持久连接

非持久连接有些缺点。首先，客户得为每个待请求的对象建立并维护一个新的连接。对于每个这样的连接，TCP得在客户端和服务器端分配TCP缓冲区，并维持TCP变量。对于有可能同时为来自数百个不同客户的请求提供服务的web服务器来说，这会严重增加其负担。其次，如前所述，每个对象都有2个RTT的响应延长——一个RTT用于建立TCP连接，另—个RTT用于请求和接收对象。最后，每个对象都遭受TCP缓启动，因为每个TCP连接都起始于缓启动阶段。不过并行TCP连接的使用能够部分减轻RTT延迟和缓启动延迟的影响。

在持久连接情况下，服务器在发出响应后让TCP连接继续打开着。同一对客户/服务器之间的后续请求和响应可以通过这个连接发送。整个Web页面(上例中为包含一个基本HTMLL文件和10个图像的页面)自不用说可以通过单个持久TCP连接发送:甚至存放在同一个服务器中的多个web页面也可以通过单个持久TCP连接发送。通常，HTTP服务器在某个连接闲置一段特定时间后关闭它，而这段时间通常是可以配置的。持久连接分为不带流水线(without pipelining)和带流水线(with pipelining)两个版本。如果是不带流水线的版本，那么客户只在收到前一个请求的响应后才发出新的请求。这种情况下，web页面所引用的每个对象(上例中的10个图像)都经历1个RTT的延迟，用于请求和接收该对象。与非持久连接2个RTT的延迟相比，不带流水线的持久连接已有所改善，不过带流水线的持久连接还能进一步降低响应延迟。不带流水线版本的另一个缺点是，服务器送出一个对象后开始等待下一个请求，而这个新请求却不能马上到达。这段时间服务器资源便闲置了。

HTTP/1.1的默认模式使用带流水线的持久连接。这种情况下，HTTP客户每碰到一个引用就立即发出一个请求，因而HTTP客户可以一个接一个紧挨着发出各个引用对象的请求。服务器收到这些请求后，也可以一个接一个紧挨着发出各个对象。如果所有的请求和响应都是紧挨着发送的，那么所有引用到的对象一共只经历1个RTT的延迟(而不是像不带流水线的版本那样，每个引用到的对象都各有1个RTT的延迟)。另外，带流水线的持久连接中服务器空等请求的时间比较少。与非持久连接相比，持久连接(不论是否带流水线)除降低了1个RTT的响应延迟外，缓启动延迟也比较小。其原因在于既然各个对象使用同一个TCP连接，服务器发出第一个对象后就不必再以一开始的缓慢速率发送后续对象。相反，服务器可以按照第一个对象发送完毕时的速率开始发送下一个对象。

4：缓存的机制

HTTP/1.1中缓存的目的是为了在很多情况下减少发送请求，同时在许多情况下可以不需要发送完整响应。前者减少了网络回路的数量；HTTP利用一个“过期（expiration）”机制来为此目的。后者减少了网络应用的带宽；HTTP用“验证（validation）”机制来为此目的。具体可以参考：

http://www.chedong.com/tech/cache_docs.html

三 RTSP协议与HTTP协议的联系与区别

      RTSP协议负责在服务器和客户端之间建立并控制一个或多个时间上同步的连续流媒体，其目标是象HTTP协议为用户提供文字和图形服务那样为用户提供连续媒体服务。因此，RTSP协议的设计在语法和操作上与HTTP协议很相似，这样，对于HTTP的大部分扩展也适用于RTSP。
　　但是RTSP协议和HTTP协议在很多方面有着区别：
　　1. HTTP是一个无状态协议，而RTSP协议是有状态的。
　　2. HTTP本质上是一个非对称协议，客户端提出请求而服务器响应；而RTSP是对称的，服务器和客户端都可发送和响应请求。

四  HTTPS传输协议

    HTTPS（Secure Hypertext Transfer Protocol）安全超文本传输协议，它是一个安全通信通道，它基于HTTP开发，用于在客户计算机和服务器之间交换信息。它使用安全套接字层(SSL)进行信息交换，简单来说它是HTTP的安全版。
它是由Netscape开发并内置于其浏览器中，用于对数据进行压缩和解压操作，并返回网络上传送回的结果。HTTPS实际上应用了Netscape的安全全套接字层（SSL）作为HTTP应用层的子层。（HTTPS使用端口443，而不是象HTTP那样使用端口80来和TCP/IP进行通信。）SSL使用40 位关键字作为RC4流加密算法，这对于商业信息的加密是合适的。HTTPS和SSL支持使用X.509数字认证，如果需要的话用户可以确认发送者是谁。

HTTPS和HTTP的区别：

1：http和https使用的是完全不同的连接方式,用的端口也不一样,前者是80,后者是443。
2：https协议需要到ca申请证书，一般免费证书很少，需要交费。
3：http是超文本传输协议，信息是明文传输，https 则是具有安全性的ssl加密传输协议
4：http的连接很简单,是无状态的，而HTTPS协议是由SSL+HTTP协议构建的可进行加密传输、身份认证的网络协议，要比http协议安全

HTTPS解决的问题：
1 . 信任主机的问题. 采用https 的server 必须从CA 申请一个用于证明服务器用途类型的证书. 改证书只有用于对应的server 的时候,客户度才信任次主机. 所以目前所有的银行系统网站,关键部分应用都是https 的. 客户通过信任该证书,从而信任了该主机. 其实这样做效率很低,但是银行更侧重安全. 这一点对我们没有任何意义,我们的server ,采用的证书不管自己issue 还是从公众的地方issue, 客户端都是自己人,所以我们也就肯定信任该server.
2 . 通讯过程中的数据的泄密和被窜改
1. 一般意义上的https, 就是 server 有一个证书.
a) 主要目的是保证server 就是他声称的server. 这个跟第一点一样.
b) 服务端和客户端之间的所有通讯,都是加密的.
i. 具体讲,是客户端产生一个对称的密钥,通过server 的证书来交换密钥. 一般意义上的握手过程.
ii. 加下来所有的信息往来就都是加密的. 第三方即使截获,也没有任何意义.因为他没有密钥. 当然窜改也就没有什么意义了.
2. 少许对客户端有要求的情况下,会要求客户端也必须有一个证书.
a) 这里客户端证书,其实就类似表示个人信息的时候,除了用户名/密码, 还有一个CA 认证过的身份. 应为个人证书一般来说上别人无法模拟的,所有这样能够更深的确认自己的身份.
b) 目前少数个人银行的专业版是这种做法,具体证书可能是拿U盘作为一个备份的载体.
HTTPS 一定是繁琐的.
a) 本来简单的http协议,一个get一个response. 由于https 要还密钥和确认加密算法的需要.单握手就需要6/7 个往返.
i. 任何应用中,过多的round trip 肯定影响性能.
b) 接下来才是具体的http协议,每一次响应或者请求, 都要求客户端和服务端对会话的内容做加密/解密.
i. 尽管对称加密/解密效率比较高,可是仍然要消耗过多的CPU,为此有专门的SSL 芯片. 如果CPU 信能比较低的话,肯定会降低性能,从而不能serve 更多的请求.
ii. 加密后数据量的影响. 所以，才会出现那么多的安全认证提示。

五 SDP协议

SDP会话描述协议：为会话通知、会话邀请和其它形式的多媒体会话初始化等目的提供了多媒体会话描述。会话目录用于协助多媒体会议的通告，并为会话参与者传送相关设置信息。 SDP 即用于将这种信息传输到接收端。 SDP 完全是一种会话描述格式――它不属于传输协议 ――它只使用不同的适当的传输协议，包括会话通知协议（SAP）、会话初始协议（SIP）、实时流协议（RTSP）、 MIME 扩展协议的电子邮件以及超文本传输协议（HTTP）。SDP 的设计宗旨是通用性，它可以应用于大范围的网络环境和应用程序，而不仅仅局限于组播会话目录。

SDP是会话描述协议的缩写，是描述流媒体初始化参数的格式，由IETF作为RFC 4566颁布。流媒体是指在传输过程中看到或听到的内容，SDP包通常包括以下信息：

（1）会话信息· 会话名和目的

      　　   · 会话活动时间

      　　      由于参与会话的资源是受限制的，因此包括以下附加信息是非常有用的

      　　 · 会话使用的带宽信息

      　　 · 会话负责人的联系信息

（2）媒体信息

      　　   · 媒体类型，例如视频和音频

      　　   · 传输协议，例如RTP/UDP/IP和H.320。

             · 多播地址和媒体传输端口（IP多播会话）

      　　   · 用于联系地址的媒体和传输端口的远端地址（IP单播会话）

SDP描述由许多文本行组成，文本行的格式为<类型>=<值>，<类型>是一个字母，<值>是结构化的文本串，其格式依<类型>而定。

SDP格式（带为可选）:

        Session description

          v=   (protocol version) //该行指示协议的版本

          o=   (owner/creator and session identifier)

例如：    o=mhandley 2890844526 2890842807 IN IP4 126.16.64.4 //o行中包含与会话所有者有关的参数（1：第一个参数表明会话发起者的名称，该参数可不填写，如填写和SIP消息中，from消息头的内容一致:2：第二个参数为主叫方的会话标识符:3：第三个参数为主叫方会话的版本，会话数据有改变时，版本号递增:4：第四个参数定义了网络类型，IN表示Internet网络类型，目前仅定义该网络类型:5：第五个参数为地址类型，目前支持IPV4和IPV6两种地址类型:6：第六个参数为地址：表明会话发起者的IP地址，该地址为信令面的IP地址，信令PDP激活时为手机分配。）

          s=   (session name) //表明本次会话的标题，或会话的名称

          i= (session information)

          u=* (URI of description)

          e=* (email address)

          p=* (phone number)

          c=* (connection information - not required if included in all media)

          b=* (zero or more bandwidth information lines)

          One or more time descriptions ("t=" and "r=" lines, see below)

          z=* (time zone adjustments)

          k=* (encryption key)

          a=* (zero or more session attribute lines)

          Zero or more media descriptions

       Time description

          t=   (time the session is active)

          r=* (zero or more repeat times)

       Media description, if present

          m=   (media name and transport address)

    例如： m=audio 3458  RTP/AVP  0   96   97   // m行又称媒体行，描述了发送方所支持的媒体类型等信息（1：第一个参数为媒体名称：表明支持音频类型。2：第二个参数为端口号，表明UE在本地端口为3458上发送音频流。3：第三个参数为传输协议，一般为RTP/AVP协议。4：四-七参数为所支持的四种净荷类型编号）

m=video 3400 RTP/AVP 98  99 //m行又称媒体行，描述了发送方所支持的媒体类型等信息

          i=* (media title)

          c=* (connection information - optional if included at

               session-level)

          b=* (zero or more bandwidth information lines)

          k=* (encryption key)

          a=* (zero or more media attribute lines)

参考文档：
http://www.cnblogs.com/tuyile006/archive/2011/02/22/1961679.html

http://www.chedong.com/tech/cache_docs.html

九：流媒体框架

android流媒体框架是从Gingerbread android2.3的时候加入的，其核心就是nuplayer。android 流媒体在4.1上资源文件主要分为httplivesource，rtspsource,genericsource.genericsource是4.1上加入的。其中Rtsp流和httplive流是最主要的，两者有本质的区别。

RTSP source是客户机在向视频服务器请求视频服务之前，

首先通过HTTP协议从Web服务器获取所请求视频服务的演示描述（Presentation description ）文件，在RTSP中，每个演示（Presentation）及其所对应的媒体流都由一个RTSPURL标识。整个演示及媒体特性都在一个演示描述（Presentation description ）文件中定义，该文件可能包括媒体编码方式、语言、RTSP URLs、目标地址、端口及其它参数。用户在向服务器请求某个连续媒体流的服务之前，必须首先从服务器获得该媒体流的演示描述（Presentationdescription ）文件以得到必需的参数，演示描述文件的获取可采用HTTP、email或其他方法。利用该文件提供的信息定位视频服务地址（包括视频服务器地址和端口号）及视频服务的编码方式等信息。

然后客户机根据上述信息向视频服务器请求视频服务。视频服务初始化完毕，视频服务器为该客户建立一个新的视频服务流，客户端与服务器运行实时流控制协议RTSP，以对该流进行各种VCR控制信号的交换，如播放（PLAY）、停止（PAUSE）、快进、快退等。当服务完毕，客户端提出拆线（TEARDOWN）请求。服务器使用RTP/UDP协议将媒体数据传输给客户端，一旦数据抵达客户端，客户端应用程序即可播放输出。在流式传输中，使用RTP/RTCP/UDP和RTSP/TCP两种不同的通信协议在客户端和服务器间建立联系。总体框架如下图：

HTTP LiveStreaming（缩写是 HLS）是一个由苹果公司提出的基于HTTP的流媒体网络传输协议。是苹果公司QuickTime X和iPhone软件系统的一部分。它的工作原理是把整个流分成一个个小的基于HTTP的文件来下载，每次只下载一些。当媒体流正在播放时，客户端可以选择从许多不同的备用源中以不同的速率下载同样的资源，允许流媒体会话适应不同的数据速率。在开始一个流媒体会话时，客户端会下载一个包含元数据的extended M3U (m3u8) playlist文件，用于寻找可用的媒体流。该视频格式为.m3u8。Httplive在android上总体框架如下图：

在android上，流媒体播放跟本地媒体播放是两个不同的架构体系，两者有啥区别呢？

1：框架层创建的player不同，local playback用的是stagefrightplayer而流媒体是nuplayer

2：跟OMX接口不一致，local playback用的是omxcodec，而流媒体用的是Acodec

3：消息机制不同，localplayback用的是TimedEventQueue模型，而流媒体用的是AHandler消息机制，类似于我们熟悉的Handler。

下一节我们讲讲流媒体的消息机制AHandler。

十：流媒体AHandler机制



为什么我们要谈论流媒体的消息机制呢？因为在流媒体中，类似于我们写APP的时候，为了不阻塞UI线程，我们把利用handler，把UI线程分开异步执行，使用handler去执行某项比较费时的操作，然后异步更新UI线程。流媒体中也是类似的，因为联网，codec都很费时，需要异步执行。handler是java的实现机制，而我们下面要讲的AHandler就是基于C++的实现了。

我们知道handler消息机制，构成就必须包括一个Loop，message。那么对应的AHandler，也应该有对应的ALooper， AMessage。下面我们将以实例化NUplayerDrriver和setdataSource为例来具体讲述AHandler消息机制。

首先看下NuplayerDriver的构造函数，这是流媒体初始化函数。

static sp createPlayer(player_type playerType, void* cookie,

        notify_callback_f notifyFunc){

caseNU_PLAYER:

            ALOGV(" createNuPlayer");

            p = newNuPlayerDriver;

}

NuPlayerDriver::NuPlayerDriver()

    : mResetInProgress(false),

      mPrepareInProgress(false),

      mIsPrepared(false),

      mDurationUs(-1),

      mPositionUs(-1),

      mNumFramesTotal(0),

      mNumFramesDropped(0),

      mLooper(new ALooper),-----创建一个新的ALooper

      mState(UNINITIALIZED),

      mAtEOS(false),

      mStartupSeekTimeUs(-1) {

      mLooper->setName("NuPlayerDriverLooper");----给该Looper取名字，以便与AHandler一一对应

    mLooper->start(

            false, /* runOnCallingThread /

            true, / canCallJava /

            PRIORITY_AUDIO);-------------启动该Looper

    mPlayer = new NuPlayer;------------创建一个AHandler即Nuplayer

    mLooper->registerHandler(mPlayer);-----把该AHandler注册到Looper中，具体的实现我们往后看

    mPlayer->setDriver(this);

}

看看ALooper的启动函数：

status_t ALooper::start(

        bool runOnCallingThread, boolcanCallJava, int32_t priority) {

    if (runOnCallingThread) {------runOnCallingThread开始为false，不走这里

        …………

    }

    Mutex::Autolock autoLock(mLock);

    if (mThread != NULL || mRunningLocally) {

        return INVALID_OPERATION;

    }

    mThread = newLooperThread(this, canCallJava);----新建一个thread

    status_t err =mThread->run(

            mName.empty() ?"ALooper" : mName.c_str(), priority);----looper线程启动

    if (err != OK) {

        mThread.clear();

    }

    return err;

}

看下关键步骤注册Handler：

ALooper::handler_idALooper::registerHandler(const sp &handler) {

    return gLooperRoster.registerHandler(this,handler);

}

ALooper::handler_idALooperRoster::registerHandler(

        const sp looper, constsp &handler) {

    Mutex::Autolock autoLock(mLock);

    if (handler->id() != 0) {

        CHECK(!"A handler must only beregistered once.");

        return INVALID_OPERATION;

    }

    HandlerInfo info;

    info.mLooper = looper;----- “NuPlayerDriver Looper”

    info.mHandler = handler;------nuplayer

    ALooper::handler_idhandlerID = mNextHandlerID++;

    mHandlers.add(handlerID, info);-------KeyedVector mHandlers;

    handler->setID(handlerID);------设置handlerID，以便发送message时找到对应的handler

    return handlerID;

}

ALooperRoster::ALooperRoster()

    : mNextHandlerID(1),------------------从1开始

      mNextReplyID(1) {

}

有了LOOPER，也有了对应的handler，看看如何发送消息给LOOPER，交个相应的handler去处理。我们以setdataSource方法为例：

Nuplayer本身也是个AHandler，因为其继承自AHandler。

structNuPlayer : public AHandler {

}

我们看看其父类AHandler：

struct AHandler : public RefBase {

    AHandler()

        : mID(0){

    }

    ALooper::handler_id id() const {

        return mID;

    }

    sp looper();

protected:

    virtual voidonMessageReceived(const sp &msg) = 0;---处理消息函数

private:

    friend struct ALooperRoster;

    ALooper::handler_id mID;

    void setID(ALooper::handler_id id) {

        mID = id;

    }

    DISALLOW_EVIL_CONSTRUCTORS(AHandler);

};

以setdataSource为例看看如何传递message

void NuPlayer::setDataSource(

        const char url, constKeyedVector headers) {

   （1） sp msg =new AMessage(kWhatSetDataSource, id());

    size_t len = strlen(url);

………..

elseif ((!strncasecmp(url, "http://", 7) || !strncasecmp(url,"https://", 8))

                    && ((len >= 4&& !strcasecmp(".sdp", &url[len - 4]))

                    || strstr(url,".sdp?"))) {

        source = newRTSPSource(url, headers, mUIDValid, mUID, true);

        mSourceType = kRtspSource;

    }

……….

    （2）msg->setObject("source", source);

    （3）msg->post();

}

首先新建一个AMessage的实例，传入的参数为事件的名称以及处理该消息的Handlerid，该id在    mLooper->registerHandler(mPlayer);方法中设置上。

我们看下AMessage：

AMessage::AMessage(uint32_twhat, ALooper::handler_id target)

    : mWhat(what),

      mTarget(target),

      mNumItems(0) {

}

void AMessage::setObject(const char name, const sp &obj) {

    setObjectInternal(name, obj, kTypeObject);

}

void AMessage::setObjectInternal(

        const char name, constsp &obj, Type type) {

    Item item = allocateItem(name);

    item->mType = type;

    if (obj != NULL) { obj->incStrong(this);}

    item->u.refValue = obj.get();

}

POST 过程:

void AMessage::post(int64_t delayUs) {

    gLooperRoster.postMessage(this, delayUs);----调用ALooperRoster的postMessage函数

}

status_tALooperRoster::postMessage(

        const sp &msg,int64_t delayUs) {

    Mutex::Autolock autoLock(mLock);

    return postMessage_l(msg, delayUs);

}

status_t ALooperRoster::postMessage_l(

        const sp &msg,int64_t delayUs) {

    ssize_t index =mHandlers.indexOfKey(msg->target());--target即为Handler_id

    if (index < 0) {

        ALOGW("failed to post message.Target handler not registered.");

        return -ENOENT;

    }

    const HandlerInfo &info =mHandlers.valueAt(index);---根据handler_id找到HandlerInfo

    splooper = info.mLooper.promote();----根据我们注册的HandlerInfo找到相应的ALooper，我们现在就是“NuPlayerDriver Looper”

    if (looper == NULL) {

        ALOGW("failed to post message."

             "Target handler %d stillregistered, but object gone.",

             msg->target());

        mHandlers.removeItemsAt(index);

        return -ENOENT;

    }

    looper->post(msg,delayUs);---往“NuPlayerDriver Looper”里传递消息

    return OK;

}

void ALooper::post(const sp &msg, int64_t delayUs) {

    Mutex::Autolock autoLock(mLock);

    int64_t whenUs;

    if (delayUs > 0) {

        whenUs = GetNowUs() + delayUs;

    } else {

        whenUs = GetNowUs();

    }

    List::iterator it =mEventQueue.begin();

    while (it != mEventQueue.end() &&(it).mWhenUs <= whenUs) {

        ++it;

    }

    Event event;

    event.mWhenUs = whenUs;

    event.mMessage = msg;

    if (it == mEventQueue.begin()) {

        mQueueChangedCondition.signal();

    }

    mEventQueue.insert(it,event);----往消息队列里插入消息

}

当队列里有消息时便会触发loop函数：

bool ALooper::loop() {

    Event event;

    {

        Mutex::Autolock autoLock(mLock);

        if (mThread == NULL &&!mRunningLocally) {

          return false;

        }

        if (mEventQueue.empty()) {

            mQueueChangedCondition.wait(mLock);

            return true;

        }

        int64_t whenUs =(mEventQueue.begin()).mWhenUs;

        int64_t nowUs = GetNowUs();

        if (whenUs > nowUs) {

            int64_t delayUs = whenUs - nowUs;

           mQueueChangedCondition.waitRelative(mLock, delayUs * 1000ll);

            return true;

        }

        event = *mEventQueue.begin();

        mEventQueue.erase(mEventQueue.begin());

    }

    gLooperRoster.deliverMessage(event.mMessage);

    return true;

}

void ALooperRoster::deliverMessage(const sp &msg) {

    sp handler;

    {

        Mutex::Autolock autoLock(mLock);

        ssize_t index = mHandlers.indexOfKey(msg->target());

        if (index < 0) {

            ALOGW("failed to delivermessage. Target handler not registered.");

            return;

        }

        const HandlerInfo &info =mHandlers.valueAt(index);

        handler =info.mHandler.promote();

        if (handler == NULL) {

            ALOGW("failed to delivermessage. "

                 "Target handler %dregistered, but object gone.",

                 msg->target());

            mHandlers.removeItemsAt(index);

            return;

        }

    }

    handler->onMessageReceived(msg);------对应为Nuplayer

}

void NuPlayer::onMessageReceived(const sp &msg) {

    switch (msg->what()) {

        case kWhatSetDataSource:

        {

………………………………………

            mSource = static_cast(obj.get());

            sp notify = newAMessage(kWhatSourceNotify, id());

            mSource->setNotify(notify);

            mSource->connect();-------------RTSPSource

            break;

        }

}

至此我们的Ahandler的流程讲完了，大致就是启动一个threadLooper，监听looper的消息队列是否有变化，如有交个相应的Handler去处理。

十一、流媒体具体流程（一）

病了两周，一吃医生开的药就加重，NND以后不去那儿看病了，最近好多了但人也懒了，也好久没有更新博文了，难道我的计划要这样的搁浅了？NO！生命不息，笔耕不辍，哈哈，有点夸大了，嘚吧嘚吧啥，进入正题.

上面我们把流媒体的框架和里面的消息机制讲了一遍，下面我们开搞流程了。我们首先探讨android里的主流支持的RTSP相关的流程。

RTSP协议相关的，不了解的，可以回头去看看：http://blog.csdn.net/tjy1985/article/details/7996121

我们知道，不管是播放本地媒体，还是流媒体，上层实现的方法都是一样的：

1：创建mediaplayer

2：setdataSource

3：prepare

4：start

5：pause

6：stop

本质的区别在于framework层，Locateplayback选用stagefrighplayert+awesomeplayer来实现，流媒体用的是nuplayer。

我们首先来看看，构造nuplayer和setdataSource都干了啥？

nuplayer的构成过程：

mediaplayerservice.cpp

staticsp createPlayer(player_type playerType, void* cookie,

        notify_callback_f notifyFunc)

{

    void* handle;

    CreateMPQ_PlayerClientFunc funcHandle;

    sp p;

    switch (playerType) {

………

        case NU_PLAYER:

            ALOGV(" createNuPlayer");

            p = newNuPlayerDriver;

            break;

……..

}

NuPlayerDriver.cpp

NuPlayerDriver::NuPlayerDriver()

    : mResetInProgress(false),

      mPrepareInProgress(false),

      mIsPrepared(false),

      mDurationUs(-1),

      mPositionUs(-1),

      mNumFramesTotal(0),

      mNumFramesDropped(0),

      mLooper(new ALooper),

      mState(UNINITIALIZED),

      mAtEOS(false),

      mStartupSeekTimeUs(-1) {

    mLooper->setName("NuPlayerDriverLooper");

    mLooper->start(

            false, /* runOnCallingThread /

            true, / canCallJava /

            PRIORITY_AUDIO);

    mPlayer = new NuPlayer;

    mLooper->registerHandler(mPlayer);

    mPlayer->setDriver(this);

}

NuPlayer.cpp

NuPlayer::NuPlayer()

    : mUIDValid(false),

      mVideoIsAVC(false),

      mAudioEOS(false),

      mVideoEOS(false),

      mDecoderEOS(false),

      mScanSourcesPending(false),

     mScanSourcesGeneration(0),

      mTimeDiscontinuityPending(false),

      mFlushingAudio(NONE),

      mFlushingVideo(NONE),

      mVideoSkipToIFrame(false),

      mResetInProgress(false),

      mResetPostponed(false),

      mSkipRenderingAudioUntilMediaTimeUs(-1ll),

     mSkipRenderingVideoUntilMediaTimeUs(-1ll),

      mVideoLateByUs(0ll),

      mNumFramesTotal(0ll),

      mNumFramesDropped(0ll),

      mPauseIndication(false),

      mSourceType(kDefaultSource),

      mStats(NULL),

      mBufferingNotification(false),

      mSRid(0) {

      mTrackName = new char[6];

}

构成nuplayer的过程，无非就是初始化一些状态，标志位，重要的是起了消息队列，也就是我们上篇写的AHandler消息机制：http://blog.csdn.net/tjy1985/article/details/8063484，我们也不多说了，直接进入setdataSource，先来个概图吧：

setDataSource分三步来走：

1：创建相应的消息

2：根据URL创建对应的source

3：onmessageReceive处理对应的消息

voidNuPlayer::setDataSource(

        const char url, constKeyedVector *headers) {

    （1）sp msg = new AMessage(kWhatSetDataSource, id());----构建一个kWhatSetDataSource的消息

    sp source;

    if (IsHTTPLiveURL(url)) {

     （2）   source = newHTTPLiveSource(url, headers, mUIDValid, mUID);----创建的HTTPLiveSource

    } else if (!strncasecmp(url,"rtsp://", 7)) {

        source = newRTSPSource(url, headers, mUIDValid, mUID);-----创建RTSPSource实例

    } else {

        source = new GenericSource(url,headers, mUIDValid, mUID);

    }

    msg->setObject("source",source);

    msg->post();-----post刚才构建的kWhatSetDataSource消息

}

voidNuPlayer::onMessageReceived(const sp &msg) {

    switch (msg->what()) {

   （3）     case kWhatSetDataSource:------------处理kWhatSetDataSource消息

        {

            ALOGV("kWhatSetDataSource");

            CHECK(mSource == NULL);

            sp obj;

           CHECK(msg->findObject("source", &obj));

            mSource = static_cast(obj.get());

            break;

        }

十二、流媒体具体流程（二）

上篇我们讲了流媒体RTSP部分的setdataSource方法，prepare没有实质的东西，我们直接讲start方法, 这个方法是它的核心方法，比较复杂，我们先来看下整个start方法的时序图吧，让大家有个大概的了解：

跟踪下代码，看看start里面有什么名堂？

NuPlayer.cpp

void NuPlayer::start() {

    (new AMessage(kWhatStart, id()))->post();

}

void NuPlayer::onMessageReceived(const sp &msg) {

    switch (msg->what()) {

case kWhatStart:

        {

            ALOGV("kWhatStart");

            mVideoIsAVC = false;

            mAudioEOS = false;

            mVideoEOS = false;

            mDecoderEOS = false;

            mSkipRenderingAudioUntilMediaTimeUs = -1;

            mSkipRenderingVideoUntilMediaTimeUs = -1;

            mVideoLateByUs = 0;

            mNumFramesTotal = 0;

            mNumFramesDropped = 0;

        (1)    mSource->start();-------RTSPSource

        (2)    mRenderer = new Renderer(

                    mAudioSink,

                    new AMessage(kWhatRendererNotify, id()));

         (3) postScanSources();

            break;

        }

}

从代码我们看到start分三步走：start（通过socket跟web服务器连接并通过HTTP协议从Web服务器获取所请求视频服务的演示描述等），创建Renderer（new Renderer），转载解码器并解码（posetScanSources）.

首先我们来探讨下mSource->start()，mSource就是RTSPSource，

先看下总的流程图吧（画得不怎么好，将就看吧）：

void NuPlayer::RTSPSource::start() {

    if (mLooper == NULL) {

        mLooper = new ALooper;

        mLooper->setName("rtsp");

        mLooper->start();

        mReflector = new AHandlerReflector(this);

        mLooper->registerHandler(mReflector);-------创建一个‘rtsp’的looper

    }

    CHECK(mHandler == NULL);

    sp notify = new AMessage(kWhatNotify, mReflector->id());-----记住这个消息

    mHandler = new MyHandler(mURL.c_str(),notify, mUIDValid, mUID);

    mLooper->registerHandler(mHandler);-----MyHandler，‘rtsp’looper连接起来

    CHECK_EQ(mState, (int)DISCONNECTED);

    mState = CONNECTING;

    mHandler->connect();-------调用myhandler的connect方法

}

我们来看这个Myhandler的构造函数：

MyHandler(

            const char url,

            const sp ¬ify,

            bool uidValid = false, uid_t uid = 0)

        : mNotify(notify),

          mUIDValid(uidValid),

          mUID(uid),

          mNetLooper(new ALooper),

          mConn(new ARTSPConnection(mUIDValid, mUID)),-----创建ARTSPConnection，主要用来跟服务器连接

          mRTPConn(new ARTPConnection),

          ………………………..

          mKeepAliveGeneration(0) {

        mNetLooper->setName("rtsp net");

        mNetLooper->start(false / runOnCallingThread /,

                          false / canCallJava /,

                          PRIORITY_HIGHEST);-------自己创建一个looper。

        ……………

    }

在MyHandler中我们创建了ARTSPConnection,这将在我们的connect方法中会用到：

void connect() {

        looper()->registerHandler(mConn);

        (1 ? mNetLooper : looper())->registerHandler(mRTPConn);

        sp notify = new AMessage('biny', id());

        mConn->observeBinaryData(notify);

        sp reply = new AMessage('conn', id());----记住这AMessage，这个将会传给ARTSPConnection,并传回来

        mConn->connect(mOriginalSessionURL.c_str(), reply);----mConn == ARTSPConnection

    }

void ARTSPConnection::connect(const char url, const sp &reply) {

    sp msg = new AMessage(kWhatConnect, id());

    msg->setString("url", url);

    msg->setMessage("reply", reply);

    msg->post();

}

void ARTSPConnection::onMessageReceived(const sp &msg) {

    switch (msg->what()) {

        case kWhatConnect:

            onConnect(msg);

            break;

………..

}

void ARTSPConnection::onConnect(const sp &msg) {

    ++mConnectionID;

…………………

    AString url;

    CHECK(msg->findString("url", &url));

    sp reply;

    CHECK(msg->findMessage("reply", &reply));------reply == 'conn'

………………….

    mSocket = socket(AF_INET, SOCK_STREAM, 0); ------  建立一个socket

    if (mUIDValid) {

        HTTPBase::RegisterSocketUserTag(mSocket, mUID,

                                       (uint32_t)(uint32_t) "RTSP");

    }

    MakeSocketBlocking(mSocket, false);------设置socket为非阻塞

    struct sockaddr_in remote;

    memset(remote.sin_zero, 0, sizeof(remote.sin_zero));

    remote.sin_family = AF_INET;

    remote.sin_addr.s_addr = (in_addr_t )ent->h_addr;

    remote.sin_port = htons(port);

    int err = ::connect(

            mSocket, (const struct sockaddr )&remote, sizeof(remote));----连接

    reply->setInt32("server-ip", ntohl(remote.sin_addr.s_addr));

    if (err < 0) {

        if (errno == EINPROGRESS) {-----当非阻塞时，connect立刻返回-1，同时errno设置为EINPROGRESS。然后再检测socket是否可写，如果可写了，说明
socket已经建立的连接

            sp msg = new AMessage(kWhatCompleteConnection, id());

            msg->setMessage("reply", reply);

            msg->setInt32("connection-id", mConnectionID);

            msg->post();

            return;

        }

……………………….

    reply->post();

}

void ARTSPConnection::onCompleteConnection(const sp &msg) {

    sp reply;

    CHECK(msg->findMessage("reply", &reply));

    int32_t connectionID;

    CHECK(msg->findInt32("connection-id", &connectionID));

    if ((connectionID != mConnectionID) || mState != CONNECTING) {

        // While we were attempting to connect, the attempt was

        // cancelled.

        reply->setInt32("result", -ECONNABORTED);

        reply->post();

        return;

    }

    struct timeval tv;

    tv.tv_sec = 0;

    tv.tv_usec = kSelectTimeoutUs;-----超时时间

    fd_set ws;

    FD_ZERO(&ws);

    FD_SET(mSocket, &ws);

    int res = select(mSocket + 1, NULL, &ws, NULL, &tv);

…………

    int err;

   socklen_t optionLen = sizeof(err);

    CHECK_EQ(getsockopt(mSocket, SOL_SOCKET, SO_ERROR, &err, &optionLen), 0);

    CHECK_EQ(optionLen, (socklen_t)sizeof(err));

    if (err != 0) {

        ALOGE("err = %d (%s)", err, strerror(err));

        reply->setInt32("result", -err);

        mState = DISCONNECTED;

        if (mUIDValid) {

            HTTPBase::UnRegisterSocketUserTag(mSocket);

        }

        close(mSocket);

        mSocket = -1;

    } else {

        reply->setInt32("result", OK);

        mState = CONNECTED;

        mNextCSeq = 1;

        postReceiveReponseEvent();------处理从服务器回来的reponse

    }

    reply->post();-----post给myhandler处理

}

又回到MyHandler.h，真够绕的啊！

virtual void onMessageReceived(const sp &msg) {

        switch (msg->what()) {

            case 'conn':

            {

                int32_t result;

                CHECK(msg->findInt32("result", &result));

                ALOGI("connection request completed with result %d (%s)",

                     result, strerror(-result));

                if (result == OK) {

                    AString request;

                    request = "DESCRIBE ";----DESCRIBE获得媒体文件的类型的请求类型

                    request.append(mSessionURL);

                    request.append(" RTSP/1.0\r\n");

                    request.append("Accept: application/sdp\r\n");

                    request.append("\r\n");   -----建立连接后，发送获得媒体文件的类型的request

                    sp reply = new AMessage('desc', id());

                    mConn->sendRequest(request.c_str(), reply);

                } else {

                    (new AMessage('disc', id()))->post();

                }

                break;

}

看到”DESRIBE”，我们可以回头看看流媒体的协议一张http://blog.csdn.net/tjy1985/article/details/7996121，在播放流媒体前，首先要从web服务器获取媒体文件的类型，要获取这些信息，就得往服务器发生“DESCRIBE”的请求，我们又得回到ARTSPConnection了：

void ARTSPConnection::sendRequest(

        const char request, const sp &reply) {

    sp msg = new AMessage(kWhatSendRequest, id());

    msg->setString("request", request);

    msg->setMessage("reply", reply);

    msg->post();

}

void ARTSPConnection::onMessageReceived(const sp &msg) {

    switch (msg->what()) {

case kWhatSendRequest:

            onSendRequest(msg);

            break;

}

void ARTSPConnection::onSendRequest(const sp &msg) {

    sp reply;

    CHECK(msg->findMessage("reply", &reply));

    if (mState != CONNECTED) {

        reply->setInt32("result", -ENOTCONN);

        reply->post();

        return;

    }

    …………………..

    size_t numBytesSent = 0;

    while (numBytesSent < request.size()) {

        ssize_t n =

            send(mSocket, request.c_str() + numBytesSent,

                 request.size() - numBytesSent, 0);-------通过send把request通过socket发送给服务器端

        if (n < 0 && errno == EINTR) {

            continue;

        }

        if (n <= 0) {

            performDisconnect();

            if (n == 0) {

                // Server closed the connection.

                ALOGE("Server unexpectedly closed the connection.");

                reply->setInt32("result", ERROR_IO);

                reply->post();

            } else {

                ALOGE("Error sending rtsp request. (%s)", strerror(errno));

                reply->setInt32("result", -errno);

                reply->post();

            }

            return;

        }

        numBytesSent += (size_t)n;

    }

    mPendingRequests.add(cseq, reply);

}

在等待服务器的response后，我们又回到MyHandler.h的onMessageReceived函数：

virtual void onMessageReceived(const sp &msg) {

        switch (msg->what()) {

            case 'desc':

            {

                int32_t result;

                CHECK(msg->findInt32("result", &result));

                ALOGI("DESCRIBE completed with result %d (%s)",

                     result, strerror(-result));

                if (result == OK) {

                    sp obj;

                    CHECK(msg->findObject("response", &obj));

                    sp response =

                        static_cast(obj.get());

…………………………….

                    if (response->mStatusCode != 200) {

                        result = UNKNOWN_ERROR;

                    } else {

                        mSessionDesc = new ASessionDescription; ---媒体流的演示描述,该文件提供的信息定位视频服务地址（包括视频服务器地址和端口号）及视频服务的编码方式等信息

                        mSessionDesc->setTo(

                               response->mContent->data(),

                               response->mContent->size());

…………..

                             if (mSessionDesc->countTracks() < 2) {

                                // There's no actual tracks in this session.

                                // The first "track" is merely session meta

                                // data.

                                ALOGW("Session doesn't contain any playable "

                                     "tracks. Aborting.");

                                result = ERROR_UNSUPPORTED;

                            } else {

                               setupTrack(1);--------此处到了我们RTSP中的所有的操作中SETUP步骤

                            }

                        }

                    }

                }

                if (result != OK) {

                    sp reply = new AMessage('disc', id());

                    mConn->disconnect(reply);

                }

                break;

            }

}

bool ASessionDescription::setTo(const void *data, size_t size) {

    mIsValid = parse(data, size);---解析该SessionDescription

    if (!mIsValid) {

        mTracks.clear();

        mFormats.clear();

    }

    return mIsValid;

}

到此我们连接上web服务器，并从web服务器获取sessionDescription分析完了，具体还得大伙慢慢琢磨。下篇我们将要开始跟流媒体服务打交道了！

十三、流媒体具体流程（三）

上一篇我们讲到了从web server 中获取了sessiondescription，并解析出了media server的路径和一些基本的媒体信息。下面我们开始讲述如何跟mediaserver建立连接并控制服务器端和客户端以达到播放，暂停，停止的目的。

首先跟media server建立连接 SETUP：

具体的格式如下（UDP）：

C->A（audio）: SETUPrtsp://audio.com/twister/audio.en RTSP/1.0

CSeq: 1

Transport:RTP/AVP/UDP;unicast

;client_port=3056-3057

具体到代码的话，我们看myHandler.h中的setupTrack函数：

   void setupTrack(size_t index) {

        sp source =

            new APacketSource(mSessionDesc,index);

……………………….

        AString url;

        CHECK(mSessionDesc->findAttribute(index,"a=control", &url));

        AString trackURL;

        CHECK(MakeURL(mBaseURL.c_str(),url.c_str(), &trackURL));----检查session description中取出media server的URL是否正确

        …………

        AString request= "SETUP ";

       request.append(trackURL);

        request.append("RTSP/1.0\r\n");------拼接request字符

选择TCP连接还是ARTP连接，

        if (mTryTCPInterleaving) {

            size_t interleaveIndex = 2 (mTracks.size() - 1);

            info->mUsingInterleavedTCP =true;

            info->mRTPSocket =interleaveIndex;

            info->mRTCPSocket =interleaveIndex + 1;

           request.append("Transport: RTP/AVP/TCP;interleaved=");

           request.append(interleaveIndex);

           request.append("-");

           request.append(interleaveIndex + 1);

        } else {

            unsigned rtpPort;

            ARTPConnection::MakePortPair(

                    &info->mRTPSocket,&info->mRTCPSocket, &rtpPort);

            if (mUIDValid) {

               HTTPBase::RegisterSocketUserTag(info->mRTPSocket, mUID,

                                               (uint32_t)(uint32_t) "RTP_");

               HTTPBase::RegisterSocketUserTag(info->mRTCPSocket, mUID,

                                                (uint32_t)(uint32_t)"RTP_");

            }

            request.append("Transport:RTP/AVP/UDP;unicast;client_port=");

           request.append(rtpPort);

           request.append("-");

            request.append(rtpPort+ 1);

        }

        request.append("\r\n");

        if (index > 1) {

            request.append("Session:");

            request.append(mSessionID);

            request.append("\r\n");

        }

        request.append("\r\n");

        sp reply = newAMessage('setu', id());

        reply->setSize("index",index);

       reply->setSize("track-index", mTracks.size() - 1);

        mConn->sendRequest(request.c_str(),reply);-----发送给服务器端，等待回复，返回的Amessage是“setu”

}



假设收到服务端的连接成功的消息，我们看看myHandler.h中onMessageReceived对应的”setu”如何处理，按道理应该回复回来的信息如下（UDP）：

A->C: RTSP/1.0200 OK

CSeq: 1

Session: 12345678

Transport:RTP/AVP/UDP;unicast

;client_port=3056-3057;

;server_port=5000-5001

virtualvoid onMessageReceived(const sp &msg) {

……

    case 'setu':

            {

                ……………………….

                int32_t result;

               CHECK(msg->findInt32("result", &result));

                ALOGI("SETUP(%d) completedwith result %d (%s)",

                     index, result,strerror(-result));

                if (result == OK) {

                    CHECK(track != NULL);

                    sp obj;

                    CHECK(msg->findObject("response",&obj));

                    spresponse =

                       static_cast(obj.get());

                    if(response->mStatusCode != 200) {

                        result = UNKNOWN_ERROR;

                    } else {

                       ssize_t i = response->mHeaders.indexOfKey("session");-------查找session id

                        CHECK_GE(i, 0);

                       mSessionID = response->mHeaders.valueAt(i);

………………………..

                        i =mSessionID.find(";");

                        if (i >= 0) {

                            // Remove options,i.e. ";timeout=90"

                            mSessionID.erase(i,mSessionID.size() - i);

                        }

                        i = response->mHeaders.indexOfKey("server");---server

                        if (i >= 0) {

                            AString server =response->mHeaders.valueAt(i);

                            if(server.startsWith("XenonStreamer")

                                    ||server.startsWith("XTream")) {

                                ALOGI("Usefake timestamps");

                                mUseSR = false;

                            }

                        }

                        spnotify = new AMessage('accu', id());

                       notify->setSize("track-index", trackIndex);

                        i =response->mHeaders.indexOfKey("transport");---transport

                        CHECK_GE(i, 0);

                        if(track->mRTPSocket != -1 && track->mRTCPSocket != -1) {

                            if(!track->mUsingInterleavedTCP) {

                                AStringtransport = response->mHeaders.valueAt(i);

……………….

                ++index;

                if (result == OK &&index < mSessionDesc->countTracks()) {

                    setupTrack(index);----一般有两条track，先是audio track然后是videotrack

                } else if(mSetupTracksSuccessful) {

建立完成后就可以“PLAY”了

                    ++mKeepAliveGeneration;

                    postKeepAlive();

                  AStringrequest = "PLAY ";---------发送”PLAY”请求给服务器端

                   request.append(mControlURL);

                   request.append(" RTSP/1.0\r\n");

                   request.append("Session: ");

                   request.append(mSessionID);

                    request.append("\r\n");

                   request.append("\r\n");

                   sp reply = new AMessage('play', id());

                   mConn->sendRequest(request.c_str(), reply);

                } else {

                   sp reply = newAMessage('disc', id());

                   mConn->disconnect(reply);

                }

                break;

            }

完成“SETUP”阶段就可以“PLAY”了，发送给服务器端的格式如下：

C->V:PLAY rtsp://video.com/twister/video RTSP/1.0

CSeq: 2

Session:23456789

Range:smpte=0:10:00-

代码在myHandler.h中onMessageReceived对应的”setu”。

下面我们分析下服务器端返回后客户端如何处理“PLAY”。还是在myHandler.h中onMessageReceived函数：

            case 'play':

            {

                ………..

                if (result == OK) {

                    sp obj;

                   CHECK(msg->findObject("response", &obj));

                    spresponse =

                        static_cast(obj.get());

                    if(response->mStatusCode != 200) {

                        result = UNKNOWN_ERROR;

                    } else {

                        parsePlayResponse(response);---解析response回来的数据

………………

                }

                if (result != OK) {

                    sp reply =new AMessage('disc', id());

                   mConn->disconnect(reply);

                }

                break;

            }

response回来的格式一般如下：

V->C:RTSP/1.0 200 OK

CSeq: 2

Session:23456789

Range:smpte=0:10:00-0:20:00------------------播放从10分钟到20分钟时间段的视频

RTP-Info:url=rtsp://video.com/twister/video

;seq=12312232;rtptime=78712811

voidparsePlayResponse(const sp &response) {

        if (mTracks.size() == 0) {

            ALOGV("parsePlayResponse: latepackets ignored.");

            return;

        }

        mPlayResponseReceived = true;

        ssize_t i =response->mHeaders.indexOfKey("range");

…………

        AString range = response->mHeaders.valueAt(i);

………………

        i =response->mHeaders.indexOfKey("rtp-info");

        CHECK_GE(i, 0);

        AString rtpInfo =response->mHeaders.valueAt(i);

        List streamInfos;

        SplitString(rtpInfo, ",",&streamInfos);

        int n = 1;

        for (List::iterator it =streamInfos.begin();

             it != streamInfos.end(); ++it) {

            (it).trim();

            ALOGV("streamInfo[%d] =%s", n, (it).c_str());

            CHECK(GetAttribute((it).c_str(),"url", &val));

            size_t trackIndex = 0;

            while (trackIndex

                size_t startpos = 0;

                if(mTracks.editItemAt(trackIndex).mURL.size() >= val.size()) {

                    startpos =mTracks.editItemAt(trackIndex).mURL.size() - val.size();

                }

                // Use AString::find in orderto allow the url in the RTP-Info to be a

                // truncated variant (example:"url=trackID=1") of the complete SETUP url

                if(mTracks.editItemAt(trackIndex).mURL.find(val.c_str(), startpos) == -1) {

                    ++trackIndex;

                } else {

                    // Found track

                    break;

                }

            }

            CHECK_LT(trackIndex,mTracks.size());

            char end;

            unsigned long seq = 0;

            if (GetAttribute((it).c_str(),"seq", &val)) {

                seq = strtoul(val.c_str(),&end, 10);

            } else {

               CHECK(GetAttribute((it).c_str(), "rtptime", &val));

            }

            TrackInfo info = &mTracks.editItemAt(trackIndex);

            info->mFirstSeqNumInSegment =seq;

            info->mNewSegment = true;

            uint32_t rtpTime = 0;

            if (GetAttribute((it).c_str(),"rtptime", &val)) {

                rtpTime = strtoul(val.c_str(),&end, 10);

                mReceivedRTPTime = true;

                ALOGV("track #%d:rtpTime=%u <=> npt=%.2f", n, rtpTime, npt1);

            } else {

                ALOGV("no rtptime in playresponse: track #%d: rtpTime=%u <=> npt=%.2f", n,

                        rtpTime, npt1);

               CHECK(GetAttribute((it).c_str(), "seq", &val));

            }

            info->mRTPAnchor = rtpTime;

            mLastMediaTimeUs = (int64_t)(npt1 1E6);

            mMediaAnchorUs = mLastMediaTimeUs;

            // Removing packets with old RTPtimestamps

            while (!info->mPackets.empty()){

                sp accessUnit =info->mPackets.begin();

                uint32_t firstRtpTime;

               CHECK(accessUnit->meta()->findInt32("rtp-time", (int32_t*)&firstRtpTime));

                if (firstRtpTime == rtpTime) {

                    break;

                }

               info->mPackets.erase(info->mPackets.begin());

            }

            ++n;

        }



至此video source 和audiosource就可以通过RTP不断的往客户端发送，客户端拿到这些数据就可以通过相应的解码器解析播放了。
我们的流媒体播放流程也讲得差不多了，如何关闭两端的流程就由大伙自己去看了。但是大家要注意一点有时候一些服务在关闭的时候没有发回“TEARDOWN”的response。

转载请注明出处：太妃糖出品 http://blog.csdn.net/tjy1985/article/details/7894305

你可能感兴趣的:(Android影音,Android,多媒体,框架,架构,详细基础学习)

麒麟arm架构系统_安装nginx-1.27.0_访问500 internal server error nginx解决_13: Permission denied---Linux工作笔记072 添柴程序猿 java nginx-1.27.0 nginx最新版安装麒麟v10 arm架构麒麟v10 安装nginx
[[email protected]]#wget-chttp://nginx.org/download/nginx-1.27.0.tar.gz--2024-07-0509:47:00--http://nginx.org/download/nginx-1.27.0.tar.gzResolvingnginx.org(nginx.org)...3.125.197.172,52.58.19
Netty入门教程 Kale又菜又爱玩 java 开发语言
Netty入门教程Netty是一个高性能、低延迟的网络通信框架，广泛应用于高并发、高吞吐量的网络应用程序中。它提供了简洁易用的API，封装了底层的复杂操作，让开发者能够专注于业务逻辑。本文将从基础概念入手，逐步深入Netty的核心组件、使用方法及高级特性，帮助你在生产环境中得心应手地使用Netty。1.什么是Netty？Netty是一个异步、事件驱动的网络通信框架，极大地简化了TCP和UDP网络编
探讨消息队列系统：AWS SQS vs. Apache Kafka fxrz12 工具 aws apache kafka
在现代软件架构中，消息队列系统扮演着关键角色，帮助系统实现异步通信、负载均衡和解耦。两种广泛使用的消息队列系统是AWSSimpleQueueService(SQS)和ApacheKafka。尽管它们都提供消息传递功能，但在设计理念、功能和使用场景上存在显著差异。本文将详细探讨AWSSQS和ApacheKafka的特点，帮助你在不同场景下做出最佳选择。一、ApacheKafkaApacheKafka
解析JSON的这 6 种方案（带示例）浪九天企业级开发效率提升 java spring spring boot spring cloud
目录1.使用Gson详细解释运用场景代码示例2.使用Jackson详细解释运用场景代码示例3.使用JSON.simple详细解释运用场景代码示例4.使用org.json详细解释运用场景代码示例5.使用FastJSON详细解释运用场景代码示例6.使用Moshi详细解释运用场景代码示例在Java中，有多种方案可以用于解析JSON数据，以下为你详细介绍6种常见的方案：1.使用Gson详细解释Gson是G
Android入门（七） | 常用控件 ·Jormungand Android android java android studio
文章目录TextView控件：文本信息Button控件：按钮EditText控件：输入框ImageView控件：图片ProgressBar控件：进度条AlertDialog控件：提示框ProgressDialog控件：带有进度条的提示框TextView控件：文本信息TextView是Android中较常用的一个控件。主要用于在界面上显示一段文本信息，配置在每个活动的xml文件中。除了之前用到的an
Linux目录删除指南：彻底解决“Is a directory”错误 linux运维服务器
在Linux系统中遇到cannotremove'xxx':Isadirectory错误时，说明你正在尝试删除目录但未正确使用参数。以下是详细解决方案：1.基础命令修正删除空目录rmdir目录名#仅删除空目录删除非空目录rm-r目录名#递归删除（确认目录内容可删）rm-rf目录名#强制递归删除（慎用！）2.权限问题处理查看目录权限ls-ld目录名#输出示例：drwxr-xr-x2useruser40
HarmonyNext实战：基于ArkTS的高性能音视频播放器开发 harmonyos-next
HarmonyNext实战：基于ArkTS的高性能音视频播放器开发引言在HarmonyNext生态系统中，音视频播放是一个复杂且具有挑战性的领域。本文将深入探讨如何利用ArkTS语言开发一个高性能的音视频播放器，涵盖从基础播放功能到高级控制与优化的完整流程。我们将通过一个实战案例，详细讲解如何实现一个支持多种格式、流畅播放的音视频播放器，并确保其性能优化。1.环境准备与项目初始化首先，确保你的开发
利用Java爬虫获取衣联网商品详情：实战指南 Jason-河山 java 爬虫开发语言
在电商领域，获取商品详情是数据分析和市场研究的重要环节。衣联网作为知名的电商平台，提供了丰富的服装商品资源。本文将详细介绍如何利用Java编写爬虫程序，通过商品ID获取衣联网商品详情。一、准备工作（一）环境搭建Java安装：确保已安装Java开发环境，推荐使用JDK11或更高版本。开发工具配置：使用IntelliJIDEA或Eclipse等Java开发工具，创建一个新的Maven项目。依赖库添加：
Zookeeper与Kafka学习笔记上海研博数据 zookeeper kafka 学习
一、Zookeeper核心要点1.核心特性分布式协调服务，用于维护配置/命名/同步等元数据采用层次化数据模型（Znode树结构），每个节点可存储<1MB数据典型应用场景：HadoopNameNode高可用HBase元数据管理Kafka集群选举与状态管理2.设计限制内存型存储，不适合大数据量场景数据变更通过版本号（Version）控制，实现乐观锁机制采用ZAB协议保证数据一致性二、Kafka核心架构
Zookeeper学习种豆走天下 zookeeper 学习分布式
Zookeeper是一个开源的分布式协调框架，它主要用于处理分布式系统中的一些常见问题，如同步、配置管理、命名服务和集群管理等。Zookeeper是由Apache提供的，并且广泛应用于各种分布式应用中，特别是在高可用、高可靠性和高性能的系统中。Zookeeper的主要功能分布式协调：Zookeeper提供了协调多个节点（服务器）间行为的机制。例如，分布式锁、选举、配置管理等。命名服务：Zookee
CV：图像的直方图均衡化壹十壹 CV opencv 计算机视觉人工智能
均衡化在图像处理中通常指的是直方图均衡化（HistogramEqualization），其主要目的是改善图像的对比度，使图像细节更加明显。以下是对直方图均衡化的详细说明：直方图均衡化原理直方图图像的直方图表示各灰度级在图像中出现的频率。对于对比度较低的图像，直方图可能集中在灰度范围的某一小区间。均衡化目标直方图均衡化通过将原图的灰度分布重新映射，使得输出图像的直方图尽量均匀分布在整个灰度范围内。这
Zookeeper实践指南 Kale又菜又爱玩 zookeeper 分布式 java
Zookeeper实践指南1.什么是Zookeeper？Zookeeper是Apache旗下的一个开源分布式协调框架，主要用于解决分布式系统中的一致性问题，提供高效可靠的分布式数据管理能力。1.1Zookeeper的核心特性顺序一致性：客户端的更新请求按顺序执行。原子性：更新操作要么成功要么失败，不存在中间状态。可靠性：一旦数据写入Zookeeper，它就不会丢失，除非主动删除。高可用性：采用主从
ITSM流程落地经验之变更管理运维经验云计算容器服务器
本文来自腾讯蓝鲸智云社区用户:CanWay大多数组织中都实施了变更管理，但是效果参差不齐，尤其在变更管理的核心环节，部分组织因缺乏有效的把控，使得变更管理的效果不尽人意，甚至可能面临失控的风险。为此，我们有必要深入探讨并详细分析变更管理中的关键活动，并通过实例加以说明。变更模型与适用场景变更模型是对特定变更的可重复管理方法，这种方法为处理一般变更提供指导，解决一般变更无法适应不同的管理模式的问题。
数字IC前端设计究竟怎样？薪资前景如何？ IC观察者 fpga开发集成电路模拟IC 模拟版图模拟版图入门
数字ic前端岗位介绍：数字ic前端设计处于数字IC设计流程的前端，属于数字IC设计类岗位的一种。数字ic前端设计主要分成几种层次的设计：IPlevel，unitlevel，fullchip/SoClevel，gatelevel等。作为数字IC前端工程师，为了让写的RTL代码没有bug，会经常与验证工程师要求debugcase；为了了解芯片整体架构和功能属性，还要与架构工程师打交道；还要与后端工程师
如何在Spring Boot中实现数据加密后端springboot
如何在SpringBoot中实现数据加密大家好，我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编，也是冬天不穿秋裤，天冷也要风度的程序猿！一、数据加密的重要性与应用场景在当今信息安全日益受到重视的背景下，数据加密成为保护敏感信息不被未授权访问的重要手段。SpringBoot作为一种流行的Java开发框架，提供了多种方式来实现数据加密，适用于用户密码、数据库连接、敏感配置等场景。二、
PHP的架构设计 weixin_34294649 php
首先，大概陈述一下架构的关联，如下所述：首先会先设计标准DALclass(STDAL)，放置getData,delete,update等标准常见的功能函数在来设计程式会用到的各种DAL，基本上每一个Table都需要有一个DAL来实现，后面根据table应用、画面呈现等需求，也可以一个table有多个DAL，这各观念类似View的概念。根据商业逻辑的操作，制作对应的BLL，像是insert、upda
基于transformer实现机器翻译(日译中) 小白_laughter 课程学习 transformer 机器翻译深度学习
文章目录一、引言二、使用编码器—解码器和注意力机制来实现机器翻译模型2.0含注意力机制的编码器—解码器2.1读取和预处理数据2.2含注意力机制的编码器—解码器2.3训练模型2.4预测不定长的序列2.5评价翻译结果三、使用Transformer架构和PyTorch深度学习库来实现的日中机器翻译模型3.1、导入必要的库3.2、数据集准备3.3、准备分词器3.4、构建TorchText词汇表对象，并将句
Java的定时器Timer和TimerTask使用全解析程序员总部 java java python 开发语言
在Java编程中，定时任务是一个常见的需求。无论是定期执行某些操作，还是在特定时间点执行任务，Java提供的Timer和TimerTask类就可以帮助我们轻松实现这些功能。今天将详细介绍如何使用这两个类，包括任务的执行和暂停。理解Timer和TimerTaskTimer是一个可以安排任务在指定的时间或周期性地执行的类。TimerTask是一个抽象类，表示要被定时执行的任务。使用Timer时，我们需
Android 11 DAC和MAC Optimus●Prime android frameworks Android DAC MAC 权限控制
在Android11中，DAC（DiscretionaryAccessControl，自主访问控制）和MAC（MandatoryAccessControl，强制访问控制）是两种不同的访问控制机制，主要用于权限管理、安全性以及进程间访问控制。1.DAC（自主访问控制）DAC（DiscretionaryAccessControl，自主访问控制）是Android的传统权限管理机制，基于用户ID（UID）
ES6解构赋值详解漫天转悠 ES6 es6 前端 ecmascript
ES6解构赋值详解ES6解构赋值是JavaScript语言的一项强大特性，它允许从数组或对象中提取数据，并将其赋值给变量。这一特性不仅简化了代码，提高了可读性，还增强了代码的灵活性。本文将详细介绍ES6解构赋值的基本概念、语法、应用场景以及一些高级用法。1.基本概念解构赋值是对赋值运算符的扩展。它允许按照一定的模式，从数组或对象中提取值，并赋值给变量。这种语法使得从复杂数据结构中提取数据变得更加简
一文理清：阿里系数据中台-数据治理工具集(傻傻也能分清楚） Debug_Snail Hadoop Big Data 技术工具人工智能 hadoop 数据仓库
阿里云提供的大数据与数据分析产品种类较多，各产品的定位和核心功能有所不同。以下是对DataWorks、MaxCompute、Dataphin、AnalyticDBforMySQL（ADB）、QuickBI、EMR的详细梳理。一、核心产品定位与功能DataWorks定位：一站式大数据开发治理平台，提供数据集成、开发、调度、治理、服务等全链路能力。核心功能：数据集成：支持异构数据源（如数据库、OSS、
大语言模型(LLM)入门学习路线图_llm教程，从零基础到精通，理论与实践结合的最佳路径！ AGI学习社语言模型学习人工智能 LLM 大模型大数据自然语言处理
Github项目上有一个大语言模型学习路线笔记，它全面涵盖了大语言模型的所需的基础知识学习，LLM前沿算法和架构，以及如何将大语言模型进行工程化实践。这份资料是初学者或有一定基础的开发/算法人员入门活深入大型语言模型学习的优秀参考。这份资料重点介绍了我们应该掌握哪些核心知识，并推荐了一系列优质的学习视频和博客，旨在帮助大家系统性地掌握大型语言模型的相关技术。大语言模型（LargeLanguageM
Vue初体验码上跑步 vue.js 前端
Vue基础Vue是什么？Vue是javascript的渐进式框架。Vue初识Vue工作时必须要创建一个Vue的实例，并且传入一个配置对象。root容器里的代码是符合html的语法但是新添加了一些Vue语法，在这些地方Vue会自动进行解析。root容器里的代码称为Vue模版。Vue实例和容器是一一对应的。在实际开发中只有一个Vue，配合组件使用。在vue里的插值{{}}内部只要写js表达式就能正常解
一文理清概念：数据中台(DMP)-数据仓库(DW)-数据湖(DL)-湖仓一体-数据治理(DG) Debug_Snail Hadoop Big Data Data Science 数据仓库大数据数据中台数据湖数据治理
数据仓库、数据中台、数据湖、湖仓一体是数据管理和分析领域的重要概念，它们在功能、架构和应用场景上各有特点，同时也在演进中相互关联和补充。以下是对它们的定义和关系的详细解析：1.核心概念（1）数据仓库（DataWarehouse,DW）定义：一种面向主题的、集成的、稳定的数据存储系统，用于支持企业决策分析（如BI、报表）。数据通常经过ETL（抽取、转换、加载）处理，以结构化形式存储，采用Schema
如何编写POC/EXP 藤原千花的败北 web漏洞 web安全 python 网络安全
文章目录前言一、漏洞验证方式二、POC是什么？三、POC框架四、简单的POC/EXP编写1、POC编写流程2、以sqli-labs第8关为例-POC3、以sqli-labs第8关为例-EXP前言初学安全时，很多概念理解不透彻，被POC/EXP的概念困扰了许久。最近看到许多招聘上都需要熟练编写POC/编写特殊场景的工具脚本等要求，下决心要理解并学会如何写POC。（这里是Web应用类漏洞的POC）看了
git submodule管理的仓库怎么删除子仓库绛洞花主敏明 git
删除Git子模块需要执行一系列步骤，以确保从项目中彻底移除子模块及其相关配置。以下是详细的步骤：1.取消初始化子模块运行以下命令以取消子模块的初始化，这会从.git/config文件中移除子模块的配置：gitsubmoduledeinit-f-f参数用于强制执行，避免因子模块目录中有未提交的更改而导致命令失败。2.删除子模块目录从工作目录中删除子模块的文件夹：rm-rf3.从.gitmodules
Linux tcpdump -any抓的包转换成标准的pcap 812503533 linux tcpdump 网络协议 tcp/ip
在Linux中使用tcpdump-any抓包并转换为标准pcap文件时出现额外字段，通常与链路层协议头部的差异以及pcap文件格式的兼容性有关。以下是详细原因和解决方案：一、问题原因分析-any选项的局限性tcpdump-any会自动猜测链路层协议类型（如Ethernet、IEEE802.11、PPP等），但可能因环境复杂导致误判。例如：在混合网络（如同时包含有线和无线流量）中，自动检测可能失败。
Spring Boot 与 Spring MVC 有何不同大G哥 spring spring boot mvc 后端 java
SpringBoot和SpringMVC都是Spring框架的一部分，但它们有不同的目标和功能。以下是它们之间的主要区别：1.核心目标SpringBoot：SpringBoot的目标是简化Spring应用的配置和部署。它通过提供默认配置和嵌入式服务器(如Tomcat、Jetty或Undertow)，使开发者能够快速构建和启动Spring应用，而无需配置繁琐的XML或类配置。SpringMVC：Sp
mysql 数据库部署 IT 古月方源网络安全运维网络数据库
以下是基于CentOS7系统部署MySQL数据库的详细步骤及常见问题解决方案：一、卸载旧版本MySQL/MariaDB停止服务并检查残留systemctlstopmariadb#停止MariaDB服务rpm-qa|grepmariadb#检查MariaDB安装包rpm-e--nodepsmariadb-libs-*#强制卸载MariaDB及其依赖包rm-rf/etc/my.cnf/var/lib/
【推荐项目】 043-停车管理系统蜗牛 | ICU 推荐项目 spring boot vue.js java 前端框架
043-停车管理系统介绍使用springbootvuejsmysql技术搭建框架。智能停车管理系统描述后端框架：采用SpringBoot与MySQL的强强联合，为系统提供稳健、高效的服务支撑。前端框架：前端选用Vue.js，打造流畅、美观的用户交互界面。管理员功能：用户信息管理：轻松管理用户信息，包括新增、编辑、删除及查询用户。界面清晰，操作便捷，确保用户数据的安全与准确。车位信息管理：实时查看车
怎么样才能成为专业的程序员？ cocos2d-x小菜编程 PHP
如何要想成为一名专业的程序员？仅仅会写代码是不够的。从团队合作去解决问题到版本控制，你还得具备其他关键技能的工具包。当我们询问相关的专业开发人员，那些必备的关键技能都是什么的时候，下面是我们了解到的情况。关于如何学习代码，各种声音很多，然后很多人就被误导为成为专业开发人员懂得一门编程语言就够了？！呵呵，就像其他工作一样，光会一个技能那是远远不够的。如果你想要成为
java web开发高并发处理 BreakingBad java Web 并发开发处理高
java处理高并发高负载类网站中数据库的设计方法（java教程,java处理大量数据，java高负载数据）一：高并发高负载类网站关注点之数据库没错,首先是数据库,这是大多数应用所面临的首个SPOF。尤其是Web2.0的应用，数据库的响应是首先要解决的。一般来说MySQL是最常用的，可能最初是一个mysql主机，当数据增加到100万以上，那么，MySQL的效能急剧下降。常用的优化措施是M-S（
mysql批量更新 ekian mysql
mysql更新优化：一版的更新的话都是采用update set的方式，但是如果需要批量更新的话，只能for循环的执行更新。或者采用executeBatch的方式，执行更新。无论哪种方式，性能都不见得多好。三千多条的更新，需要3分多钟。查询了批量更新的优化，有说replace into的方式，即： replace into tableName(id,status) values
微软BI（3） 18289753290 微软BI SSIS
1) Q：该列违反了完整性约束错误；已获得 OLE DB 记录。源:“Microsoft SQL Server Native Client 11.0” Hresult: 0x80004005 说明:“不能将值 NULL 插入列 'FZCHID'，表 'JRB_EnterpriseCredit.dbo.QYFZCH'；列不允许有 Null 值。INSERT 失败。”。 A：一般这类问题的存在是
Java中的List g21121 java
List是一个有序的 collection（也称为序列）。此接口的用户可以对列表中每个元素的插入位置进行精确地控制。用户可以根据元素的整数索引（在列表中的位置）访问元素，并搜索列表中的元素。与 set 不同，列表通常允许重复
读书笔记永夜-极光读书笔记
1. K是一家加工厂,需要采购原材料,有A,B,C,D 4家供应商,其中A给出的价格最低,性价比最高,那么假如你是这家企业的采购经理,你会如何决策? 传统决策: A:100%订单 B,C,D:0% &nbs
centos 安装 Codeblocks 随便小屋 codeblocks
1.安装gcc,需要c和c++两部分,默认安装下,CentOS不安装编译器的,在终端输入以下命令即可yum install gccyum install gcc-c++ 2.安装gtk2-devel,因为默认已经安装了正式产品需要的支持库,但是没有安装开发所需要的文档.yum install gtk2* 3. 安装wxGTK yum search w
23种设计模式的形象比喻 aijuans 设计模式
1、ABSTRACT FACTORY—追MM少不了请吃饭了，麦当劳的鸡翅和肯德基的鸡翅都是MM爱吃的东西，虽然口味有所不同，但不管你带MM去麦当劳或肯德基，只管向服务员说“来四个鸡翅”就行了。麦当劳和肯德基就是生产鸡翅的Factory 　　工厂模式：客户类和工厂类分开。消费者任何时候需要某种产品，只需向工厂请求即可。消费者无须修改就可以接纳新产品。缺点是当产品修改时，工厂类也要做相应的修改。如：
开发管理 CheckLists aoyouzi 开发管理 CheckLists
开发管理 CheckLists(23) -使项目组度过完整的生命周期开发管理 CheckLists(22) -组织项目资源开发管理 CheckLists(21) -控制项目的范围开发管理 CheckLists(20) -项目利益相关者责任开发管理 CheckLists(19) -选择合适的团队成员开发管理 CheckLists(18) -敏捷开发 Scrum Master 工作开发管理 C
js实现切换百合不是茶 JavaScript 栏目切换
js主要功能之一就是实现页面的特效,窗体的切换可以减少页面的大小,被门户网站大量应用思路: 1,先将要显示的设置为display:bisible 否则设为none 2,设置栏目的id ,js获取栏目的id,如果id为Null就设置为显示 3,判断js获取的id名字;再设置是否显示代码实现: html代码: <di
周鸿祎在360新员工入职培训上的讲话 bijian1013 感悟项目管理人生职场
这篇文章也是最近偶尔看到的，考虑到原博客发布者可能将其删除等原因，也更方便个人查找，特将原文拷贝再发布的。“学东西是为自己的，不要整天以混的姿态来跟公司博弈，就算是混，我觉得你要是能在混的时间里，收获一些别的有利于人生发展的东西，也是不错的，看你怎么把握了”，看了之后，对这句话记忆犹新。 &
前端Web开发的页面效果 Bill_chen html Web Microsoft
1.IE6下png图片的透明显示： <img src="图片地址" border="0" style="Filter.Alpha(Opacity)=数值(100),style=数值(3)"/> 或在<head></head>间加一段JS代码让透明png图片正常显示。 2.<li>标
【JVM五】老年代垃圾回收：并发标记清理GC(CMS GC) bit1129 垃圾回收
CMS概述并发标记清理垃圾回收(Concurrent Mark and Sweep GC）算法的主要目标是在GC过程中，减少暂停用户线程的次数以及在不得不暂停用户线程的请夸功能，尽可能短的暂停用户线程的时间。这对于交互式应用，比如web应用来说，是非常重要的。 CMS垃圾回收针对新生代和老年代采用不同的策略。相比同吞吐量垃圾回收，它要复杂的多。吞吐量垃圾回收在执
Struts2技术总结白糖_ struts2
必备jar文件早在struts2.0.*的时候，struts2的必备jar包需要如下几个： commons-logging-*.jar Apache旗下commons项目的log日志包 freemarker-*.jar
Jquery easyui layout应用注意事项 bozch jquery 浏览器 easyui layout
在jquery easyui中提供了easyui-layout布局，他的布局比较局限，类似java中GUI的border布局。下面对其使用注意事项作简要介绍：如果在现有的工程中前台界面均应用了jquery easyui，那么在布局的时候最好应用jquery eaysui的layout布局，否则在表单页面（编辑、查看、添加等等）在不同的浏览器会出
java-拷贝特殊链表：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？ bylijinnan java
public class CopySpecialLinkedList { /** * 题目：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？拷贝pNext指针非常容易，所以题目的难点是如何拷贝pRand指针。假设原来链表为A1 -> A2 ->... -> An，新拷贝
color Chen.H JavaScript html css
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <HTML> <HEAD>&nbs
[信息与战争]移动通讯与网络 comsci 网络
两个坚持:手机的电池必须可以取下来光纤不能够入户,只能够到楼宇建议大家找这本书看看:<&
oracle flashback query(闪回查询) daizj oracle flashback query flashback table
在Oracle 10g中，Flash back家族分为以下成员： Flashback Database Flashback Drop Flashback Table Flashback Query(分Flashback Query,Flashback Version Query，Flashback Transaction Query) 下面介绍一下Flashback Drop 和Flas
zeus持久层DAO单元测试 deng520159 单元测试
zeus代码测试正紧张进行中,但由于工作比较忙,但速度比较慢.现在已经完成读写分离单元测试了,现在把几种情况单元测试的例子发出来,希望有人能进出意见,让它走下去. 本文是zeus的dao单元测试: 1.单元测试直接上代码 package com.dengliang.zeus.webdemo.test; import org.junit.Test; import o
C语言学习三printf函数和scanf函数学习 dcj3sjt126com c printf scanf language
printf函数 /* 2013年3月10日20:42:32 地点：北京潘家园功能：目的：测试%x %X %#x %#X的用法 */ # include <stdio.h> int main(void) { printf("哈哈！\n"); // \n表示换行 int i = 10; printf
那你为什么小时候不好好读书? dcj3sjt126com life
dady, 我今天捡到了十块钱, 不过我还给那个人了 good girl! 那个人有没有和你讲thank you啊没有啦....他拉我的耳朵我才把钱还给他的, 他哪里会和我讲thank you 爸爸, 如果地上有一张5块一张10块你拿哪一张呢.... 当然是拿十块的咯... 爸爸你很笨的, 你不会两张都拿爸爸为什么上个月那个人来跟你讨钱, 你告诉他没
iptables开放端口 Fanyucai linux iptables 端口
1，找到配置文件 vi /etc/sysconfig/iptables 2，添加端口开放，增加一行，开放18081端口 -A INPUT -m state --state NEW -m tcp -p tcp --dport 18081 -j ACCEPT 3，保存 ESC :wq! 4，重启服务 service iptables
Ehcache（05）——缓存的查询 234390216 排序 ehcache 统计 query
缓存的查询目录 1. 使Cache可查询 1.1 基于Xml配置 1.2 基于代码的配置 2 指定可搜索的属性 2.1 可查询属性类型 2.2 &
通过hashset找到数组中重复的元素 jackyrong hashset
如何在hashset中快速找到重复的元素呢?方法很多，下面是其中一个办法： int[] array = {1,1,2,3,4,5,6,7,8,8}; Set<Integer> set = new HashSet<Integer>(); for(int i = 0
使用ajax和window.history.pushState无刷新改变页面内容和地址栏URL lanrikey history
后退时关闭当前页面 <script type="text/javascript"> jQuery(document).ready(function ($) { if (window.history && window.history.pushState) {
应用程序的通信成本 netkiller.github.com 虚拟机应用服务器陈景峰 netkiller neo
应用程序的通信成本什么是通信一个程序中两个以上功能相互传递信号或数据叫做通信。什么是成本这是是指时间成本与空间成本。时间就是传递数据所花费的时间。空间是指传递过程耗费容量大小。都有哪些通信方式全局变量线程间通信共享内存共享文件管道 Socket 硬件（串口，USB）等等全局变量全局变量是成本最低通信方法，通过设置
一维数组与二维数组的声明与定义恋洁e生二维数组一维数组定义声明初始化
/** * */ package test20111005; /** * @author FlyingFire * @date:2011-11-18 上午04:33:36 * @author ：代码整理 * @introduce :一维数组与二维数组的初始化 *summary： */ public c
Spring Mybatis独立事务配置 toknowme mybatis
在项目中有很多地方会使用到独立事务，下面以获取主键为例（1）修改配置文件spring-mybatis.xml  <tx:annotation-driven transaction-manager="transactionManager" /> &n
更新Anadroid SDK Tooks之后，Eclipse提示No update were found xp9802 eclipse
使用Android SDK Manager 更新了Anadroid SDK Tooks 之后，打开eclipse提示 This Android SDK requires Android Developer Toolkit version 23.0.0 or above, 点击Check for Updates 检测一会后提示 No update were found

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他