Mr_xkHuang

ffmpeg系列-解决ffmpeg获取aac音频文件duration不准

这个问题是这样产生的，一同事反应会随机出现ijk获取到的aac文件的duration不准，发来一看，确实不准，在AE或者系统mediaplayer中得到的都是8.4秒（准确时间是MtkAACExtractor: ADTS: duration = 8448000 us），ijk得到的是9.3秒，在播放的时候，在8秒的时候流就结束了，放到编译的ffmpeg中，一看也是9.3秒。

1.分析问题

下面开始分析这个问题，命令行看下这个文件，ffmpeg中获取到的确实是9.3秒

仔细看下红色箭头所指，这个意思是获取到的duration是根据比特率计算的，可能不准确。这种获取音视频info有问题的我们一般可以从avformat_find_stream_info函数开始分析。

这里直接从log开始看，waring出现出现在utils.c/libavformat下

static void estimate_timings_from_bit_rate(AVFormatContext *ic)
{
    int64_t filesize, duration;
    int i, show_warning = 0;
    AVStream *st;
	
	av_log(ic, AV_LOG_WARNING,
				   "hxk-->ic->bit_rate:%lld\n",ic->bit_rate);
	//这里从log可以看到，bitrate也没获取到，bitrate = 0
    /* if bit_rate is already set, we believe it */
    if (ic->bit_rate <= 0) {
        int64_t bit_rate = 0;
        for (i = 0; i < ic->nb_streams; i++) {
            st = ic->streams[i];
			
            if (st->codecpar->bit_rate <= 0 && st->internal->avctx->bit_rate > 0)
                st->codecpar->bit_rate = st->internal->avctx->bit_rate;
            if (st->codecpar->bit_rate > 0) {
                if (INT64_MAX - st->codecpar->bit_rate < bit_rate) {
                    bit_rate = 0;
                    break;
                }
                bit_rate += st->codecpar->bit_rate;
            } else if (st->codecpar->codec_type == AVMEDIA_TYPE_VIDEO && st->codec_info_nb_frames > 1) {
                // If we have a videostream with packets but without a bitrate
                // then consider the sum not known
                bit_rate = 0;
                break;
            }
        }
        //这里算出来一个bitrate
        ic->bit_rate = bit_rate;
		av_log(ic, AV_LOG_WARNING,
				   "hxk-->ic->bit_rate:%lld\n",ic->bit_rate);
    }
    //从log中可以看到，这里的duration也是0

    /* if duration is already set, we believe it */
	av_log(ic, AV_LOG_WARNING,
               "hxk-->ic->duration:%lld\n",ic->duration);
    if (ic->duration == AV_NOPTS_VALUE &&
        ic->bit_rate != 0) {
        filesize = ic->pb ? avio_size(ic->pb) : 0;
		av_log(ic, AV_LOG_WARNING,
               "hxk-->ic->filesize:%lld\n",filesize);
        if (filesize > ic->internal->data_offset) {
            filesize -= ic->internal->data_offset;
            for (i = 0; i < ic->nb_streams; i++) {
                st      = ic->streams[i];
                if (   st->time_base.num <= INT64_MAX / ic->bit_rate
                    && st->duration == AV_NOPTS_VALUE) {
                    //这里根据文件字节*8 /比特率来计算duration，这里cbr这样计算可以计算，但是如果vbr（码率动态）的话就有问题了
                    duration = av_rescale(8 * filesize, st->time_base.den,
                                          ic->bit_rate *
                                          (int64_t) st->time_base.num);
                //获取到的duration就不准确了
                    st->duration = duration;
                    show_warning = 1;
                }
            }
        }
    }
    if (show_warning)
        av_log(ic, AV_LOG_WARNING,
               "Estimating duration from bitrate, this may be inaccurate\n");
}

调用上面这个函数的地方是utils.c/libavofrmat：

static void estimate_timings(AVFormatContext *ic, int64_t old_offset)
{
    int64_t file_size;

    /* get the file size, if possible */
    if (ic->iformat->flags & AVFMT_NOFILE) {
        file_size = 0;
    } else {
        file_size = avio_size(ic->pb);
        file_size = FFMAX(0, file_size);
    }
	av_log(ic, AV_LOG_WARNING, "hxk->ic->iformat->name:%s\n", ic->iformat->name);
	av_log(ic, AV_LOG_WARNING, "hxk->file_size:%lld\n", file_size);
	av_log(ic, AV_LOG_WARNING, "hxk->ic->pb->seekable:%d\n", ic->pb->seekable);

    if ((!strcmp(ic->iformat->name, "mpeg") ||
         !strcmp(ic->iformat->name, "mpegts")) &&
        file_size && (ic->pb->seekable & AVIO_SEEKABLE_NORMAL)) {
        /* get accurate estimate from the PTSes */
        estimate_timings_from_pts(ic, old_offset);
        ic->duration_estimation_method = AVFMT_DURATION_FROM_PTS;
    } else if (has_duration(ic)) {
    //如果在demuxer中获取到duration了
        /* at least one component has timings - we use them for all
         * the components */
        fill_all_stream_timings(ic);
        ic->duration_estimation_method = AVFMT_DURATION_FROM_STREAM;
    } else {
    //这个文件没有获取到duration，所以走的是这里
        /* less precise: use bitrate info */
        estimate_timings_from_bit_rate(ic);
        ic->duration_estimation_method = AVFMT_DURATION_FROM_BITRATE;
    }
    update_stream_timings(ic);

    {
        int i;
        AVStream av_unused *st;
        for (i = 0; i < ic->nb_streams; i++) {
            st = ic->streams[i];
            av_log(ic, AV_LOG_TRACE, "stream %d: start_time: %0.3f duration: %0.3f\n", i,
                   (double) st->start_time * av_q2d(st->time_base),
                   (double) st->duration   * av_q2d(st->time_base));
        }
        av_log(ic, AV_LOG_TRACE,
                "format: start_time: %0.3f duration: %0.3f bitrate=%"PRId64" kb/s\n",
                (double) ic->start_time / AV_TIME_BASE,
                (double) ic->duration   / AV_TIME_BASE,
                (int64_t)ic->bit_rate / 1000);
    }
}

调用上面这个方法是在avformat_find_stream_info/utils.c/libavformat函数中。

2.解决问题

原因已经知道了，那么可以如何解决这个问题呢？
aac的duration可以如何获取呢？
我们看下android系统中libstagefright框架中aacextractore的实现

AACExtractor.cpp/libstagefrgiht

AACExtractor::AACExtractor(
        const sp &source, const sp &_meta)
    : mDataSource(source),
      mInitCheck(NO_INIT),
      mFrameDurationUs(0) {
    sp meta = _meta;

    if (meta == NULL) {
        String8 mimeType;
        float confidence;
        sp _meta;

        if (!SniffAAC(mDataSource, &mimeType, &confidence, &meta)) {
            return;
        }
    }

    int64_t offset;
    CHECK(meta->findInt64("offset", &offset));

    uint8_t profile, sf_index, channel, header[2];
    if (mDataSource->readAt(offset + 2, &header, 2) < 2) {
        return;
    }
//获取profile
    profile = (header[0] >> 6) & 0x3;
//获取采样索引
    sf_index = (header[0] >> 2) & 0xf;
//获取采样率
    uint32_t sr = get_sample_rate(sf_index);
    if (sr == 0) {
        return;
    }
//通道
    channel = (header[0] & 0x1) << 2 | (header[1] >> 6);

    mMeta = MakeAACCodecSpecificData(profile, sf_index, channel);

    off64_t streamSize, numFrames = 0;
    size_t frameSize = 0;
    int64_t duration = 0;
//获取文件大小
    if (mDataSource->getSize(&streamSize) == OK) {
         while (offset < streamSize) {
         //获取adts每一帧大小
            if ((frameSize = getAdtsFrameLength(source, offset, NULL)) == 0) {
                return;
            }

            mOffsetVector.push(offset);

            offset += frameSize;//偏移加加
            numFrames ++;//计算帧数目
        }
//***************重点看下这里，这里在下面分析aac文件格式的时候会讲解细致一点*************
        // Round up and get the duration
        mFrameDurationUs = (1024 * 1000000ll + (sr - 1)) / sr;
        duration = numFrames * mFrameDurationUs;//总帧数x一个AAC音频帧的播放时间
        mMeta->setInt64(kKeyDuration, duration);
    }

    mInitCheck = OK;
}

我们再看下getAdtsFrameLength/AACExtractor.cpp/libstagefrgiht函数，这个函数其实就是根据adts头来计算出每一个framesize的大小的

static size_t getAdtsFrameLength(const sp &source, off64_t offset, size_t* headerSize) {
//CRC
    const size_t kAdtsHeaderLengthNoCrc = 7;
    const size_t kAdtsHeaderLengthWithCrc = 9;

    size_t frameSize = 0;
//同步字
    uint8_t syncword[2];
    if (source->readAt(offset, &syncword, 2) != 2) {
        return 0;
    }
    if ((syncword[0] != 0xff) || ((syncword[1] & 0xf6) != 0xf0)) {
        return 0;
    }
//0没有crc，1有crc
    uint8_t protectionAbsent;
	
    if (source->readAt(offset + 1, &protectionAbsent, 1) < 1) {
        return 0;
    }
    protectionAbsent &= 0x1;

    uint8_t header[3];
    if (source->readAt(offset + 3, &header, 3) < 3) {
        return 0;
    }
//获取framesize的大小
    frameSize = (header[0] & 0x3) << 11 | header[1] << 3 | header[2] >> 5;

    // protectionAbsent is 0 if there is CRC
    size_t headSize = protectionAbsent ? kAdtsHeaderLengthNoCrc : kAdtsHeaderLengthWithCrc;
    if (headSize > frameSize) {
        return 0;
    }
    if (headerSize != NULL) {
        *headerSize = headSize;
    }

    return frameSize;
}

上面的实现原理就是根据一个AAC原始帧包含一段时间内1024个采样及相关数据。一个AAC音频帧的播放时间=一个AAC帧对应的采样样本的个数/采样率。所以aac音频文件总时间t=总帧数x一个AAC音频帧的播放时间

下面看一下aac的demuxer，在aacdec.c/libavformat下，发现里面连对aidf头的处理都没有，这个先不管了。

AAC格式：

下面我们先简单看下aac的格式：

详细的AAC格式参考下这篇文章吧，实在懒得写。

AAC文件格式与音频文件时长计算

解决问题

下面我们看下ffmpeg中这个格式的demuxer，这个文件封装格式raw ADTS AAC，下面我们看下aacdec.c/libavformat

修改aacdec.c文件，新加函数

//add by hxk
//获取adts frame的帧长
static int getAdtsFrameLength(AVFormatContext *s,int64_t offset,int* headerSize)
{
	int64_t filesize, position = avio_tell(s->pb);  
    filesize = avio_size(s->pb);
	//av_log(NULL, AV_LOG_WARNING, "hxk->getAdtsFrameLength.filesize:%d\n",filesize);
    const int kAdtsHeaderLengthNoCrc = 7;
    const int kAdtsHeaderLengthWithCrc = 9;
    int frameSize = 0;
    uint8_t syncword[2];
	avio_seek(s->pb, offset, SEEK_SET);
	//读取同步字
    if(avio_read(s->pb,&syncword, 2)!= 2){
		return 0;
	}
    if ((syncword[0] != 0xff) || ((syncword[1] & 0xf6) != 0xf0)) {
        return 0;
    }
	uint8_t protectionAbsent;
	avio_seek(s->pb, offset+1, SEEK_SET);
	//读取protectionAbsent
    if (avio_read(s->pb, &protectionAbsent, 1) < 1) {
        return 0;
    }
    protectionAbsent &= 0x1;
    uint8_t header[3];
//读取header
	avio_seek(s->pb, offset+3, SEEK_SET);
    if (avio_read(s->pb, &header, 3) < 3) {
        return 0;
    }
    
    //获取framesize
    frameSize = (header[0] & 0x3) << 11 | header[1] << 3 | header[2] >> 5;
    // protectionAbsent is 0 if there is CRC
    int headSize = protectionAbsent ? kAdtsHeaderLengthNoCrc : kAdtsHeaderLengthWithCrc;
    if (headSize > frameSize) {
        return 0;
    }
    if (headerSize != NULL) {
        *headerSize = headSize;
    }
    return frameSize;
}
//根据采样率下标获取采样率
static uint32_t get_sample_rate(const uint8_t sf_index)
{
    static const uint32_t sample_rates[] =
    {
        96000, 88200, 64000, 48000, 44100, 32000,
        24000, 22050, 16000, 12000, 11025, 8000
    };

    if (sf_index < sizeof(sample_rates) / sizeof(sample_rates[0])) {
        return sample_rates[sf_index];
    }

    return 0;
}

//add end

修改adts_aac_read_header函数

static int adts_aac_read_header(AVFormatContext *s)
{
	av_log(NULL, AV_LOG_WARNING, "hxk->adts_aac_read_header!\n");

    AVStream *st;
    uint16_t state;

    st = avformat_new_stream(s, NULL);
    if (!st)
        return AVERROR(ENOMEM);

    st->codecpar->codec_type = AVMEDIA_TYPE_AUDIO;
    st->codecpar->codec_id   = s->iformat->raw_codec_id;
    st->need_parsing         = AVSTREAM_PARSE_FULL_RAW;
    ff_id3v1_read(s);
    if ((s->pb->seekable & AVIO_SEEKABLE_NORMAL) &&
        !av_dict_get(s->metadata, "", NULL, AV_DICT_IGNORE_SUFFIX)) {
        int64_t cur = avio_tell(s->pb);
        ff_ape_parse_tag(s);
        avio_seek(s->pb, cur, SEEK_SET);
    }

    // skip data until the first ADTS frame is found
    state = avio_r8(s->pb);
    while (!avio_feof(s->pb) && avio_tell(s->pb) < s->probesize) {
        state = (state << 8) | avio_r8(s->pb);
        if ((state >> 4) != 0xFFF)
            continue;
        avio_seek(s->pb, -2, SEEK_CUR);
        break;
    }
    if ((state >> 4) != 0xFFF)
        return AVERROR_INVALIDDATA;

    // LCM of all possible ADTS sample rates
 //   avpriv_set_pts_info(st, 64, 1, 28224000);
//add by hxk
#if  1
        //句柄指回起点
		avio_seek(s->pb, 0, SEEK_SET);
		uint8_t profile, sf_index, channel, header[2];
		//文件指针移动到文件起点前2个字节
		avio_seek(s->pb, 2, SEEK_SET);
		if (avio_read(s->pb,&header, 2) < 2) {
			av_log(NULL, AV_LOG_ERROR, "avio_read header error!\n");
			return 0;
		}
		int64_t offset = 0;
		//获取profile
		profile = (header[0] >> 6) & 0x3;
		st->codecpar->profile = profile;
		//av_log(NULL, AV_LOG_WARNING, "hxk->profile:%d!\n",profile);
		sf_index = (header[0] >> 2) & 0xf;
		//获取采样率
		uint32_t sr = get_sample_rate(sf_index);
		//av_log(NULL, AV_LOG_WARNING, "hxk->samplerate:%d!\n",sr);
		if (sr == 0) {
			av_log(NULL, AV_LOG_ERROR, "avio_read read sampletare error!\n");
			return 0;
		}
		//赋值给codec参数
		st->codecpar->sample_rate = sr;
		//获取通道
		channel = (header[0] & 0x1) << 2 | (header[1] >> 6);
		if (channel == 0) {
			av_log(NULL, AV_LOG_ERROR, "adts_aac_read_header read channel error!\n");
			return 0;
		}
	    //赋值给codec 参数
		st->codecpar->channels = channel;
		//av_log(NULL, AV_LOG_WARNING, "hxk->channel:%d!\n",channel);
		sf_index = (header[0] >> 2) & 0xf;
		int frameSize = 0;
		int64_t mFrameDurationUs = 0;
		int64_t duration = 0;
		//采样率赋值给codec
		st->codecpar->sample_rate = sr;
		int64_t streamSize, numFrames = 0;
	    avpriv_set_pts_info(st, 64, 1, st->codecpar->sample_rate);
	    //获取文件大小
		streamSize =  avio_size(s->pb);
	//	av_log(NULL, AV_LOG_WARNING, "hxk->streamSize:%d!\n",streamSize);
		if (streamSize > 0) {
			while (offset < streamSize) {
				if ((frameSize = getAdtsFrameLength(s, offset, NULL)) == 0) {
					  return 0;
				}
				offset += frameSize;//偏移加加
				numFrames ++;//帧数加加，获取总帧数
			//	av_log(NULL, AV_LOG_WARNING, "hxk->frameSize:%d!\n",frameSize);
			}
		//	av_log(NULL, AV_LOG_WARNING, "hxk->numFrames:%lld!\n",numFrames);
			// Round up and get the duration，计算每一帧时间
			mFrameDurationUs = (1024 * 1000000ll + (sr - 1)) / sr;
			duration = numFrames * mFrameDurationUs;//us
			//时间基转换avstream的，us单位(AV_TIME_BASE_Q)转avstream的时间基
			duration = av_rescale_q(duration,AV_TIME_BASE_Q, st->time_base);
			st->duration = duration;
		//	av_log(NULL, AV_LOG_WARNING, "hxk->duration:%d!\n",duration);
		}
		
#endif
//add end

    return 0;
}

这样在demuxer中就获得了duration，在上面的estimate_timings函数中就直接走has_duration这个判断了，得到的duration也是比较准确的了。

运行一下修改后的代码，从下图可以看到时间已经改变了，和android中MtkAACExtractor获取的duration是一样的了。

后续

正满心欢喜解决了问题后，把改动的代码移植到ijk上的时候，发现不能播放，没报任何错误，文件info读取都是正确的，seek一下的时候报了这么一行错误

IJKMEDIA: /storage/emulated/0/3ee807175fc2488d8264ac014ccf55ff.aac: error while seeking

原来忘记把句柄置回去了
修改如下：

static int adts_aac_read_header(AVFormatContext *s)
{
    AVStream *st;
    uint16_t state;

    st = avformat_new_stream(s, NULL);
    if (!st)
        return AVERROR(ENOMEM);

    st->codecpar->codec_type = AVMEDIA_TYPE_AUDIO;
    st->codecpar->codec_id   = s->iformat->raw_codec_id;
    st->need_parsing         = AVSTREAM_PARSE_FULL_RAW;

    ff_id3v1_read(s);
    if ((s->pb->seekable & AVIO_SEEKABLE_NORMAL) &&
        !av_dict_get(s->metadata, "", NULL, AV_DICT_IGNORE_SUFFIX)) {
        int64_t cur = avio_tell(s->pb);
        ff_ape_parse_tag(s);
        avio_seek(s->pb, cur, SEEK_SET);
    }

    // skip data until the first ADTS frame is found
    state = avio_r8(s->pb);
    while (!avio_feof(s->pb) && avio_tell(s->pb) < s->probesize) {
        state = (state << 8) | avio_r8(s->pb);
        if ((state >> 4) != 0xFFF)
            continue;
        avio_seek(s->pb, -2, SEEK_CUR);
        break;
    }
    if ((state >> 4) != 0xFFF)
        return AVERROR_INVALIDDATA;

    // LCM of all possible ADTS sample rates
   // avpriv_set_pts_info(st, 64, 1, 28224000);
	//add by hxk
#if  1
			
			avio_seek(s->pb, 0, SEEK_SET);
			uint8_t profile, sf_index, channel, header[2];
			avio_seek(s->pb, 2, SEEK_SET);
			if (avio_read(s->pb,&header, 2) < 2) {
				av_log(NULL, AV_LOG_ERROR, "avio_read header error!\n");
				return 0;
			}
			int64_t offset = 0;
			profile = (header[0] >> 6) & 0x3;
			st->codecpar->profile = profile;
			sf_index = (header[0] >> 2) & 0xf;
			uint32_t sr = get_sample_rate(sf_index);
			if (sr == 0) {
				av_log(NULL, AV_LOG_ERROR, "adts_aac_read_header read sampletare error!\n");
				return 0;
			}
			st->codecpar->sample_rate = sr;
			channel = (header[0] & 0x1) << 2 | (header[1] >> 6);
			if(channel == 0) {
				av_log(NULL, AV_LOG_ERROR, "adts_aac_read_header read channel error!\n");
				return 0;
			}
			st->codecpar->channels = channel;
			sf_index = (header[0] >> 2) & 0xf;
			int frameSize = 0;
			int64_t mFrameDurationUs = 0;
			int64_t duration = 0;
			st->codecpar->sample_rate = sr;
			int64_t streamSize, numFrames = 0;
			avpriv_set_pts_info(st, 64, 1, st->codecpar->sample_rate);
			streamSize =  avio_size(s->pb);
			//av_log(NULL, AV_LOG_WARNING, "hxk->streamSize:%d!\n",streamSize);
			if (streamSize > 0) {
				while (offset < streamSize) {
					if ((frameSize = getAdtsFrameLength(s, offset, NULL)) == 0) {
						  return 0;
					}
					offset += frameSize;
					numFrames ++;
				//av_log(NULL, AV_LOG_WARNING, "hxk->frameSize:%d!\n",frameSize);
				}
				// av_log(NULL, AV_LOG_WARNING, "hxk->numFrames:%lld!\n",numFrames);
				// Round up and get the duration
				mFrameDurationUs = (1024 * 1000000ll + (sr - 1)) / sr;
				duration = numFrames * mFrameDurationUs;//us
				duration = av_rescale_q(duration,AV_TIME_BASE_Q, st->time_base);
				st->duration = duration;
				//av_log(NULL, AV_LOG_WARNING, "hxk->duration:%d!\n",duration);
			}
			//置回句柄
			avio_seek(s->pb, 0, SEEK_SET);
			
#endif
	//add end

    return 0;
}

嗯，可以获取正确的时间来正常播放了。

linux下用ffmpeg测试nvidia 显示驱动是否安装成功的脚本谢平康 linux ffmpeg 运维
#!/bin/bash#生成一个10秒用户来测试的文件ffmpeg-y-flavfi-itestsrc=duration=10:size=1280x720:rate=30\-flavfi-isine=frequency=1000:duration=10\-c:vlibx264-presetfast-crf23\-c:aaac-b:a192k\input.mp4#测试输入文件（可替换为你自己的视频文
【原创】【4】【辅助工具】基于视觉模型+FFmpeg+MoviePy实现短视频自动化二次编辑+多赛道三块钱0794 ffmpeg 音视频自动化
主要功能目录选择-浏览选择包含视频的目录智能扫描-自动递归扫描所有视频文件️赛道管理-从文件夹名自动获取赛道或手动指定实时进度-显示扫描和导入的实时进度双数据库-支持SQLite（推荐）和MySQL重复检测-自动跳过已存在的视频文件使用场景示例假设您的视频目录结构是：D:\短视频\├──外国人系列\│├──1.mp4│├──2.mp4│└──3.mov├──美食系列\│├──美食1.mp4│└──
python：pydub模块 face丶第三方模块音频 pydub
一、安装1、安装模块pipinstallpydub2、安装插件云盘中下载文件ffmpeg打开电脑上的控制面板-系统-高级系统设置-环境变量然后双击path,看到如下的界面：然后点新建会出现一个新建的地址栏，你需要在这个新建地址栏里输入一个文件地址：打开你下载的ffmpeg文件中的bin文件，你应该可以看到一个这样的界面，把这个界面中地址栏中的地址复制粘贴到上面图片新建的地址栏中，然后点确定，来保存
Pydub AI小译 Github精选 ffmpeg python 音频
文章目录关于Pydub快速入门调试错误和问题安装依赖性回放设置ffmpeg重要注意事项Ogg导出和默认编解码器示例使用再举一个例子怎么样？关于PydubPydub让您可以以一种不愚蠢的方式对音频进行处理。github:https://github.com/jiaaro/pydub官网：https://pydub.com/API文档：https://github.com/jiaaro/pydub/b
B站视频下载技术揭秘：从浏览器抓包到FFmpeg音视频合成 soonlyai 音视频 ffmpeg
摘要本文旨在深入探讨B站（哔哩哔哩）视频的实际加载与分发机制，并通过Python脚本实现一个功能性的视频下载器。我们将从使用浏览器开发者工具分析B站播放页的网络请求入手，定位获取视频流地址的关键API。在此基础上，本文将详细讲解如何利用Python的requests库模拟API请求、通过携带Cookie获取登录后才能访问的4K高清视频流，并最终调用ffmpeg工具将B站特有的音、视频分离流合并为完
web端rtmp推拉流测试、抽帧识别计数，一键式生成巡检报告（ECUT）Edward-tan 全栈开发 python进阶人工智能--CV 全栈 YOLO
本文旨在实现无人机城市交通智慧巡检中的一个模块——无人机视频实时推拉流以及识别流并在前端展示，同时，统计目标数量以及违停数量，生成结果评估，一并发送到前端展示。对于本文任何技术上的空缺，可在博主主页前面博客寻找，有任何问题欢迎私信或评论区讨论！！！目录涉及技术栈基本效果存在的问题，亟需解决代码及粗略解释资源涉及技术栈：Django5+vue3+websocket+SRS+FFmpeg+RTMP+Y
Windows下QT引用ffmpeg库 SpongBob^_^ ffmpeg qt
Windows下QT引用ffmpeg库一、在官网中下载ffmpeg的Shared运行和Dev开发下载地址：https://ffmpeg.zeranoe.com/builds/注意：注意要通过QT编译环境确认是下载32位还是64位，否则会出现库和编译器位数不匹配的报错我的QT环境是32位，所以选择win-32bit二、在QT中配置ffmpeg文件新建qt项目，将dev解压，在源代码中新建lib文件夹
Linux下QT如何调用ffmpeg库,Qt中使用ffmpeg--直接调用动态库 or 手动编译相关刘妮卡
介绍下在Qt下直接调用官方下载的动态库以及自己编译成静态库等，另外关于ffmpeg怎么用算LGPL谁知道的话求告知直接使用动态库官网下载如果没有特殊要求，可以直接在ffmpeg官网下载编译好的库文件直接使用，自己编译还是相当麻烦的QAQ。选择自己操作系统相关的版本，下载shared和dev两个压缩包：官网下载Static包含的是静态编译的ffmpeg.exe，Shared包含的是ffmpeg的动态
利用H5无插件播放RTSP流的实现方案橘色的喵视频图像 RTSP RTMP 直播推流 WebRTC FLV.JS openresty
文章目录0.引言1.问题分析1.1RTSP流与浏览器的兼容性1.2解决思路2.方案设计2.1总体架构2.2关键组件3.实施步骤3.1环境准备3.2安装与配置3.2.1安装FFmpeg3.2.2安装OpenResty3.2.3添加nginx-rtmp-module模块3.2.4配置OpenResty3.3推流操作3.4前端播放3.4.1引入flv.js3.4.2播放器代码4.原理解释4.1协议转换原
在 Windows 系统中配置 FFmpeg 并集成到 Qt 项目北极星在海里. windows ffmpeg qt
在Windows系统中配置FFmpeg并集成到Qt项目需要以下步骤：1.下载FFmpeg开发包步骤说明访问FFmpegWindows预编译包推荐从以下地址下载官方提供的预编译开发包（包含头文件和库文件）：Gyan.devFFmpegBuilds选择ffmpeg-release-full-shared.7z（动态链接库）或ffmpeg-release-full-static.7z（静态链接库）。开发
技术解析：基于x264与FFmpeg的视频高效压缩策略——以小丸工具箱类GUI工具为例 soonlyai ffmpeg 音视频人工智能经验分享
摘要本文旨在探讨视频文件高效压缩的技术原理与实践方法，特别是针对如何在保持较高视觉质量的前提下显著减小文件体积。我们将以常见的视频处理GUI工具（如“小丸工具箱”等）所封装的核心技术为引，重点分析基于x264编码器和FFmpeg框架的参数配置，如CRF（ConstantRateFactor）值的选择。同时，本文将提供一个基础的FFmpeg命令行示例，演示核心压缩操作，并讨论批量处理及GUI封装此类
Ubuntu20.04安装录屏工具OBS 奉系坤阀 Linux linux ubuntu obs
1、安装OBSOBSStudio可以通过Ubuntu官方的软件源直接安装，打开终端，输入以下命令安装OBSStudio：sudoaptupdatesudoaptinstallffmpegobs-studio2、启动OBS安装完成后，一般在桌面应用里面就能找到，也可以通过终端输入obs命令并按回车键来启动OBSStudio。obs其他问题参考下面链接：Ubuntu20.04安装使用OBS-Studi
ffmpeg（六）：图片与视频互转命令却道天凉_好个秋 #ffmpeg命令 ffmpeg 音视频
图像序列转视频（多张图片➜视频）ffmpeg-framerate25-iimage_%03d.jpg-c:vlibx264-pix_fmtyuv420poutput.mp4参数说明：image_%03d.jpg：文件名格式（如image_001.jpg、image_002.jpg）。-framerate25：输入帧率（25fps）。-c:vlibx264：使用H.264编码。-pix_fmtyuv
ffmpeg（七）：直播相关命令却道天凉_好个秋 #ffmpeg命令 ffmpeg
推流场景推本地文件为直播流（RTMP）ffmpeg-re-stream_loop-1-iinput.mp4\-c:vlibx264-presetveryfast-b:v1500k\-c:aaac-b:a128k\-fflvrtmp://your_server/live/stream摄像头+麦克风推流（Linux）ffmpeg-fv4l2-i/dev/video0\-falsa-idefault\-
【Tools】Mac brew工具 CodeWithMe Tools macos
Homebrew（简称brew）是macOS（也支持Linux）上的一款包管理工具，它的作用类似于：Ubuntu下的aptCentOS下的yumArchLinux下的pacman一句话概括：brew是用来在macOS上安装、管理软件包的命令行工具。brew能做什么？安装CLI工具（如wget,git,cmake,python,node,ffmpeg等）安装GUI应用（如VisualStudioCo
3.1 Android NDK交叉编译FFmpeg
一、NDK编译新版本FFmpeg编译FFmpeg的版本：4.4.6、5.1.6、6.1.2、7.0.2脚本下载地址：ffmpeg_build编译环境：系统：Ubuntu20.04编译工具：sudoaptinstallbuild-essentialnasmyasmmakecmakeautomakeautoconflibtooldiffutilspkg-configgitunzip编译器是：llvm项
4.1 FFmpeg编译选项配置卖猪肉的痴汉 #FFmpeg编译与移植 ffmpeg
一、不同场景的编译选项1.1源码调试场景开启debug和禁用strip，防止代码优化，避免源码调试时乱跳。#生成Makefile./configure\--prefix=$(pwd)/../install_mingw\--enable-gpl\--enable-debug=3\--disable-optimizations\--disable-asm\--disable-stripping\--e
音视频及H264/H256编码相关原理 Everbrilliant89 音视频开发音视频视频编解码 H264编码 H265编码音视频编解码
一、音视频封装格式原理：我们播放的视频文件一般都是用一种封装格式封装起来的，封装格式的作用是什么呢？一般视频文件里不光有视频，还有音频，封装格式的作用就是把视频和音频打包起来。所以我们先要解封装格式，看有哪些视频流和哪些音频流，此时的音频流和视频流都还是压缩数据，不能直接用于显示的，这就需要解码。如FFmpeg视频文件就是一个容器(视频流（H264）音频流(aac))。1、视频文件封装格式：封装格
【音视频】PJSIP库——pjsua命令使用详解郭老二视频音视频
1、源码编译1）安装依赖库sudoaptinstalllibsrtp2-devsudoaptinstalllibopus-devalsa-toolslibalsaplayer-devffmpeglibalsa*pulseaudio-module-jacksudoaptinstalljackdlibjack-jackd2-devlibjack-devlibsdl2-devlibv4l-devliba
RK3568笔记八十四：rtmp转rtmp直播流测试殷忆枫 RK3568学习笔记笔记
若该文为原创文章，转载请注明原文出处。此文章只是记录下通过ffmpeg把rtmp转rtmp，代码是网上的，只是测试效果。参考：FFmpeg/opencv+C++实现直播拉流和直播推流（对视频帧进行处理）_ffmpeg视频压缩推流c++-CSDN博客一、源码代码没有修改，直附上源码ffmpeg_rtmp2rtmp.cpp//https://blog.csdn.net/weixin_43482623/
RK3568笔记八十五：LVGL播放AVI视频殷忆枫 RK3568学习笔记笔记
若该文为原创文章，转载请注明原文出处。最近有个需求，需要播放视频，但使用的框架是LVGL显示，所以了解了下LVGL怎么实现播放视频。目前了解到的方法有两种：一、使用ffmpeg方式，此方法适用于大部分视频二、使用opencv方式，此方法适用于大部分视频三、使用woshinieao/avilib库，此方法受限，只是AVI文件，且格式是MJPEG此篇记录，使用woshinieao/avilib库解析A
ffmpeg 带alpha透明层的视频编码 Ternence_Hsu ffmpeg alpha 透明层视频编码 png
png编码可以封装为mp4、mov等ffmpeg-fimage2-r25-iinput_%d.png-vffps=25-vcodecpngoutput.mov-yqtrle编码只能封装为mov，不可以封装为mp4ffmpeg-iinput.mov-vcodecqtrleoutput.mov输入流编码信息：Stream#0:0(eng):Video:qtrle(rle/0x20656C72),bgr
ffmpeg python rgba图片合成 4444格式mov视频，保留透明通道 Lee魅儿 python ffmpeg 计算机视觉
defconvert_pngs_to_mov(input_pattern,output_path,frame_rate=30):"""将BGRA四通道PNG序列转换为ProRes4444编码的MOV视频（保留透明通道）参数:input_pattern:PNG序列路径模式（如："/path/to/frames/frame_%04d.png"）output_path:输出MOV文件路径（如："/pat
ffmpeg mac m1芯片 4444格式mov视频转码成hevc with alpha 的四通道视频 Lee魅儿 ffmpeg macos 音视频
ffmpeg-iDesktop/test.mov-vf"premultiply=inplace=1"-c:vhevc_videotoolbox-allow_sw1-alpha_quality1-tag:vhvc1-b:v355555Desktop/out5.mp4-vf"premultiply=inplace=1"#保证视频的质量，避免压缩透明通道视频质量
FFmpeg 的算法体系 lianghu666 音视频硬件 Linux ffmpeg 算法 linux
️一、FFmpeg核心算法体系与作用1.编解码算法编解码是FFmpeg的核心能力，通过libavcodec实现音视频的压缩与还原。视频编码算法帧间预测：通过运动估计（菱形搜索、全搜索法）减少时间冗余，支持P帧（前向预测）和B帧（双向预测）变换与量化：采用整数离散余弦变换（DCT）将空域信号转为频域，再通过量化舍弃高频信息（H.264/H.265使用）熵编码：对残差数据采用CABAC（上下文自适应二
RK3568笔记八十六：FFMPEG接收RTSP转发RTMP流殷忆枫 RK3568学习笔记笔记 ffmpeg
若该文为原创文章，转载请注明原文出处。前面测试了RTMP转RTMP功能，此篇记录下RTSP转TTMP一、介绍记录目的是想测试如果使用FFMPEG接收RTSP并转成RTMP推流，看到很多设备都支持此功能，所以做个验证，验证一下想法。二、FFMPEG命令测试1、RTSP服务器推RTSP流需要先运行RTSP服务器下载rtsp-simple-server_v0.19.1_windows_amd64.zip
音视频面经_音视频知识解析：第三章FFMPEG编写视频解码 2301_79125642 java
小调查一次小调查，各位javaer除了用springboot写过项目，还用过啥框架写项目？有没有牛友来指点一二，真的好纠结本人位于湖南某民办二本(在湖南民办二本里算好的)，目前大三下，准备找工作干java后端，跟着b站的黑勇攀高峰6月12日举行的毕业典礼，一周的时间很快就过去了。回想起整个春招，机会确实很少，大概只有字节美团快手#和牛牛一起刷题打卡(51733)##和牛牛一起刷题打卡#简历求指导投
FFmpeg裁剪视频在Android上的实现 AD钙奶-lalala 全栈音视频 android
添加依赖：implementation'com.arthenica:mobile-ffmpeg-full:4.4.LTS'代码实现：funcropMiddleThird(inputPath:String,outputPath:String){valcmd=arrayOf("-y",//覆盖输出文件"-i",inputPath,"-filter:v","crop=iw:ih/3:0:ih/3",//
【记录】服务器安装ffmpeg qq_29750461 机器学习 Python 服务器 ffmpeg 运维
前言因为项目中需要用到ffmpeg进行图像的一些操作，本文记录下在服务器安装ffmpeg的全过程，还是具有一定挑战性的。系统详情本文使用的操作系统详情如下通过命令cat/etc/os-release获取虽然操作系统为RockyLinux，但安装过程是通用的，因为本文记录的是从源代码安装。尝试过的失败策略大多的教程可能给出的答案均是下面的步骤：但是下面命令虽然简单，但是一直会报依赖异常，即有些依赖尚
ffmpeg ，结合 SSRF任意文件读取漏洞德古拉的杂货铺渗透测试篇 ffmpeg 安全漏洞视频处理
ffmpeg，结合SSRF任意文件读取漏洞前言一、ffmpeg是什么？FFmpeg背景知识简介HLS(HTTPLiveStreaming)二、使用步骤CentOS7下的安装三、ffmpeg任意文件读取漏洞复现环境搭建漏洞利用修复建议前言初衷：最近空闲，想通过vulhub靶场进行学习，猛的看到ffmpeg，很熟悉。在2018年开发的堡垒机时，曾经用过它进行视频文件的处理。于是决定从它开始练习写博客。
多线程编程之理财周凡杨 java 多线程生产者消费者理财
现实生活中，我们一边工作，一边消费，正常情况下会把多余的钱存起来，比如存到余额宝，还可以多挣点钱，现在就有这个情况：我每月可以发工资20000万元（暂定每月的1号），每月消费5000（租房+生活费）元（暂定每月的1号），其中租金是大头占90%，交房租的方式可以选择（一月一交，两月一交、三月一交），理财：1万元存余额宝一天可以赚1元钱，
[Zookeeper学习笔记之三]Zookeeper会话超时机制 bit1129 zookeeper
首先，会话超时是由Zookeeper服务端通知客户端会话已经超时，客户端不能自行决定会话已经超时，不过客户端可以通过调用Zookeeper.close()主动的发起会话结束请求，如下的代码输出内容 Created /zoo-739160015 CONNECTEDCONNECTED .............CONNECTEDCONNECTED CONNECTEDCLOSEDCLOSED
SecureCRT快捷键 daizj secureCRT 快捷键
ctrl + a : 移动光标到行首ctrl + e ：移动光标到行尾crtl + b: 光标前移1个字符crtl + f: 光标后移1个字符crtl + h : 删除光标之前的一个字符ctrl + d ：删除光标之后的一个字符crtl + k ：删除光标到行尾所有字符crtl + u : 删除光标至行首所有字符crtl + w: 删除光标至行首
Java 子类与父类这间的转换周凡杨 java 父类与子类的转换
最近同事调的一个服务报错，查看后是日期之间转换出的问题。代码里是把 java.sql.Date 类型的对象强制转换为 java.sql.Timestamp 类型的对象。报java.lang.ClassCastException。代码：
可视化swing界面编辑朱辉辉33 eclipse swing
今天发现了一个WindowBuilder插件，功能好强大，啊哈哈，从此告别手动编辑swing界面代码，直接像VB那样编辑界面，代码会自动生成。首先在Eclipse中点击help，选择Install New Software,然后在Work with中输入WindowBui
web报表工具FineReport常用函数的用法总结（文本函数）老A不折腾 finereport web报表工具报表软件 java报表
文本函数 CHAR CHAR(number):根据指定数字返回对应的字符。CHAR函数可将计算机其他类型的数字代码转换为字符。 Number:用于指定字符的数字，介于1Number:用于指定字符的数字，介于165535之间（包括1和65535）。示例: CHAR(88)等于“X”。 CHAR(45)等于“-”。 CODE CODE(text):计算文本串中第一个字
mysql安装出错林鹤霄 mysql安装
[root@localhost ~]# rpm -ivh MySQL-server-5.5.24-1.linux2.6.x86_64.rpm Preparing... #####################
linux下编译libuv aigo libuv
下载最新版本的libuv源码，解压后执行： ./autogen.sh 这时会提醒找不到automake命令，通过一下命令执行安装（redhat系用yum，Debian系用apt-get）： # yum -y install automake # yum -y install libtool 如果提示错误：make: *** No targe
中国行政区数据及三级联动菜单 alxw4616
近期做项目需要三级联动菜单,上网查了半天竟然没有发现一个能直接用的! 呵呵,都要自己填数据....我了个去这东西麻烦就麻烦的数据上. 哎,自己没办法动手写吧. 现将这些数据共享出了,以方便大家.嗯,代码也可以直接使用文件说明 lib\area.sql -- 县及县以上行政区划分代码（截止2013年8月31日)来源：国家统计局发布时间：2014-01-17 15:0
哈夫曼加密文件百合不是茶哈夫曼压缩哈夫曼加密二叉树
在上一篇介绍过哈夫曼编码的基础知识,下面就直接介绍使用哈夫曼编码怎么来做文件加密或者压缩与解压的软件,对于新手来是有点难度的,主要还是要理清楚步骤; 加密步骤: 1,统计文件中字节出现的次数,作为权值 2,创建节点和哈夫曼树 3,得到每个子节点01串 4,使用哈夫曼编码表示每个字节
JDK1.5 Cyclicbarrier实例 bijian1013 java thread java多线程 Cyclicbarrier
CyclicBarrier类一个同步辅助类，它允许一组线程互相等待，直到到达某个公共屏障点 (common barrier point)。在涉及一组固定大小的线程的程序中，这些线程必须不时地互相等待，此时 CyclicBarrier 很有用。因为该 barrier 在释放等待线程后可以重用，所以称它为循环的 barrier。 CyclicBarrier支持一个可选的 Runnable 命令，
九项重要的职业规划 bijian1013 工作学习
一. 学习的步伐不停止古人说，活到老，学到老。终身学习应该是您的座右铭。世界在不断变化，每个人都在寻找各自的事业途径。您只有保证了足够的技能储
【Java范型四】范型方法 bit1129 java
范型参数不仅仅可以用于类型的声明上，例如 package com.tom.lang.generics; import java.util.List; public class Generics<T> { private T value; public Generics(T value) { this.value =
【Hadoop十三】HDFS Java API基本操作 bit1129 hadoop
package com.examples.hadoop; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FSDataInputStream; import org.apache.hadoop.fs.FileStatus; import org.apache.hadoo
ua实现split字符串分隔 ronin47 lua split
LUA并不象其它许多"大而全"的语言那样，包括很多功能，比如网络通讯、图形界面等。但是LUA可以很容易地被扩展：由宿主语言(通常是C或 C++)提供这些功能，LUA可以使用它们，就像是本来就内置的功能一样。LUA只包括一个精简的核心和最基本的库。这使得LUA体积小、启动速度快，从而适合嵌入在别的程序里。因此在lua中并没有其他语言那样多的系统函数。习惯了其他语言的字符串分割函
java-从先序遍历和中序遍历重建二叉树 bylijinnan java
public class BuildTreePreOrderInOrder { /** * Build Binary Tree from PreOrder and InOrder * _______7______ / \ __10__ ___2 / \ / 4
openfire开发指南《连接和登陆》开窍的石头 openfire 开发指南 smack
第一步官网下载smack.jar包下载地址：http://www.igniterealtime.org/downloads/index.jsp#smack 第二步把smack里边的jar导入你新建的java项目中开始编写smack连接openfire代码 p
[移动通讯]手机后盖应该按需要能够随时开启 comsci 移动
看到新的手机，很多由金属材质做的外壳，内存和闪存容量越来越大，CPU速度越来越快，对于这些改进，我们非常高兴，也非常欢迎但是，对于手机的新设计，有几点我们也要注意第一：手机的后盖应该能够被用户自行取下来，手机的电池的可更换性应该是必须保留的设计,
20款国外知名的php开源cms系统 cuiyadll cms
内容管理系统，简称CMS，是一种简易的发布和管理新闻的程序。用户可以在后端管理系统中发布，编辑和删除文章，即使您不需要懂得HTML和其他脚本语言，这就是CMS的优点。在这里我决定介绍20款目前国外市面上最流行的开源的PHP内容管理系统，以便没有PHP知识的读者也可以通过国外内容管理系统建立自己的网站。 1. Wordpress WordPress的是一个功能强大且易于使用的内容管
Java生成全局唯一标识符 darrenzhu java uuid unique identifier id
How to generate a globally unique identifier in Java http://stackoverflow.com/questions/21536572/generate-unique-id-in-java-to-label-groups-of-related-entries-in-a-log http://stackoverflow
php安装模块检测是否已安装过, 使用的SQL语句 dcj3sjt126com sql
SHOW [FULL] TABLES [FROM db_name] [LIKE 'pattern'] SHOW TABLES列举了给定数据库中的非TEMPORARY表。您也可以使用mysqlshow db_name命令得到此清单。本命令也列举数据库中的其它视图。支持FULL修改符，这样SHOW FULL TABLES就可以显示第二个输出列。对于一个表，第二列的值为BASE T
5天学会一种 web 开发框架 dcj3sjt126com Web 框架 framework
web framework层出不穷，特别是ruby/python,各有10+个,php/java也是一大堆根据我自己的经验写了一个to do list,按照这个清单，一条一条的学习，事半功倍，很快就能掌握一共25条，即便很磨蹭，2小时也能搞定一条，25*2=50。只需要50小时就能掌握任意一种web框架各类web框架大同小异:现代web开发框架的6大元素，把握主线，就不会迷路建议把本文
Gson使用三(Map集合的处理,一对多处理) eksliang json gson Gson map Gson 集合处理
转载请出自出处：http://eksliang.iteye.com/blog/2175532 一、概述 Map保存的是键值对的形式，Json的格式也是键值对的，所以正常情况下，map跟json之间的转换应当是理所当然的事情。二、Map参考实例 package com.ickes.json; import java.lang.refl
cordova实现“再点击一次退出”效果 gundumw100 android
基本的写法如下： document.addEventListener("deviceready", onDeviceReady, false); function onDeviceReady() { //navigator.splashscreen.hide(); document.addEventListener("b
openldap configuration leaning note iwindyforest configuration
hostname // to display the computer name hostname <changed name> // to change go to: /etc/sysconfig/network, add/modify HOSTNAME=NEWNAME to change permenately dont forget to change /etc/hosts
Nullability and Objective-C 啸笑天 Objective-C
https://developer.apple.com/swift/blog/?id=25 http://www.cocoachina.com/ios/20150601/11989.html http://blog.csdn.net/zhangao0086/article/details/44409913 http://blog.sunnyxx
jsp中实现参数隐藏的两种方法 macroli JavaScript jsp
在一个JSP页面有一个链接，//确定是一个链接?点击弹出一个页面，需要传给这个页面一些参数。//正常的方法是设置弹出页面的src="***.do?p1=aaa&p2=bbb&p3=ccc"//确定目标URL是Action来处理?但是这样会在页面上看到传过来的参数，可能会不安全。要求实现src="***.do"，参数通过其他方法传！//////
Bootstrap A标签关闭modal并打开新的链接解决方案 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
Bootstrap里面的js modal控件使用起来很方便，关闭也很简单。只需添加标签 data-dismiss="modal" 即可。可是偏偏有时候需要a标签既要关闭modal，有要打开新的链接，尝试多种方法未果。只好使用原始js来控制。 <a href="#/group-buy" class="btn bt
二维数组在Java和C中的区别流淚的芥末 java c 二维数组数组
Java代码： public class test03 { public static void main(String[] args) { int[][] a = {{1},{2,3},{4,5,6}}; System.out.println(a[0][1]); } } 运行结果： Exception in thread "mai
systemctl命令用法 wmlJava linux systemctl
对比表，以 apache / httpd 为例任务旧指令新指令使某服务自动启动 chkconfig --level 3 httpd on systemctl enable httpd.service 使某服务不自动启动 chkconfig --level 3 httpd off systemctl disable httpd.service 检查服务状态 service h

ffmpeg系列-解决ffmpeg获取aac音频文件duration不准

1.分析问题

2.解决问题

AAC格式：

解决问题

后续

你可能感兴趣的:(ffmpeg)