lifei092

FFmpeg 解码音视频实例及碰到的问题记录（一）

最近项目开发中需要使用FFmpeg进行音视频的解码，在使用过程中遇到了一些问题对其进行记录。

FFmpeg版本：FFmpeg3.4.1 下载地址如下：https://download.csdn.net/download/lifei092/10670992

1、视频解码：

av_register_all(); 遍历注册所有的组件，包括各种编解码器、解复用器等等；
AVFormatContext *pFormatCtx = avformat_alloc_context(); 主要存储视音频封装格式中包含的信息，此变量非常重要，几乎贯穿了解码过程的始终，此后主要为pFormatCtx变量分配内存；
avformat_open_input(&pFormatCtx, pInput_test, NULL, NULL); 打开输入视频文件，读取文件头信息，将文件头信息读取到pFormatCtx 结构体内，为后续解码做准备；
avformat_find_stream_info(pFormatCtx, NULL); 获取文件流信息，主要根据pFormatCtx结构体内的已有信息对pFormatCtx结构体内流字段赋值流信息，即，可看作进一步为pFormatCtx结构体进行赋值；
AVCodecParameters *pCodecCtx = pFormatCtx->streams[v_stream_idx]->codecpar; 提取pFormatCtx结构体内的对应流编码器信息
AVCodec *pCodec = avcodec_find_decoder(pCodecCtx->codec_id); 根据编解码的编码id号查找对应的解码器信息
AVCodecContext *pEnc = avcodec_alloc_context3(pCodec); 根据初始化AVCodecContext,只是分配，还没打开
avcodec_open2(pEnc, pCodec, NULL); 打开解码器
av_read_frame(pFormatCtx, packet); 从pFormatCtx结构体内流字段读取视频文件压缩流到packet变量内
avcodec_send_packet(pEnc, packet); 将packet内文件压缩流导入到对应解码器内
avcodec_receive_frame(pEnc, pFrame); 从解码器pEnc内解码压缩流到pFrame变量内（存储解压缩后的音视频数据）
pFrame结构体内的 uint8_t *data[AV_NUM_DATA_POINTERS];成员内存储了音视频流解码后的数据，可对其进行相应操作（可保存可进行图像处理等等）。

以下是示例代码（由于从项目中扣取出来，大致流程无问题，未进行验证可能会有一些小问题，现先记录后续再进行验证）：

#include 
#include 
#include 

extern "C"
{
#include "libavcodec/avcodec.h"   
#include "libavformat/avformat.h"  
#include "libavutil/channel_layout.h"  
#include "libavutil/common.h"  
#include "libavutil/imgutils.h"  
#include "libswscale/swscale.h"   
#include "libavutil/imgutils.h"      
#include "libavutil/opt.h"         
#include "libavutil/mathematics.h"      
#include "libavutil/samplefmt.h"   
};

#define ES_STREAM_VIDEO 1
#define ES_STREAM_AUDIO 2

#pragma comment(lib, "FFmpeg/lib/avcodec.lib")  
#pragma comment(lib, "FFmpeg/lib/avformat.lib")  
#pragma comment(lib, "FFmpeg/lib/avdevice.lib")  
#pragma comment(lib, "FFmpeg/lib/avfilter.lib")  
#pragma comment(lib, "FFmpeg/lib/avutil.lib")   
#pragma comment(lib, "FFmpeg/lib/swresample.lib")  
#pragma comment(lib, "FFmpeg/lib/swscale.lib")  

typedef struct AVMediaPacket
{
	BYTE* m_data[TL_NUM_DATA_POINTERS];
	int m_linesize[TL_NUM_DATA_POINTERS];
	BYTE* m_pBuf;
	int m_buf_size;
	int m_max_size;
	int m_cur_size;//ES包使用
	int m_packet_type;//0ES包 1Frame

	//enum AVPixelFormat for video frames
	//enum AVSampleFormat for audio
	int m_pixel_format;
	int m_channel_count;
	LONGLONG m_channel_layout;
	int m_nb_samples;  // 单个声道音频样本个数
	int m_sample_rate; // 音频采样率

	int m_width;
	int m_height;
	/**
	* The content of the picture is interlaced.
	* - encoding: Set by user.
	* - decoding: Set by libavcodec. (default 0)
	*/
	int m_interlaced_frame;//0逐行帧，1隔行帧
	/**
	* If the content is interlaced, is top field displayed first.
	* - encoding: Set by user.
	* - decoding: Set by libavcodec.
	*/
	int m_top_field_first;//0偶底场优先，1上奇场优先
	int m_pict_type;

	int m_es_stream_type;//是视频帧还是音频帧

	LONGLONG m_pos;
	LONGLONG m_origin_size;//原始ES包的字节数
	LONGLONG m_dts;//ES包使用
	LONGLONG m_pts;
	LONGLONG m_origin_ts;
	LONGLONG m_sys_pts;//转换成系统时间的pts(毫秒)
	LONGLONG m_duration;//帧时长
	LONGLONG m_sys_duration;//转换成系统时间的长度(毫秒)

	int m_align;//数据的对齐方式

	int m_scale_mod;//视频帧用到的变换方式(该帧是经过该变换方式得来的)

	int m_stream_index;//同AVPacket的stream_index
	int m_flags;//同AVPacket的flags
}AVMediaPacket;


/********** 查询FFmpeg支持的编解码器 ************/
void CheckEncoderDecoder()
{
	char *info = (char *)malloc(40000);
	memset(info, 0, 40000);

	AVCodec *c_temp = av_codec_next(NULL);

	while (c_temp != NULL)
	{
		if (c_temp->decode != NULL)
		{
			strcat(info, "[Decode]");
		}
		else
		{
			strcat(info, "[Encode]");
		}
		switch (c_temp->type)
		{
		case AVMEDIA_TYPE_VIDEO:
			strcat(info, "[Video]");
			break;
		case AVMEDIA_TYPE_AUDIO:
			strcat(info, "[Audeo]");
			break;
		default:
			strcat(info, "[Other]");
			break;
		}
		sprintf(info, "%s %10s\n", info, c_temp->name);
		c_temp = c_temp->next;
	}
	puts(info);
	free(info);
}

void InitMediaPacket(AVMediaPacket* pFrame,int nPacketType, int nEsStreamType)
{
	for (int i = 0; i < TL_NUM_DATA_POINTERS; i++)
	{
		pFrame->m_data[i] = NULL;   // 音视频数据
		pFrame->m_linesize[i] = 0;  // 每行数据的size
	}
	pFrame->m_pBuf = NULL;  // 音视频数据指针

	pFrame->m_buf_size = 0;
	pFrame->m_max_size = 0;
	pFrame->m_cur_size = 0;//ES包使用
	pFrame->m_packet_type = nPacketType;//0ES包 1Frame

	//enum AVPixelFormat for video frames
	//enum AVSampleFormat for audio
	pFrame->m_pixel_format = AV_PIX_FMT_NONE; 
	pFrame->m_channel_count = -1;
	pFrame->m_channel_layout = -1;
	pFrame->m_nb_samples = -1;  // 单个声道音频样本个数
	pFrame->m_sample_rate = -1; // 音频采样率

	pFrame->m_width = -1;
	pFrame->m_height = -1;
	/**
	* The content of the picture is interlaced.
	* - encoding: Set by user.
	* - decoding: Set by libavcodec. (default 0)
	*/
	pFrame->m_interlaced_frame = -1;//0逐行帧，1隔行帧
	/**
	* If the content is interlaced, is top field displayed first.
	* - encoding: Set by user.
	* - decoding: Set by libavcodec.
	*/
	pFrame->m_top_field_first = -1;//0偶底场优先，1上奇场优先
	pFrame->m_pict_type = -1;

	pFrame->m_es_stream_type = nEsStreamType;//是视频帧还是音频帧

	pFrame->m_pos = -1;
	pFrame->m_origin_size = -1;//原始ES包的字节数
	pFrame->m_dts = -1;//ES包使用
	pFrame->m_pts = -1;
	pFrame->m_origin_ts = -1;
	pFrame->m_sys_pts = -1;//转换成系统时间的pts(毫秒)
	pFrame->m_duration = -1;//帧时长
	pFrame->m_sys_duration = -1;//转换成系统时间的长度(毫秒)

	pFrame->m_align = -1;//数据的对齐方式

	pFrame->m_scale_mod = -1;//视频帧用到的变换方式(该帧是经过该变换方式得来的)

	pFrame->m_stream_index = -1;//同AVPacket的stream_index
	pFrame->m_flags = -1;//同AVPacket的flags
}

BOOL MallocMediaFrameBuf(AVMediaPacket* pFrame, int nBufLen)
{
	if (nBufLen <= 0)
		return FALSE;

	for (int i = 0; i < TL_NUM_DATA_POINTERS; i++)
	{
		pFrame->m_data[i] = NULL;   // 音视频数据
		pFrame->m_linesize[i] = 0;  // 每行数据的size
	}

	pFrame->m_pBuf = (BYTE*)malloc(nBufLen*sizeof(BYTE));

	pFrame->m_buf_size = nBufLen;

	if (pFrame->m_pBuf)
		return TRUE;
	else
		return FALSE;
}

void ReleaseMediaPacket(AVMediaPacket* pFrame)
{
	if (pFrame->m_pBuf)
	{
		free(pFrame->m_pBuf);
		pFrame->m_pBuf = NULL;
	}
}



int main()
{
	const char *pInput_test = "E:\\C++\\VideoExaminationSystem\\TEST.gxf";
    FILE *fout = fopen("E://test.yuv", "wb+");
    AVMediaPacket src_frame;
    InitMediaPacket(&src_frame, 1, ES_STREAM_VIDEO);

	//1.注册所有组件
	av_register_all();

	CheckEncoderDecoder();  // 查询此FFmpeg版本支持的编解码器

	//封装格式上下文，统领全局的结构体，保存了视频文件封装格式的相关信息
	AVFormatContext *pFormatCtx = avformat_alloc_context();  //主要存储视音频封装格式中包含的信息

	//2.打开输入视频文件，读取文件头信息
	if (avformat_open_input(&pFormatCtx, pInput_test, NULL, NULL) != 0)
	{
		printf("%s", "无法打开输入视频文件");
		return -1;
	}

	//3.获取视频文件信息
	if (avformat_find_stream_info(pFormatCtx, NULL) < 0)
	{
		printf("%s", "无法获取视频文件信息");
		return -1;
	}

	//获取视频流的索引位置
	//遍历所有类型的流（音频流、视频流、字幕流），找到视频流
	int v_stream_idx = -1;  // 视频流
	
	//number of streams
	for (int i = 0; i < pFormatCtx->nb_streams; i++)
	{
		//流的类型
		if (pFormatCtx->streams[i]->codecpar->codec_type == AVMEDIA_TYPE_VIDEO)
		{
			v_stream_idx = i;  // 记录视频流索引
            break;
		}
	}

	if (v_stream_idx == -1)
	{
		printf("%s", "找不到视频流\n");
		return -1;
	}

	//只有知道视频的编码方式，才能够根据编码方式去找到解码器
	//获取视频流中的编解码上下文
	AVCodecParameters *pCodecCtx = NULL;
	AVCodec *pCodec = NULL;
	AVCodecContext *pEnc = NULL;
	AVPacket *packet = NULL;
	AVFrame *pFrame = NULL;
	int src_buf_len = -1;

	pCodecCtx = pFormatCtx->streams[v_stream_idx]->codecpar;
	//4.根据编解码上下文中的编码id查找对应的解码
	pCodec = avcodec_find_decoder(pCodecCtx->codec_id);
	if (pCodec == NULL)
	{
		printf("%s", "找不到视频解码器\n");
		return -1;
	}
	pEnc = avcodec_alloc_context3(pCodec);  // 初始化AVCodecContext,只是分配，还没打开

	//5.打开解码器
	if (avcodec_open2(pEnc, pCodec, NULL)<0)
	{
		printf("%s", "视频解码器无法打开\n");
		return -1;
	}

	//输出视频信息
	printf("视频的文件格式：%s\n", pFormatCtx->iformat->name);
	printf("视频时长：%d\n", (pFormatCtx->duration) / 1000000);
	printf("视频的宽高：%d,%d\n", pCodecCtx->width, pCodecCtx->height);
	printf("视频解码器的名称：%s\n", pCodec->name);
	std::cout << std::endl;

    src_frame.m_pixel_format = pCodecCtx->format;
	src_frame.m_width = pCodecCtx->width;
	src_frame.m_height = pCodecCtx->height;

	src_buf_len = av_image_get_buffer_size((AVPixelFormat)src_frame.m_pixel_format, src_frame.m_width, src_frame.m_height, 1);

    if (!MallocMediaFrameBuf(&src_frame, src_buf_len))
	{
		return NULL;
	}

	// 根据视频格式填充结构体相关字段
	av_image_fill_arrays(src_frame.m_data, src_frame.m_linesize, src_frame.m_pBuf, (AVPixelFormat)src_frame.m_pixel_format, src_frame.m_width, src_frame.m_height, 1);
		
		
	//准备读取
	//缓冲区，开辟空间,AVPacket用于存储一帧一帧的压缩数据（H264）
	packet = (AVPacket*)av_malloc(sizeof(AVPacket));

	//内存分配, AVFrame用于存储解码后的像素数据(YUV)
	pFrame = av_frame_alloc();

	int ret = -1;
	int video_frame_count = 0;

	//6.一帧一帧的读取压缩数据
	while (av_read_frame(pFormatCtx, packet) >= 0)
	{
		//只要视频压缩数据（根据流的索引位置判断）
		if (packet->stream_index == v_stream_idx  && (VIDEO_DETECT_ONLY == nDetectFlag || AV_DETECT == nDetectFlag))
		{
			//7.解码一帧视频压缩数据，得到视频像素数据
			ret = avcodec_send_packet(pEnc, packet);
			if (ret < 0)
			{
				printf("%s", "解码错误");
				return -1;
			}

			ret = avcodec_receive_frame(pEnc, pFrame);

			if (!ret)  // 0表示解码成功
			{
				for (int j = 0, cont = 0; j < TL_NUM_DATA_POINTERS && cont < src_buf_len; j++ )
				{
					int size = pFrame->linesize[j];

					if (size <= 0)
						break;
					int radio = pFrame->linesize[0] / size;
					for (int i = 0; i < pFrame->height / radio; i++)
					{
						memcpy(src_frame.m_pBuf + cont, pFrame->data[j] + i * size, pFrame->width / radio);
						cont += pFrame->width / radio;
					}

                    fwrite(src_frame->m_data[j], pFrame->width*pFrame->height/(radio*radio), 1, fout);
				}                

				video_frame_count++;
				printf("Decode Video Frame Number : %d\n", video_frame_count);
			}
		}

		//释放资源
		av_packet_unref(packet);
	}

	// Free the YUV frame
	av_frame_free(&pFrame);

	// Close the codecs
	avcodec_close(pEnc);

	// Close the video file
	avformat_close_input(&pFormatCtx);

	if(fout)
	{
		fclose(fout);
		fout = NULL;
	}

    ReleaseMediaPacket(&src_frame);

	std::cout << "I: Finish Video Scale." << std::endl;

	system("pause");
	return 0;
}

在调试过程中遇到了以下问题：

具体见上一篇博客：《FFmpeg中AVFrame中data与linesize的联系》https://blog.csdn.net/lifei092/article/details/82684217

OpenCV入门到精通：从基础到实战的全面指南
摘要：本文旨在为初学者和有一定经验的开发者提供OpenCV从入门到精通的全面指南。文章首先介绍了OpenCV的基本概念和安装方法，然后深入讲解了图像处理基础、特征检测与匹配、视频处理与分析等核心内容，最后通过实战案例展示了OpenCV在计算机视觉任务中的应用。关键词：OpenCV；图像处理；特征检测；视频分析；实战案例引言OpenCV（OpenSourceComputerVisionLibrary
HDMI高清矩阵与无缝拼接矩阵 OEM定制控标 geffen08 TPHD141K vc-1 g711 es13
HDMI高清矩阵与无缝拼接矩阵：GEFFEN/GF-MIX系列介绍GEFFEN/GF-MIX系列矩阵是一款集成了高性能、高灵活性和高可靠性于一身的音视频处理设备，特别适用于需要高清视频信号切换、拼接和显示的场合。HDMI高清矩阵主要功能与特点：高清视频信号切换：GEFFEN/GF-MIX系列HDMI高清矩阵支持多路HDMI输入和多路HDMI输出，能够轻松实现高清视频信号之间的快速切换。无缝切换技术
[硬件接口]HDMI和DP 区别
DisplayPort和HDMI在FPGA应用场景的实现使用与区别概述DisplayPort（DP）和HDMI是两种主流的数字音视频接口，广泛应用于视频传输场景。在FPGA（现场可编程门阵列）应用中，DP和HDMI常用于视频处理、显示驱动和高带宽数据传输。本文档比较两者在FPGA实现中的使用方式、应用场景及主要区别，并以Markdown格式呈现。1.FPGA实现概述1.1DisplayPort在F
[AXI] AXI Interconnect
AXIInterconnectIP详细介绍概述AXIInterconnect专为AXI4、AXI3和AXI4-Lite协议设计，提供多个AXI主设备（Master）和从设备（Slave）之间的灵活互联功能。它通过模块化架构实现高效的数据路由、协议转换、数据宽度转换和时钟域转换，广泛应用于FPGA和SoC系统设计，特别是在需要复杂AXI总线互联的场景，如多核处理器系统、视频处理、网络通信和硬件加速器
[FPGA Video IP] Video Processing Subsystem S＆Z3463 FPGA Video IP fpga开发 tcp/ip 网络协议 Video
XilinxVideoProcessingSubsystemIP(PG231)详细介绍概述XilinxLogiCORE™IPVideoProcessingSubsystem(VPSS)（PG231）是一个高度可配置的视频处理模块，设计用于在单一IP核中集成多种视频处理功能，包括缩放（Scaling）、去隔行（Deinterlacing）、颜色空间转换（ColorSpaceConversion,CS
XILINX Ultrascale+ Kintex系列FPGA的架构 InnoLink_1024 FPGA RTL设计芯片 fpga开发架构
Xilinx（现为AMD）KintexUltraScale+系列FPGA是基于16nmFinFET工艺的高性能、中等成本的现场可编程门阵列，专为高带宽、低功耗和成本效益的应用设计，广泛用于5G通信、数据中心、视频处理、航空航天等领域。以下详细介绍KintexUltraScale+系列FPGA的架构，结合其关键组件、特性和功能模块，并提供示例代码以展示时序约束的定义。1.KintexUltraSca
CVPR 2024 图像、视频处理总汇（视频字幕、图像超分辨率、图像分类和压缩等）点云SLAM 图形图像处理深度学习计算机视觉图像处理视频处理 3DGS CVPR2024
1、Image/VideoCaptioning(图像/视频字幕)VisualFactChecker:EnablingHigh-FidelityDetailedCaptionGenerationPolos:MultimodalMetricLearningfromHumanFeedbackforImageCaptioning⭐codeprojectPanda-70M:Captioning70MVide
视频工具箱 1.1.1 |小而美的视频处理工具，支持多种常用功能星图软件库软件分享音视频软件工程
VideoTools是一款基于FFmpeg的小而美的视频处理工具，专为需要快速高效地进行视频编辑的用户设计。这款工具无需安装，体积仅约200KB，提供了视频压缩、格式转换、转GIF、修改分辨率、加速播放以及音频提取等多种常用功能。其用户界面简洁直观，上手即用，首次运行时可自动下载或手动指定FFmpeg路径。此外，VideoTools还支持GPU加速（兼容Intel、AMD、Nvidia显卡），让视
【Python小工具】使用 OpenCV 获取视频时长的详细指南
【Python小工具】使用OpenCV获取视频时长的详细指南在处理视频数据时，获取视频的时长是一项常见且基础的需求。无论是进行视频分析、编辑，还是在视频处理项目中进行预处理，了解视频的时长都是不可或缺的一步。在Python中，借助强大的OpenCV库，我们可以轻松实现这一功能。本文将详细介绍如何使用Python和OpenCV获取视频时长，并对每一行代码进行深入解析。一、代码实现importcv2d
【Python基础】07 实战：批量视频压缩的实现智算菩萨 python 服务器开发语言
前言在数字化时代，视频内容已成为信息传播的主要载体。无论是个人用户还是企业，都面临着大量视频文件存储和传输的挑战。视频文件通常体积庞大，占用大量存储空间，同时在网络传输时也会消耗大量带宽。因此，一个高效、易用的视频压缩工具变得尤为重要。本文将详细介绍一个基于Python开发的批量视频压缩工具，该工具结合了现代图形界面设计和强大的FFmpeg视频处理能力，为用户提供了一站式的视频压缩解决方案。通过本
FFmpeg中TS与MP4格式的extradata差异详解码流怪侠音视频基础 ffmpeg MP4 TS 音视频 extradata 视频编解码实时音视频
在视频处理中，extradata是存储解码器初始化参数的核心元数据，直接影响视频能否正确解码。本文深入解析TS和MP4格式中extradata的结构差异、存储逻辑及FFmpeg处理方案。一、extradata的核心作用extradata是解码必需的参数集合，包含：H.264：SPS（序列参数集）、PPS（图像参数集）H.265：VPS（视频参数集）、SPS、PPS音频：采样率、声道数等配置其核心功
前端计算机视觉：使用 OpenCV.js 在浏览器中实现图像处理亿只小灿灿前端 OpenCV 前端计算机视觉 opencv
一、OpenCV.js简介与环境搭建OpenCV（OpenSourceComputerVisionLibrary）是一个强大的计算机视觉库，广泛应用于图像和视频处理领域。传统上，OpenCV主要在后端使用Python或C++等语言。但随着WebAssembly(Wasm)技术的发展，OpenCV也有了JavaScript版本——OpenCV.js，它可以直接在浏览器中高效运行，为前端开发者提供了前
【软件系统架构】系列四：数字信号处理器（DSP）
目录一、什么是DSP？二、DSP的核心架构特点1.基本结构2.工作流程：3.关键特性：三、DSP与MCU/MPU/NPU的对比四、DSP与通用处理器的对比五、常用DSP算法类型六、常见DSP芯片平台七、开发工具链与语言支持八、典型应用场景举例通信领域：音频处理：图像与视频处理：工业控制：军事与航空航天：九、选型关键因素十、技术趋势总结一、什么是DSP？DSP（DigitalSignalProces
联咏NT98567高度集成边缘IPC应用SoC规格特性 weixin_Todd_Wong2010 边缘计算人工智能计算机视觉 python c++神经网络
联咏NT98567MQG是一款高度集成的SoC，具有高图像质量、低比特率和低功耗的特点，适用于电池应用，目标是2Mp至5Mp/8Mp边缘IP摄像头应用。该SoC集成了双核ARMCortexA7CPU、新一代ISP、H.265/H.264视频压缩编解码器、视频处理引擎（VPE）用于双传感器拼接和鱼眼去畸变、高性能硬件DLA模块、图形引擎、显示控制器、以太网PHY、USB2.0主机/设备、音频编解码器
Gen AI：重塑未来的创造力工具箱一杯酒zpy 人工智能
目录页一、GenAI工具箱助力大学生涯1.通用GenAI工具2.GenAI科研辅助1.文献阅读与论文写作2.数据分析与可视化3.AI翻译工具二、GenAI办公、学习助手1.PPT制作2.表格制作3.AI思维导图4.AI办公5.AI图像处理6.AI视频处理7.AI音频处理8.AI编程工具9.AI搜索引擎说明：网盘资源密码获取：关注微信公众号【土木岛】，后台回复文件框中提示的对应关键词自动发送。点击查
智能汽车图像及视频处理方案，支持视频智能包装创作能力美摄科技汽车
在这个日新月异的智能时代，每一帧画面都承载着超越想象的力量。随着自动驾驶技术的飞速发展，智能汽车不仅成为了未来出行的代名词，更是技术与艺术完美融合的典范。在这场变革的浪潮中，美摄科技以创新为翼，推出了领先的智能汽车图像及视频处理方案，为智能汽车行业带来了前所未有的视觉盛宴，重新定义了智能出行的视觉体验。一、智能重塑，视觉新境界美摄科技的智能汽车图像及视频处理方案，是基于深度学习、人工智能及大数据处
编译OpenCV支持CUDA视频解码 AI标书 python openvc cuda nvidia docker build
如何在Ubuntu上编译OpenCV并启用CUDA视频解码支持（cudacodec）在深度学习、视频处理等高性能计算领域，OpenCV的GPU加速功能非常重要。特别是它的cudacodec模块，能直接利用NVIDIA硬件实现高效的视频解码，极大提升性能。本文将基于Ubuntu环境，详细介绍从环境准备到编译安装OpenCV，并开启cudacodec模块的全过程。完整的shell脚本以及本次编译所用到
技术解析：基于x264与FFmpeg的视频高效压缩策略——以小丸工具箱类GUI工具为例 soonlyai ffmpeg 音视频人工智能经验分享
摘要本文旨在探讨视频文件高效压缩的技术原理与实践方法，特别是针对如何在保持较高视觉质量的前提下显著减小文件体积。我们将以常见的视频处理GUI工具（如“小丸工具箱”等）所封装的核心技术为引，重点分析基于x264编码器和FFmpeg框架的参数配置，如CRF（ConstantRateFactor）值的选择。同时，本文将提供一个基础的FFmpeg命令行示例，演示核心压缩操作，并讨论批量处理及GUI封装此类
RNN、LSTM、GRU详解昔颜1121 人工智能 rnn python
RNN、LSTM、GRU详解在深度学习领域，序列数据（如语音识别、机器翻译、文本生成等）广泛应用于自然语言处理（NLP）、时间序列预测、语音和视频处理等任务中。针对序列数据，循环神经网络（RNN,RecurrentNeuralNetwork）及其改进版本——长短时记忆网络（LSTM,LongShort-TermMemory）和门控循环单元（GRU,GatedRecurrentUnit）成为处理时序
线程池中的线程数量设置为多少比较合适？ Mutig_s java 后端面试
影响因素影响线程数设定的因素，主要有CPU核心数、以及应用类型。CPU密集型应用CPU密集型应用主要是指需要大量计算资源的应用，常见类型包括：科学计算：气象模拟、流体动力学模拟。图形渲染：3D动画制作、电影特效渲染。密码学运算：区块链挖矿、数据加密。机器学习和人工智能：神经网络训练、深度学习。金融分析：量化分析、高频交易。图像和视频处理：视频编辑、编码解码。编译器和代码分析：代码编译、大型软件项目
Android端直播SDK实现方案
概述直播系统的架构总体上分为采集模块、预览模块、处理模块、编码模块、推流模块。把这五个模块串联起来就构成了整个直播系统的数据流。如下图所示：音频采集：采集原始的PCM数据。音频处理：对音频进行混音消除、降噪、自动增益等处理。音频编码：把PCM格式的数据编码为AAC格式。视频采集：相机/屏幕流的采集；YUV格式或者纹理格式。视频处理：对视频进行美颜/滤镜等处理。预览：把视频处理后的视频流在屏幕上进行
探秘卷积神经网络（CNN）：从原理到实战的深度解析 LNL13 cnn 人工智能神经网络
在图像识别、视频处理等领域，卷积神经网络（ConvolutionalNeuralNetwork，简称CNN）如同一位“超级侦探”，能够精准捕捉图像中的关键信息，实现对目标的快速识别与分析。从医疗影像诊断到自动驾驶中的路况感知，CNN凭借独特的架构设计和强大的特征提取能力，成为深度学习领域的中流砥柱。接下来，让我们深入探索CNN的奥秘。一、CNN的诞生背景与核心优势传统的神经网络，如多层感知机（ML
LPDDR5x电源使用Si电容对PI和PSIJ影响分析芯片电源完整性与信号完整性设计
SoC可能包含许多高速接口，其中LPDDR5X目前因为高带宽、低功耗、大容量等性能优势开始逐渐在AI计算、5G通信、视频处理等领域开始使用。LPDDR5X目前的速率高达8.533GT/s，以及多个为这些接口供电的IO电压轨，而这些IO轨的PDN需要提供低阻抗，同时最小化在PCB上占用的资源，如封装焊球和PCB电源填充。需要为IO信号设计低阻抗的PDN，对于涉及在电源网络上提供的去耦电容需要严格设计
XS9922D芯昇CHIPUP，爱芯元智，2路AHD模拟芯片 AUTO_15075675965 CVI/芯昇编解码芯片国产芯片
XS9922D芯昇CHIPUP，爱芯元智，2路AHD模拟芯片输入2通道AHD模拟视频输出BT.656*2/BT.1120*1视频协议AHD/CVI/TVI/CVBS视频分辨率2K@25/30fps1080P@25/30fps720P@25/30/50/60fps960H/D1Multi-CH视频处理AGC,ACC,White-Peak亮度,饱和度,对比度,色度PTZ（正/反向）支持EQ补偿300m
双缓冲区技巧：提升性能的利器 Jay_515 嵌入式单片机 C语言
双缓冲区技术是解决生产者-消费者速度不匹配问题的经典方案，在图形渲染、音视频处理等领域广泛应用什么是双缓冲区？双缓冲区是一种数据缓冲技术，它使用两个缓冲区（BufferA和BufferB）来解决生产者和消费者速度不匹配的问题。核心思想是：生产者向一个缓冲区（后台缓冲区）写入数据消费者从另一个缓冲区（前台缓冲区）读取数据当生产者完成写入后，切换缓冲区角色，使得消费者可以读取新数据为什么需要双缓冲区？
AVCap视频处理成帧和音频脚本 xijiancui 音视频
###############处理原视频，使其格式和原数据一样importosimportcv2importsubprocessimportjsonfromPILimportImagefrompydubimportAudioSegmentimportsysimportshutil#===第一步：强制检测并设置FFmpeg路径===defget_ffmpeg_path():"""确保FFmpeg和F
macOS上利用FFmpeg将m3u8转化为mp4实现播放 Kaede0326 #macOS macos ffmpeg 经验分享
我们经常在浏览网页视频的时候试图下载，但是将文件打开后发现扩展名是.m3u8,使得系统默认或是常见的播放器无法打开它，这时候就需要借助转码工具，我经过查找，发现大部分可以实现上述功能的软件需要收费，要么就是不好用，所以特别推荐大家使用FFmpeg概要操作系统：macOS15.3设备：MacBookAir什么是FFmpeg?FFmpeg是一个开源跨平台的音视频处理工具，它可以用来录制、转换和流式播放
opencv的videocapture 和VideoWriter简单使用秋冬晚归客 python openCV opencv 计算机视觉 visual studio
OpenCV中对于视频处理提供了VideoCapture和VideoWriter两个类进行处理，理论上支持各种视频格式。不过最终在电脑上支持的格式还是要取决于操作系统和OpenCv的构建配置。接下来，让我尝试了对一个视频进行复制，代码如下：importcv2video=cv2.VideoCapture('AMV.mp4')fps=video.get(cv2.CAP_PROP_FPS)#获得视频帧数
opencv 之视频类 VideoCapture、VideoWriter详细介绍明月醉窗台 #C++-opencv opencv 音视频人工智能计算机视觉
opencv之视频类VideoCapture、VideoWriter详细介绍VideoCapture用于打开视频文件或者摄像头及设置相关属性VideoWriter用于保存视频文件及设置相关属性1.VideoCapturecv::VideoCapture是OpenCV中用于从视频文件、图像序列或摄像头捕获视频的类。它是OpenCV视频处理模块的核心类之一。cv::VideoCapture提供了以下主
短视频矩阵系统开发实战：PHP实现SaaS独立部署 Yxh18137784554 音视频矩阵 php
系统架构与技术栈我们采用PHP语言开发短视频矩阵系统，支持SaaS模式独立部署。系统包含两大核心模块：AI剪辑矩阵系统-基于深度学习的智能视频处理无人直播系统-自动化直播推流与交互//视频剪辑核心配置模块$video_mixed_mode=plum_parse_config('project_mixed_mode','dydqt/project');//腾讯云/火山引擎配音服务切换$huoshan
ASM系列五利用TreeApi 解析生成Class lijingyao8206 ASM 字节码动态生成 ClassNode TreeAPI
前面CoreApi的介绍部分基本涵盖了ASMCore包下面的主要API及功能，其中还有一部分关于MetaData的解析和生成就不再赘述。这篇开始介绍ASM另一部分主要的Api。TreeApi。这一部分源码是关联的asm-tree-5.0.4的版本。在介绍前，先要知道一点， Tree工程的接口基本可以完
链表树——复合数据结构应用实例 bardo 数据结构树型结构表结构设计链表菜单排序
我们清楚：数据库设计中，表结构设计的好坏，直接影响程序的复杂度。所以，本文就无限级分类（目录）树与链表的复合在表设计中的应用进行探讨。当然，什么是树，什么是链表，这里不作介绍。有兴趣可以去看相关的教材。需求简介：经常遇到这样的需求，我们希望能将保存在数据库中的树结构能够按确定的顺序读出来。比如，多级菜单、组织结构、商品分类。更具体的，我们希望某个二级菜单在这一级别中就是第一个。虽然它是最后
为啥要用位运算代替取模呢 chenchao051 位运算哈希汇编
在hash中查找key的时候，经常会发现用&取代%，先看两段代码吧， JDK6中的HashMap中的indexFor方法： /** * Returns index for hash code h. */ static int indexFor(int h, int length) {
最近的情况麦田的设计者生活感悟计划软考想
今天是2015年4月27号整理一下最近的思绪以及要完成的任务 1、最近在驾校科目二练车，每周四天，练三周。其实做什么都要用心，追求合理的途径解决。为
PHP去掉字符串中最后一个字符的方法 IT独行者 PHP 字符串
今天在PHP项目开发中遇到一个需求，去掉字符串中的最后一个字符原字符串1,2,3,4,5,6, 去掉最后一个字符","，最终结果为1,2,3,4,5,6 代码如下： $str = "1,2,3,4,5,6,"; $newstr = substr($str,0,strlen($str)-1); echo $newstr;
hadoop在linux上单机安装过程 _wy_ linux hadoop
1、安装JDK jdk版本最好是1.6以上，可以使用执行命令java -version查看当前JAVA版本号，如果报命令不存在或版本比较低，则需要安装一个高版本的JDK，并在/etc/profile的文件末尾，根据本机JDK实际的安装位置加上以下几行： export JAVA_HOME=/usr/java/jdk1.7.0_25
JAVA进阶----分布式事务的一种简单处理方法无量多系统交互分布式事务
每个方法都是原子操作：提供第三方服务的系统，要同时提供执行方法和对应的回滚方法 A系统调用B,C,D系统完成分布式事务 =========执行开始======== A.aa(); try { B.bb(); } catch(Exception e) { A.rollbackAa(); } try { C.cc(); } catch(Excep
安墨移动广告：移动DSP厚积薄发引领未来广告业发展命脉矮蛋蛋 hadoop 互联网
　　“谁掌握了强大的DSP技术，谁将引领未来的广告行业发展命脉。”2014年，移动广告行业的热点非移动DSP莫属。各个圈子都在纷纷谈论，认为移动DSP是行业突破点，一时间许多移动广告联盟风起云涌，竞相推出专属移动DSP产品。　　到底什么是移动DSP呢? 　　DSP(Demand-SidePlatform)，就是需求方平台，为解决广告主投放的各种需求，真正实现人群定位的精准广
myelipse设置 alafqq IP
在一个项目的完整的生命周期中，其维护费用，往往是其开发费用的数倍。因此项目的可维护性、可复用性是衡量一个项目好坏的关键。而注释则是可维护性中必不可少的一环。注释模板导入步骤安装方法：打开eclipse/myeclipse 选择 window-->Preferences-->JAVA-->Code-->Code
java数组百合不是茶 java数组
java数组的声明创建初始化； java支持C语言数组中的每个数都有唯一的一个下标一维数组的定义声明： int[] a = new int[3];声明数组中有三个数int[3] int[] a 中有三个数，下标从0开始，可以同过for来遍历数组中的数
javascript读取表单数据 bijian1013 JavaScript
利用javascript读取表单数据，可以利用以下三种方法获取： 1、通过表单ID属性：var a = document.getElementByIdx_x_x("id"); 2、通过表单名称属性：var b = document.getElementsByName("name"); 3、直接通过表单名字获取：var c = form.content.
探索JUnit4扩展：使用Theory bijian1013 java JUnit Theory
理论机制（Theory）一.为什么要引用理论机制（Theory）当今软件开发中，测试驱动开发（TDD — Test-driven development）越发流行。为什么 TDD 会如此流行呢？因为它确实拥有很多优点，它允许开发人员通过简单的例子来指定和表明他们代码的行为意图。 TDD 的优点： &nb
[Spring Data Mongo一]Spring Mongo Template操作MongoDB bit1129 template
什么是Spring Data Mongo Spring Data MongoDB项目对访问MongoDB的Java客户端API进行了封装，这种封装类似于Spring封装Hibernate和JDBC而提供的HibernateTemplate和JDBCTemplate，主要能力包括 1. 封装客户端跟MongoDB的链接管理 2. 文档-对象映射，通过注解:@Document(collectio
【Kafka八】Zookeeper上关于Kafka的配置信息 bit1129 zookeeper
问题： 1. Kafka的哪些信息记录在Zookeeper中 2. Consumer Group消费的每个Partition的Offset信息存放在什么位置 3. Topic的每个Partition存放在哪个Broker上的信息存放在哪里 4. Producer跟Zookeeper究竟有没有关系？没有关系！！！ //consumers、config、brokers、cont
java OOM内存异常的四种类型及异常与解决方案 ronin47 java OOM 内存异常
　OOM异常的四种类型：　　　　　一：　StackOverflowError ：通常因为递归函数引起（死递归，递归太深）。-Xss 128k 一般够用。　二：　out Of memory: PermGen Space：通常是动态类大多，比如web 服务器自动更新部署时引起。-Xmx
java-实现链表反转-递归和非递归实现 bylijinnan java
20120422更新：对链表中部分节点进行反转操作，这些节点相隔k个： 0->1->2->3->4->5->6->7->8->9 k=2 8->1->6->3->4->5->2->7->0->9 注意1 3 5 7 9 位置是不变的。解法：将链表拆成两部分： a.0-&
Netty源码学习-DelimiterBasedFrameDecoder bylijinnan java netty
看DelimiterBasedFrameDecoder的API，有举例：接收到的ChannelBuffer如下： +--------------+ | ABC\nDEF\r\n | +--------------+ 经过DelimiterBasedFrameDecoder(Delimiters.lineDelimiter())之后，得到： +-----+----
linux的一些命令 -查看cc攻击-网口ip统计等 hotsunshine linux
Linux判断CC攻击命令详解 2011年12月23日 ⁄ 安全 ⁄ 暂无评论查看所有80端口的连接数 netstat -nat|grep -i '80'|wc -l 对连接的IP按连接数量进行排序 netstat -ntu | awk '{print $5}' | cut -d: -f1 | sort | uniq -c | sort -n 查看TCP连接状态 n
Spring获取SessionFactory ctrain sessionFactory
String sql = "select sysdate from dual"; WebApplicationContext wac = ContextLoader.getCurrentWebApplicationContext(); String[] names = wac.getBeanDefinitionNames(); for(int i=0; i&
Hive几种导出数据方式 daizj hive 数据导出
Hive几种导出数据方式 1.拷贝文件如果数据文件恰好是用户需要的格式，那么只需要拷贝文件或文件夹就可以。 hadoop fs –cp source_path target_path 2.导出到本地文件系统 --不能使用insert into local directory来导出数据，会报错 --只能使用
编程之美 dcj3sjt126com 编程 PHP 重构
我个人的 PHP 编程经验中，递归调用常常与静态变量使用。静态变量的含义可以参考 PHP 手册。希望下面的代码，会更有利于对递归以及静态变量的理解 header("Content-type: text/plain"); function static_function () { static $i = 0; if ($i++ < 1
Android保存用户名和密码 dcj3sjt126com android
转自：http://www.2cto.com/kf/201401/272336.html 我们不管在开发一个项目或者使用别人的项目，都有用户登录功能，为了让用户的体验效果更好，我们通常会做一个功能，叫做保存用户，这样做的目地就是为了让用户下一次再使用该程序不会重新输入用户名和密码，这里我使用3种方式来存储用户名和密码 1、通过普通的txt文本存储 2、通过properties属性文件进行存
Oracle 复习笔记之同义词 eksliang Oracle 同义词 Oracle synonym
转载请出自出处：http://eksliang.iteye.com/blog/2098861 1.什么是同义词同义词是现有模式对象的一个别名。概念性的东西，什么是模式呢？创建一个用户，就相应的创建了一个模式。模式是指数据库对象，是对用户所创建的数据对象的总称。模式对象包括表、视图、索引、同义词、序列、过
Ajax案例 gongmeitao Ajax jsp
数据库采用Sql Server2005 项目名称为:Ajax_Demo 1.com.demo.conn包 package com.demo.conn; import java.sql.Connection;import java.sql.DriverManager;import java.sql.SQLException; //获取数据库连接的类public class DBConnec
ASP.NET中Request.RawUrl、Request.Url的区别 hvt .net Web C#asp.net hovertree
如果访问的地址是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree%3C&n=myslider#zonemenu那么Request.Url.ToString() 的值是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree<&
SVG 教程（七）SVG 实例，SVG 参考手册天梯梦 svg
SVG 实例在线实例下面的例子是把SVG代码直接嵌入到HTML代码中。谷歌Chrome，火狐，Internet Explorer9，和Safari都支持。注意：下面的例子将不会在Opera运行，即使Opera支持SVG - 它也不支持SVG在HTML代码中直接使用。 SVG 实例 SVG基本形状一个圆矩形不透明矩形一个矩形不透明2 一个带圆角矩
事务管理 luyulong java spring 编程事务
事物管理 spring事物的好处为不同的事物API提供了一致的编程模型支持声明式事务管理提供比大多数事务API更简单更易于使用的编程式事务管理API 整合spring的各种数据访问抽象 TransactionDefinition 定义了事务策略 int getIsolationLevel()得到当前事务的隔离级别 READ_COMMITTED
基础数据结构和算法十一：Red-black binary search tree sunwinner Algorithm Red-black
The insertion algorithm for 2-3 trees just described is not difficult to understand; now, we will see that it is also not difficult to implement. We will consider a simple representation known
centos同步时间 stunizhengjia linux 集群同步时间
做了集群，时间的同步就显得非常必要了。以下是查到的如何做时间同步。在CentOS 5不再区分客户端和服务器，只要配置了NTP，它就会提供NTP服务。 1)确认已经ntp程序包： # yum install ntp 2)配置时间源（默认就行，不需要修改） # vi /etc/ntp.conf server pool.ntp.o
ITeye 9月技术图书有奖试读获奖名单公布 ITeye管理员 ITeye
ITeye携手博文视点举办的9月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 9月试读活动回顾：http://webmaster.iteye.com/blog/2118112本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《NFC：Arduino、Andro

FFmpeg 解码音视频实例及碰到的问题记录（一）

你可能感兴趣的:(视频处理)