快乐阿门

6.使用DirecrShow采集摄像头视音频并实时进行H264和AAC编码后封装成MP4

之前一篇说了采集视频并实时进行H264编码，没有讲音频的实时编码，本篇将讲一个比较完整的例子，从DirectShow采集视音频，然后实时进行视音频的编码，最后封装成MP4。视频编码还使用之前用过的X264编码器，音频使用FAAC，这也比较常用的音频编码器，可直接在官网下载源码，最后将编码后的H264和AAC封装成MP4。

本篇将在前一篇（5.使用DirectShow进行摄像头采集并进行H264实时编码）的基础上进行，只要增加音频采集、编码以及最后的合成封装。不过视频的采集有和之前不一样的地方就是之前的编码工作直接在回调中进行的，本篇换了一种更好的方式，在回调中把每次过来的帧数据都放在一个array中保存起来，然后开启了一个处理线程，一边采集，一边编码处理，这样做比较合理一点，避免在回调中编码时花费大量时间而可能导致帧丢失问题。回调代码如下：

HRESULT STDMETHODCALLTYPE CSampleGrabberCB::BufferCB(double SampleTime, BYTE *pBuffer, long BufferLen)
{
	CString str;
	//str.Format(_T("\n BufferCB--lBufferSize:%ld,lWidth:%d,lHeight:%d"), BufferLen, lWidth, lHeight);
	//OutputDebugString(str);

	//也是开始录制
	if (m_bBeginEncode)
	{
		BYTE * pRgbData = new BYTE[BufferLen];
		memcpy(pRgbData, pBuffer, BufferLen);
		GrabDataInfo sData;
		sData.pData = pRgbData;
		sData.nDataSize = BufferLen;
		sData.dSampleTime = SampleTime;

		//把数据先存到array中
		m_mxMsgLog.Lock();
		m_arrGrabDataArr.Add(sData);
		m_mxMsgLog.Unlock();

		str.Format(_T("\n Video--BufferLen:%ld, SampleTime:%f \n"), BufferLen, SampleTime);
		OutputDebugString(str);

		if (m_bFirst)
		{
			m_bFirst = FALSE;

			CString str;
			str.Format(_T("\n Video--SampleTime:%f \n"), SampleTime);
			OutputDebugString(str);
			//开启线程来处理
			AfxBeginThread(VideoDealFunc, this);
		}
	}

	return 0;
}

m_arrGrabDataArr是一个结构，定义如下：

struct GrabDataInfo
{
	BYTE *pData;
	int nDataSize;
	double dSampleTime;

	GrabDataInfo()
	{
		pData = NULL;
		nDataSize = 0;
		dSampleTime = 0.0;
	};
	
	GrabDataInfo(const GrabDataInfo &other)
	{
		*this = other;
	};
	
	GrabDataInfo& operator = (const GrabDataInfo& other)
	{
		pData = other.pData;
		nDataSize = other.nDataSize;
		dSampleTime = other.dSampleTime;
		return *this;
	};
};
typedef CArray  ASGrabDataInfoArray;

然后处理的部分全部放到线程中了，代码如下：

UINT VideoDealFunc(LPVOID lpVoid)
{
	CSampleGrabberCB *pManage = (CSampleGrabberCB*)lpVoid;
	if (pManage)
	{
		pManage->VideoDeal();
	}
	return 0;
}

void CSampleGrabberCB::VideoDeal()
{
	//等待音频正式开始的第一个样本时间有了后再比较
	while (!theApp.m_IsBegin)
	{
		Sleep(200);
	}

	double dSampleTime = theApp.m_nSampleTime;

	m_nFrameIndex = 0;
	int csp = X264_CSP_I420;
	int width = lWidth;
	int height = lHeight;
	int y_size = width * height;
	ULONG nYUVLen = lWidth * lHeight + (lWidth * lHeight)/2;

	USES_CONVERSION;
	string strFullPath = W2A(m_sSavePath);
	m_fp_dst = fopen(strFullPath.c_str(), "wb");

	m_pParam = (x264_param_t*)malloc(sizeof(x264_param_t));

	//初始化，是对不正确的参数进行修改,并对各结构体参数和cabac编码,预测等需要的参数进行初始化
	x264_param_default(m_pParam);

	//如果有编码延迟，可以这样设置就能即时编码
	x264_param_default_preset(m_pParam, "fast", "zerolatency"); 

	m_pParam->i_width = width;
	m_pParam->i_height = height;
	m_pParam->i_csp = X264_CSP_I420;          
	m_pParam->i_fps_num = 30;       // 设置帧率  
	m_pParam->i_fps_den = 1;        // 设置帧率
	//m_pParam->b_repeat_headers = 1;  // 重复SPS/PPS 放到关键帧前面          

	//设置Profile，这里有5种级别（编码出来的码流规格），级别越高，清晰度越高，耗费资源越大
	x264_param_apply_profile(m_pParam, x264_profile_names[1]);

	//x264_picture_t存储压缩编码前的像素数据
	m_pPic_in = (x264_picture_t*)malloc(sizeof(x264_picture_t));
	m_pPic_out = (x264_picture_t*)malloc(sizeof(x264_picture_t));

	x264_picture_init(m_pPic_out);

	//为图像结构体x264_picture_t分配内存
	x264_picture_alloc(m_pPic_in, csp, m_pParam->i_width, m_pParam->i_height);

	//打开编码器
	m_pHandle = x264_encoder_open(m_pParam);
	if(m_pHandle == NULL)//失败就退出
	{
		free(m_pPic_in);
		m_pPic_in = NULL;
		free(m_pPic_out);
		m_pPic_out = NULL;

		free(m_pParam);
		m_pParam = NULL;
		return;	
	}

	while (1)
	{
		DWORD dwRet = WaitForSingleObject(m_hMainExitEvent, 5);  
		if(dwRet == WAIT_OBJECT_0)
		{
			if (m_arrGrabDataArr.GetSize() <= 0)
			{
				break;
			}
		}

		m_mxMsgLog.Lock();
		int nCount = m_arrGrabDataArr.GetSize();
		if(nCount<=0)
		{
			m_mxMsgLog.Unlock();
			continue;
		}

		GrabDataInfo sDataInfo = m_arrGrabDataArr.GetAt(0);
		m_arrGrabDataArr.RemoveAt(0);
		m_mxMsgLog.Unlock();

		if (sDataInfo.dSampleTime < dSampleTime)
		{
			delete[] sDataInfo.pData;
			continue;
		}

		//编码
		//每一帧大小
		BYTE * yuvByte = new BYTE[nYUVLen];
		//先把RGB24转为YUV420
		RGB2YUV(sDataInfo.pData, lWidth, lHeight, yuvByte, &nYUVLen);

		delete[] sDataInfo.pData;

		if (m_pPic_in == NULL || m_pPic_out == NULL || m_pHandle == NULL || m_pParam == NULL)
		{
			continue;
		}

		int iNal = 0;

		//存储压缩编码后的码流数据
		x264_nal_t* pNals = NULL;

		//注意写的起始位置和大小，前y_size是Y的数据，然后y_size/4是U的数据，最后y_size/4是V的数据
		memcpy(m_pPic_in->img.plane[0], yuvByte, y_size);						//先写Y
		memcpy(m_pPic_in->img.plane[1], yuvByte + y_size, y_size/4);			//再写U
		memcpy(m_pPic_in->img.plane[2], yuvByte + y_size + y_size/4, y_size/4); //再写V

		m_pPic_in->i_pts = m_nFrameIndex++; //时钟

		//编码一帧图像，pNals为返回的码流数据，iNal是返回的pNals中的NAL单元的数目
		int ret = x264_encoder_encode(m_pHandle, &pNals, &iNal, m_pPic_in, m_pPic_out);
		if (ret < 0)
		{
			OutputDebugString(_T("\n x264_encoder_encode err"));
			delete[] yuvByte;
			continue;
		}

		//写入目标文件
		for (int j = 0; j < iNal; ++j)
		{
			fwrite(pNals[j].p_payload, 1, pNals[j].i_payload, m_fp_dst);
		}

		delete[] yuvByte; //用完要释放
	}

	int iNal = 0;
	//存储压缩编码后的码流数据
	x264_nal_t* pNals = NULL;

	//把编码器中剩余的码流数据输出
	while (1)
	{
		int ret = x264_encoder_encode(m_pHandle, &pNals, &iNal, NULL, m_pPic_out);
		if (ret == 0)
		{
			break;
		}
		for (int j = 0; j < iNal; ++j)
		{
			fwrite(pNals[j].p_payload, 1, pNals[j].i_payload, m_fp_dst);
		}
	}

	//释放内存
	x264_picture_clean(m_pPic_in);

	//关闭编码器
	x264_encoder_close(m_pHandle);
	m_pHandle = NULL;

	free(m_pPic_in);
	m_pPic_in = NULL;
	free(m_pPic_out);
	m_pPic_out = NULL;

	free(m_pParam);
	m_pParam = NULL;

	//关闭文件
	fclose(m_fp_dst);
	m_fp_dst = NULL;
		
	m_nFrameIndex = 0;
	m_bEndEncode = TRUE;
}

注意编码的参数填写，之前一篇在编码时没有填写帧率，这里加上了，不过帧率要按照采集设备的实际帧率来填写比较好，否则可能与声音同步的时候出现快慢不一致的问题。

另外，有些机器好像帧率不是固定的，会随着曝光值的变化而变化，录出来的视频可能播放就像快进一样。这种情况解决方案很简单，把采集设备的曝光值设置为手动固定值即可。设置代码如下：

//关闭自动曝光
IAMCameraControl *m_pCtrl;
m_pVideoFilter->QueryInterface(IID_IAMCameraControl, (void **)&m_pCtrl );
m_pCtrl->Set(CameraControl_Exposure, -5, CameraControl_Flags_Manual );

以上针对视频的，音频的采集方式跟视频一样，使用回调的方式，采集之前设置好回调，代码如下：

//设置音频抓取数据
		m_pAudioGrabberFilter->QueryInterface(IID_ISampleGrabber, (void **)&m_pAudioGrabber);

		//获取音频采集源的相关参数
		IAMStreamConfig *pAudioConfig = NULL;  
		m_pCapture->FindInterface(&PIN_CATEGORY_CAPTURE, &MEDIATYPE_Audio, 
							m_pAudioFilter, IID_IAMStreamConfig, (void **) &pAudioConfig);

		AM_MEDIA_TYPE *audiPmt = NULL; 
		AUDIO_STREAM_CONFIG_CAPS ascc;
		pAudioConfig->GetStreamCaps(0, &audiPmt, (BYTE*)&ascc);

		WAVEFORMATEX *pVih = (WAVEFORMATEX*)audiPmt->pbFormat;

		m_audioCB.m_nChannels = pVih->nChannels;
		m_audioCB.m_nSamplesPerSec = pVih->nSamplesPerSec;
		m_audioCB.m_wBitsPerSample = pVih->wBitsPerSample;
		
		//audiPmt->cbFormat = sizeof(WAVEFORMATEX);
		//audiPmt->pbFormat = (BYTE*)pVih;
		audiPmt->majortype = MEDIATYPE_Audio;//MEDIATYPE_Video
		audiPmt->subtype = MEDIASUBTYPE_PCM;//MEDIASUBTYPE_RGB24
		audiPmt->formattype = FORMAT_WaveFormatEx;//视频采集时没设置这一项

		pAudioConfig->SetFormat(audiPmt);
		hr = m_pAudioGrabber->SetMediaType(audiPmt);
		if(FAILED(hr))
		{
			AfxMessageBox(_T("Fail to set audio media type!"));
			return;
		}

		m_pAudioGrabber->SetBufferSamples(FALSE); 
		m_pAudioGrabber->SetOneShot(FALSE);
		m_pAudioGrabber->SetCallback(&m_audioCB, 1);

同样，回调中也开启一个线程处理音频的编码，回调代码如下：

HRESULT STDMETHODCALLTYPE CAudioSampleGrabber::BufferCB(double SampleTime, BYTE *pBuffer, long BufferLen)
{
	CString str;
	//str.Format(_T("\n Audio--BufferLen:%ld"), BufferLen);
	//OutputDebugString(str);

	if(m_bBeginEncode)
	{
		BYTE * pcmData = new BYTE[BufferLen];
		memcpy(pcmData, pBuffer, BufferLen);
		GrabDataInfo sData;
		sData.pData = pcmData;
		sData.nDataSize = BufferLen;
		sData.dSampleTime = SampleTime;
		m_arrAudioDataInfo.Add(sData);

		str.Format(_T("\n Audio--BufferLen:%ld, SampleTime:%f \n"), BufferLen, SampleTime);
		OutputDebugString(str);

		if (m_bFirst)
		{
			m_bFirst = FALSE;

			AfxBeginThread(AudioDealFunc, this);
		}
	}

	return 0;
}

音频的编码使用faac，但注意，faac的接口每次处理的数据在通道数和采样率配置好后是固定的，而回调每次返回的数据大小一般都会大于这个固定大小。所以在编码的时候要注意切分好数据，不要直接把每次回调过来的数据做一次性编码，而要做多次编码。具体编码处理如下：

void CAudioSampleGrabber::AudioDeal()
{
	USES_CONVERSION;
	string strFullPath = W2A(m_sSavePath);
	m_fpOut = fopen(strFullPath.c_str(), "wb");

	m_hFaacEncHandle = faacEncOpen(m_nSamplesPerSec, m_nChannels, &m_nInputSamples, &m_nMaxOutputBytes);
	if(m_hFaacEncHandle == NULL)
	{
		OutputDebugString(_T("faacEncOpen failed"));
		return;
	}

	//获取配置
	m_faacConfigurePtr = faacEncGetCurrentConfiguration(m_hFaacEncHandle);
	m_faacConfigurePtr->inputFormat = FAAC_INPUT_16BIT;
	// 0 = Raw,1 = ADTS
	m_faacConfigurePtr->outputFormat = 1;
	m_faacConfigurePtr->aacObjectType = MAIN;
	m_faacConfigurePtr->allowMidside = 0;
	m_faacConfigurePtr->useLfe = 0;
	m_faacConfigurePtr->useTns = 1;

	//设置配置
	int nRet = faacEncSetConfiguration(m_hFaacEncHandle, m_faacConfigurePtr);

	m_bSampleBegin = TRUE;

	while (1)
	{
		DWORD dwRet = WaitForSingleObject(m_hMainExitEvent, 10);  
		if(dwRet == WAIT_OBJECT_0)
		{
			if (m_arrAudioDataInfo.GetSize() <= 0)
			{
				break;
			}
		}
		m_mxMsgLog.Lock();
		int nCount = m_arrAudioDataInfo.GetSize();
		if(nCount<=0)
		{
			m_mxMsgLog.Unlock();
			continue;
		}

		GrabDataInfo sDataInfo = m_arrAudioDataInfo.GetAt(0);
		m_arrAudioDataInfo.RemoveAt(0);
		m_mxMsgLog.Unlock();

		if (m_hFaacEncHandle == NULL || m_faacConfigurePtr == NULL)
		{
			continue;
		}

		//设定每次能编码的数据大小
		int nPCMBufferSize = m_nInputSamples*m_wBitsPerSample / 8;

		BYTE* pbPCMBuffer = new BYTE[nPCMBufferSize];
		BYTE *pbAACBuffer = new BYTE [m_nMaxOutputBytes];

		ULONG ulTotalEncode = 0;
		int nTime = 0;
		while (1)
		{
			//pBuffer大小为BufferLen，远大于编码能力nPCMBufferSize，所以这里多分几次编
			//每次从pBuffer中取出nPCMBufferSize的大小，直到取完
			memcpy(pbPCMBuffer, sDataInfo.pData+ulTotalEncode, nPCMBufferSize);
			ulTotalEncode += nPCMBufferSize;
			nTime++;
			int nRet = faacEncEncode(m_hFaacEncHandle, (int*) pbPCMBuffer, m_nInputSamples, pbAACBuffer, m_nMaxOutputBytes);
			if (nRet <= 0) //faac一般需要几个样本缓存，所以相当于丢弃
			{
				break;
			}

			//记录正式开始编码的第一个样本时间
			if (m_bSampleBegin)
			{
				m_bSampleBegin = FALSE;
				theApp.m_nSampleTime = sDataInfo.dSampleTime; //用来与视频样本同步的时间
				theApp.m_IsBegin = TRUE;
			}

			//写入文件
			fwrite(pbAACBuffer, 1, nRet, m_fpOut);

			//取到最后一次要注意，大小不是nPCMBufferSize了，而是BufferLen - ulTotalEncode
			if (sDataInfo.nDataSize < ulTotalEncode + nPCMBufferSize) 
			{
				int nEndDataSize = sDataInfo.nDataSize - ulTotalEncode;
				if (nEndDataSize > 0) //剩余的
				{
					delete[] pbPCMBuffer;
					pbPCMBuffer = new BYTE[nEndDataSize];
					memcpy(pbPCMBuffer, sDataInfo.pData+ulTotalEncode, nEndDataSize);

					//要修改一下输入采样
					int nInputSamples = nEndDataSize / (m_wBitsPerSample/8);
					//对剩余的数据编码
					nRet = faacEncEncode(m_hFaacEncHandle, (int*)pbPCMBuffer, nInputSamples, pbAACBuffer, m_nMaxOutputBytes);
					if (nRet <= 0)
					{
						break;
					}
					fwrite(pbAACBuffer, 1, nRet, m_fpOut);
				}
				break;
			}
		}
		delete [] pbPCMBuffer;
		delete [] pbAACBuffer;
		delete [] sDataInfo.pData;
	}

	//最后flush一下编码器中的数据
	BYTE *pbAACBuffer = new BYTE [m_nMaxOutputBytes];
	while((	nRet=faacEncEncode(m_hFaacEncHandle, NULL, 0, pbAACBuffer,m_nMaxOutputBytes)) > 0)
	{
		fwrite(pbAACBuffer,1,nRet,m_fpOut);
	}
	delete [] pbAACBuffer;
	faacEncClose(m_hFaacEncHandle);
	fclose(m_fpOut);

	m_bEndEncode = TRUE;
}

接下来说说视音频在采集的同步问题，由于faac编码开始时需要几次的样本做缓存，所以导致前几个样本被废弃，具体哪个样本开始，每次可能都不一样，而视频从第一个样本开始就正常编码，所以视音频这时不一定同步，所以我这里用了一个简单的方法，就是先进行faac编码，等待faac编码正式成功的第一个样本开始，以这个样本的采样时间为基准，拿视频的采样时间与其比较，只有大于等于音频的第一个样本时间，才进行正式的视频的编码，这样基本上能同步，当然，还有更好的办法。

最后是合成封装，将编码后H264和AAC封装成MP4，这个就不多讲了，只要按照MP4的格式规范来写，一般不是问题，当然，最好的方法是用ffmpeg来实现，这里我参考了一下雷霄骅的《最简单的基于FFmpeg的封装格式处理：视音频复用器（muxer）》，雷大神是我非常敬佩的一个程序员，虽然他已离开这个世界，但他的技术博客却永远在这里发着光。具体见下方的工程下载。

最后的界面再次展示一下，

完整工程下载见这里：工程代码下载

FFmpeg音视频采集 yerennuo ffmpeg ffmpeg 音视频
文章目录音视频采集音频采集获取设备信息录制麦克风录制声卡视频采集摄像机画面采集音视频采集DirectShow（简称DShow）是一个Windows平台上的流媒体框架，提供了高质量的多媒体流采集和回放功能，它支持多种多样的媒体文件格式，包括ASF、MPEG、AVI、MP3和WAV文件，同时支持使用WDM驱动或早期的VFW驱动来进行多媒体流的采集。DirectShow大大简化了媒体回放、格式转换和采集
Python中使用OpenCv中的cv2.imwrite()，没有报错，但是并没有将图片保存在对应目录夏沐草 python opencv 开发语言
今天在用OpenCv保存图片时，代码并没有报错，可对应的目录中并没有保存下来图片，错误代码如下："""打开摄像头实时读取并显示视频，当按下空格键时，关闭摄像头，保存并显示此时摄像头视频中的图像"""importcv2ascvcap=cv.VideoCapture(0,cv.CAP_DSHOW)#打开笔记本内置摄像头whilecap.isOpened():ret,frame=cap.read()#从
Parade Series - RTSP - Web unix2linux 服务器 DOS
实验室-单摄像头-测试高拍仪-双摄像头-测试CamList@SETTMP-LOG=dshow.dummy.%bofTime%@ffmpeg-list_devicestrue-fdshow-idummy2>%TMP-LOG%@ECHO.@type%TMP-LOG%|grep@|grep-v"Alternative\|DirectShow"|awk-F"\""'{print$2}'::========
【音视频 ffmpeg 学习】麦克风数据采集，命令行播放持续更新道剑剑非道音视频 ffmpeg 学习
ffmpeg命令windows环境查看设备ffmpeg-list_devicestrue-fdshow-idummy采集麦克风代码//1.initavdevice_register_all();//avformat_network_init();//2.获取windows采集数据所支持的格式（dshow）constAVInputFormat*fmt=av_find_input_format("ds
python（opencv + pyaudio + moviepy）实现录制音视频文件并合并の娟子 Python opencv python 音视频
使用opencv录制视频文件defrecord_webcam(filename):"""cv2.VideoCapture(0,cv2.CAP_DSHOW)参数1：打开前置摄像头参数是0,打开后置摄像头参数是1,如果多个摄像头,需要测试2，3其他参数,参数是视频文件路径则打开视频，如cap=cv2.VideoCapture(“../test.avi”)参数2：***设置cv2.CAP_DSHOW参数
4、FFmpeg命令行操作8 Qt学视觉音视频 ffmpeg c++开发语言
视频录制(Windows)先安装dshow软件ScreenCapturerRecorder，项目地址：onscreencapturerecordertovideofree-BrowseFilesatSourceForge.netonscreencapturerecordertovideowindowsfreeopensourcedirectshow"screencapture"deviceallo
ffmpeg中使用screen capture recorder录音的问题 Fandes_F 录屏 windows 后端 python c++c#
看完本篇文章，可以解决使用ffmpeg录屏时需要的screencapturerecorder软件过大问题在windows下使用ffmpeg的-gdigrab方法录屏是没有声音的！ffmpeg-fgdigrab-idesktoptest.mp4解决办法就是注册dshow软件ScreenCapturerRecorder的虚拟音频捕捉设备(virtual-audio-capturer)获取音频。现在网上
Windows UVC DShow IMoniker对象获取位置等属性的方法哇咔咔咔咔哇 UVC windows UVC
（1）获取设备路径通过IMoniker的BindToStorage(0,0,IID_IPropertyBag,(void**)&pBag)方法可以获取IPropertyBag对象，然后通过IPropertyBag对象的Read(L"DevicePath",&varDevPath,NULL)方法获取设备路径。voidGetMonikerDeviceInfo(IMoniker*pM){HRESULTh
ffmpeg RTMP 推流demo solomon415 ffmpeg学习实时音视频机器学习
ffmpeg官方的转码例子transcoding.c不涉及mp4的转码。本例推流包括两种方式推流：用mp4文件推流，或者通过dshow采集摄像头和麦克风的音视频流再推流。详细注释已添加到代码中，后面会持续完善。待跟踪项：1.硬件编码(h264_nvenc)的支持2.声音/视频pts、dts未完全同步。transcodingRtmpThread1.cpp#include"transcodingRtm
FFmpeg RTMP 推流demo 十年编程老舅音视频开发 ffmpeg RTMP RTSP ffmpeg推流 ffmpeg拉流 srs流媒体服务器 hls
ffmpeg官方的转码例子transcoding.c不涉及mp4的转码。本例推流包括两种方式推流：用mp4文件推流，或者通过dshow采集摄像头和麦克风的音视频流再推流。详细注释已添加到代码中，后面会持续完善。待跟踪项：1.硬件编码(h264_nvenc)的支持2.声音/视频pts、dts未完全同步。transcodingRtmpThread1.cpp#include"transcodingRtm
dshow枚举设备,声音回放... wgm001 程序笔记 null path audio server
HRESULTEnumerateAudioOutputFilters(IBaseFilter**pFilter)...{HRESULThr;ULONGcFetched;ICreateDevEnum*pSysDevEnum=NULL;IEnumMoniker*pEnumCat=NULL;IMoniker*pMoniker=NULL;charszDevName[MAX_PATH]=...{0};//创
WaveOut系列多段缓冲播放 wgm001 程序笔记 windows null 平台 mobile api
wave的播放方法很多，可以用dsound,dshow,甚至是sndPlay，sendMciString等等方法都可以实现。但是这都是对于windows平台下的音频播放，如果换到windowsmobile平台，就未必支持以上几种方式，这时就必须用到低级的wave系列的API了。步骤1：申请二个或二个以上的WAVEHDR结构，m_WaveHdr1，m_WaveHdr2填充WAVEHDR结构，如下:m
使用Vlc.DotNet打开摄像头并截图 C# weixin_34250709 c#
参考上一篇使用vlc打开usb摄像头理论上输入下面地址"dshow://:dshow-size=1600*1200:dshow-vdev=USBCAM2"C#就能打开摄像头了类似打开本地文件或者rtsp之类的网络地址但实际测试怎么着都是打开第一个摄像头，第二个怎么也打不开实际上vlc打开网络串流那里复制这个地址进去也是只能打开第一个摄像头注意到media.AddOption这个方法就试了一下，发现
音视频录制+RTMP直播推拉流音视频开发老舅音视频开发进阶音视频 ffmpeg C++音视频 RTMP RTSP
音视频录制：1，录音通过条件编译识别pc或者mac://条件编译技术识别pc或者mac#ifdefQ_OS_WIN#defineFMT_NAME"dshow"#defineDEVICE_NAME"audio=麦克风(RealtekAudio)"#else#defineFMT_NAME"avfoundation"#defineDEVICE_NAME":0"#endif根据short_name寻找自己
kdxf speex 彩云的笔记 speex kdxf
speeximportsubprocess#定义FFmpeg命令ffmpeg_command=['ffmpeg',#'-f','dshow','-i',r'd:\tug\iat_mp3_16k.mp3','-acodec','speex','-ar','16000','-ab','16000','-ac','1','output.spx']spxcmd='spxTest-enc1600071280
opencv报错：[SOURCEREADERCB::~SOURCEREADERCB TERMINATING ASYNC CALLBACK]解决方案白舟的博客抠脑问题 python 深度学习
问题：>读取图像可以但是按下ESC退出时就有问题。解决方法：**将**cap=cv2.VideoCapture(0,cv2.CAP_DSHOW)**改为：**videoSourceIndex=0cap=cv2.VideoCapture(cv2.CAP_DSHOW+videoSourceIndex)如果还不行可以将第三方库opencv-python的版本换成3.2.0的，可能是兼容性的问题。
音视频 ffmpeg命令视频录制(Windows) 苍天饶过谁？音视频开发学习音视频
先安装dshow软件ScreenCapturerRecorder，项目地址：https://sourceforge.net/projects/screencapturer/files/然后查看可用设备名字：ffmpeg-list_devicestrue-fdshow-idummy[dshow@0509d6c0]DirectShowvideodevices(somemaybebothvideoand
音视频 ffmpeg ffplay ffprobe命令行师从小白音视频 ffmpeg ffplay
ffmpeg工具命令格式ffmpeg[全局选项]{[输入选项]-iinput_url}...{[输出选项]output_url}...帮助命令#查看解封装帮助（dhavffmpeg4.2才有）ffmpeg-hdemuxer=dhavffmpeg-hdemuxer=dshow#查看流过滤器帮助ffmpeg-hbsf=h264_mp4toannexb#查看mp4封装器的选项帮助，比如movflags设
外置摄像头cv2.VideoCapture(0)过慢问题 _yxc___ bug日常记录 python 开发语言
cv2.VideoCapture(0)好像是加载内置摄像头的，将代码改为cap=cv2.VideoCapture(0,cv2.CAP_DSHOW)解决，如果将0改为1会出现报错
Python OpenCV读取并显示USB UVC摄像头 konga python opencv 开发语言
1.安装Python，略。2.安装OpenCV:pipinstallopencv-python3.预览摄像头画面脚本：importcv2cap=cv2.VideoCapture(0,cv2.CAP_DSHOW)ifnot(cap.isOpened()):print("Couldnotopenvideodevice")cap.set(cv2.CAP_PROP_FRAME_WIDTH,640)cap.
FFmpeg录屏和常用命令总结（不录制声音 Windows平台）光头小杨音视频音视频 Windows FFmpeg
一、ffmpeg录屏1、使用dshow录屏（1）下载安装dshow软件，下载地址dshow下载地址（2）检查dshow是否安装成功ffmpeg-list_devicestrue-fdshow-idummy（3）使用dshow录屏ffmpeg-y-fdshow-ivideo="screen-capture-recorder"-t27-r20-vcodeclibx264-s800x600-b:v100
python安装OpenCV qq_16740151 python OpenCV python opencv
安装OpenCVpipinstallopencv-pythonpythonOpenCV打开摄像头importcv2WIDTH=1080HEIGHT=720cap=cv2.VideoCapture(0,cv2.CAP_DSHOW)cap.set(cv2.CAP_PROP_FRAME_WIDTH,WIDTH)cap.set(cv2.CAP_PROP_FRAME_HEIGHT,HEIGHT)whileT
已解决：`anonymous-namespace‘::SourceReaderCB::~SourceReaderCB terminating async callback 书涵baci 机器学习经验总结 python 神经网络机器学习目标检测算法
问题描述opencv警告异常：解决方法：第一种：修改代码，添加一个参数；将cap=cv2.VideoCapture(0)改为：cap=cv2.VideoCapture(0,cv2.CAP_DSHOW)第二种：】windows系统下,运行命令cmd打开终端并输入下列代码：setxOPENCV_VIDEOIO_PRIORITY_MSMF0
ffmpeg 采集音频数据蓝天巨人 FFmpeg学习 ffmpeg 音视频
音视频数据采集的步骤：设备注册设置对应的采集方式，avfoundation、dshow、alas打开设备具体的例子:#includeextern"C"{#include#include#include#include}intmain(intargc,charconst*argv[]){/*code*///注册所有的设备avdevice_register_all();//输出的文件char*file
python 修改摄像头分辨率 Robin_Leslie python opencv
默认情况下，摄像头的分辨率的为：640X480查看摄像头的分辨率可以使用cap.shape函数，其中前两个值分别是高、宽值修改分辨率可以使用set方法对其修改，如改为1920X1080:importcv2#打开摄像头cap=cv2.VideoCapture(0+cv2.CAP_DSHOW)#设置分辨率cap.set(3,1920)cap.set(4,1080)修改窗口大小显示窗口大小可这样设置cv
python + opencv监测视频内容移动程序员小软 opencv python 计算机视觉
#-*-coding:UTF-8-*-importdatetimefromcollectionsimportdequeimportcv2importnumpyasnpimportmathimporttimefont=cv2.FONT_HERSHEY_PLAINcamera=cv2.VideoCapture(0,cv2.CAP_DSHOW)pre_frame=Nonefile_path="D:/te
obs windows10 下编译 freeswitch1993 obs二次开发 c++qt
1.下载obs源码：gitclonehttps://github.com/obsproject/obs-studio.git本demo主要采用27.2.4版本注意：进入obs/plugin/win-dshow拉取libdshowcapture工程，不然编译出来打不开摄像头gitcloneGitHub-obsproject/libdshowcapture:FreeandOpenSourceC++11
19_视频录制02_编程咸鱼Jay
本文的主要内容：演示如何通过编程采集摄像头的视频数据。整体的流程跟《08_音频录制02_编程》类似。依赖库需要依赖4个库。extern"C"{#include#include#include#include#include}宏定义#ifdefQ_OS_WIN//格式名称#defineFMT_NAME"dshow"//设备名称#defineDEVICE_NAME"video=IntegratedCa
OBS 进阶之摄像头操作清水迎朝阳 OBS进阶 OBS qt 录课直播 obs
目录一、摄像头1、win-dshow插件中，摄像头枚举操作1）、视频源ID2）、注册视频源信息
windows桌面采集（GDI、DSHOW、DXGI对比）玖零儛
桌面采集就是定时截取桌面的画面，并且将截取后的RGB画面通过某种编码方式（比如H264）压缩后再发送出去。采集的帧率达到20帧以上的时候，接收端再显示出来就有投屏的效果了。GDIWindows图形设备接口(GDI)是为与设备无关的图形设计的。基于Windows的应用程序不能直接访问图形硬件，应用程序通过GDI来与设备驱动程序进行交互。GDI截图就是通过屏幕的设备环境（DC）获取到当前屏幕的位图数据
ViewController添加button按钮解析。（翻译）张亚雄 c
<div class="it610-blog-content-contain" style="font-size: 14px"></div>// ViewController.m // Reservation software // // Created by 张亚雄 on 15/6/2.
mongoDB 简单的增删改查开窍的石头 mongodb
在上一篇文章中我们已经讲了mongodb怎么安装和数据库/表的创建。在这里我们讲mongoDB的数据库操作在mongo中对于不存在的表当你用db.表名他会自动统计下边用到的user是表明，db代表的是数据库添加(insert):
log4j配置 0624chenhong log4j
1) 新建java项目 2) 导入jar包，项目右击，properties—java build path—libraries—Add External jar，加入log4j.jar包。 3) 新建一个类com.hand.Log4jTest package com.hand; import org.apache.log4j.Logger; public class
多点触摸(图片缩放为例) 不懂事的小屁孩多点触摸
多点触摸的事件跟单点是大同小异的，上个图片缩放的代码，供大家参考一下 import android.app.Activity; import android.os.Bundle; import android.view.MotionEvent; import android.view.View; import android.view.View.OnTouchListener
有关浏览器窗口宽度高度几个值的解析换个号韩国红果果 JavaScript html
1 元素的 offsetWidth 包括border padding content 整体的宽度。 clientWidth 只包括内容区 padding 不包括border。 clientLeft = offsetWidth -clientWidth 即这个元素border的值 offsetLeft 若无已定位的包裹元素
数据库产品巡礼：IBM DB2概览蓝儿唯美 db2
IBM DB2是一个支持了NoSQL功能的关系数据库管理系统，其包含了对XML，图像存储和Java脚本对象表示（JSON）的支持。DB2可被各种类型的企业使用，它提供了一个数据平台，同时支持事务和分析操作，通过提供持续的数据流来保持事务工作流和分析操作的高效性。 DB2支持的操作系统 DB2可应用于以下三个主要的平台: 工作站，DB2可在Linus、Unix、Windo
java笔记5 a-john java
控制执行流程： 1，true和false 利用条件表达式的真或假来决定执行路径。例：（a==b）。它利用条件操作符“==”来判断a值是否等于b值，返回true或false。java不允许我们将一个数字作为布尔值使用，虽然这在C和C++里是允许的。如果想在布尔测试中使用一个非布尔值，那么首先必须用一个条件表达式将其转化成布尔值，例如if(a!=0)。 2，if-els
Web开发常用手册汇总 aijuans PHP
一门技术，如果没有好的参考手册指导,很难普及大众。这其实就是为什么很多技术，非常好，却得不到普遍运用的原因。正如我们学习一门技术，过程大概是这个样子： ①我们日常工作中，遇到了问题，困难。寻找解决方案，即寻找新的技术； ②为什么要学习这门技术？这门技术是不是很好的解决了我们遇到的难题，困惑。这个问题，非常重要，我们不是为了学习技术而学习技术，而是为了更好的处理我们遇到的问题，才需要学习新的
今天帮助人解决的一个sql问题 asialee sql
今天有个人问了一个问题，如下： type AD value A
意图对象传递数据百合不是茶 android 意图Intent Bundle对象数据的传递
学习意图将数据传递给目标活动; 初学者需要好好研究的 1,将下面的代码添加到main.xml中 <?xml version="1.0" encoding="utf-8"?> <LinearLayout xmlns:android="http:/
oracle查询锁表解锁语句 bijian1013 oracle object session kill
一.查询锁定的表如下语句，都可以查询锁定的表语句一： select a.sid, a.serial#, p.spid, c.object_name, b.session_id, b.oracle_username, b.os_user_name from v$process p, v$s
mac osx 10.10 下安装 mysql 5.6 二进制文件［tar.gz］征客丶 mysql osx
场景：在 mac osx 10.10 下安装 mysql 5.6 的二进制文件。环境：mac osx 10.10、mysql 5.6 的二进制文件步骤：[所有目录请从根“/”目录开始取，以免层级弄错导致找不到目录] 1、下载 mysql 5.6 的二进制文件，下载目录下面称之为 mysql5.6SourceDir；下载地址：http://dev.mysql.com/downl
分布式系统与框架 bit1129 分布式
RPC框架 Dubbo 什么是Dubbo Dubbo是一个分布式服务框架，致力于提供高性能和透明化的RPC远程服务调用方案，以及SOA服务治理方案。其核心部分包含: 远程通讯: 提供对多种基于长连接的NIO框架抽象封装，包括多种线程模型，序列化，以及“请求-响应”模式的信息交换方式。集群容错: 提供基于接
那些令人蛋痛的专业术语白糖_ spring Web SSO IOC
spring 【控制反转(IOC)/依赖注入(DI)】：由容器控制程序之间的关系，而非传统实现中，由程序代码直接操控。这也就是所谓“控制反转”的概念所在：控制权由应用代码中转到了外部容器，控制权的转移，是所谓反转。简单的说：对象的创建又容器(比如spring容器)来执行，程序里不直接new对象。 Web 【单点登录(SSO)】：SSO的定义是在多个应用系统中，用户
《给大忙人看的java8》摘抄 braveCS java8
函数式接口：只包含一个抽象方法的接口 lambda表达式：是一段可以传递的代码你最好将一个lambda表达式想象成一个函数，而不是一个对象，并记住它可以被转换为一个函数式接口。事实上，函数式接口的转换是你在Java中使用lambda表达式能做的唯一一件事。方法引用：又是要传递给其他代码的操作已经有实现的方法了，这时可以使
编程之美-计算字符串的相似度 bylijinnan java 算法编程之美
public class StringDistance { /** * 编程之美计算字符串的相似度 * 我们定义一套操作方法来把两个不相同的字符串变得相同，具体的操作方法为： * 1.修改一个字符（如把“a”替换为“b”）; * 2.增加一个字符（如把“abdd”变为“aebdd”）; * 3.删除一个字符（如把“travelling”变为“trav
上传、下载压缩图片 chengxuyuancsdn 下载
/** * * @param uploadImage --本地路径(tomacat路径) * @param serverDir --服务器路径 * @param imageType --文件或图片类型 * 此方法可以上传文件或图片.txt,.jpg,.gif等 */ public void upload(String uploadImage,Str
bellman-ford(贝尔曼-福特)算法 comsci 算法 F#
Bellman-Ford算法(根据发明者 Richard Bellman 和 Lester Ford 命名)是求解单源最短路径问题的一种算法。单源点的最短路径问题是指：给定一个加权有向图G和源点s，对于图G中的任意一点v，求从s到v的最短路径。有时候这种算法也被称为 Moore-Bellman-Ford 算法，因为 Edward F. Moore zu 也为这个算法的发展做出了贡献。与迪科
oracle ASM中ASM_POWER_LIMIT参数 daizj ASM oracle ASM_POWER_LIMIT 磁盘平衡
ASM_POWER_LIMIT 该初始化参数用于指定ASM例程平衡磁盘所用的最大权值，其数值范围为0~11，默认值为1。该初始化参数是动态参数，可以使用ALTER SESSION或ALTER SYSTEM命令进行修改。示例如下： SQL>ALTER SESSION SET Asm_power_limit=2;
高级排序:快速排序 dieslrae 快速排序
public void quickSort(int[] array){ this.quickSort(array, 0, array.length - 1); } public void quickSort(int[] array,int left,int right){ if(right - left <= 0
C语言学习六指针_何谓变量的地址一个指针变量到底占几个字节 dcj3sjt126com C语言
# include <stdio.h> int main(void) { /* 1、一个变量的地址只用第一个字节表示 2、虽然他只使用了第一个字节表示，但是他本身指针变量类型就可以确定出他指向的指针变量占几个字节了 3、他都只存了第一个字节地址，为什么只需要存一个字节的地址，却占了4个字节，虽然只有一个字节，但是这些字节比较多，所以编号就比较大，
phpize使用方法 dcj3sjt126com PHP
phpize是用来扩展php扩展模块的，通过phpize可以建立php的外挂模块,下面介绍一个它的使用方法,需要的朋友可以参考下安装（fastcgi模式）的时候，常常有这样一句命令：代码如下: /usr/local/webserver/php/bin/phpize 一、phpize是干嘛的？ phpize是什么？ phpize是用来扩展php扩展模块的，通过phpi
Java虚拟机学习 - 对象引用强度 shuizhaosi888 JAVA虚拟机
本文原文链接：http://blog.csdn.net/java2000_wl/article/details/8090276 转载请注明出处！无论是通过计数算法判断对象的引用数量，还是通过根搜索算法判断对象引用链是否可达，判定对象是否存活都与“引用”相关。引用主要分为：强引用(Strong Reference)、软引用(Soft Reference)、弱引用(Wea
.NET Framework 3.5 Service Pack 1（完整软件包）下载地址 happyqing .net 下载 framework
Microsoft .NET Framework 3.5 Service Pack 1（完整软件包） http://www.microsoft.com/zh-cn/download/details.aspx?id=25150 Microsoft .NET Framework 3.5 Service Pack 1 是一个累积更新，包含很多基于 .NET Framewo
JAVA定时器的使用 jingjing0907 java timer 线程定时器
1、在应用开发中，经常需要一些周期性的操作，比如每5分钟执行某一操作等。对于这样的操作最方便、高效的实现方式就是使用java.util.Timer工具类。 privatejava.util.Timer timer; timer = newTimer(true); timer.schedule( newjava.util.TimerTask() { public void run()
Webbench 流浪鱼 webbench
首页下载地址 http://home.tiscali.cz/~cz210552/webbench.html Webbench是知名的网站压力测试工具，它是由Lionbridge公司（http://www.lionbridge.com）开发。 Webbench能测试处在相同硬件上，不同服务的性能以及不同硬件上同一个服务的运行状况。webbench的标准测试可以向我们展示服务器的两项内容：每秒钟相
第11章动画效果（中） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
windows下制作bat启动脚本. sanyecao2314 java cmd 脚本 bat
java -classpath C:\dwjj\commons-dbcp.jar;C:\dwjj\commons-pool.jar;C:\dwjj\log4j-1.2.16.jar;C:\dwjj\poi-3.9-20121203.jar;C:\dwjj\sqljdbc4.jar;C:\dwjj\voucherimp.jar com.citsamex.core.startup.MainStart
Java进行RSA加解密的例子 tomcat_oracle java
加密是保证数据安全的手段之一。加密是将纯文本数据转换为难以理解的密文；解密是将密文转换回纯文本。　　数据的加解密属于密码学的范畴。通常，加密和解密都需要使用一些秘密信息，这些秘密信息叫做密钥，将纯文本转为密文或者转回的时候都要用到这些密钥。　　对称加密指的是发送者和接收者共用同一个密钥的加解密方法。　　非对称加密(又称公钥加密)指的是需要一个私有密钥一个公开密钥，两个不同的密钥的
Android_ViewStub 阿尔萨斯 ViewStub
public final class ViewStub extends View java.lang.Object android.view.View android.view.ViewStub 类摘要： ViewStub 是一个隐藏的，不占用内存空间的视图对象，它可以在运行时延迟加载布局资源文件。当 ViewSt

6.使用DirecrShow采集摄像头视音频并实时进行H264和AAC编码后封装成MP4

你可能感兴趣的:(DShow)