CBlueware

视频特效滤镜 via Media Foundation Transform (MFT)

视频特效滤镜 via Media Foundation Transform

视频特效定义
Media Foundation Transform

IMFTransform::GetInputStreamInfo 函数
IMFTransform::GetOutputStreamInfo 函数
IMFTransform::GetInputAvailableType 函数

CGrayscale::OnGetPartialType 函数

IMFTransform::SetInputType 函数

CGrayscale::OnCheckInputType 函数

CGrayscale::OnCheckMediaType 函数

CGrayscale::OnSetInputType 函数

IMFTransform::SetOutputType 函数
IMFTransform::ProcessMessage 函数
IMFTransform::ProcessInput 函数
IMFTransform::ProcessOutput 函数

CGrayscale::OnProcessOutput 函数

其他框架的滤镜

视频特效定义

视频特效（Video effects 或 Visual effects）是对每帧图像进行各种数字化处理达到的效果。如对画面的尺寸、位置、亮度及色度等参数进行处理，就可获得缩放、旋转、黑白、油画等各种效果。

常见的特效技术有：缩放、旋转、裁剪、叠加、老电影、黑白、淡入淡出、水印、去噪、慢动作、2D 转 3D 等等。

Media Foundation Transform

MF 中插件是以 MFT 的形式创建的，需要继承 IMFTransform 接口，接口函数如下：

// Methods That Handle Format Negotiation
STDMETHODIMP GetStreamLimits(DWORD *pInputMinimum, DWORD *pInputMaximum, DWORD *pOutputMinimum, DWORD *pOutputMaximum);
STDMETHODIMP GetStreamCount(DWORD *pcInputStreams, DWORD *pcOutputStreams);
STDMETHODIMP GetStreamIDs(DWORD dwInputIDArraySize, DWORD *pdwInputIDs, DWORD dwOutputIDArraySize, DWORD *pdwOutputIDs);
STDMETHODIMP GetInputStreamInfo(DWORD dwInputStreamID, MFT_INPUT_STREAM_INFO *pStreamInfo);
STDMETHODIMP GetOutputStreamInfo(DWORD dwOutputStreamID, MFT_OUTPUT_STREAM_INFO *pStreamInfo);
STDMETHODIMP GetAttributes(IMFAttributes **ppAttributes);
STDMETHODIMP GetInputStreamAttributes(DWORD dwInputStreamID, IMFAttributes **ppAttributes);
STDMETHODIMP GetOutputStreamAttributes(DWORD dwOutputStreamID, IMFAttributes **ppAttributes);
STDMETHODIMP GetInputAvailableType(DWORD dwInputStreamID, DWORD dwTypeIndex, IMFMediaType **ppType);
STDMETHODIMP GetOutputAvailableType(DWORD dwOutputStreamID, DWORD dwTypeIndex, IMFMediaType **ppType);
STDMETHODIMP SetInputType(DWORD dwInputStreamID, IMFMediaType *pType, DWORD dwFlags);
STDMETHODIMP SetOutputType(DWORD dwOutputStreamID, IMFMediaType *pType, DWORD dwFlags);

// Methods That Specify or Retrieve State Information
STDMETHODIMP GetInputCurrentType(DWORD dwInputStreamID, IMFMediaType **ppType);
STDMETHODIMP GetOutputCurrentType(DWORD dwOutputStreamID, IMFMediaType **ppType);
STDMETHODIMP DeleteInputStream(DWORD dwStreamID);
STDMETHODIMP AddInputStreams(DWORD cStreams, DWORD *adwStreamIDs);
STDMETHODIMP GetInputStatus(DWORD dwInputStreamID, DWORD *pdwFlags);
STDMETHODIMP GetOutputStatus(DWORD *pdwFlags);
STDMETHODIMP SetOutputBounds(LONGLONG hnsLowerBound, LONGLONG hnsUpperBound);

// Methods That Handle Buffering and Processing Data
STDMETHODIMP ProcessEvent(DWORD dwInputStreamID, IMFMediaEvent *pEvent);
STDMETHODIMP ProcessMessage(MFT_MESSAGE_TYPE eMessage, ULONG_PTR ulParam);
STDMETHODIMP ProcessInput(DWORD dwInputStreamID, IMFSample *pSample, DWORD dwFlags);
STDMETHODIMP ProcessOutput(DWORD dwFlags, DWORD cOutputBufferCount, MFT_OUTPUT_DATA_BUFFER *pOutputSamples, DWORD *pStatus);

如果要实现一个异步的 MFT，则还需要继承 IMFMediaEventGenerator 和 IMFShutdown 接口。

// IMFMediaEventGenerator
HRESULT BeginGetEvent(IMFAsyncCallback *pCallback, IUnknown *punkState);
HRESULT EndGetEvent(IMFAsyncResult *pResult, IMFMediaEvent **ppEvent);
HRESULT GetEvent(DWORD dwFlags, IMFMediaEvent **ppEvent);
HRESULT QueueEvent(MediaEventType met, REFGUID guidExtendedType, HRESULT hrStatus, const PROPVARIANT *pvValue);

// IMFShutdown
HRESULT GetShutdownStatus(MFSHUTDOWN_STATUS *pStatus);
HRESULT Shutdown();

下面介绍一下 IMFTransform 的几个比较重要的接口，以一个灰度化视频的插件为例。
代码包含在 Windows SDK 7.x 的 samples\multimedia\mediafoundation\mft_grayscale\ 目录下。

IMFTransform::GetInputStreamInfo 函数

对输入流的要求，比如视频 sample 必须完整且只有一个 buffer，流的大小等等。

HRESULT CGrayscale::GetInputStreamInfo(DWORD dwInputStreamID, MFT_INPUT_STREAM_INFO *pStreamInfo)
{
    AutoLock lock(m_critSec);
    if (pStreamInfo == NULL)
        return E_POINTER;
    
    if (!IsValidInputStream(dwInputStreamID))
        return MF_E_INVALIDSTREAMNUMBER;

    // NOTE: This method should succeed even when there is no media type on the stream. 
    //       If there is no media type, we only need to fill in the dwFlags member of 
    //       MFT_INPUT_STREAM_INFO. The other members depend on having a valid media type.
    pStreamInfo->hnsMaxLatency = 0;
    pStreamInfo->dwFlags = MFT_INPUT_STREAM_WHOLE_SAMPLES | MFT_INPUT_STREAM_SINGLE_SAMPLE_PER_BUFFER ;

    if (m_pInputType == NULL)
        pStreamInfo->cbSize = 0;
    else
        pStreamInfo->cbSize = m_cbImageSize;

    pStreamInfo->cbMaxLookahead = 0;
    pStreamInfo->cbAlignment = 0;
    return S_OK;
}

IMFTransform::GetOutputStreamInfo 函数

输出流的信息，比如视频 sample 是完整且固定大小的，流的大小等等。

HRESULT CGrayscale::GetOutputStreamInfo(DWORD dwOutputStreamID, MFT_OUTPUT_STREAM_INFO *pStreamInfo)
{
    AutoLock lock(m_critSec);
    if (pStreamInfo == NULL)
        return E_POINTER;
        
    if (!IsValidOutputStream(dwOutputStreamID))
        return MF_E_INVALIDSTREAMNUMBER;

    // NOTE: This method should succeed even when there is no media type on the stream. 
    //       If there is no media type, we only need to fill in the dwFlags member of 
    //       MFT_OUTPUT_STREAM_INFO. The other members depend on having a valid media type.
    pStreamInfo->dwFlags = 
        MFT_OUTPUT_STREAM_WHOLE_SAMPLES | 
        MFT_OUTPUT_STREAM_SINGLE_SAMPLE_PER_BUFFER |
        MFT_OUTPUT_STREAM_FIXED_SAMPLE_SIZE ;

    if (m_pOutputType == NULL)
        pStreamInfo->cbSize = 0;
    else
        pStreamInfo->cbSize = m_cbImageSize;
    pStreamInfo->cbAlignment = 0;
    return S_OK;
}

IMFTransform::GetInputAvailableType 函数

获取支持的输入媒体类型，如果输出类型已设置，则要求输入和输出类型一致，否则提供一组可接受的类型。

HRESULT CGrayscale::GetInputAvailableType(
    DWORD           dwInputStreamID,    // Input stream ID.
    DWORD           dwTypeIndex,        // 0-based index into the list of preferred types.
    IMFMediaType    **ppType            // Receives a pointer to the media type.
    )
{
    AutoLock lock(m_critSec);
    if (ppType == NULL)
        return E_INVALIDARG;
        
    if (!IsValidInputStream(dwInputStreamID))
        return MF_E_INVALIDSTREAMNUMBER;
        
    HRESULT hr = S_OK;
    // If the output type is set, return that type as our preferred input type.
    if (this->m_pOutputType) {
        if (dwTypeIndex > 0)
            return MF_E_NO_MORE_TYPES;
            
        *ppType = m_pOutputType;
        (*ppType)->AddRef();
    }
    else // The output type is not set. Create a partial media type.
        hr = OnGetPartialType(dwTypeIndex, ppType);
        
    return hr;
}

CGrayscale::OnGetPartialType 函数

可接受的媒体类型，此处只提供了三种（理论上没有限制）：

NV12
YUY2
UYVY

const GUID* g_MediaSubtypes[] = 
{
    & MEDIASUBTYPE_NV12,
    & MEDIASUBTYPE_YUY2,
    & MEDIASUBTYPE_UYVY,
};

HRESULT CGrayscale::OnGetPartialType(DWORD dwTypeIndex, IMFMediaType **ppmt)
{
    HRESULT hr = S_OK;
    if (dwTypeIndex >= g_cNumSubtypes)
        return MF_E_NO_MORE_TYPES;

    IMFMediaType *pmt = NULL;
    CHECK_HR(hr = MFCreateMediaType(&pmt));
    CHECK_HR(hr = pmt->SetGUID(MF_MT_MAJOR_TYPE, MFMediaType_Video));
    CHECK_HR(hr = pmt->SetGUID(MF_MT_SUBTYPE, *g_MediaSubtypes[dwTypeIndex]));

    *ppmt = pmt;
    (*ppmt)->AddRef();
done:
    SAFE_RELEASE(pmt);
    return hr;
}

IMFTransform::SetInputType 函数

MF session 尝试设置某个输入媒体类型到该 MFT，可以是 Test Only 的，如果接受该类型，则返回成功，否则返回失败。

HRESULT CGrayscale::SetInputType( DWORD dwInputStreamID,
      IMFMediaType    *pType, // Can be NULL to clear the input type.
      DWORD           dwFlags )
{
    AutoLock lock(m_critSec);
    if (!IsValidInputStream(dwInputStreamID))
        return MF_E_INVALIDSTREAMNUMBER;
        
    if (dwFlags & ~MFT_SET_TYPE_TEST_ONLY)
        return E_INVALIDARG;
        
    HRESULT hr = S_OK;
    // Does the caller want us to set the type, or just test it?
    BOOL bReallySet = ((dwFlags & MFT_SET_TYPE_TEST_ONLY) == 0);
    
    // If we have an input sample, the client cannot change the type now.
    if (HasPendingOutput())
        CHECK_HR(hr = MF_E_TRANSFORM_CANNOT_CHANGE_MEDIATYPE_WHILE_PROCESSING);
        
    if (pType)
        CHECK_HR(hr = OnCheckInputType(pType));
        
    // The type is OK. Set the type, unless the caller was just testing.
    if (bReallySet)
        CHECK_HR(hr = OnSetInputType(pType));
done:
    return hr;
}

CGrayscale::OnCheckInputType 函数

检查输入类型，如果已设置输出类型，则要求一致，否则做视频类型检查（OnCheckMediaType）。

HRESULT CGrayscale::OnCheckInputType(IMFMediaType *pmt)
{
    assert(pmt != NULL);
    HRESULT hr = S_OK;

    // If the output type is set, see if they match.
    if (m_pOutputType != NULL) {
        DWORD flags = 0;
        hr = pmt->IsEqual(m_pOutputType, &flags);

        // IsEqual can return S_FALSE. Treat this as failure.
        if (hr != S_OK)
            hr = MF_E_INVALIDMEDIATYPE;
    }
    else
        // Output type is not set. Just check this type.
        hr = OnCheckMediaType(pmt);

    return hr;
}

CGrayscale::OnCheckMediaType 函数

检测视频类型是否符合该 MFT 的要求。

HRESULT CGrayscale::OnCheckMediaType(IMFMediaType *pmt)
{
    GUID major_type = GUID_NULL;
    GUID subtype = GUID_NULL;
    BOOL bFoundMatchingSubtype = FALSE;
    HRESULT hr = S_OK;
    
    CHECK_HR(hr = pmt->GetGUID(MF_MT_MAJOR_TYPE, &major_type));
    RETURN_IF_FALSE_EX(major_type == MFMediaType_Video, MF_E_INVALIDMEDIATYPE);
    
    // Subtype must be one of the subtypes in our global list.
    CHECK_HR(hr = pmt->GetGUID(MF_MT_SUBTYPE, &subtype));
    
    for (DWORD i = 0; i < g_cNumSubtypes; i++) {
        if (subtype == *g_MediaSubtypes[i]) {
            bFoundMatchingSubtype = TRUE;
            break;
        }
    }
    
    RETURN_IF_FALSE_EX(bFoundMatchingSubtype, MF_E_INVALIDMEDIATYPE);
done:
    return hr;
}

CGrayscale::OnSetInputType 函数

设置或清除输入媒体类型，并获得一帧图像的宽高和大小。

HRESULT CGrayscale::OnSetInputType(IMFMediaType *pmt)
{
    SAFE_RELEASE(m_pInputType);
    m_pInputType = pmt;
    if (m_pInputType)
        m_pInputType->AddRef();
        
    m_imageWidthInPixels = 0;
    m_imageHeightInPixels = 0;
    m_videoFOURCC = 0;
    m_cbImageSize = 0;
    m_pTransformFn = NULL;
    
    if (m_pInputType != NULL) {
        GUID subtype = GUID_NULL;
        CHECK_HR(hr = m_pInputType->GetGUID(MF_MT_SUBTYPE, &subtype));
        
        m_videoFOURCC = subtype.Data1;
        switch (m_videoFOURCC) {
            case FOURCC_YUY2: 
                m_pTransformFn = TransformImage_YUY2;
             	break;
            case FOURCC_UYVY:
                m_pTransformFn = TransformImage_UYVY;
             	break;
            case FOURCC_NV12:
                m_pTransformFn = TransformImage_NV12;
             	break;
            default:
                CHECK_HR(hr = E_UNEXPECTED);
        }
        
        CHECK_HR(hr = MFGetAttributeSize( m_pInputType, MF_MT_FRAME_SIZE, &m_imageWidthInPixels, &m_imageHeightInPixels ));
        CHECK_HR(hr = GetImageSize(m_videoFOURCC, m_imageWidthInPixels, m_imageHeightInPixels, &m_cbImageSize));
    }
    
    return S_OK;
}

IMFTransform::SetOutputType 函数

MF session 尝试设置某个输出媒体类型到该 MFT，可以是 Test Only 的，如果接受该类型，则返回成功，否则返回失败。检查过程类似 SetInputType，故此处不展开。

HRESULT CGrayscale::SetOutputType( DWORD dwOutputStreamID,
    IMFMediaType    *pType, // Can be NULL to clear the output type.
    DWORD           dwFlags )
{
    AutoLock lock(m_critSec);
    if (!IsValidOutputStream(dwOutputStreamID))
        return MF_E_INVALIDSTREAMNUMBER;
        
    if (dwFlags & ~MFT_SET_TYPE_TEST_ONLY)
        return E_INVALIDARG;
        
    HRESULT hr = S_OK;
    // Does the caller want us to set the type, or just test it?
    BOOL bReallySet = ((dwFlags & MFT_SET_TYPE_TEST_ONLY) == 0);
     
    // If we have an input sample, the client cannot change the type now.
    if (HasPendingOutput())
        CHECK_HR(hr = MF_E_TRANSFORM_CANNOT_CHANGE_MEDIATYPE_WHILE_PROCESSING);
        
    if (pType)
        CHECK_HR(hr = OnCheckOutputType(pType));
        
    if (bReallySet) // The type is OK. Set the type, unless the caller was just testing.
        CHECK_HR(hr = OnSetOutputType(pType));
done:
    return hr;
}

IMFTransform::ProcessMessage 函数

处理发送到该 MFT 的消息。

HRESULT CGrayscale::ProcessMessage(MFT_MESSAGE_TYPE eMessage, ULONG_PTR ulParam)
{
    AutoLock lock(m_critSec);
    HRESULT hr = S_OK;
    
    switch (eMessage) {
    case MFT_MESSAGE_COMMAND_FLUSH:
        hr = OnFlush();
        break;
    case MFT_MESSAGE_COMMAND_DRAIN:
        // Drain: Tells the MFT not to accept any more input until all of the pending output
        // has been processed. That is our default behavior already, so there is nothing to do.
        break;
    case MFT_MESSAGE_SET_D3D_MANAGER:
        // The pipeline should never send this message unless the MFT has the MF_SA_D3D_AWARE attribute 
        // set to TRUE. However, if we do get this message, it's invalid and we don't implement it.
        hr = E_NOTIMPL;
        break;
    // The remaining messages do not require any action from this MFT.
    case MFT_MESSAGE_NOTIFY_BEGIN_STREAMING:
    case MFT_MESSAGE_NOTIFY_END_STREAMING:
    case MFT_MESSAGE_NOTIFY_END_OF_STREAM:
    case MFT_MESSAGE_NOTIFY_START_OF_STREAM: 
        break;
    } 
    return hr;
}

IMFTransform::ProcessInput 函数

处理一个输入的 sample，这里主要是把该 sample 缓存起来。

HRESULT CGrayscale::ProcessInput( DWORD dwInputStreamID, IMFSample *pSample, DWORD dwFlags )
{
    AutoLock lock(m_critSec);
    RETURN_IF_NULL(pSample);
    RETURN_IF_FALSE_EX(dwFlags == 0, E_INVALIDARG); // dwFlags is reserved and must be zero.
    
    if (!IsValidInputStream(dwInputStreamID))
        return MF_E_INVALIDSTREAMNUMBER;
        
    if (!m_pInputType || !m_pOutputType)
        return MF_E_NOTACCEPTING;   // Client must set input and output types.
        
    if (m_pSample != NULL)
        return MF_E_NOTACCEPTING;   // We already have an input sample.
        
    HRESULT hr = S_OK;
    DWORD dwBufferCount = 0;
    // Validate the number of buffers. There should only be a single buffer to hold the video frame. 
    hr = pSample->GetBufferCount(&dwBufferCount);
    RETURN_IF_FAILED(hr);
    RETURN_IF_FALSE(dwBufferCount > 0);
    RETURN_IF_TRUE(dwBufferCount > 1, MF_E_SAMPLE_HAS_TOO_MANY_BUFFERS);
    
    // Cache the sample. We do the actual work in ProcessOutput.
    m_pSample = pSample;
    pSample->AddRef();  // Hold a reference count on the sample.
    return hr;
}

IMFTransform::ProcessOutput 函数

处理一个输出 sample 的请求，如果尚未有输入，则请求输入（返回 MF_E_TRANSFORM_NEED_MORE_INPUT），否则进行处理（特效算法），最后设置 sample 的 duration 和 timestamp。

HRESULT CGrayscale::ProcessOutput(
    DWORD dwFlags,
    DWORD cOutputBufferCount, 
    MFT_OUTPUT_DATA_BUFFER *pOutputSamples,
    DWORD *pdwStatus)
{
    AutoLock lock(m_critSec);
    if (m_pSample == NULL)
        return MF_E_TRANSFORM_NEED_MORE_INPUT;
        
    HRESULT hr = S_OK;
    
    IMFMediaBuffer *pInput = NULL;
    CHECK_HR(hr = m_pSample->ConvertToContiguousBuffer(&pInput));
    
    IMFMediaBuffer *pOutput = NULL;
    CHECK_HR(hr = pOutputSamples[0].pSample->ConvertToContiguousBuffer(&pOutput));
    
    CHECK_HR(hr = OnProcessOutput(pInput, pOutput));
    
    pOutputSamples[0].dwStatus = 0; 
    *pdwStatus = 0;
    LONGLONG hnsDuration = 0;
    
    if (SUCCEEDED(m_pSample->GetSampleDuration(&hnsDuration)))
        CHECK_HR(hr = pOutputSamples[0].pSample->SetSampleDuration(hnsDuration));
        
    LONGLONG hnsTime = 0;
    if (SUCCEEDED(m_pSample->GetSampleTime(&hnsTime)))
        CHECK_HR(hr = pOutputSamples[0].pSample->SetSampleTime(hnsTime));
done:
    SAFE_RELEASE(m_pSample);
    SAFE_RELEASE(pInput);
    SAFE_RELEASE(pOutput);
    return hr;
}

CGrayscale::OnProcessOutput 函数

获得输入输出 buffer 指针后调用算法函数进行处理，最后别忘了设置有效 buffer 的长度。

HRESULT CGrayscale::OnProcessOutput(IMFMediaBuffer *pIn, IMFMediaBuffer *pOut)
{
    HRESULT hr = S_OK;
    BYTE *pDest = NULL;         // Destination buffer.
    LONG lDestStride = 0;       // Destination stride.
    BYTE *pSrc = NULL;          // Source buffer.
    LONG lSrcStride = 0;        // Source stride.
    
    VideoBufferLock inputLock(pIn);
    VideoBufferLock outputLock(pOut);
    LONG lDefaultStride = 0;
    CHECK_HR(hr = GetDefaultStride(m_pInputType, &lDefaultStride));    
    CHECK_HR(hr = inputLock.LockBuffer(lDefaultStride, this->m_imageHeightInPixels, &pSrc, &lSrcStride));    
    CHECK_HR(hr = outputLock.LockBuffer(lDefaultStride, m_imageHeightInPixels, &pDest, &lDestStride));
    
    // Invoke the image transform function.
    if (m_pTransformFn)
        (*m_pTransformFn)( pDest, lDestStride, pSrc, lSrcStride, m_imageWidthInPixels, m_imageHeightInPixels);
    else
        CHECK_HR(hr = E_UNEXPECTED);
        
    CHECK_HR(hr = pOut->SetCurrentLength(m_cbImageSize));
done:
    return S_OK;
}

其他框架的滤镜

关于 FFmpeg 的视频滤镜请参考这里。
关于 DirectShow 的视频滤镜请参考这里。

– EOF –

Ubuntu+Qt+SDL2+FFmpeg DarcyZhou
此文档用于Ubuntu系统中搭建FFmpeg的开发环境。Qt作为开发软件，SDL2是一套开放源代码的跨平台多媒体开发库。1.安装Qt（1）下载版本：qt-opensource-linux-x64-5.9.8.runimage.png（2）安装给文件添加可执行权限：sudochmod-R777qt-opensource-linux-x64-5.9.8.run开始安装：安装过程中选择全部安装即可。（需
QT进行音频录制金博客 Qt qt 音视频 c++
文章目录QT使用`AudioRecorder`进行音频录制首先，确保你的项目文件`.pro`包含多媒体模块：然后，在Qt应用程序中，创建Widget类：小结QT使用AudioRecorder进行音频录制使用Qt框架的AudioRecorder类进行音频录制，可以通过Qt的MultimediaWidgets模块实现。‌首先，确保你的Qt项目中包含了MultimediaWidgets模块‌。这通常在项
VGA、DVI显示接口为何逐步淘汰了佣兵之王@大青山『硬件』液晶屏测试行业 VGA
如今显示器上最常用的接口无非HDMI（HighDefinitionMultimediaInterface）与DP（DisplayPort）两种，VGA与DVI已经很少使用。VGA传输的是模拟信号，在发送端需要将数字信号转换为模拟信号，在接收端又需要把模拟信号转换成数字信号，模拟信号在传输过程中及其容易受到外界干扰，逐渐被淘汰。DVI接口与HDMI接口类似，都是传输数字信号，但只能传输视频信号，不能
0-HDMI高速接口协议基础介绍芯片SIPI设计
高清多媒体接口(HDMI，HighDefinitionMultimediaInterface)是一种数字化视频/音频接口技术，是适合影像传输的专用型数字化接口，其可同时传送音频和视频信号，同时无需在信号传送前进行数/模或者模/数转换。从2002年HDMI发布最初的版本HDMI1.0，在经历了HDMI1.1、HDMI1.2、HDMI1.2a、HDMI1.3、HDMI1.4后，最新的版本是HDMI2.
Python学习笔记36：进阶篇(二十五)pygame的使用之事件监听控制切歌和暂停，继续播放明月望秋思学习 python pygame python 学习
前言基础模块的知识通过这么长时间的学习已经有所了解，更加深入的话需要通过完成各种项目，在这个过程中逐渐学习，成长。我们的下一步目标是完成pythoncrashcourse中的外星人入侵项目，这是一个2D游戏项目。在这之前，我们先简单学习一下pygame模块。私信我发送消息python资料，领取pythoncrashcourse中文版PDF。pygamePygame是一个开源的Python多媒体开发
FFmpeg和SDL的关系星海逐愿随笔 ffmpeg
SDL（SimpleDirectMediaLayer）和FFmpeg是两个在多媒体开发中常用的开源库，但它们各自的功能和用途有所不同，通常一起使用以实现完整的多媒体处理和播放解决方案。1.FFmpeg的作用FFmpeg是一个强大的多媒体框架，用于录制、转换和流式传输音视频。它包含了大量的音视频编解码器和格式支持，可以处理几乎所有已知的多媒体格式。FFmpeg主要用于：视频解码和编码：将视频文件解码
Qt第十六章多媒体Multimedia yerennuo qt 开发语言
文章目录多媒体音频播放音频录制音频低延迟音效低级音频播放和录制推送和拉取解码压缩音频到内存与音频处理相关的类视频播放视频处理低级视频帧录制视频与视频处理相关的类支持的媒体格式多媒体cmakelist添加Multimedia模块设备信息查询#include#include#include#includevoidshowDevs(){QListinAudios=QMediaDevices::audio
鸿蒙（API 12 Beta3版）【DRM会话管理(C/C++)】数字版权保护开发移动开发技术栈鸿蒙开发 harmonyos c语言 c++openharmony 媒体鸿蒙鸿蒙系统
DRM会话管理（MediaKeySession）支持媒体密钥管理及媒体解密等，MediaKeySession实例由系统管理里的MediaKeySystem实例创建和销毁。开发步骤导入NDK接口，接口中提供了DRM相关的属性和方法，导入方法如下。#include"multimedia/drm_framework/native_drm_common.h"#include"multimedia/drm_
Qt Multimedia 在 Qt6.2中的新变化 dingyuana qt 音视频
英文原文---Qt6.2的第一个测试版刚刚发布，在多个其他新附加组件中加入了全新的Qt多媒体模块。QtMultimedia是一个在Qt6中发生了较大变化的模块。在很多方面，它是一个新的API和实现，尽管我们重新使用了Qt5.15中的一些代码。虽然我们试图为我们的大多数模块保持Qt5和Qt6之间尽可能多的源代码兼容性，但我们不得不在此处进行大量更改以使API和实现适合未来，最终决定以最好的为目标AP
cmake添加QT multimedia包(mac,ubantu) 熊明之 camke Qt macos qt 开发语言 cmake
现有的百度关于cmake添加QTmultimedia包(mac,ubantu)都是错误，正确的添加方式如下，cmake添加2行set(Qt5MultimediaWidgets_DIR**/Qt5.9.8/5.9.8/clang_64/lib/cmake/Qt5MultimediaWidgets)#包的位置target_link_libraries(${PROJECT_NAME}Qt5::Widge
阅读笔记（TMM2021）Natural image stitching with layered warping constraint J@u1 传统版图像拼接图像拼接
ZhangZ,YangX,XuC.Naturalimagestitchingwithlayeredwarpingconstraint[J].IEEETransactionsonMultimedia,2021.
阅读笔记（TMM2022）Image stitching with manifold optimization J@u1 传统版图像拼接笔记图像拼接
ZhangL,HuangH.Imagestitchingwithmanifoldoptimization[J].IEEETransactionsonMultimedia,2022.
Vscode python pyside6 制作视频播放器 __lost Python 编程和应用实现 QT python 音视频开发语言
一、界面如下包含控件qcombox、qtablewidget、qpushbotton、qverticalslider二、运行代码media_player.pyimportsysfromPySide6importQtWidgetsfromPySide6.QtWidgetsimport*fromPySide6.QtMultimediaimport*fromPySide6.QtMultimediaWid
HTML5的世界 bestlove13141516 CSS HTML5的世界
HT本文作者王安，DCloud公司CEO，W3C会员、HTML5中国产业联盟发起人，HTML5开发工具HBuilder设计师，十几年web和手机开发经验。我们第一次谈论HTML5要改变世界大概是因为乔布斯，他坚持在iOS上不兼容Flash，在Adobe统治多媒体开发的那个年代，这需要付出极大的勇气。这么多年过去了，虽然所有人都在谈论HTML5，但是大部分人甚至都忘了它还是一个仍在完善中的体系。20
为何家里的WIFI用手机看电影很流畅,一点都不卡,但是浏览新闻和网页有时却很卡很慢,甚至打不开? CarlXu
是光猫是设置问题。看光猫背面的IP，浏览器地址栏输入这个IP，登录。把WMM选项关闭。WMM是音视频媒体优先播放wmm(无线多媒体)是802.11e标准的一个子集。wmm允许无线通信根据数据类型定义一个优先级范围。时间敏感的数据，如视频/音频数据将比普通的数据有更高的优先级。为了使wmm功能工作，无线客户端必须也支持wmm。客户可以根据需求选择是或否。MM(Wi-FiMultiMedia)是Wi-
Confluence 6 多媒体文件和在页面中显示文件列表 HoneyMoose
多媒体文件文件的预览同时也支持MP3音频和MP4视频文件。Confluence使用HTML5来播放附加的音频和视频文件。这个意味着这些文件类型的文件格式，用户可以在支持的浏览器中直接进行播放。你同时也可以显示其他很多类型的多媒体文件（视频，音频和动画），你需要使用多媒体（Multimedia）宏.显示在线视频（例如YouTube或者Vimeo视频），你需要使用组件（Widget）连接器宏.在页面中
Days 20 ElfBoard 板 FFmpeg移植 chriss854 ffmpeg 单片机嵌入式硬件
FFmpeg是一套可以用来记录、转换数字音频、视频，并能将其转化为流的开源计算机程序。采用LGPL或GPL许可证。它提供了录制、转换以及流化音视频的完整解决方案。因此，对于从事多媒体技术开发的工程师来说，深入研究FFMPEG成为一门必不可少的工作，可以这样说，FFMPEG之于多媒体开发工程师的重要性正如kernel之于嵌入式系统工程师一般。配置交叉编译环境ELFbord官方使用的是arm-poky
Qt金币游戏蔡徐坤学C++ QT qt 游戏 ui
firstgame.proCONFIG+=c++11QT+=multimediadataconfig.h略guanqia.h#ifndefGUANQIA_H#defineGUANQIA_H#include#include"play.h"classguanqia:publicQMainWindow{Q_OBJECTpublic:explicitguanqia(QWidget*parent=nullp
2D游戏引擎ColdDew开发（二）——在Visual Studio上配置SDL2库林玄机独立游戏 SDL2 游戏引擎
什么是SDL参考文献：http://lazyfoo.net/tutorials/SDL/SDL（英语：SimpleDirectMediaLayer）是一套开放源代码的跨平台多媒体开发库，使用C语言写成。SDL提供了数种控制图像、声音、输出入的函数，让开发者只要用相同或是相似的代码就可以开发出跨多个平台（Linux、Windows、MacOSX等）的应用软件。当前SDL多用于开发游戏、模拟器、媒体播
SDL简述稚肩音视频开发 #ffmpeg 音视频 linux
SimpleDirectMediaLayer（SDL）是一个跨平台的多媒体开发库，提供了对图形、音频、输入设备等底层操作的支持，使得开发者能够更方便地创建跨平台的多媒体应用程序。SDL被设计为轻量级且易于使用，主要用于游戏开发和嵌入式系统等领域。主要特点跨平台性：SDL致力于提供跨平台的解决方案，使得开发者可以在不同的操作系统上编写相同的代码，而不必过多关心平台差异。图形处理：SDL支持基本的图形
鸿蒙HarmonyOS开发实战—多媒体开发（媒体数据管理开发）蜀道山QAQ 鸿蒙 harmonyos 媒体华为观察者模式鸿蒙系统音视频
一、媒体数据管理开发概述HarmonyOS媒体数据管理模块支持多媒体数据管理相关的功能开发，常见操作如：获取媒体元数据、截取帧数据等。在进行应用的开发前，开发者应了解以下基本概念：PixelMapPixelMap是图像解码后无压缩的位图格式，用于图像显示或者进一步的处理。媒体元数据媒体元数据是用来描述多媒体数据的数据，例如媒体标题、媒体时长等数据信息。约束与限制为及时释放native资源，建议在媒
HarmonyOS初级案例：基础通知模块劉鎠 harmonyos 华为
该段代码通过案例简单介绍基础通知的4种通知内容类型的用法，欢迎阅读评价，如有大佬发现有可更正的地方也欢迎指点一二，非常感谢！！！importnotifyfrom'@ohos.notificationManager'importimagefrom'@ohos.multimedia.image'@Entry@ComponentstructInformPage{//ididx:number=100//p
腾讯主导制定全球首个车载小程序国际标准，助力车载应用生态发展 zhangjian857 小程序
2024年1月，国际电信联盟标准部门（ITU-T）正式发布了由腾讯主导制定的《F.749.8In-vehiclemultimediaapplets:Frameworkandfunctionalrequirements》(车载多媒体小程序框架和技术需求)国际标准。这是全球首个由中国企业主导制定的车载小程序国际标准，旨在为全球车载小程序应用框架提供技术指南，为汽车行业的设备互联、数据交换和服务共享等问
Android Media API 使用介绍大飞飞鱼 WebRTC 视频直播技术移动直播技术 Android多媒体接口
从事多媒体开发的同学，在对Android系统开发时，Android系统已经给我们提供了对视音频的强大支持，本文介绍Android的几个和视音频相关的类，通过这几个类的组合使用，其实是能变换出许多视音频处理的相关功能，下面就对这几个类进行简单介绍。MediaMetadataRetriever:用来获取视频的相关信息，例如视频宽高、时长、旋转角度、码率等等。MediaExtractor:：视音频分离器
3.2 嵌入式多媒体卡 eMMC Embedded MultiMedia Card 文可明志第3章高速总线基本知识硬件架构
3.2嵌入式多媒体卡eMMCEmbeddedMultiMediaCard1eMMC/SD是什么？2SD卡有哪些种类？2.1按照大小尺寸分类2.2按照容量大小分类2.3按照通信接口分类2.4按照支持电压不同分类3关于存储卡UHS-I、UHS-II、UHS-III总线标准4UHS-I卡的工作模式/类型/上电时序命令5Layout注意事项5.1eMMCLayout注意事项5.2SD卡连接器Layout注
HDMI接口 weixin_30745553 数据结构与算法人工智能运维
高清基础知识:HDMI的应用、限制及发展导读：HDMI的产生是为了取代传统的DVD碟机、电视及其它视频输出设备的已有接口，统一并简化用户终端接线，并提供更高带宽的数据传输速度和数字化无损传送音视频信号。HDMI的产生及发展过程HDMI是新一代的多媒体接口标准，全称是High-DefinitionMultimediaInterface，中文意思为高清晰多媒体接口，该标准由索尼、日立、松下、飞利浦、东
DP接口的电脑主机、游戏主机如何连接HDMI接口的电视机或显示器？主动式DP转HDMI解决方案 szekl 智能电视音视频电脑
DP（DisplayPort）和HDMI（High-DefinitionMultimediaInterface）是两种常见的视频接口标准，分别由VESA（VideoElectronicsStandardsAssociation）和HDMI联盟制定。它们都可以传输高清视频和音频信号，但是有一些技术和功能上的差异。因此，在一些场合，我们可能需要使用DP转HDMI线来连接不同的设备，比如笔记本电脑和显示
Android多媒体开发【4】-- 上层mediaPlayer 是如何调到Stagefright的【2】【图解】 tx3344 【架构与思想】【Android】【多媒体技术】Android多媒体开发音视频开发
基于android4.1.1源码【1】mediaserver启动后会把media相关一些服务添加到servicemanager中，其中就有mediaPlayerService.这样应用启动前，系统就有了mediaPlayerService这个服务程序。intmain(intargc,char**argv){spproc(ProcessState::self());spsm=defaultServi
qt学习：多媒体Multimedia摄像头码农小白 qt qt 学习 java
目录注意头文件模块步骤实例定义一个摄像头对象和一个摄像头拍照对象在构造函数里获取当前电脑上所有可以用的摄像头存入链表启动摄像头按钮点击事件退出按钮点击事件拍照按钮点击事件保存图片槽函数定义和实现摄像头在QtMultimedia多媒体模块里QCamera可与用于取景器显示的QCameraViewfinder、视频录制的QMediaRecorder、图像拍摄的QCamerAmageCapture一起使
ARM-LINUX安装UVC USB摄像头驱动 Lj2_jOker kernel linux arm
在内核根目录下输入:makemenuconfig进入图形界面进入:DeviceDrivers–>Multimediasupport–>MediaUSBAdaptersUSBVideoClass(UVC)这个选项按空格，选择"M"退出保存图形界面执行:makeARCH=armCROSS_COMPILE=arm-linux-guneabihf-modules执行完成后,在/drivers/media/
插入表主键冲突做更新 a-john
有以下场景：用户下了一个订单，订单内的内容较多，且来自多表，首次下单的时候，内容可能会不全（部分内容不是必须，出现有些表根本就没有没有该订单的值）。在以后更改订单时，有些内容会更改，有些内容会新增。问题：如果在sql语句中执行update操作，在没有数据的表中会出错。如果在逻辑代码中先做查询，查询结果有做更新，没有做插入，这样会将代码复杂化。解决： mysql中提供了一个sql语
Android xml资源文件中@、@android:type、@*、？、@+含义和区别 Cb123456 @+@?@*
一.@代表引用资源 1.引用自定义资源。格式：@[package:]type/name android：text="@string/hello" 2.引用系统资源。格式：@android:type/name android:textColor="@android:color/opaque_red"
数据结构的基本介绍天子之骄数据结构散列表树、图线性结构价格标签
数据结构的基本介绍数据结构就是数据的组织形式，用一种提前设计好的框架去存取数据，以便更方便，高效的对数据进行增删查改。正确选择合适的数据结构，对软件程序的高效执行的影响作用不亚于算法的设计。此外，在计算机系统中数据结构的作用也是非同小可。例如常常在编程语言中听到的栈，堆等，就是经典的数据结构。经典的数据结构大致如下：一：线性数据结构 (1)：列表 a
通过二维码开放平台的API快速生成二维码一炮送你回车库 api
现在很多网站都有通过扫二维码用手机连接的功能，联图网(http://www.liantu.com/pingtai/)的二维码开放平台开放了一个生成二维码图片的Api,挺方便使用的。闲着无聊，写了个前台快速生成二维码的方法。 html代码如下:(二维码将生成在这div下) ? 1 &nbs
ImageIO读取一张图片改变大小 3213213333332132 java IO image BufferedImage
package com.demo; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imageio.ImageIO; /** * @Description 读取一张图片改变大小 * @author FuJianyon
myeclipse集成svn（一针见血） 7454103 eclipse SVN MyEclipse
&n
装箱与拆箱----autoboxing和unboxing darkranger J2SE
4.2　自动装箱和拆箱基本数据(Primitive)类型的自动装箱(autoboxing)、拆箱(unboxing)是自J2SE 5.0开始提供的功能。虽然为您打包基本数据类型提供了方便，但提供方便的同时表示隐藏了细节，建议在能够区分基本数据类型与对象的差别时再使用。 4.2.1　autoboxing和unboxing 在Java中，所有要处理的东西几乎都是对象(Object)
ajax传统的方式制作ajax aijuans Ajax
//这是前台的代码 <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); String basePath = request.getScheme()+
只用jre的eclipse是怎么编译java源文件的？ avords java eclipse jdk tomcat
eclipse只需要jre就可以运行开发java程序了，也能自动编译java源代码，但是jre不是java的运行环境么，难道jre中也带有编译工具？还是eclipse自己实现的？谁能给解释一下呢问题补充：假设系统中没有安装jdk or jre，只在eclipse的目录中有一个jre，那么eclipse会采用该jre，问题是eclipse照样可以编译java源文件，为什么呢？ &nb
前端模块化 bee1314 模块化
背景：前端JavaScript模块化，其实已经不是什么新鲜事了。但是很多的项目还没有真正的使用起来，还处于刀耕火种的野蛮生长阶段。 JavaScript一直缺乏有效的包管理机制，造成了大量的全局变量，大量的方法冲突。我们多么渴望有天能像Java（import），Python (import)，Ruby(require)那样写代码。在没有包管理机制的年代，我们是怎么避免所
处理百万级以上的数据处理 bijian1013 oracle sql 数据库大数据查询
一.处理百万级以上的数据提高查询速度的方法： 1.应尽量避免在 where 子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描。 2.对查询进行优化，应尽量避免全表扫描，首先应考虑在 where 及 o
mac 卸载 java 1.7 或更高版本征客丶 java OS
卸载 java 1.7 或更高 sudo rm -rf /Library/Internet\ Plug-Ins/JavaAppletPlugin.plugin 成功执行此命令后，还可以执行 java 与 javac 命令 sudo rm -rf /Library/PreferencePanes/JavaControlPanel.prefPane 成功执行此命令后，还可以执行 java
【Spark六十一】Spark Streaming结合Flume、Kafka进行日志分析 bit1129 Stream
第一步，Flume和Kakfa对接，Flume抓取日志，写到Kafka中第二部，Spark Streaming读取Kafka中的数据，进行实时分析本文首先使用Kakfa自带的消息处理（脚本）来获取消息，走通Flume和Kafka的对接 1. Flume配置 1. 下载Flume和Kafka集成的插件，下载地址：https://github.com/beyondj2ee/f
Erlang vs TNSDL bookjovi erlang
TNSDL是Nokia内部用于开发电信交换软件的私有语言，是在SDL语言的基础上加以修改而成，TNSDL需翻译成C语言得以编译执行，TNSDL语言中实现了异步并行的特点，当然要完整实现异步并行还需要运行时动态库的支持，异步并行类似于Erlang的process（轻量级进程），TNSDL中则称之为hand，Erlang是基于vm(beam)开发，
非常希望有一个预防疲劳的java软件, 预防过劳死和眼睛疲劳,大家一起努力搞一个 ljy325 企业应用
　非常希望有一个预防疲劳的java软件，我看新闻和网站，国防科技大学的科学家累死了，太疲劳，老是加班，不休息，经常吃药，吃药根本就没用，根本原因是疲劳过度。我以前做java,那会公司垃圾，老想赶快学习到东西跳槽离开，搞得超负荷，不明理。深圳做软件开发经常累死人，总有不明理的人，有个软件提醒限制很好，可以挽救很多人的生命。相关新闻：（1）IT行业成五大疾病重灾区：过劳死平均37.9岁
读《研磨设计模式》-代码笔记-原型模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * Effective Java 建议使用copy constructor or copy factory来代替clone()方法： * 1.public Product copy(Product p){} * 2.publi
配置管理---svn工具之权限配置 chenyu19891124 SVN
今天花了大半天的功夫，终于弄懂svn权限配置。下面是今天收获的战绩。安装完svn后就是在svn中建立版本库，比如我本地的是版本库路径是C:\Repositories\pepos。pepos是我的版本库。在pepos的目录结构 pepos component webapps 在conf里面的auth里赋予的权限配置为 [groups]
浅谈程序员的数学修养 comsci 设计模式编程算法面试招聘
浅谈程序员的数学修养
批量执行 bulk collect与forall用法 daizj oracle sql bulk collect forall
BULK COLLECT 子句会批量检索结果，即一次性将结果集绑定到一个集合变量中，并从SQL引擎发送到PL/SQL引擎。通常可以在SELECT INTO、 FETCH INTO以及RETURNING INTO子句中使用BULK COLLECT。本文将逐一描述BULK COLLECT在这几种情形下的用法。有关FORALL语句的用法请参考：批量SQL之 F
Linux下使用rsync最快速删除海量文件的方法 dongwei_6688 OS
1、先安装rsync：yum install rsync 2、建立一个空的文件夹：mkdir /tmp/test 3、用rsync删除目标目录：rsync --delete-before -a -H -v --progress --stats /tmp/test/ log/这样我们要删除的log目录就会被清空了，删除的速度会非常快。rsync实际上用的是替换原理，处理数十万个文件也是秒删。
Yii CModel中rules验证规格 dcj3sjt126com rules yii validate
Yii cValidator主要用法分析： yii验证rulesit 分类： Yii yii的rules验证 cValidator主要属性 attributes ,builtInValidators,enableClientValidation,message,on,safe,skipOnError
基于vagrant的redis主从实验 dcj3sjt126com vagrant
平台: Mac 工具: Vagrant 系统: Centos6.5 实验目的: Redis主从实现思路制作一个基于sentos6.5, 已经安装好reids的box, 添加一个脚本配置从机, 然后作为后面主机从机的基础box 制作sentos6.5+redis的box mkdir vagrant_redis cd vagrant_
Memcached(二)、Centos安装Memcached服务器 frank1234 centos memcached
一、安装gcc rpm和yum安装memcached服务器连接没有找到，所以我使用的是make的方式安装，由于make依赖于gcc，所以要先安装gcc 开始安装，命令如下，[color=red][b]顺序一定不能出错[/b][/color]：建议可以先切换到root用户，不然可能会遇到权限问题：su root 输入密码...... rpm -ivh kernel-head
Remove Duplicates from Sorted List hcx2013 remove
Given a sorted linked list, delete all duplicates such that each element appear only once. For example,Given 1->1->2, return 1->2.Given 1->1->2->3->3, return&
Spring4新特性——JSR310日期时间API的支持 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
浅谈enum与单例设计模式 247687009 java 单例
在JDK1.5之前的单例实现方式有两种(懒汉式和饿汉式并无设计上的区别故看做一种)，两者同是私有构造器，导出静态成员变量，以便调用者访问。第一种 package singleton; public class Singleton { //导出全局成员 public final static Singleton INSTANCE = new S
使用switch条件语句需要注意的几点 openwrt c break switch
1. 当满足条件的case中没有break，程序将依次执行其后的每种条件（包括default）直到遇到break跳出 int main() { int n = 1; switch(n) { case 1: printf("--1--\n"); default: printf("defa
配置Spring Mybatis JUnit测试环境的应用上下文 schnell18 spring mybatis JUnit
Spring-test模块中的应用上下文和web及spring boot的有很大差异。主要试下来差异有：单元测试的app context不支持从外部properties文件注入属性 @Value注解不能解析带通配符的路径字符串解决第一个问题可以配置一个PropertyPlaceholderConfigurer的bean。第二个问题的具体实例是：
Java 定时任务总结一 tuoni java spring timer quartz timertask
Java定时任务总结一.从技术上分类大概分为以下三种方式： 1.Java自带的java.util.Timer类，这个类允许你调度一个java.util.TimerTask任务; 说明： java.util.Timer定时器，实际上是个线程，定时执行TimerTask类 &
一种防止用户生成内容站点出现商业广告以及非法有害等垃圾信息的方法 yangshangchuan rank 相似度计算文本相似度词袋模型余弦相似度
本文描述了一种在ITEYE博客频道上面出现的新型的商业广告形式及其应对方法，对于其他的用户生成内容站点类型也具有同样的适用性。最近在ITEYE博客频道上面出现了一种新型的商业广告形式，方法如下： 1、注册多个账号（一般10个以上）。 2、从多个账号中选择一个账号，发表1-2篇博文