之前用ffmpeg解码的时候,已经做了硬解码的处理,比如支持qsv、dxva2、d3d11va等方式进行硬解码处理,但是当时解码出来以后,还是重新转成了QImage来绘制,这样就大打折扣了,尽管可以看到GPU使用率有了,但是依然耗时的操作还是在CPU绘制显示,这就显得很尴尬了,Qt封装了大部分的opengl的操作,直接做成了QOPenGLWidget,既支持ffmpeg解码出来的yuyv格式的数据显示,还支持硬解码出来的nv12格式的数据显示,很好很强大,这样的话就大大减轻了CPU的压力,专门交给GPU绘制,经过这么一番彻底的改造,效率提升至少5倍,不要太牛逼!如果开启了opengl绘制,则对应内存会增加不少,可能opengl绘制需要开辟很多的内存来交换数据吧。
采用GPU显示需要同时支持yuyv格式和nv12格式,因为有些配置差的电脑,硬解码很可能歇菜,此时就需要用opengl来直接绘制ffmpeg软解码出来的yuyv数据,做到自动切换,这样就兼容了所有的可能的情况。测试发现ffmpeg4的性能要优于ffmpeg3,64位的性能要优于32位的,在64位的操作系统上,UDP协议性能要优于TCP性能,但是可能会丢包。
下面是本人测试的结果:
测试数据,64位WIN10+32位qt5.7+32位ffmpeg3+6路1080P主码流+6路子码流
方案 | CPU | 内存 | GPU |
---|---|---|---|
none+none | 12% | 147MB | 0% |
dxva2+none | 3% | 360MB | 38% |
d3d11va+none | 2% | 277MB | 62% |
none+painter | 30% | 147MB | 0% |
dxva2+painter | 30% | 360MB | 38% |
d3d11va+painter | 21% | 277MB | 62% |
none+yuyv | 17% | 177MB | 22% |
dxva2+yuyv | 25% | 400MB | 38% |
d3d11va+yuyv | 18% | 30MB | 65% |
qsv+nv12 | 22% | 970MB | 40% |
dxva2+nv12 | 20% | 380MB | 40% |
d3d11va+nv12 | 15% | 320MB | 62% |
void NV12OpenGLWidget::initializeGL()
{
initializeOpenGLFunctions();
glDisable(GL_DEPTH_TEST);
//存储顶点坐标和纹理坐标
static const GLfloat points[] = {-1.0f, 1.0f, 1.0f, 1.0f, 1.0f, -1.0f, -1.0f, -1.0f, 0.0f, 0.0f, 1.0f, 0.0f, 1.0f, 1.0f, 0.0f, 1.0f};
//顶点缓冲对象初始化
vbo.create();
vbo.bind();
vbo.allocate(points, sizeof(points));
//初始化shader
this->initShader();
//初始化textures
this->initTextures();
//初始化颜色
this->initColor();
}
void NV12OpenGLWidget::paintGL()
{
if (!dataY || !dataUV || width == 0 || height == 0) {
this->initColor();
return;
}
program.bind();
program.enableAttributeArray("vertexIn");
program.enableAttributeArray("textureIn");
program.setAttributeBuffer("vertexIn", GL_FLOAT, 0, 2, 2 * sizeof(GLfloat));
program.setAttributeBuffer("textureIn", GL_FLOAT, 2 * 4 * sizeof(GLfloat), 2, 2 * sizeof(GLfloat));
glActiveTexture(GL_TEXTURE0 + 1);
glBindTexture(GL_TEXTURE_2D, textureY);
//字节对齐,网上很多代码都是少了这一步,导致有时候花屏
glPixelStorei(GL_UNPACK_ROW_LENGTH, linesizeY);
glTexParameteri(GL_TEXTURE_2D, GL_TEXTURE_MAG_FILTER, GL_LINEAR);
glTexParameteri(GL_TEXTURE_2D, GL_TEXTURE_MIN_FILTER, GL_LINEAR);
glTexParameterf(GL_TEXTURE_2D, GL_TEXTURE_WRAP_S, GL_CLAMP_TO_EDGE);
glTexParameterf(GL_TEXTURE_2D, GL_TEXTURE_WRAP_T, GL_CLAMP_TO_EDGE);
glTexImage2D(GL_TEXTURE_2D, 0, GL_RED, width, height, 0, GL_RED, GL_UNSIGNED_BYTE, dataY);
glActiveTexture(GL_TEXTURE0 + 0);
glBindTexture(GL_TEXTURE_2D, textureUV);
//字节对齐,网上很多代码都是少了这一步,导致有时候花屏
glPixelStorei(GL_UNPACK_ROW_LENGTH, linesizeUV >> 1);
glTexParameteri(GL_TEXTURE_2D, GL_TEXTURE_MAG_FILTER, GL_LINEAR);
glTexParameteri(GL_TEXTURE_2D, GL_TEXTURE_MIN_FILTER, GL_LINEAR);
glTexParameterf(GL_TEXTURE_2D, GL_TEXTURE_WRAP_S, GL_CLAMP_TO_EDGE);
glTexParameterf(GL_TEXTURE_2D, GL_TEXTURE_WRAP_T, GL_CLAMP_TO_EDGE);
glTexImage2D(GL_TEXTURE_2D, 0, GL_RG, width >> 1, height >> 1, 0, GL_RG, GL_UNSIGNED_BYTE, dataUV);
glDrawArrays(GL_QUADS, 0, 4);
program.setUniformValue("textureY", 1);
program.setUniformValue("textureUV", 0);
program.disableAttributeArray("vertexIn");
program.disableAttributeArray("textureIn");
program.release();
}