无聊星期三

音视频学习：YUV

基本概念
YUV和RGB互相转换
YUV数据的存储方式
yuvplayer查看YUV图像
ffmpeg转换及查看YUV图像
YUV Parser

1. 分离YUV420P像素数据中的Y、U、V分量
2. 分离YUV444P像素数据中的Y、U、V分量
3. 将YUV420P像素数据去掉颜色（灰度图）
4. 将YUV420P像素数据的亮度减半
5. 将YUV420P像素数据周围加上边框
6. 生成YUV420P格式的灰阶测试图
7. 计算两个YUV420P像素数据的PSNR

未完待续

YUV

笔记整理于网上其他人的博客和维基百科，以及雷霄骅先生的博客。

。。没想到这才2天访问量就有300差不多，为了方便大家学习，我把我当前的项目用到的所有图片、用到的软件都放在GitHub里面了，方便大家不用去网上找原图，找软件了。

ffmpeg地址
Github地址（包括所有用到的原图和yuvplayer）

基本概念

YUV最初提出是为了解决彩色电视和黑白电视的兼容问题，YUV分别为亮度信息（Y）与色彩信息（UV）。YUV比RGB的优势在于不要求三个独立视频信号同时传输，所以占用带宽（频宽）更少。历史原因，YUV和Y’UV通常用来编码电视的模拟信号，而YCbCr则是用来描述数字的影像信号，适合影片与图片压缩以及传输，有时候看到有用Cb和Cr的方式来表示，其实等同于U和V，但应该严格区分YUV和YCbCr这两个专有名词有时并非完全相同，今天大家所讲的YUV其实就是指YCbCr。

YUV种类很多，可以理解为二维的，即“空间-间”，和“空间-内”这样的表述，借鉴了h264中的帧间和帧内的思想。

空间-间：不同空间，即描述一个像素的bit数不同，如YUV444,、YUV422、YUV411、YUV420
空间-内：相同空间，即描述一个像素的bit数相同，但存储方式不同，比如对于YUV420而言，又可以细分为YUV420P、YUV420SP、NV21、NV12、YV12、YU12，I420

在理解YUV格式时，时刻记住从bit数、存储结构两方面考察。

YUV Formats格式分为两类：

平面格式（planar formats）：先连续存储所有像素点的Y，紧接着存储所有像素点的U，随后是所有像素点的V
紧缩格式（packed formats）：每个像素点的Y、U、V是连续交叉存储的

YUV，分为三个分量，“Y”表示明亮度（Luminance或Luma），也就是灰度值；而“U”和“V” 表示的则是色度（Chrominance或Chroma），作用是描述影像色彩及饱和度，用于指定像素的颜色。

YUV码流的存储格式其实与其采样的方式密切相关，主流的采样方式有四种：

YUV444：4:4:4表示完全取样。
YUV422：4:2:2表示2:1的水平取样，垂直完全采样。
YUV420：4:2:0表示2:1的水平取样，垂直2：1采样。
YUV411：4:1:1表示4:1的水平取样，垂直完全采样。

YUV和RGB互相转换

U和V组件可以被表示成原始的R，G，和B（R，G，B为γ预校正后的）

YUV转换为RGB

$Y = 0.299 * R + 0.587 * G + 0.114 * B$

$U = - 0.169 * R - 0.331 * G + 0.5 * B + 128$

$V = 0.5 * R - 0.419 * G - 0.081 * B + 128$

RGB转换为YUV

$R = Y + 1.13983 * (V - 128)$

$G = Y - 0.39465 * (U - 128) - 0.58060 * (V - 128)$

$B = Y + 2.03211 * (U - 128)$

YUV数据的存储方式

YUYV（属于YUV422）

相邻的两个Y共用其相邻的两个Cb、Cr，例如对于Y’00和Y’01而言，其Cb、Cr的均值为Cb00、Cr00，其他像素点以此类推。
UYVY（属于YUV422）

相邻的两个Y共用其相邻的两个Cb、Cr，只不过和上面的YUYV不同的是Cb和Cr的顺序不同，其他像素点以此类推。
YUV422P

YUV422P的P表示Planar formats（平面格式），也就是说YUV不是交错存储而是先存Y，再存U和V，对于Y’00和Y’01而言，其Cb、Cr的均值为Cb00、Cr00。
YV12（属于YUV420）

YV12属于YUV420，也是Planar formats（平面格式），存储方式是先存储Y，再存储V，再存储U，4个Y分量共用一组UV，所以下图中Y’00、Y’01、Y’10、Y’11共用Cr00、Cb00。

许多重要的编码器都采用YV12空间存储视频：MPEG-4（x264，XviD，DivX），DVD-Video存储格式MPEG-2，MPEG-1以及MJPEG。

YU12则和YV12除存储方式略有不同外，其他类似，存储方式是先存储Y，再存储U，再存储V。
NV12（YUV420）

NV12属于YUV420格式，只不过存储方式为先存储Y，再交叉存储U和V，其提取方式与YV12类似，即Y’00、Y’01、Y’10、Y’11共用Cb00、Cr00。

NV21和NV12略有不同，先存储Y，再交叉存储V和U。

yuvplayer查看YUV图像

一开始打开yuv图像全是花花绿绿的，还以为是文件坏了，直到看到一句ffplay需要指定yuv图像大小，因为yuv文件不包含宽高数据所以必须用-video_size指定宽和高，这才反应过来yuvplayer需要设置宽高才能正常显示。

Size->Custom->修改宽高
Color->选择对应的YUV格式

ffmpeg转换及查看YUV图像

通过ffmpeg利用原始测试图片，来得到YUV420P的图像：

./ffmpeg -i ./originnal_pic/lena512color.tiff -pix_fmt yuv420p ./YUV/lena512_yuv420p.yuv

通过ffplay显示YUV图像：

./ffplay.exe -video_size 512*512 ./YUV/lena512_yuv420p.yuv

YUV Parser

简单的解析YUV图像代码，代码均来自于雷霄骅先生的博客。

运行环境：Windows10、VS2017

1. 分离YUV420P像素数据中的Y、U、V分量

分离YUV420P的Y、U、V保存为3个文件。

bool YuvParser::yuv420_split(const std::string input_url, int width, int height, int frame_num)
{
    FILE *input_file = fopen(input_url.c_str(), "rb+");
    FILE *output_y = fopen("output_420_y.y", "wb+");
    FILE *output_u = fopen("output_420_u.y", "wb+");
    FILE *output_v = fopen("output_420_v.y", "wb+");

    unsigned char *picture = new unsigned char[width * height * 3 / 2];

    for (int i = 0; i < frame_num; i++) {
        fread(picture, 1, width * height * 3 / 2, input_file);
        
        fwrite(picture, 1, width * height, output_y);
        fwrite(picture + width * height, 1, width * height / 4, output_u);
        fwrite(picture + width * height * 5 / 4, 1, width * height / 4, output_v);
    }

    delete[] picture;
    fclose(input_file);
    fclose(output_y);
    fclose(output_u);
    fclose(output_v);
    return true;
}

解析出来的图像需要用yuvplayer查看，原始图片为512*512，如下图：

解析后图片分为3个分量，Y、U、V，使用yuvplayer，在Color选项卡中选中分量Y，首先查看Y分量，尺寸为512*512。

output_420_y.yuv

U、V如下图，尺寸为256*256。

output_420_u.yuv output_420_v.yuv

2. 分离YUV444P像素数据中的Y、U、V分量

分离YUV444P的Y、U、V保存为3个文件。

bool YuvParser::yuv444_split(const std::string input_url, int width, int height, int frame_num)
{
    FILE *input_file = fopen(input_url.c_str(), "rb+");
    FILE *output_y = fopen("output_444_y.y", "wb+");
    FILE *output_u = fopen("output_444_u.y", "wb+");
    FILE *output_v = fopen("output_444_v.y", "wb+");

    unsigned char *picture = new unsigned char[width * height * 3];

    for (int i = 0; i < frame_num; i++) {
        fread(picture, 1, width * height * 3, input_file);
        
        fwrite(picture, 1, width * height, output_y);
        fwrite(picture + width * height, 1, width * height, output_u);
        fwrite(picture + width * height * 2, 1, width * height, output_v);
    }

    delete[] picture;
    fclose(input_file);
    fclose(output_y);
    fclose(output_u);
    fclose(output_v);
    return true;
}

原图依旧是lena标准图，用ffmpeg转换为YUV444P，分离后效果如下

output_444_y.yuv

output_444_u.yuv

output_444_v.yuv

3. 将YUV420P像素数据去掉颜色（灰度图）

将YUV420P格式像素数据的彩色去掉，变成纯粹的灰度图。

bool YuvParser::yuv420_gray(const std::string input_url, int width, int height, int frame_num)
{
    FILE *input_file = fopen(input_url.c_str(), "rb+");
    FILE *output_gray = fopen("output_420_gray.yuv", "wb+");

    unsigned char *picture = new unsigned char[width * height * 3 / 2];

    for (int i = 0; i < frame_num; i++) {
        fread(picture, 1, width * height * 3 / 2, input_file);
        memset(picture + width * height, 128, width * height / 2);
        fwrite(picture, 1, width * height * 3 / 2, output_gray);
    }

    delete[] picture;
    fclose(input_file);
    fclose(output_gray);
    return true;
}

处理结果如下：

output_420_gray.yuv

4. 将YUV420P像素数据的亮度减半

在YUV中Y代表亮度，所以只需要将Y减半，图像便会出现亮度减半。

bool YuvParser::yuv420_half_bright(const std::string input_url, int width, int height, int frame_num)
{
    FILE *input_file = fopen(input_url.c_str(), "rb+");
    FILE *output_half_bright = fopen("output_420_half_bright.yuv", "wb+");

    unsigned char *picture = new unsigned char[width * height * 3 / 2];

    for (int i = 0; i < frame_num; i++) {
        fread(picture, 1, width * height * 3 / 2, input_file);
        for (int cur_pixel = 0; cur_pixel < width * height; cur_pixel++) {
            // half Y
            picture[cur_pixel] /= 2;
        }
        fwrite(picture, 1, width * height * 3 / 2, output_half_bright);
    }

    delete[] picture;
    fclose(input_file);
    fclose(output_half_bright);
    return true;
}

亮度减半效果如下

output_420_half_bright.yuv

5. 将YUV420P像素数据周围加上边框

通过修改YUV数据中特定位置的亮度分量Y的数值，将Y值调到最亮（255），给图像添加一个“边框”的效果。

bool YuvParser::yuv420_border(const std::string input_url, int width, int height, int border_length, int frame_num)
{
    FILE *input_file = fopen(input_url.c_str(), "rb+");
    FILE *output_border = fopen("output_420_border.yuv", "wb+");

    unsigned char *picture = new unsigned char[width * height * 3 / 2];

    for (int i = 0; i < frame_num; i++) {
        fread(picture, 1, width * height * 3 / 2, input_file);
        for (int cur_height = 0; cur_height < height; cur_height++) {
            for (int cur_width = 0; cur_width < width; cur_width++) {
                if (cur_width < border_length || cur_width > width - border_length ||
                    cur_height < border_length || cur_height > height - border_length) {
                    picture[cur_height * width + cur_width] = 255;
                }
            }
        }
        fwrite(picture, 1, width * height * 3 / 2, output_border);
    }
    
    delete[] picture;
    fclose(input_file);
    fclose(output_border);
    return true;
}

20像素的边框效果图如下

output_420_border.yuv

6. 生成YUV420P格式的灰阶测试图

以下函数可以生成一张灰阶测试图。

bool YuvParser::yuv420_graybar(int width, int height, int y_min, int y_max, int bar_num)
{
    FILE *output_graybar = fopen("output_420_graybar.yuv", "wb+");

    unsigned char *picture = new unsigned char[width * height * 3 / 2];
    
    if (bar_num == 1 && y_max != y_min) {
        return false;
    }

    float luma_range = (float)(y_max - y_min) / (float)(bar_num > 1 ? bar_num - 1 : bar_num);
    unsigned char cur_luma = y_min;
    int cur_block = 0;
    int bar_width = width / bar_num;

    // write Y
    for (int cur_height = 0; cur_height < height; cur_height++) {
        for (int cur_width = 0; cur_width < width; cur_width++) {
            cur_block = (cur_width / bar_width == bar_num) ? (bar_num - 1) : (cur_width / bar_width);
            cur_luma = y_min + (unsigned char)(cur_block * luma_range);
            picture[cur_height * width + cur_width] = cur_luma;
        }
    }

    // NOTE: write U and write V can use memset to set,
    //       write them separately to make them easier
    //       to understand
    
    // write U
    for (int cur_height = 0; cur_height < height / 2; cur_height++) {
        for (int cur_width = 0; cur_width < width / 2; cur_width++) {
            picture[height * width + cur_height * width / 2 + cur_width] = 128;
        }
    }

    // write V
    for (int cur_height = 0; cur_height < height / 2; cur_height++) {
        for (int cur_width = 0; cur_width < width / 2; cur_width++) {
            picture[height * width * 5 / 4 + cur_height * width / 2 + cur_width] = 128;
        }
    }

    fwrite(picture, 1, width * height * 3 / 2, output_graybar);

    delete[] picture;
    fclose(output_graybar);
    return true;
}

简单学雷神测试下10阶灰阶测试图，宽1024像素，高512，效果如下图。

output_420_graybar.yuv

各个灰度条Y、U、V值如下

Y	U	V
0	128	128
28	128	128
56	128	128
85	128	128
113	128	128
141	128	128
170	128	128
198	128	128
226	128	128
255	128	128

7. 计算两个YUV420P像素数据的PSNR

PSNR是最基本的视频质量评价方法，对于8bit量化的像素数据来说，计算方法如下：
$\lg(\frac{255}{MSE})$
其中MSE计算方式为：
$\frac{1}{M * N}\sum_{i = 1}^M\sum_{j = 1}^N(x_{ij} - y_{ij})^2$
其中M、N代表图像的宽和高， $x_{ij}$ 和 $y_{ij}$ 分别为两张图像每一个像素值，用来计算受损图像和原始图像之间的差别，评估受损图像的质量。PSNR取值通常情况下都在20-50的范围内，取值越高，代表两张图像越接近，反映出受损图像质量越好。

bool YuvParser::yuv420_psnr(const std::string input_url1, const std::string input_url2, int width, int height, int frame_num)
{
    FILE *input_file1 = fopen(input_url1.c_str(), "rb+");
    FILE *input_file2 = fopen(input_url2.c_str(), "rb+");

    unsigned char *picture1 = new unsigned char[width * height * 3 / 2];
    unsigned char *picture2 = new unsigned char[width * height * 3 / 2];

    for (int i = 0; i < frame_num; i++) {
        fread(picture1, 1, width * height * 3 / 2, input_file1);
        fread(picture2, 1, width * height * 3 / 2, input_file2);

        double mse_total = 0, mse = 0, psnr = 0;
        for (int cur_pixel = 0; cur_pixel < width * height; cur_pixel++) {
            mse_total += pow((double)(picture1[cur_pixel] - picture2[cur_pixel]), 2);
        }
        mse = mse_total / (width * height);
        psnr = 10 * log10(255.0 * 255.0 / mse);
        printf("frame_num=%d psnr=%5.3f\n", frame_num, psnr);

        // Skip the UV component
        fseek(input_file1, width * height / 2, SEEK_CUR);
        fseek(input_file2, width * height / 2, SEEK_CUR);
    }

    delete[] picture1;
    delete[] picture2;
    fclose(input_file1);
    fclose(input_file2);
    return true;
}

由于我不晓得怎么让图片损坏，所以图片选用雷神的256*256的lena素材。

结果如下，为26.693：

output_420_psnr.yuv

未完待续

YUV整理弄了两天，代码跟着都敲了一遍，感觉现在格式已经搞懂了，但是还有不懂得地方：

为什么U、V分量的无色是128？
如果像素不是4的倍数，那么YUV是怎么存储的？
YUV4:2:0这些数字的解释是啥，虽然上面有总结到，但是还是一知半解？

后面还要做的：

利用ffmpeg搞一个YUV视频分离工具。

我已经看到有人做过了，后面写~~~链接先贴着

https://blog.csdn.net/longjiang321/article/details/103229035

音视频学习（二十三）：srs+ffmpeg实现rtmp的推拉流却道天凉_好个秋音视频学习音视频学习 ffmpeg
rtmp协议：https://blog.csdn.net/www_dong/article/details/131026072rtmp收流：https://blog.csdn.net/www_dong/article/details/135073488rtmp发流：https://blog.csdn.net/www_dong/article/details/135254847安装和配置SRS服务器
音视频学习笔记002：视频封装格式我是摆乌龙音视频学习
前面网上查资料，大概了解了一些H.264的一些皮毛。接下来就需要参考如何学习，一脸懵逼o((⊙﹏⊙))o，查看各种博客，虽然大概了解了一下，还没开始怎么敲代码，也不知道如何开始敲相关的代码，接下来期望能从雷神的笔记中领悟节奏吧，然后再参考其他的博客啥的理解…，既然敲不会敲，那也好办，就先不管了，把能做的先做吧，其实现阶段能做的也就是各种专有名词的理解与概念的理解与一些常识理解…视频封装格式视频封装
音视频学习-H264帧基础知识鱼儿-1226 ffmpeg 音视频
一组图像GOP所谓GOP就是1组图像GroupofPicture，在这一组图像中有且只有1个I帧，多个P帧或B帧，两个I帧之间的帧数，就是一个GOP。GOP一般设置为编码器每秒输出的帧数，即每秒帧率，一般为25或30，当然也可设置为其他值。在一个GOP中，P、B帧是由I帧预测得到的，当I帧的图像质量比较差时，会影响到一个GOP中后续P、B帧的图像质量，直到下一个GOP开始才有可能得以恢复，所以GO
音视频学习（三十五）：aud 却道天凉_好个秋音视频学习音视频学习 aud
概念AUD（AccessUnitDelimiter）访问单元分隔符AUD是在视频编码（特别是H.264/AVC）中定义的一种NALU（网络抽象层单元）类型，用于指示视频流中一帧（访问单元）的边界。它是一个特殊的NAL单元，其作用是：明确表示一帧视频数据的开始。提供解析边界，方便解码器正确解码每一帧。技术细节NALunittype:9通常是可选的（对某些流媒体协议或容器格式来说）内容示例（十六进制）
【音视频学习笔记】- FFMPEG - 1.命令行参数解析及生效过程 Y&LOVE&G ffmpeg 音视频学习笔记
目录一、文章简介二、源码阅读2.1代码位置2.2主要功能及函数介绍2.2.1解析命令行参数及参数生效2.2.2解析命令行参数2.2.3处理命令行的全局参数2.2.4打开输入文件(输入参数生效)2.2.5打开输出文件(输出参数生效)音视频学习笔记系列主要介绍笔者在学习音视频过程中，学习了解到的音视频相关知识点，涉及内容包括但不限于音视频基础、音视频封装、传输协议、FFMPEG。本系列持续更新一、文章
Linux音视频学习--音视频编解码相关基本概念介绍文艺小少年 IPC项目实践之音视频相关整理音视频 linux dsp isp
一、引言二、ISP、DSP------>1、ISP------------>内置isp------>2、DSP三、编解码------>1、视频编码------------>各个格式(H264/H265)的编码------------>码率调节------>2、音频编码------>3、码流、采样率、比特率、采样点数概念介绍------>4、采样点数一、引言入职的事终于告一段落，现在要慢慢开始熟悉新
【Qt | 音视频学习路线（高薪路线 AI）】 Qt历险记 Qt 高级开发工程师 qt 音视频学习
Answer学习Qt音视频开发的学习路线可以分为以下几个阶段：1.基础知识准备C++编程基础：Qt主要使用C++，因此需要有扎实的C++编程基础。计算机图形学基础：了解基本的图形学概念，如图像处理、渲染等。音视频基础：了解音视频的基本概念，如编码、解码、格式等。2.学习Qt框架Qt基础：学习Qt的基本概念，如信号与槽、事件处理、界面布局等。QtWidgets：掌握QtWidgets模块，用于创建传
C++音视频学习路线高力士等十万人音视频开发 c++音视频学习
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。作者：姚冬链接：http://www.zhihu.com/question/31156766/answer/54645514来源：知乎我们先假设某人在音视频方面是零基础，也没学过任何数字信号处理相关知识，数学基础基本是高中水准，但是熟悉C/C++开发，至少熟悉某一个平台下的编译调试IDE。着重研究两个开源项目ffmpeg和webR
音视频学习(三)Shell脚本入门主音King
介绍Shell是用C语言编写的程序，用户使用Linux桥接。Shell是命令语言，又是程序设计语言。访问操作系统内核服务。Shell入门学习打开编辑器(vi/vim命令来创建文件)，新建test.sh，扩展名为sh。第一个Shell脚本./test.sh如果有权限问题，则赋予脚本执行权限chmod+x./test.sh#!是一个约定的标记，需要什么解释器来执行。echo向窗口输出文本变量定义变量时
音视频学习之路--NDK交叉编译解析蜗牛是不是牛
前言在说C/C++项目时必须要涉及编译问题，本章就来系统的说一下这些知识点，包括linux编译、常用linux指令、交叉编译等等。正文为了方便使用Linux环境，我这里直接在VMWare中安装了一个ubuntu，具体安装的步骤在网上非常多，安装完就是这样：由于好久不玩Linux系统了，这里我也是边搞边学习总结。编译原理这里主要说的是一个C/C++文件要经过下面4个步骤菜能变成可执行文件：预处理(p
音视频学习(一)JNI入门主音King
前言Android平台从一开始就支持C/C++了，Android支持JNI编程方式第三方应用完全可以通过JNI调用自己的C动态库，于是NDK(NativeDevelopKit)就诞生了。介绍JNI是Java程序设计语言功能最强的特征，允许Java类的某些方法原生实现(C/C++)。环境配置安装AS+NDK+CMAKE+LLDBAS：AndroidStudio4.0NDK：允许Android使用C和
音视频学习之路--C++ 蜗牛是不是牛
前言C和C++作为学习音视频技术首要具备的语言基础，所以十分必要学习和复习一下之前学习C++语言基础。这里IDE和环境配置在前面C语言复习的文章里已经说过了，还是使用CLion这个软件，话不多说，直接开始学习。正文C++作为一门用途更广、功能更齐全的语言，其知识深度很深，所以这里也就复习、学习一些基本知识点，等后续在实际项目中有遇到难点再进行补充。helloworld创建完一个C++项目，还是打印
Android 音视频学习基础--1.1 音视频基础知识神农笔记
基础数据通过上图可以了解播放器的原理，其实就是将一个压缩数据还原成一个基础数据的过程。那么什么时基础数据，基础数据就是硬件所能识别的数据，音频硬件所能识别的是pcm。下面分开将。视频yuvrgbyuv420rgb视频的基本数据，就是显示器能识别的数据，最早以前的是rgb通过串口，显示到显示器上比如最简单的用前三位表示红色中间三位表示绿色后面表示蓝色，这样就组成了基本的图案。后来又发明了yuv，YU
音视频学习之基础概念整理（rgb/yuv,pcm,采样频率，帧率，码率，i帧p帧b帧，dts/pts） yun6853992 音视频音视频
1：常用的视频压缩算法： MPEG2===>MPEG阵营 H264===>MPEG阵营 H265===>MPEG阵营 AVS===>中国阵营 VP8===>Google阵营 VP9===>Google阵营2：图像表示方法：2.1：RGB红绿蓝每个像素8bit色彩：256256256=16,777,216 一个1280*720的照片，用RGB存储,大小：1280×720*3=2.637
推荐几个堪称教科书级别的 Android 音视频入门项目 glumes
在直播中有提到几个不错的开源项目，这里再重点推荐一下：目前，市面上关于音视频学习的相关书籍并不多，而且即使看了书籍学了理论，最终还是要回归到代码上来。毕竟IT行业实践性要求高，强调动手能力，音视频这方面就更得多操作和探索了。推荐下面几个项目会各有侧重，分别涵盖了Android音视频录制API、OpenGL渲染和综合运用的例子。GPUImageGithub地址：https://github.com/
2021-12-29晨间日记 bbf75beb07a4
今天是什么日子起床：04:30起床，看了2小时书，拍了一条视频，写下一篇书中重要笔记，这会躺在床上回笼觉顺便复盘一下书中的点就寝：11点睡觉天气：阴心情：很好纪念日：任务清单昨日完成的任务，最重要的三件事：更新小红书笔记一篇，抖音视频一条。给小孩准备了一周的辅食肉丸还有面点改进：复盘笔记完成的很敷衍习惯养成：早上4；30起床；读书后笔记；中途回想复盘周目标·完成进度日更小红书笔记/抖音视频学习·信
WebRTC实现1对1音视频通信原理十年编程老舅音视频开发 webrtc 音视频 C++音视频视频编解码音视频通话 srs 流媒体服务器
什么是WebRTC？WebRTC（WebReal-TimeCommunication）是Google于2010以6829万美元从GlobalIPSolutions公司购买，并于2024年01月10日将其开源，旨在建立一个互联网浏览器间的实时通信的平台，让WebRTC技术成为H5标准之一。我们看官网（https://webrtc.org）的介绍本文福利，免费领取C++音视频学习资料包+学习路线大纲、
RTMP vs SRT：延迟与最大带宽的比较十年编程老舅音视频开发 ffmpeg RTSP RTMP 音视频开发音视频 SRT
引言文来自Haivision的白皮书，比较了RTMP和SRT两种流媒体协议的优缺点，并通过实验测试了两种协议在延迟和最大带宽两方面的表现。本文福利，免费领取C++音视频学习资料包+学习路线大纲、技术视频/代码，内容包括（音视频开发，面试题，FFmpeg，webRTC，rtmp，hls，rtsp，ffplay，编解码，推拉流，srs）↓↓↓↓↓↓见下面↓↓文章底部点击免费领取↓↓介绍对于希望在IP上
android 实时流媒体实时流媒体播放十年编程老舅音视频开发 android 音视频开发音视频流媒体服务器实时流媒体
场景描述将实时流采集终端的视频数据实时推送到另外一个（多个）播放终端，完成远距离实时视频播放的功能。典型场景：（1）远程查看监控摄像头。选择指定摄像头，将该摄像头采集到的实时数据推送到指定播放终端，供值班（监控中心）人员查看。包括实时视频上墙，推送到指定大屏幕上；（2）直播系统。用户在PC上安装推流工具，抓取屏幕（麦克风）实时数据，推送给观看直播的观众。本文福利，免费领取C++音视频学习资料包+学
2021-11-10晨间日记沐溪呀
今天是什么日子起床：8:00就寝：预计23:00天气：晴心情：很好，感觉一切依旧美好如初纪念日：无（我们家现在只有小一一宝宝配拥有仪式感和纪念日……）任务清单昨日完成的任务，最重要的三件事：1.按时下班2.当日所有学习完成3.完成本学期雨露行动方案、计划、九月份帮扶记录表和简报改进：早睡时间习惯养成：阅读、日更、普通话打卡、学习强国、音视频学习周目标·完成进度把APP里该刷的课全部刷完学习·信息·
音视频学习(二十二)——rtmp发流(tcp方式) 却道天凉_好个秋音视频学习音视频学习 tcp/ip rtmp
前言本文主要介绍自研的RtmpStreamSender.dll，rtmp库提供接口接收裸流数据，支持将裸流数据封装为flv格式并通过rtmp协议发流。关于rtmp协议基础介绍可查看：https://blog.csdn.net/www_dong/article/details/131026072关于rtmp收流介绍可查看：https://blog.csdn.net/www_dong/article/
音视频学习笔记廖燊
前言自己都是对直播这个模块很好奇，觉得是很深的，一直没有学习的机会，没有再项目中运用到，现在根据自己网上看到的文章推流：指的是把采集阶段封包好的内容，传输到服务器的过程。拉流：指服务器已有直播内容，用指定地址进行拉取的过程。主流的推送协议RTMP：视频必须是H264编码，音频必须是AAC或MP3编码，且多以flv格式封包。优点：对CDN支持良好，实现难度较低缺点：不支持浏览器HLS：基于HTTP的
mp4文件格式解析音视频开发老马流媒体服务器 Android音视频开发音视频开发音视频实时音视频视频编解码语音识别计算机视觉
目录概述mp4文件基本信息封装格式重要概念重要box介绍其他box介绍实用技术开源软件参考【文末扫马进君羊，领取音视频学习资料】[1]ISO/IEC14496-12:2015[2]wikipedia/MPEG-4[3]wikipedia/ISObasemediafileformat[4]wikipedia/MPEG-4Part14[5]Tocy/多媒体文件格式之MP4[6]PhilCluff/Wh
音视频学习(二十一)——rtmp收流(tcp方式) 却道天凉_好个秋音视频学习音视频学习 tcp/ip rtmp
前言本文主要介绍rtmp协议收流流程，在linux上搭建rtmp服务器，通过自研的rtmp收流库发起取流请求，使用ffmpeg+qt实现视频流的解码与播放。关于rtmp协议基础介绍可查看：https://blog.csdn.net/www_dong/article/details/131026072环境搭建nginx-rtmp-module下载#下载地址,下载zip包即可https://githu
flv.js解析与使用程序员老舅音视频开发进阶实时音视频视频编解码音视频 webrtc linux
简介Flv.js是HTML5Flash视频（FLV）播放器，纯原生JavaScript开发，没有用到Flash。由bilibili网站开源。它的工作原理是将FLV文件流转码复用成ISOBMFF（MP4碎片）片段，然后通过MediaSourceExtensions将MP4片段喂进浏览器。本文福利，免费领取C++音视频学习资料包、技术视频，内容包括（音视频开发，面试题，FFmpeg，webRTC，rt
音视频学习（二十）——rtsp收流(udp方式) 却道天凉_好个秋音视频学习音视频学习 udp c++
前言本文主要介绍通过udp方式实现rtsp拉流。流程图流程说明：相较于tcp方式“信令+数据”复用同一连接拉流，udp方式拉流“信令+数据”采用不同的连接，信令传输采用tcp，流数据传输采用udp；客户端向服务端（设备等）发起tcp请求，用于后续信令交互；tcp连接成功后，开始rtsp信令交互（describe、setup、play等），rtsp链路需要保活；客户端选择两个未用的端口创建udp链路
音视频学习从零到整--视频解码思路 _小迷糊_997
作者：CC老师_HelloCoder原文地址：https://www.jianshu.com/p/c99ce47f4280音视频编解码处理流程,这个问题经常是面试官抛砖引玉的问题.他们渴望能从这个流程中看到你的宏观思考和微观技术处理.采集编码解码渲染一.解码的思路:解析数据(NALUUnit)I/P/B...初始化解码器将解析后的H264NALUUnit输入解码器解码完成回调,输出解码数据解码数据
音视频学习之路--一些基础概念蜗牛是不是牛
前言本章还是继续了解一些音视频基础的名词等，因为这方面内容非常多，所以还是多阅读、多复习。正文视频编码根据之前的播放器原理，视频编码也就是通过特定的压缩技术，将某个视频格式文件转换为另一种视频格式文件，这个编码技术主要分为2类，一类是H.264、H.265等，还有一种是MPEG。MPEG系列：MPEG其实就是MovingPictureExpertsGroup，即运动图像专家组。它在视频编码主要有M
音视频学习之路--JNI全面解析蜗牛是不是牛
前言复习完C和C++的基础就可以来进行NDK相关的开发了，也就是又回到Java，但是用Java来调用C/C++。所以本章先仔细学习一下JNI，在很久之前我做过有关JNI的开发，但是比较少，没有深入过，所以本篇文章就先介绍一下JNI。在文章正式开始之前，先给大家分享一个B站上非常不错的视频教程，该视频教程从基础知识讲解再到直播推流实战，非常全面讲的也很细致，大家可以去看看。音视频开发全系列教程：ht
【音视频连载-008】基础学习篇-SDL 播放 PCM 音频文件（下） glumes
音视频学习入门技术文章连载：技术开发故事会连载【音视频连载-001】基础学习篇-SDL介绍以及工程配置【音视频连载-002】基础学习篇-SDL创建窗口并显示颜色【音视频连载-003】基础学习篇-SDL消息循环和事件响应【音视频连载-004】基础学习篇-SDL加载图片并显示【音视频连载-005】基础学习篇-SDL加载YUV文件并显示【音视频连载-006】基础学习篇-SDL播放YUV视频文件【音视频连
SQL的各种连接查询 xieke90 UNION ALL UNION 外连接内连接 JOIN
一、内连接概念：内连接就是使用比较运算符根据每个表共有的列的值匹配两个表中的行。内连接（join 或者inner join ） SQL语法： select * fron
java编程思想--复用类百合不是茶 java 继承代理组合 final类
复用类看着标题都不知道是什么,再加上java编程思想翻译的比价难懂,所以知道现在才看这本软件界的奇书一:组合语法:就是将对象的引用放到新类中即可代码: package com.wj.reuse; /** * * @author Administrator 组
[开源与生态系统]国产CPU的生态系统 comsci cpu
计算机要从娃娃抓起...而孩子最喜欢玩游戏.... 要让国产CPU在国内市场形成自己的生态系统和产业链,国家和企业就不能够忘记游戏这个非常关键的环节.... 投入一些资金和资源,人力和政策,让游
JVM内存区域划分Eden Space、Survivor Space、Tenured Gen，Perm Gen解释商人shang jvm内存
jvm区域总体分两类，heap区和非heap区。heap区又分：Eden Space（伊甸园）、Survivor Space(幸存者区)、Tenured Gen（老年代-养老区）。非heap区又分：Code Cache(代码缓存区)、Perm Gen（永久代）、Jvm Stack(java虚拟机栈)、Local Method Statck(本地方法栈)。 HotSpot虚拟机GC算法采用分代收
页面上调用 QQ oloz qq
<A href="tencent://message/?uin=707321921&Site=有事Q我&Menu=yes"> <img style="border:0px;" src=http://wpa.qq.com/pa?p=1:707321921:1></a>
一些问题文强chu 问题
1.eclipse 导出 doc 出现“The Javadoc command does not exist.” javadoc command 选择 jdk/bin/javadoc.exe 2.tomcate 配置 web 项目 ..... SQL:3.mysql * 必须得放前面否则 select&nbs
生活没有安全感小桔子生活孤独安全感
圈子好小，身边朋友没几个，交心的更是少之又少。在深圳，除了男朋友，没几个亲密的人。不知不觉男朋友成了唯一的依靠，毫不夸张的说，业余生活的全部。现在感情好，也很幸福的。但是说不准难免人心会变嘛，不发生什么大家都乐融融，发生什么很难处理。我想说如果不幸被分手(无论原因如何)，生活难免变化很大，在深圳，我没交心的朋友。明
php 基础语法 aichenglong php 基本语法
1 .1 php变量必须以$开头 <?php $a=” b”; echo ?> 1 .2 php基本数据库类型 Integer float/double Boolean string 1 .3 复合数据类型数组array和对象 object 1 .4 特殊数据类型 null 资源类型(resource) $co
mybatis tools 配置详解 AILIKES mybatis
MyBatis Generator中文文档 MyBatis Generator中文文档地址： http://generator.sturgeon.mopaas.com/ 该中文文档由于尽可能和原文内容一致，所以有些地方如果不熟悉，看中文版的文档的也会有一定的障碍，所以本章根据该中文文档以及实际应用，使用通俗的语言来讲解详细的配置。本文使用Markdown进行编辑，但是博客显示效
继承与多态的探讨百合不是茶 JAVA面向对象继承对象
继承 extends 多态继承是面向对象最经常使用的特征之一：继承语法是通过继承发、基类的域和方法 //继承就是从现有的类中生成一个新的类，这个新类拥有现有类的所有extends是使用继承的关键字：在A类中定义属性和方法； class A{ //定义属性 int age； //定义方法 public void go
JS的undefined与null的实例 bijian1013 JavaScript JavaScript
<form name="theform" id="theform"> </form> <script language="javascript"> var a alert(typeof(b)); //这里提示undefined if(theform.datas
TDD实践（一） bijian1013 java 敏捷 TDD
一.TDD概述 TDD：测试驱动开发，它的基本思想就是在开发功能代码之前，先编写测试代码。也就是说在明确要开发某个功能后，首先思考如何对这个功能进行测试，并完成测试代码的编写，然后编写相关的代码满足这些测试用例。然后循环进行添加其他功能，直到完全部功能的开发。
[Maven学习笔记十]Maven Profile与资源文件过滤器 bit1129 maven
什么是Maven Profile Maven Profile的含义是针对编译打包环境和编译打包目的配置定制，可以在不同的环境上选择相应的配置，例如DB信息，可以根据是为开发环境编译打包，还是为生产环境编译打包，动态的选择正确的DB配置信息 Profile的激活机制 1.Profile可以手工激活，比如在Intellij Idea的Maven Project视图中可以选择一个P
【Hive八】Hive用户自定义生成表函数(UDTF) bit1129 hive
1. 什么是UDTF UDTF，是User Defined Table-Generating Functions，一眼看上去，貌似是用户自定义生成表函数，这个生成表不应该理解为生成了一个HQL Table，貌似更应该理解为生成了类似关系表的二维行数据集 2. 如何实现UDTF 继承org.apache.hadoop.hive.ql.udf.generic
tfs restful api 加auth 2.0认计 ronin47
　　目前思考如何给tfs的ngx-tfs api增加安全性。有如下两点：　　一是基于客户端的ip设置。这个比较容易实现。　　二是基于OAuth2.0认证，这个需要lua，实现起来相对于一来说，有些难度。　　现在重点介绍第二种方法实现思路。　　前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGe
jdk环境变量配置 byalias java jdk
进行java开发，首先要安装jdk，安装了jdk后还要进行环境变量配置： 1、下载jdk（http://java.sun.com/javase/downloads/index.jsp），我下载的版本是：jdk-7u79-windows-x64.exe 2、安装jdk-7u79-windows-x64.exe 3、配置环境变量：右击"计算机"-->&quo
《代码大全》表驱动法-Table Driven Approach-2 bylijinnan java
package com.ljn.base; import java.io.BufferedReader; import java.io.FileInputStream; import java.io.InputStreamReader; import java.util.ArrayList; import java.util.Collections; import java.uti
SQL 数值四舍五入小数点后保留2位 chicony 四舍五入
1.round() 函数是四舍五入用，第一个参数是我们要被操作的数据，第二个参数是设置我们四舍五入之后小数点后显示几位。 2.numeric 函数的2个参数，第一个表示数据长度，第二个参数表示小数点后位数。例如：　　select cast(round(12.5,2) as numeric(5,2))
c++运算符重载 CrazyMizzz C++
一、加+，减-，乘*，除/ 的运算符重载 Rational operator*(const Rational &x) const{ return Rational(x.a * this->a); } 在这里只写乘法的，加减除的写法类似二、<<输出,>>输入的运算符重载 &nb
hive DDL语法汇总 daizj hive 修改列 DDL 修改表
hive DDL语法汇总１、对表重命名 hive> ALTER TABLE table_name RENAME TO new_table_name; 2、修改表备注 hive> ALTER TABLE table_name SET TBLPROPERTIES ('comment' = new_comm
jbox使用说明 dcj3sjt126com Web
参考网址：http://www.kudystudio.com/jbox/jbox-demo.html jBox v2.3 beta [ 点击下载] 技术交流QQGroup：172543951 100521167 [2011-11-11] jBox v2.3 正式版 - [调整&修复] IE6下有iframe或页面有active、applet控件
UISegmentedControl 开发笔记 dcj3sjt126com
// typedef NS_ENUM(NSInteger, UISegmentedControlStyle) { // UISegmentedControlStylePlain, // large plain &
Slick生成表映射文件 ekian scala
Scala添加SLICK进行数据库操作，需在sbt文件上添加slick-codegen包 "com.typesafe.slick" %% "slick-codegen" % slickVersion 因为我是连接SQL Server数据库，还需添加slick-extensions，jtds包 "com.typesa
ES-TEST gengzg test
package com.MarkNum; import java.io.IOException; import java.util.Date; import java.util.HashMap; import java.util.Map; import javax.servlet.ServletException; import javax.servlet.annotation
为何外键不再推荐使用 hugh.wang mysql DB
表的关联，是一种逻辑关系，并不需要进行物理上的“硬关联”，而且你所期望的关联，其实只是其数据上存在一定的联系而已，而这种联系实际上是在设计之初就定义好的固有逻辑。在业务代码中实现的时候，只要按照设计之初的这种固有关联逻辑来处理数据即可，并不需要在数据库层面进行“硬关联”，因为在数据库层面通过使用外键的方式进行“硬关联”，会带来很多额外的资源消耗来进行一致性和完整性校验，即使很多时候我们并不
领域驱动设计 julyflame VO DAO 设计模式 DTO po
概念： VO（View Object）：视图对象，用于展示层，它的作用是把某个指定页面（或组件）的所有数据封装起来。 DTO（Data Transfer Object）：数据传输对象，这个概念来源于J2EE的设计模式，原来的目的是为了EJB的分布式应用提供粗粒度的数据实体，以减少分布式调用的次数，从而提高分布式调用的性能和降低网络负载，但在这里，我泛指用于展示层与服务层之间的数据传输对
单例设计模式 hm4123660 java Singleton 单例设计模式懒汉式饿汉式
单例模式是一种常用的软件设计模式。在它的核心结构中只包含一个被称为单例类的特殊类。通过单例模式可以保证系统中一个类只有一个实例而且该实例易于外界访问，从而方便对实例个数的控制并节约系统源。如果希望在系统中某个类的对象只能存在一个，单例模式是最好的解决方案。 &nb
logback zhb8015 log logback
一、logback的介绍 Logback是由log4j创始人设计的又一个开源日志组件。logback当前分成三个模块：logback-core,logback- classic和logback-access。logback-core是其它两个模块的基础模块。logback-classic是log4j的一个改良版本。此外logback-class
整合Kafka到Spark Streaming——代码示例和挑战 Stark_Summer spark storm zookeeper PARALLELISM processing
作者Michael G. Noll是瑞士的一位工程师和研究员，效力于Verisign，是Verisign实验室的大规模数据分析基础设施（基础Hadoop）的技术主管。本文，Michael详细的演示了如何将Kafka整合到Spark Streaming中。期间， Michael还提到了将Kafka整合到 Spark Streaming中的一些现状，非常值得阅读，虽然有一些信息在Spark 1.2版
spring-master-slave-commondao 王新春 DAO spring dataSource slave master
互联网的web项目，都有个特点：请求的并发量高，其中请求最耗时的db操作，又是系统优化的重中之重。为此，往往搭建 db的一主多从库的数据库架构。作为web的DAO层，要保证针对主库进行写操作，对多个从库进行读操作。当然在一些请求中，为了避免主从复制的延迟导致的数据不一致性，部分的读操作也要到主库上。（这种需求一般通过业务垂直分开，比如下单业务的代码所部署的机器，读去应该也要从主库读取数

Y	U	V
0	128	128
28	128	128
56	128	128
85	128	128
113	128	128
141	128	128
170	128	128
198	128	128
226	128	128
255	128	128

Y	U	V
0	128	128
28	128	128
56	128	128
85	128	128
113	128	128
141	128	128
170	128	128
198	128	128
226	128	128
255	128	128

音视频学习：YUV