candycat1992

【图形学】我理解的伽马校正（Gamma Correction）

写在前面

我相信几乎所有做图像处理方面的人都听过伽马校正（Gamma Correction）这一个名词，但真正明白它是什么、为什么要有它、以及怎么用它的人其实不多。我也不例外。

最初我查过一些资料，但很多文章的说法都不一样，有些很晦涩难懂。直到我最近在看《Real Time Rendering，3rd Edition》这本书的时候，才开始慢慢对它有所理解。

本人才疏学浅，写的这篇文章很可能成为网上另一篇误导你的“伽马传说”，但我尽可能把目前了解的资料和可能存在的疏漏写在这里。如有错误，还望指出。

伽马的传说

关于这个方面，龚大写过一篇文章，但我认为其中的说法有不准确的地方。

从我找到的资料来看，人们使用伽马曲线来进行显示最开始是源于一个巧合：在早期，CRT几乎是唯一的显示设备。但CRR有个特性，它的输入电压和显示出来的亮度关系不是线性的，而是一个类似幂律（pow-law）曲线的关系，而这个关系又恰好跟人眼对光的敏感度是相反的。这个巧合意味着，虽然CRT显示关系是非线性的，但对人类来说感知上很可能是一致的。

我来详细地解释一下这个事件：在很久很久以前（其实没多久），全世界都在使用一种叫CRT的显示设备。这类设备的显示机制是，使用一个电压轰击它屏幕上的一种图层，这个图层就可以发亮，我们就可以看到图像了。但是，人们发现，咦，如果把电压调高两倍，屏幕亮度并没有提高两倍啊！典型的CRT显示器的伽马曲线大致是一个伽马值为2.5的幂律曲线。显示器的这类伽马也称为display gamma。由于这个问题的存在，那么图像捕捉设备就需要进行一个伽马校正，它们使用的伽马叫做encoding gamma。所以，一个完整的图像系统需要2个伽马值：

- encoding gamma：它描述了encoding transfer function，即图像设备捕捉到的场景亮度值（scene radiance values）和编码的像素值（encoded pixel values）之间的关系。
- display gamma：它描述了display transfer function，即编码的像素值和显示的亮度（displayed radiance）之间的关系。

如下图所示：

而encoding gamma和display gamma的乘积就是真个图像系统的end-to-end gamma。如果这个乘积是1，那么显示出来的亮度就是和捕捉到的真实场景的亮度是成比例的。

上面的情景是对于捕捉的相片。那么对于我们渲染的图像来说，我们需要的是一个encoding gamma。如果我们没有用一个encoding gamma对shader的输出进行校正，而是直接显示在屏幕上，那么由于display gamma的存在就会使画面失真。

至此为止，就是龚大所说的伽马传说。由此，龚大认为全部的问题都出在CRT问题上，跟人眼没有任何关系。

但是，在《Real-time Rendering》一书中，指出了这种乘积为1的end-to-end gamma的问题。看起来，乘积为1的话，可以让显示器精确重现原始场景的视觉条件。但是，由于原始场景的观察条件和显示的版本之间存在两个差异：1）首先是，我们能够显示的亮度值其实和真实场景的亮度值差了好几个数量级，说通俗点，就是显示器的精度根本达不到真实场景的颜色精度（大自然的颜色种类几乎是无穷多的，而如果使用8-bit的编码，我们只能显示256^3种颜色）；2）这是一种称为surround effect的现象。在真实的场景中，原始的场景填充了填充了观察者的所有视野，而显示的亮度往往只局限在一个被周围环境包围的屏幕上。这两个差别使得感知对比度相较于原始场景明显下降了。也就是我们一开始说的，对光的灵敏度对不同亮度是不一样的。如下图所示（来源： Youtube: Color is Broken）：

为了中和这种现象，所以我们需要乘积不是1的end-to-end gamma，来保证显示的亮度结果在感知上和原始场景是一致的。根据《Real-time Rendering》一书中，推荐的值在电影院这种漆黑的环境中为1.5，在明亮的室内这个值为1.125。

个人电脑使用的一个标准叫sRGB，它使用的encoding gamma大约是0.45（也就是1/2.2）。这个值就是为了配合display gamma为2.5的设备工作的。这样，end-to-end gamma就是0.45 * 2.5 = 1.125了。

这意味着，虽然CRT的display gamma是2.5，但我们使用的encoding gamma应该是1.125/2.5 = 1/2.2，而不是1/2.5。这样才能保证end-to-end gamma为1.125，从而在视觉上进行了补偿。

虽然现在CRT设备很少见了，但为了保证这种感知一致性（这是它一直沿用至今的很重要的一点），同时也为了对已有图像的兼容性（之前很多图像使用了encoding gamma对图像进行了编码），所以仍在使用这种伽马编码。而且，现在的LCD虽然有不同的响应曲线（即display gamma不是2.5），但是在硬件上做了调整来提供兼容性。

重要：上面的说法主要来源于Real-time Rendering》一书。

来自其他领域的伽马传说

今天很幸运听了知乎上韩世麟童鞋的讲解。在听了他的讲座后，我听到了另一个版本的伽马传说。和上面的讨论不同，他认为伽马的来源完全是由于人眼的特性造成的。对伽马的理解和职业很有关系，长期从事摄影、视觉领域相关的工作的人可能更有发言权。我觉得这个版本更加可信。感兴趣的同学可以直接去知乎上领略一下。

我在这里来大致讲一下他的理解。

事情的起因可以从在真实环境中拍摄一张图片说起。摄像机的原理可以简化为，把进入到镜头内的光线亮度编码成图像（例如一张JEPG）中的像素。这样很简单啦，如果采集到的亮度是0，像素就是0，亮度是1，像素就是1，亮度是0.5，像素就是0.5。这里，就是这里，出现了一点问题！如果我们假设只用8位空间来存储像素的话，以为着0-1可以表示256种颜色，没错吧？但是，人眼有的特性，就是对光的灵敏度在不同亮度是不一样的。还是这张图Youtube: Color is Broken：

这张图说明一件事情，即亮度上的线性变化在人眼看来是非均匀的，再通俗点，从0亮度变到0.01亮度，人眼是可以察觉到的，但从0.99变到1.0，人眼可能就根本差别不出来，觉得它们是一个颜色。也就是说，人眼对暗部的变化更加敏感，而对亮部变化其实不是很敏感。也就是说，人眼认为的中灰其实不在亮度为0.5的地方，而是在大约亮度为0.18的地方（18度灰）。强烈建议去看一下Youtube上的视频， Color is Broken。

那么，这和拍照有什么关系呢？如果在8位图中，我们仍然用0.5亮度编码成0.5的像素，那么暗部和亮部区域我们都使用了128种颜色来表示，但实际上，亮部区域使用这么多种其实相对于暗部来说是种存储浪费。不浪费的做法是，我们应该把人眼认为的中灰亮度放在像素值为0.5的地方，也就是说，0.18亮度应该编码成0.5像素值。这样存储空间就可以充分利用起来了。所以，摄影设备如果使用了8位空间存储照片的话，会用大约为0.45的encoding gamma来对输入的亮度编码，得到一张图像。0.45这个值完全是由于人眼的特性测量得到的。

那么显示的时候到了。有了一张图片，显示的时候我们还是要把它还原成原来的亮度值进行显示。毕竟，0.454只是为了充分利用存储空间而已。我们假设一下，当年CRT设备的输入电压和产生亮度之间完全是线性关系，我们还是要进行伽马校正的。这是为了把用0.45伽马编码后的图像正确重现在屏幕上。巧合的是，当年人们发现CRT显示器竟然符合幂律曲线！人们想，“天哪，太棒了，我们不需要做任何调整就可以让拍摄的图像在电脑上看起来和原来的一样了”。这就是我们一直说的“那个巧合”。当年，CRT的display gamma是2.5，这样导致最后的end-to-end gamma大约是0.45 * 2.5 = 1.125，其实是非1的。

直到后来，微软联合爱普生、惠普提供了sRGB标准，推荐显示器中display gamma值为2.2。这样，配合0.45的encoding gamma就可以保证end-to-end gamma为1了。当然，上一节提到的两个观察差异，有些时候我们其实更希望end-to-end gamma非1的结果，例如，在电影院这种暗沉沉的环境中，end-to-end gamma为1.5我们人看起来更爽、更舒服，而在明亮的办公室这种环境中1.125的end-to-end gamma值更舒服、更漂亮。所以，我们可以根据环境的不同，去选择使用什么样的display gamma。

总之， 伽马校正一直沿用至今说到底是人眼特性决定的。你会说，伽马这么麻烦，什么时候可以舍弃它呢？按韩世麟童鞋的说法，如果有一天我们对图像的存储空间能够大大提升，通用的格式不再是8位的时候，例如是32位的时候，伽马就没有用了。因为，我们不需要为了提高精度而把18度灰编码成0.5像素，因为我们有足够多的颜色空间可以利用，不需要考虑人眼的特性。

好啦，上面就是来自摄影、建筑领域的看法和理解。希望这两种看法可以让大家更深地理解伽马校正的存在意义。

这和渲染有什么关系

其实，对伽马传说的理解就算有偏差，也不会影响我们对伽马校正的使用。我们只要知道，根据sRGB标准，大部分显示器使用了2.2的display gamma来显示图像。

前面提到了，和渲染相关的是encoding gamma。我们知道了，显示器在显示的时候，会用display gamma把显示的像素进行display transfer之后再转换成显示的亮度值。所以，我们要在这之前，像图像捕捉设备那样，对图像先进行一个encoding transfer，与此相关的就是encoding gamma了。

而不幸的是，在游戏界长期以来都忽视了伽马校正的问题，也造成了为什么我们渲染出来的游戏总是暗沉沉的，总是和真实世界不像。

回到渲染的时候。我们来看看没有正确进行伽马校正到底会有什么问题。

以下实验均在Unity中进行。

光照

我们来看一个最简单的场景：在场景中放置一个球，使用默认的Diffuse材质，打一个平行光：

看起来很对是吗？但实际上，这和我们在真实场景中看到的是不一样的。在真实的场景中，如果我们把一个球放在平行光下，它是长这个样子的：

假设球上有一点B，它的法线和光线方向成60°，还有一点A，它的法线和光线方向成90°。那么，在shader中计算diffuse的时候，我们会得出B的输出是（0.5, 0.5, 0.5），A的输出的（1.0, 1.0, 1.0）。

在第一张图中，我们没有进行伽马校正。因此，在把像素值转换到屏幕亮度时并不是线性关系，也就是说B点的亮度其实并不是A亮度的一半，在Mac显示器上，这个亮度只有A亮度的1/1.8呗，约为四分之一。在第二章图中，我们进行了伽马校正，此时的亮度才是真正跟像素值成正比的。

混合

混合其实是非常容易受伽马的影响。我们还是在Unity里创建一个场景，使用下面的shader渲染三个Quad：

Shader "Custom/Gamma Correction For Quad" {
    Properties {
        _MainTex ("Base (RGB)", 2D) = "white" {}
        _Color ("Color", Color) = (1, 1, 1, 1)
    }
    SubShader {     
        Tags
        {
            "Queue" = "Transparent"
            "IgnoreProjector" = "True"
            "RenderType" = "Transparent"
        }

        Pass {
// Blend One One
            Blend SrcAlpha OneMinusSrcAlpha

            CGPROGRAM
            #pragma vertex vert
            #pragma fragment frag

            #include "UnityCG.cginc"

            sampler2D _MainTex;
            float4 _Color;

            struct v2f {
                float4 pos : SV_POSITION;
                float4 uv : TEXCOORD0;
                float4 normal : TEXCOORD1;
            };

            v2f vert(appdata_base i) {
                v2f o;
                o.pos = mul(UNITY_MATRIX_MVP, i.vertex);
                o.uv = i.texcoord;

                return o;
            }

            float4 circle(float2 pos, float2 center, float radius, float3 color, float antialias) {
                float d = length(pos - center) - radius;
                float t = smoothstep(0, antialias, d);
                return float4(color, 1.0 - t);
            }

            float4 frag(v2f i) : SV_Target {
                float4 background = float4(0.0);
                float4 layer1 = circle(i.uv, float2(0.5, 0.5), 0.3, _Color.rgb, 0.2);

                float4 fragColor = float4(0.0);
                fragColor = lerp(fragColor, layer1, layer1.a);

// fragColor = pow(fragColor, 1.0/1.8);
                return fragColor;
            }

            ENDCG
        }
    } 
    FallBack "Diffuse"
}

上面的shader其实很简单，就是在Quad上画了个边缘模糊的圆，然后使用了混合模式来会屏幕进行混合。我们在场景中画三个这样不同颜色的圆，三种颜色分别是(0.78, 0, 1)，(1, 0.78, 0)，(0, 1, 0.78)：

看出问题了吗？在不同颜色的交接处出现了不正常的渐变。例如，从绿色(0, 1, 0.78)到红色(0.78, 0, 1)的渐变中，竟然出现了蓝色。

正确的显示结果应该是：

第一张图的问题出在，在混合后进行输出时，显示器进行了display transfer，导致接缝处颜色变暗。

非线性输入

shader中非线性的输入最有可能的来源就是纹理了。

为了直接显示时可以正确显示，大多数图像文件都进行了提前的校正，即已经使用了一个encoding gamma对像素值编码。但这意味着它们是非线性的，如果在shader中直接使用会造成在非线性空间的计算，使得结果和真实世界的结果不一致。

Mipmaps

在计算纹理的Mipmap时也需要注意。如果纹理存储在非线性空间中，那么在计算mipmap时就会在非线性空间里计算。由于mipmap的计算是种线性计算——即降采样的过程，需要对某个方形区域内的像素去平均值，这样就会得到错误的结果。正确的做法是，把非线性的纹理转换到线性空间后再计算Mipmap。

扩展

由于未进行伽马校正而造成的混合问题其实非常常见，不仅仅是在渲染中才遇到的。

Youtube上有一个很有意思的视频，非常建议大家看一下。里面讲的就是，由于在混合前未对非线性纹理进行转换，造成了混合纯色时，在纯色边界处出现了黑边。用数学公式来阐述这一现象就是：

x1gamma+y1gamma2<(x+y2)1gamma
我们可以把

x1gamma 和

y1gamma 看成是两个非线性空间的纹理，如果直接对它们进行混合（如取平均值），得到的结果实际要暗于在线性空间下取平均值再伽马校正的结果。

所以，在处理非线性纹理时一定要格外小心。

进行伽马校正

我们的目标是：保证所有的输入都转换到线性空间，并在线性空间下做各种光照计算，最后的输出在通过一个encoding gamma进行伽马校正后进行显示。

在Unity中，有一个专门的设置是为伽马校正服务的，具体可以参见官方文档（Linear Lighting）。

简单来说就是靠Edit -> Project Settings -> Player -> Other Settings中的设置：

它有两个选项：一个是Gamma Space，一个Linear Space。

- 当选择Gamma Space时，实际上就是“放任模式”，不会对shader的输入进行任何处理，即使输入可能是非线性的；也不会对输出像素进行任何处理，这意味着输出的像素会经过显示器的display gamma转换后得到非预期的亮度，通常表现为整个场景会比较昏暗。

当选择Linear Space时，Unity会背地里把输入纹理设置为sRGB模式，这种模式下硬件在对纹理进行采样时会自动将其转换到线性空间中；并且，也会设置一个sRGB格式的buffer，此时GPU会在shader写入color buffer前自动进行伽马校正。如果此时开启了混合（像我们之前的那样），在每次混合是，之前buffer中存储的颜色值会先重新转换回线性空间中，然后再进行混合，完成后再进行伽马校正，最后把校正后的混合结果写入color buffer中。这里需要注意，Alpha通道是不会参与伽马校正的。

sRGB模式是在近代的GPU上才有的东西。如果不支持sRGB，我们就需要自己在shader中进行伽马校正。对非线性输入纹理的校正通常代码如下：

float3 diffuseCol = pow(tex2D( diffTex, texCoord ), 2.2 );

在最后输出前，对输出像素值的校正代码通常长下面这样：

fragColor.rgb = pow(fragColor.rgb, 1.0/2.2);
return fragColor;

但是，手工对输出像素进行伽马校正在使用混合的时候会出现问题。这是因为，校正后导致写入color buffer的颜色是非线性的，这样混合就发生在非线性空间中。一种解决方法时，在中间计算时不要对输出进行伽马校正，在最后进行一个屏幕后处理操作对最后的输出进行伽马校正，但很显然这会造成性能问题。

还有一些细节问题，例如在进行屏幕后处理的时候，要小心我们目前正在处理的图像到底是不是已经伽马校正后的。

总之，一切工作都是为了“保证所有的输入都转换到线性空间，并在线性空间下做各种光照计算，最后的输出（最最最最后的输出）进行伽马校正后再显示”。

虽然Unity的这个设置非常方便，但是其支持的平台有限，目前还不支持移动平台。也就是说，在安卓、iOS上我们无法使用这个设置。因此，对于移动平台，我们需要像上面给的代码那样，手动对非线性纹理进行转换，并在最后输出时再进行一次转换。但这又会导致混合错误的问题。

在Unity中使用Linear Space

如果我们在Edit -> Project Settings -> Player -> Other Settings中使用了Linear Space，那么之前的光照、混合问题都可以解决（这里的解决是说和真实场景更接近）。但在处理纹理时需要注意，所有Unity会把所有输入纹理都设置成sRGB格式，也就说，所有纹理都会被硬件当成一个非线性纹理，使用一个display gamma（通常是2.2）进行处理后，再传递给shader。但有时，输入纹理并不是非线性纹理就会发生问题。

例如，我们绘制一个亮度为127/255的纹理，传给shader后乘以2后进行显示：

可以看出，Gamma Space的反而更加正确。这是因为，我们的输入纹理已经是线性了，而Unity错误地又进行了sRGB的转换处理。这样一来，右边显示的亮度实际是，(pow(0.5, 2.2) * 2, 1/2.2)。

为了告诉Unity，“嘿，这张纹理就是线性的，不用你再处理啦”，可以在Texture的面板中设置：

上面的“Bypass sRGB Sample”就是告诉Untiy要绕过sRGB处理，“它是啥就是啥！”。

这样设置后，就可以得到正确采样结果了。

写在最后

伽马校正一直是个众说纷纭的故事，当然我写的这篇也很可能会有一些错误，如果您能指出不胜感激。

即便关于一些细节问题说法很多，但本质是不变的。GPU Gems上的一段话可以说明伽马校正的重要性：

This is one reason why most (but not all) CG for film looks much better than games—a reason that has nothing to do with the polygon counts, shading, or artistic skills of game creators. (It’s also sometimes a reason why otherwise well-made film CG looks poor—because the color palettes and gammas have been mismatched by a careless compositor.)

最后，给出GPU Gems中的一段总结，以下步骤应该在游戏开发中应用：

1. 假设大部分游戏使用没有校正过的显示器，这些显示器的display gamma可以粗略地认为是2.2。（对于更高质量要求的游戏，可以让你的游戏提供一个伽马校正表格，来让用户选择合适的伽马值。）
2. 在对非线性纹理（也就是那些在没有校正的显示器上看起来是正确的纹理）进行采样时，而这些纹理又提供了光照或者颜色信息，我们需要把采样结果使用一个伽马值转换到线性空间中。不要对已经在线性颜色空间中的纹理，例如一些HDR光照纹理、法线纹理、凹凸纹理（bump heights）、或者其他包含非颜色信息的纹理，进行这样的处理。对于非线性纹理，尽量使用sRGB纹理格式。
3. 在显示前，对最后的像素值应用一个伽马校正（即使用1/gamma对其进行处理）。尽量使用sRGB frame-buffer extensions来进行有效自动的伽马校正，这样可以保证正确的混合。

所幸的是，在Unity中，上面的过程可以通过设置Edit -> Project Settings -> Player -> Other Settings->Color Space轻松地完成，需要注意的是对纹理的处理。但不幸的是，不支持移动平台。

最后，一句忠告，在游戏渲染的时候一定要考虑伽马校正的问题，否则就很难得到非常真实的效果。

下面有一些文章是我觉得很好的资料，但是其中有很多说法是有争议的，希望大家能自己评估：

http://http.developer.nvidia.com/GPUGems3/gpugems3_ch24.html
《Real-Time Rendering, Third Edition》5.8. Gamma Correction
http://www.klayge.org/2011/02/26/gamma%E7%9A%84%E4%BC%A0%E8%AF%B4/
http://qiankanglai.me/misc/2014/12/24/gamma-correction/
http://docs.unity3d.com/Manual/LinearLighting.html
知乎上的讨论，看了很凌乱~啊啊啊啊~

matlab带下标的字母,matlab的特殊字符（上下标和希腊字母等）赤脚大仙儿 matlab带下标的字母
‘T=25\circC‘，(摄氏度)下标用_(下划线)上标用^(尖号)希腊字母等特殊字符用α\alphaβ\betaγ\gammaθ\thetaΘ\ThetaГ\Gammaδ\deltaΔ\Deltaξ\xiΞ\Xiη\eltaε\epsilonζ\zetaμ\miuυ\nuτ\tauλ\lamdaΛ\Lamdaπ\piΠ\Piσ\sigmaΣ\Sigmaφ\phiΦ\Phiψ\psiΨ\Psiχ
数据的流动——计算机是如何显示一个像素的一尾66 基础知识图形渲染其他
在计算机内部是怎么把一张照片显示到屏幕上的呢？对于这个问题一直很好奇，这应该是也是图形学的一个最基础的问题吧。没上过计算机组成原理课，只好自行百度谷歌~发现网上的答案大多不完整，前段时间顺着问题一直搜索，从计算机的发明到显示器成像后来又到了电路，后来甚至工业革命的发展史，根本停不下来，有了一个主题后看历史也是真挺有意思的。在这里将我的理解大概记下来，不求细节精确，只求完整易懂。一个从编程/输入设备
Unity面试：MipMap是什么，有什么作用？ returnShitBoy unity 游戏引擎
MipMap（多级纹理映射）是计算机图形学中用于提高渲染效率和图像质量的一种技术。在Unity3D等游戏开发中，MipMap的作用主要体现在以下几个方面：减少模糊效果：当纹理在屏幕上缩小时，使用MipMap可以避免出现模糊和失真现象。MipMap的概念是为同一纹理创建多个采样级别，每个级别的分辨率逐渐降低。当物体离摄像机较远时，使用较低分辨率的纹理进行渲染，从而提供更清晰、自然的视觉效果。提高渲染
PDF标准详解（三）—— PDF坐标系统和坐标变换 aluluka PDF 相关技术 pdf
之前我们了解了PDF文档的基本结构，并且展示了一个简单的helloworld。这个helloworld虽然只在页面中显示一个helloworld文字，但是包含的内容却是不少。这次我们仍然以它为切入点，来了解PDF的坐标系统以及坐标变换的相关知识图形学中二维图形变换中学我们学习了平面直角坐标系，x轴沿着水平方向从左往右递增，Y轴沿着竖直方向，从下往上坐标递增。而PDF的坐标系与数学中的坐标系相同。但
Coding and Paper Letter（十四） G小调的Qing歌
资源整理。1Coding:1.R语言包ungeviz，ggplot2的拓展包，专门用来作不确定性的可视化。ungeviz2.计算机图形学相关开源项目。计算机图形学光线追踪开源项目C++源码。computergraphicsraytracing计算机图形学格网开源项目C++源码。computergraphicsmeshes计算机图形学介绍开源项目。computergraphics3.R语言包GLMM
向量的叉积、点积、外积 qq_27390023 pytorch python 深度学习
向量的叉积、点积和外积是向量代数中非常重要的操作，用于描述向量间的关系。它们广泛应用于物理、计算机图形学、几何以及蛋白质结构分析等领域。下面对每个运算进行详细介绍，并通过PyTorch示例代码展示其实现。1.点积(DotProduct)点积是两个向量之间的数量积，结果是一个标量。点积用于测量两个向量的平行性或相对角度。如果两个向量的点积为零，则它们互相垂直。其中，θ是两个向量之间的夹角。PyTor
如何开发一个Web 3D引擎易之阴阳数字孪生 3D技术前端开发技术 3d
开发一个Web3D引擎是一项复杂且具有挑战性的任务，涉及计算机图形学、Web技术、性能优化等多个领域的知识。以下是一份详细的步骤指南，帮助您逐步创建一个Web3D引擎：1.确定项目目标与技术栈确定目标：明确引擎要支持的功能特性，如基本的3D模型加载、材质渲染、光照处理、动画系统、物理模拟、碰撞检测、脚本支持、后期处理效果等。还要考虑是否支持特定行业需求，如GIS集成、BIM数据处理等。选择技术栈：
unity3d 大地图接壤_多人紧密交互场景下的多视角人体动态三维重建方法与流程... weixin_39947908 unity3d 大地图接壤
本发明属于计算机视觉和图形学领域，具体讲，涉及人体关键点检测、追踪和人体三维模型重建方法。背景技术：在计算机视觉和计算机图形学中，无标记人体运动捕捉已经成为一个热门并且具有挑战性的热点问题，其主要任务是通过跟踪视频中移动对象的运动来恢复动态时间一致的3D形状。最近十年以来单人运动捕捉方法取得了巨大的进步，然而当前的方法需要对相机进行设置或处于一个受控的工作室环境中，并且依赖于良好的图像分割技术。在
三维海浪模型建模与matlab仿真简简单单做算法 MATLAB算法开发 #三维重建 matlab 开发语言计算机视觉
目录1.算法理论概述一、引言二、海浪模型三、三维海浪模型建模四、海浪模型数学原理2.部分核心程序3.算法运行软件版本4.算法运行效果图预览5.算法完整程序工程1.算法理论概述一、引言三维海浪模型建模是计算机图形学中的一个重要研究方向，可以模拟海浪的形态和运动规律，具有广泛的应用价值。目前，三维海浪模型建模已经成为计算机图形学领域的一个热门研究方向。本文将详细介绍三维海浪模型建模的实现步骤和数学原理
【Qt | 音视频学习路线（高薪路线 AI）】 Qt历险记 Qt 高级开发工程师 qt 音视频学习
Answer学习Qt音视频开发的学习路线可以分为以下几个阶段：1.基础知识准备C++编程基础：Qt主要使用C++，因此需要有扎实的C++编程基础。计算机图形学基础：了解基本的图形学概念，如图像处理、渲染等。音视频基础：了解音视频的基本概念，如编码、解码、格式等。2.学习Qt框架Qt基础：学习Qt的基本概念，如信号与槽、事件处理、界面布局等。QtWidgets：掌握QtWidgets模块，用于创建传
探索C++设计模式：一个实用的学习资源曹俐莉
探索C++设计模式：一个实用的学习资源项目简介在编程世界中，设计模式是解决常见问题的最佳实践和模板，它们为复杂软件设计提供了可重用的解决方案。是一个专门针对C++编程语言的设计模式实现库。这个开源项目不仅提供了各种设计模式的实例代码，还包含了详细的注释和解释，帮助开发者理解和应用这些模式。技术分析该项目覆盖了GOF（Gamma,Erich;Helm,Richard;Johnson,Ralph;Vl
学习笔记：计算机图形学中的辐射度基础1 ghostee
之前几篇笔记集中于计算机图形学中的坐标变换问题。在昨天一篇长篇的学习笔记完成后，暂时告一段落。从这篇学习笔记开始，将逐渐深入pbrt的核心。今天主要介绍pbrt中的一大核心要素——辐射度学的一些基本概念，笔记的篇幅不一定会长，但到多花些时间来理解这些基本概念，这样才能够对在这些概念的基础上产生的算法真正弄懂吃透。辐射度学源自于物理学，跟很多物理学领域类似，该学科的基础是能量，这里用Q来表示，可以被
详解cuda by example中第八章图形互操作性代码肖肥羊xy cuda by example c语言 c++人工智能 visual studio
这两天学到第八章了，发现第八章内容有部分是关于图形学的内容于是就把我对第八章关于图形互操作的代码理解也写一下，仅供学习，如果大家有发现不对的地方欢迎指正。（文章代码顺序按照官方示例代码顺序给出，可按顺序食用）1.引入头文件#include"../common/book.h"#include"../common/cpu_bitmap.h"#include"cuda.h"#include"cuda_g
fpga图像处理实战-RGB与HSV互转梦梦梦梦子~ OV5640+图像处理图像处理计算机视觉人工智能
HSV颜色模型HSV（Hue,Saturation,Value）颜色模型是一种常用的色彩表示方式，特别适用于图像处理、计算机图形学和色彩选取工具中。它通过将颜色的表示从传统的RGB（红、绿、蓝）模型转换为更符合人类视觉感知的方式来描述颜色。以下是HSV模型的三个主要分Hue（色调，H）：色调表示颜色的种类，通常用角度来表示，范围从0°到360°。在HSV模型的色轮中：0°代表红色，120°代表绿色
《计算机图形学编程》笔记——第四章小C酱油兵图形学图形学 opengl
《计算机图形学编程》笔记——第四章管理3D图形数据关键模块介绍1.缓冲区2.统一变量3.顶点属性插值4.模型-视图5.矩阵堆栈代码及结果BUG引用碎碎念管理3D图形数据使用OpenGL渲染3D图形通常需要将若干数据集发送给OpenGL着色器管线。举个例子：想要绘制一个简单的3D对象，比如一个立方体，至少需要发送以下项目：立方体模型的顶点；控制立方体在3D空间中朝向表现的变换矩阵;把数据发送给Ope
图形学论文笔记 Jozky86 图形学图形学笔记
文章目录PBD：XPBD：shapematchingPBD：【深入浅出NvidiaFleX】(1)PositionBasedDynamics最简化的PBD(基于位置的动力学)算法详解-论文原理讲解和太极代码最简化的PBD(基于位置的动力学)算法详解-论文原理讲解和太极代码XPBD：基于XPBD的物理模拟一条龙：公式推导+代码+文字讲解（纯自制）【论文精读】XPBD基于位置的动力学XPBD论文解读(
OpenCL在移动端GPU计算中的应用与实践 m0_67544708 java GPU OpenCL
一、引言移动端芯片性能的不断提升为在手机上进行计算密集型任务，如计算机图形学和深度学习模型推理，提供了可能。在Android设备上，GPU，尤其是高通Adreno和华为Mali，因其卓越的浮点运算能力，成为了异构计算中的重要组成部分。百度APP已经利用GPU计算加速深度模型推理和计算密集型业务。本文将介绍OpenCL的基础概念和简单编程。二、基础概念2.1异构计算异构计算指的是使用不同类型指令集和
AR技术的深度解读及实际应用 m0_70960708 笔记 ar
一、增强现实（AR）技术深度解读增强现实（AR）技术是一种将虚拟信息与现实世界相结合的技术。它通过计算机图形学、传感器技术、跟踪和定位技术等手段，将数字信息、三维模型等虚拟内容实时叠加到真实场景中，为用户提供更加丰富和立体的视觉体验。AR技术的基本原理是利用摄像头、传感器等设备获取真实场景的信息，通过计算机图形学技术将虚拟内容与真实场景进行融合，再通过显示器将最终的合成图像呈现给用户。这种技术能够
算法笔记：空间填充曲线 UQI-LIUWJ 算法笔记
空间填充曲线（Space-fillingcurve）是一种数学曲线，它可以无间断地覆盖一个多维空间的每一个点，从而实现从一维到多维的映射。用以解决连续与离散空间之间的映射问题。空间填充曲线的应用广泛，包括图像处理、地理信息系统、数据库索引等领域。计算机图形学和图像处理：在图像压缩和像素处理中，利用空间填充曲线的局部保持特性，可以优化图像的存储和访问效率。地理信息系统：空间填充曲线用于地理空间数据索
希腊字母表及其读音 Dream_Bri 数学希腊字母表
希腊字母是希腊语的字母系统，也被广泛用于数学、物理、化学、工程等领域作为符号标记。下面是希腊字母表及其读音：Αα(Alpha)-读作/ˈælfə/Ββ(Beta)-读作/ˈbeɪtə/Γγ(Gamma)-读作/ˈgæmə/Δδ(Delta)-读作/ˈdɛltə/Εε(Epsilon)-读作/ˈɛpsɪlən/Ζζ(Zeta)-读作/ˈziːtə/Ηη(Eta)-读作/ˈeɪtə/Θθ(Theta)
计算机图形学入门 -- Raster Image 忻恆
Pixelisshortfor“pictureelement".rasterdevices:电视，喷墨/激光打印机；在输入设备中，相机，扫描仪等等。因此，rasterimage是最通常的存储图像方式。当然，我们会去对图像进行处理，所以显示的pixel跟实际的pixel不相同。另外还有矢量图这种存储方法,存储对形状的描述。好处是，resolutionindependentandcanbedispla
线性代数基础——向量我是李蜀黍计算机图形学基础学习笔记线性代数几何学
向量基础属性向量的基础属性为方向与长度；向量a⃗\vec{a}a的长度写为∥a⃗∥\Vert\vec{a}\Vert∥a∥；单位向量a^=a⃗∥a⃗∥\widehat{a}=\frac{\vec{a}}{\Vert\vec{a}\Vert}a=∥a∥a用来表示方向。向量的代数写法在图形学中，向量一般会写出矩阵的形式A⃗=(xy)\vec{A}=\begin{pmatrix}x\\y\end{pma
MATLAB图像拼接算法及实现程序员小溪算法 matlab 计算机视觉 MATLAB 人工智能
图像拼接算法及实现（一）论文关键词：图像拼接图像配准图像融合全景图论文摘要：图像拼接(imagemosaic)技术是将一组相互间重叠部分的图像序列进行空间匹配对准,经重采样合成后形成一幅包含各图像序列信息的宽视角场景的、完整的、高清晰的新图像的技术。图像拼接在摄影测量学、计算机视觉、遥感图像处理、医学图像分析、计算机图形学等领域有着广泛的应用价值。一般来说,图像拼接的过程由图像获取,图像配准,图像
Opencv实战(1)读取与图像操作 stoAir Opencv学习 opencv 人工智能计算机视觉
Opencv文章目录Opencv一、读取图片1.imshow2.namedWindow3.imshow4.效果图二、像素操作(1).访问像素1.at()2.Mat_(2).遍历像素1.指针遍历2.迭代器遍历(3).threshold(4).通道分离1.split2.merge(5)Gamma矫正三、深浅拷贝一、读取图片1.imshowMatimread(conststring&filename,i
数字人包含哪些生成式AI技术？上交最新「基于神经网络的生成式三维数字人研究综述：表示、渲染与学习」... 数据派THU 人工智能神经网络学习机器学习大数据
来源：专知本文约6000字，建议阅读10+分钟本文对三维数字人的典型应用进行分析,并对当前挑战与未来发展方向进行总结和展望。随着人工智能技术的高速发展,计算机视觉与图形学等相关学科的交叉融合掀起了一场数字人生成技术的新革命,人类进入“元宇宙”等数字空间的梦想正逐渐变为现实。面对大规模三维数字人的生产需求,基于传统图形学的建模过程繁琐,周期冗长,阻碍了虚拟数字人的普及和应用,而利用生成式人工智能技术
Unity3d Shader篇（七）— 纹理采样雪弯了眉梢 #Shader 着色器 unity 游戏引擎 3d
文章目录前言一、什么是纹理采样？1.纹理采样的工作原理2.纹理采样的优缺点优点缺点二、使用步骤1.Shader属性定义2.SubShader设置3.渲染Pass4.定义结构体和顶点着色器函数5.片元着色器函数三、效果四、总结使用场景前言纹理采样是一种常用的图形学技术，它可以让我们在渲染物体表面时，使用一张图片来提供颜色信息，从而增强物体的细节和真实感。在本文中，我们将介绍纹理采样的基本概念，原理和
虚拟人专题报告：虚拟人深度产业分析报告人工智能学派 xr
今天分享的是虚拟人系列深度研究报告：《虚拟人专题报告：虚拟人深度产业分析报告》。（报告出品方：Q量子位）报告共计：18页技术背景虚拟数字人指存在于非物理世界中，由计算机图形学、图形渲染、动作捕捉、深度学习、语音合成等计算机手段创造及使用，并具有多重人类特征（外貌特征、人类表演能力、人类交互能力等）的综合产物。市面上也多将其称为为虚拟形象、虚拟人、数字人等，代表性的细分应用包括虚拟助手、虚拟客服、虚
HOG特征 ce0b74704937
HOG特征是在文章《HistogramsofOrientedGradientsforHumanDetection》中提出，看文章标题可知，该文章是为了行人检测提出的，不过后来也用于其它方向，比如特征点检测等。该文中行人检测大概分为以下几步：输入图像（行人的图像）采用Gamma矫正法对输入图像进行颜色空间的标准化；目的是调节图像的对比度，降低图像局部的阴影和光照所造成的影响，同时可以抑制噪声。（原文
语义化版本控制和谐创新前端版本控制
语义化版本控制常见的软件版本命名规则：x.y.z-[先行版本号]+[版本编译信息]x.y.z即主版本号.次版本号.修订号，版本号递增规则如下：主版本号：当你做了不兼容的API修改，次版本号：当你做了向下兼容的功能性新增，修订号：当你做了向下兼容的问题修正。先行版本号和版本编译信息是可选的，如常见的先行版本号如下：标识含义alpha内测版，bug多beta公测版，有缺陷gamma成熟测试版，接近发行
OpenGL学习——13.投光物_平行光黄愿学习图形渲染 c++着色器贴图材质
前情提要：本文代码源自Github上的学习文档“LearnOpenGL”，我仅在源码的基础上加上中文注释。本文章不以该学习文档做任何商业盈利活动，一切著作权归原作者所有，本文仅供学习交流，如有侵权，请联系我删除。LearnOpenGL原网址：https://learnopengl.com/请大家多多支持原作者！当谈到计算机图形学和实时渲染时，OpenGL是一个广泛使用的开源图形库。它提供了丰富的功
java Illegal overloaded getter method with ambiguous type for propert的解决 zwllxs java jdk
好久不来iteye,今天又来看看，哈哈,今天碰到在编码时，反射中会抛出 Illegal overloaded getter method with ambiguous type for propert这么个东东，从字面意思看，是反射在获取getter时迷惑了，然后回想起java在boolean值在生成getter时，分别有is和getter，也许我们的反射对象中就有is开头的方法迷惑了jdk，
IT人应当知道的10个行业小内幕 beijingjava 工作互联网
10. 虽然IT业的薪酬比其他很多行业要好，但有公司因此视你为其“佣人”。　　尽管IT人士的薪水没有互联网泡沫之前要好，但和其他行业人士比较，IT人的薪资还算好点。在接下的几十年中，科技在商业和社会发展中所占分量会一直增加，所以我们完全有理由相信，IT专业人才的需求量也不会减少。　　然而，正因为IT人士的薪水普遍较高，所以有些公司认为给了你这么多钱，就把你看成是公司的“佣人”，拥有你的支配
java 实现自定义链表 CrazyMizzz java 数据结构
1.链表结构链表是链式的结构 2.链表的组成链表是由头节点，中间节点和尾节点组成节点是由两个部分组成： 1.数据域 2.引用域 3.链表的实现 &nbs
web项目发布到服务器后图片过一会儿消失麦田的设计者 struts2 上传图片永久保存
作为一名学习了android和j2ee的程序员，我们必须要意识到，客服端和服务器端的交互是很有必要的，比如你用eclipse写了一个web工程，并且发布到了服务器（tomcat）上，这时你在webapps目录下看到了你发布的web工程，你可以打开电脑的浏览器输入http://localhost:8080/工程/路径访问里面的资源。但是，有时你会突然的发现之前用struts2上传的图片
CodeIgniter框架Cart类 name 不能设置中文的解决方法 IT独行者 CodeIgniter Cart 框架　
今天试用了一下CodeIgniter的Cart类时遇到了个小问题，发现当name的值为中文时，就写入不了session。在这里特别提醒一下。在CI手册里也有说明，如下： $data = array( 'id' => 'sku_123ABC', 'qty' => 1, '
linux回收站 _wy_ linux 回收站
今天一不小心在ubuntu下把一个文件移动到了回收站，我并不想删，手误了。我急忙到Nautilus下的回收站中准备恢复它，但是里面居然什么都没有。后来我发现这是由于我删文件的地方不在HOME所在的分区，而是在另一个独立的Linux分区下，这是我专门用于开发的分区。而我删除的东东在分区根目录下的.Trash-1000/file目录下，相关的删除信息（删除时间和文件所在
jquery回到页面顶端知了ing html jquery css
html代码： <h1 id="anchor">页面标题</h1> <div id="container">页面内容</div> <p><a href="#anchor" class="topLink">回到顶端</a><
B树、B-树、B+树、B*树矮蛋蛋 B树
原文地址： http://www.cnblogs.com/oldhorse/archive/2009/11/16/1604009.html B树即二叉搜索树： 1.所有非叶子结点至多拥有两个儿子（Left和Right）； &nb
数据库连接池 alafqq 数据库连接池
http://www.cnblogs.com/xdp-gacl/p/4002804.html @Anthor:孤傲苍狼数据库连接池用MySQLv5版本的数据库驱动没有问题，使用MySQLv6和Oracle的数据库驱动时候报如下错误： java.lang.ClassCastException: $Proxy0 cannot be cast to java.sql.Connec
java泛型百合不是茶 java泛型
泛型在Java SE 1.5之前，没有泛型的情况的下，通过对类型Object的引用来实现参数的“任意化”，任意化的缺点就是要实行强制转换，这种强制转换可能会带来不安全的隐患泛型的特点：消除强制转换确保类型安全向后兼容简单泛型的定义：泛型：就是在类中将其模糊化，在创建对象的时候再具体定义 class fan
javascript闭包[两个小测试例子] bijian1013 JavaScript JavaScript
一.程序一 <script> var name = "The Window"; var Object_a = { 　　name : "My Object", 　　getNameFunc : function(){ var that = this; 　　　　return function(){ 　　　　
探索JUnit4扩展：假设机制（Assumption） bijian1013 java Assumption JUnit 单元测试
一.假设机制（Assumption）概述理想情况下，写测试用例的开发人员可以明确的知道所有导致他们所写的测试用例不通过的地方，但是有的时候，这些导致测试用例不通过的地方并不是很容易的被发现，可能隐藏得很深，从而导致开发人员在写测试用例时很难预测到这些因素，而且往往这些因素并不是开发人员当初设计测试用例时真正目的，
【Gson四】范型POJO的反序列化 bit1129 POJO
在下面这个例子中，POJO(Data类)是一个范型类，在Tests中，指定范型类为PieceData，POJO初始化完成后，通过 String str = new Gson().toJson(data); 得到范型化的POJO序列化得到的JSON串，然后将这个JSON串反序列化为POJO import com.google.gson.Gson; import java.
【Spark八十五】Spark Streaming分析结果落地到MySQL bit1129 Stream
几点总结： 1. DStream.foreachRDD是一个Output Operation，类似于RDD的action，会触发Job的提交。DStream.foreachRDD是数据落地很常用的方法 2. 获取MySQL Connection的操作应该放在foreachRDD的参数（是一个RDD[T]=>Unit的函数类型)，这样，当foreachRDD方法在每个Worker上执行时，
NGINX + LUA实现复杂的控制 ronin47 nginx lua
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-递归判断数组是否升序 bylijinnan java
public class IsAccendListRecursive { /*递归判断数组是否升序 * if a Integer array is ascending,return true * use recursion */ public static void main(String[] args){ IsAccendListRecursiv
Netty源码学习-DefaultChannelPipeline2 bylijinnan java netty
Netty3的API http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/ChannelPipeline.html 里面提到ChannelPipeline的一个“pitfall”：如果ChannelPipeline只有一个handler（假设为handlerA）且希望用另一handler（假设为handlerB）来
Java工具之JPS chinrui java
JPS使用熟悉Linux的朋友们都知道，Linux下有一个常用的命令叫做ps（Process Status)，是用来查看Linux环境下进程信息的。同样的，在Java Virtual Machine里面也提供了类似的工具供广大Java开发人员使用，它就是jps（Java Process Status)，它可以用来
window.print分页打印 ctrain window
function init() { var tt = document.getElementById("tt"); var childNodes = tt.childNodes[0].childNodes; var level = 0; for (var i = 0; i < childNodes.length; i++) {
安装hadoop时执行jps命令Error occurred during initialization of VM daizj jdk hadoop jps
在安装hadoop时，执行JPS出现下面错误 [slave16][email protected]:/tmp/hsperfdata_hdfs# jps Error occurred during initialization of VM java.lang.Error: Properties init: Could not determine current working
PHP开发大型项目的一点经验 dcj3sjt126com PHP 重构
一、变量最好是把所有的变量存储在一个数组中，这样在程序的开发中可以带来很多的方便，特别是当程序很大的时候。变量的命名就当适合自己的习惯，不管是用拼音还是英语，至少应当有一定的意义，以便适合记忆。变量的命名尽量规范化，不要与PHP中的关键字相冲突。二、函数 PHP自带了很多函数，这给我们程序的编写带来了很多的方便。当然，在大型程序中我们往往自己要定义许多个函数，几十
android笔记之--向网络发送GET/POST请求参数 dcj3sjt126com android
使用GET方法发送请求 private static boolean sendGETRequest (String path, Map<String, String> params) throws Exception{ //发送地http://192.168.100.91:8080/videoServi
linux复习笔记之bash shell (3) 通配符 eksliang linux 通配符 linux通配符
转载请出自出处： http://eksliang.iteye.com/blog/2104387 在bash的操作环境中有一个非常有用的功能，那就是通配符。下面列出一些常用的通配符，如下表所示符号意义 * 万用字符，代表0个到无穷个任意字符 ? 万用字符，代表一定有一个任意字符 [] 代表一定有一个在中括号内的字符。例如：[abcd]代表一定有一个字符，可能是a、b、c
Android关于短信加密 gqdy365 android
关于Android短信加密功能，我初步了解的如下（只在Android应用层试验）： 1、因为Android有短信收发接口，可以调用接口完成短信收发；发送过程：APP（基于短信应用修改）接受用户输入号码、内容——>APP对短信内容加密——>调用短信发送方法Sm
asp.net在网站根目录下创建文件夹 hvt .net C#hovertree asp.net Web Forms
假设要在asp.net网站的根目录下建立文件夹hovertree,C#代码如下： string m_keleyiFolderName = Server.MapPath("/hovertree"); if (Directory.Exists(m_keleyiFolderName)) { //文件夹已经存在 return; } else { try { D
一个合格的程序员应该读过哪些书 justjavac 程序员书籍
编者按：2008年8月4日，StackOverflow 网友 Bert F 发帖提问：哪本最具影响力的书，是每个程序员都应该读的？ “如果能时光倒流，回到过去，作为一个开发人员，你可以告诉自己在职业生涯初期应该读一本，你会选择哪本书呢？我希望这个书单列表内容丰富，可以涵盖很多东西。” 很多程序员响应，他们在推荐时也写下自己的评语。以前就有国内网友介绍这个程序员书单，不过都是推荐数
单实例实践跑龙套_az 单例
1、内部类 public class Singleton { private static class SingletonHolder { public static Singleton singleton = new Singleton(); } public Singleton getRes
PO VO BEAN 理解 q137681467 VO DTO po
PO：全称是 persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。 BO：全称是 business object:业务对象主要作用是把业务逻辑封装为一个对象。这个对
战胜惰性，暗自努力金笛子努力
偶然看到一句很贴近生活的话：“别人都在你看不到的地方暗自努力，在你看得到的地方，他们也和你一样显得吊儿郎当，和你一样会抱怨，而只有你自己相信这些都是真的，最后也只有你一人继续不思进取。”很多句子总在不经意中就会戳中一部分人的软肋，我想我们每个人的周围总是有那么些表现得“吊儿郎当”的存在，是否你就真的相信他们如此不思进取，而开始放松了对自己的要求随波逐流呢？我有个朋友是搞技术的，平时嘻嘻哈哈，以
NDK/JNI二维数组多维数组传递 wenzongliang 二维数组 jni NDK
多维数组和对象数组一样处理，例如二维数组里的每个元素还是一个数组用jArray表示，直到数组变为一维的，且里面元素为基本类型，去获得一维数组指针。给大家提供个例子。已经测试通过。 Java_cn_wzl_FiveChessView_checkWin( JNIEnv* env,jobject thiz,jobjectArray qizidata) { jint i,j; int s