捉不住的鼬鼠

Vulkan教程 - 14 顶点缓冲

接下来几章，我们会使用内存中的顶点缓冲替换掉顶点着色器中的硬编码顶点数据。我们用最简单的方式开始，创建一个CPU可见的缓冲，使用memcpy来将顶点数据直接拷贝到它上面，之后我们会介绍如何使用临时缓冲来拷贝顶点数据到高性能内存中。

首先修改顶点着色器，不要再在着色器代码中包括顶点数据。顶点着色器使用in关键字接收来自顶点缓冲的输入：

#version 450
#extension GL_ARB_separate_shader_objects : enable

layout(location = 0) in vec2 inPosition;
layout(location = 1) in vec3 inColor;

layout(location = 0) out vec3 fragColor;

void main() {
    gl_Position = vec4(inPosition, 0.0, 1.0);
    fragColor = inColor;
}

inPosition和inColor变量是顶点属性，它们是顶点缓冲中每个顶点都明确指定的，如同我们使用两个数组手动指定的位置和颜色一样。记得修改后重新编译着色器。

和fragColor一样，layout(location = x)标记对我们后来要用的输入分配索引，这样我们就能引用它们了。有些类型如dvec3 64位向量，使用多个槽。这意味着它之后的索引至少要比它大2。

layout(location = 0) in dvec3 inPosition;
layout(location = 2) in vec3 inColor;

我们将顶点数据从顶点着色器中移动到了我们自己程序的数组中，包含GLM库，它提供了线性代数有关的向量和矩阵。我们使用这些类型来指定位置和颜色向量。

#include

创建一个叫做Vertex的结构体，里面放两个属性，我们将会在顶点着色器中使用：

struct Vertex {
    glm::vec2 pos;
    glm::vec3 color;
};

GLM给我们提供了易于使用的C++类型，和着色器语言中的向量类型正好匹配：

const std::vector vertices = {
    {{0.0f, -0.5f}, {1.0f, 0.0f, 0.0f}},
    {{0.5f, 0.5f}, {0.0f, 1.0f, 0.0f}},
    {{-0.5f, 0.5f}, {0.0f, 0.0f, 1.0f}}
};

现在使用Vertex结构体来指定一组顶点数据。我们就使用和之前一样的位置及颜色，但是现在它们被绑定到一组顶点上了。这也就是交叉顶点属性。

下一步就是告诉Vulkan，一旦它被上传到GPU内存，如何将这个数据格式传递到顶点着色器。为了传递这个信息，需要两类结构体。第一个是VkVertexInputBindingDescription，我们会在Vertex中添加一个成员方法，以让它输入正确的数据。

struct Vertex {
    glm::vec2 pos;
    glm::vec3 color;

    static VkVertexInputBindingDescription getBindingDescription() {
        VkVertexInputBindingDescription bindingDescription = {};

        return bindingDescription;
    }
};

顶点绑定描述以什么样的速率从内存加载数据。它指定了数据入口的字节个数，以及是否在每个顶点或每个实例后移动到下一个数据入口。

bindingDescription.binding = 0;
bindingDescription.stride = sizeof(Vertex);
bindingDescription.inputRate = VK_VERTEX_INPUT_RATE_VERTEX;

每个顶点的数据都是打包在一个数组中的，所以我们只要进行绑定即可。binding参数指定了绑定数组中绑定的索引，stride参数指定了内存中从一个记录到下一个之间的字节个数。inputRate参数可以有以下值：

VK_VERTEX_INPUT_RATE_VERTEX：每个顶点处理后移动到下一个数据记录；

VK_VERTEX_INPUT_RATE_INSTANCE：每个实例处理后移动到下一个数据记录。

我们不会使用实例渲染，所以就还是用逐顶点数据。

处理顶点输入的第二个结构体是VkVertexInputAttributeDescription。我们要添加另一个助手函数到Vertex：

static std::array
    getAttributeDescriptions() {
    std::array
        attributeDescriptions = {};

    return attributeDescriptions;
}

注意要包含array头文件。

如函数原型所示，这里将会有两个这样的结构体。一个属性描述结构体描述如何从来自绑定描述的一堆顶点数据中提取一个顶点属性。我们有两个描述，位置和颜色，所以我们要两个属性描述结构体：

attributeDescriptions[0].binding = 0;
attributeDescriptions[0].location = 0;
attributeDescriptions[0].format = VK_FORMAT_R32G32_SFLOAT;
attributeDescriptions[0].offset = offsetof(Vertex, pos);

binding参数告诉Vulkan逐顶点的数据来自哪个绑定。location参数引用顶点着色器中的输入中的location。顶点着色器中的输入有location 0的是位置，它由两个32位浮点组件组成。

format参数描述了属性的数据类型。有一点迷惑性的是，该格式使用的是和颜色格式一样的枚举。以下着色器类型和格式通常一起用：

float：VK_FORMAT_R32_SFLOAT；

vec2：VK_FORMAT_R32G32_SFLOAT；

vec3：VK_FORMAT_R32G32B32_SFLOAT；

vec4：VK_FORMAT_R32G32B32A32_SFLOAT。

可以看出，你要使用颜色通道个数与着色器数据类型组件个数匹配的格式。也能使用多于着色器中组件个数的通道，但是会静默丢弃处理。如果通道个数比组件个数少，那么BGA组件会使用默认值(0, 0, 1)。颜色类型(SFLOAT, UINT, SINT)和位宽也应该和着色器的输入匹配，看下面的例子：

ivec2：VK_FORMAT_R32G32_SINT，这是一个由32位有符号整数组成的2组件向量；

uvec4：VK_FORMAT_R32G32B32A32_UINT，这是一个由32位无符号整数组成的4组件向量；

double：VK_FORMAT_R64_SFLOAT，双精度浮点数（64位）。

format参数隐式定义了属性数据的字节大小，offset参数指定了从逐顶点数据读取的起始的字节数。绑定就是一次加载一个Vertex结构体数据，描述信息（pos）是一个值位0的相对于该结构体开头的偏置。这个会使用offsetof宏自动计算。

attributeDescriptions[1].binding = 0;
attributeDescriptions[1].location = 1;
attributeDescriptions[1].format = VK_FORMAT_R32G32B32_SFLOAT;
attributeDescriptions[1].offset = offsetof(Vertex, color);

该颜色属性描述也基本和位置的一样。

现在我们要建立图形管线来接收该格式的顶点数据，方法就是在createGraphicsPipeline中引用该结构体。找到vertexInputInfo结构体，修改如下来引用这两个描述：

auto bindingDescription = Vertex::getBindingDescription();
auto attributeDescriptions = Vertex::getAttributeDescriptions();

VkPipelineVertexInputStateCreateInfo vertexInputInfo = {};
vertexInputInfo.sType = VK_STRUCTURE_TYPE_PIPELINE_VERTEX_INPUT_STATE_CREATE_INFO;
vertexInputInfo.vertexBindingDescriptionCount = 1;
vertexInputInfo.vertexAttributeDescriptionCount = static_cast(attributeDescriptions.size());
vertexInputInfo.pVertexBindingDescriptions = &bindingDescription;
vertexInputInfo.pVertexAttributeDescriptions = attributeDescriptions.data();

现在管线已经准备好接收vertices容器中格式的顶点数据了。现在运行程序，会发现没用顶点缓冲绑定到该绑定：

下一步就是创建顶点缓冲并移动顶点数据到其中以便GPU能读取。

Vulkan中的缓冲是一些内存区域，用于存储显卡能去读的任意数据。它们可以用于存储顶点数据，也就是我们这一章要做的事情。但是它们也可以用于许多其他目的，这等以后再看。不像我们之前处理的Vulkan对象，缓冲不会自动为自己分配内存。

创建一个新的方法createVertexBuffer，从initVulkan中调用，就在createCommandBuffers之前。创建缓冲要填写VkBufferCreateInfo：

VkBufferCreateInfo bufferInfo = {};
bufferInfo.sType = VK_STRUCTURE_TYPE_BUFFER_CREATE_INFO;
bufferInfo.size = sizeof(vertices[0]) * vertices.size();

该结构体第一个字段是size，指定了缓冲大小，单位是字节。计算顶点数据大小很直白，用sizeof即可。

bufferInfo.usage = VK_BUFFER_USAGE_VERTEX_BUFFER_BIT;

第二个字段是usage，表明了缓冲中的数据将用于什么目的。使用按位与操作可以设定多个目标操作。我们这里是一个顶点缓冲，以后看其他的用法。

bufferInfo.sharingMode = VK_SHARING_MODE_EXCLUSIVE;

就和交换链中的图像一样，缓冲也可以被某个特定的队列族拥有，或者同时在多个队列族之间共享。这里缓冲将会只用于图形队列，所以我们就还是用独占访问模式。

flags参数用于配置稀疏缓冲内存，现在与我们不相干，就用默认值0。现在可以用vkCreateBuffer创建缓冲，定义一个类成员来保存缓冲句柄，就叫做vertexBuffer。

if (vkCreateBuffer(device, &bufferInfo, nullptr, &vertexBuffer) != VK_SUCCESS) {
    throw std::runtime_error("failed to create vertex buffer!");
}

缓冲会在渲染命令中可用，直到程序结束，且它不依赖交换链，所以就在cleanup方法中清理交换链操作之后清理掉它。

vkDestroyBuffer(device, vertexBuffer, nullptr);

现在缓冲创建好了，但是它实际上还没有分配内存。给缓冲分配内存的第一步就是查询它所需的内存量：

VkMemoryRequirements memRequirements;
vkGetBufferMemoryRequirements(device, vertexBuffer, &memRequirements);

该结构体有以下字段：

size：以字节为单位的所需内存大小，可能和bufferInfo.size不一样；

alignment：以字节为单位的偏移量，缓冲起始于分配的内存区域，依赖于bufferInfo.usage和bufferInfo.flags；

memoryTypeBits：适用于缓冲的内存类型，这是一个位字段。

显卡可以提供不同类型的内存分配。每种根据允许的操作变换，每个内存类型根据可用的操作变化。我们将缓冲的要求和我们的应用结合起来，以找到正确的内存来使用。为我们创建一个新的方法findMemoryType：

uint32_t findMemoryType(uint32_t typeFilter, VkMemoryPropertyFlags properties) {

}

首先我们要查询可用内存类型信息，用的方法是vkGetPhysicalDeviceMemoryProperties：

VkPhysicalDeviceMemoryProperties memProperties;
vkGetPhysicalDeviceMemoryProperties(physicalDevice, &memProperties);

VkPhysicalDeviceMemoryProperties结构体有两组memoryTypes和memoryHeaps。内存堆是截然不同的内存资源，如同专用VRAM以及RAM的交换空间一样。这种不同类型的内存存在于这些堆之间。现在我们只关心这种内存而不关心它来自哪，但是你可以想象下这其实可以影响到性能的。

我们先找到适合该缓冲的内存类型：

for (uint32_t i = 0; i < memProperties.memoryTypeCount; i++) {
    if (typeFilter & (1 << i)) {
        return i;
    }
}

throw std::runtime_error("failed to find suitable memory type!");

typeFilter参数用于指定合适的内存类型的位域。这表明我们可以找到一个合适内存类型的索引，方法就是遍历它们，检查是否对应位设置为1。

但是我们仅关心适合于顶点缓冲的内存类型，我们要可以将我们的顶点数据写入内存。memoryTypes数组由VkMemoryType结构体组成，指定了堆和每种内存的属性。属性定义了内存的特性，比如能进行映射以便我们可以从CPU向其写入内容。这个属性就是VK_MEMORY_PROPERTY_HOST_VISIBLE_BIT，但是我们还要用VK_MEMORY_PROPERTY_HOST_COHERENT_BIT属性，当我们要映射内存的适合再看为什么需要。

我们可以修改循环，在其中检查是否支持该特性：

for (uint32_t i = 0; i < memProperties.memoryTypeCount; i++) {
    if ((typeFilter & (1 << i)) && (memProperties.memoryTypes[i].propertyFlags& properties) == properties) {
        return i;
    }
}

我们可能有不止一个想要的属性，所以我们应该检查按位的或操作结果是否不仅仅非零，还要等于想要的属性位域。如果有一个内存类型适合该缓冲，而且也有所有我们想要的特性，那么我们应该返回它的索引，否则我们抛出异常。

我们现在可以确定正确的内存类型，所以我们可以分配内存了：

VkMemoryAllocateInfo allocInfo = {};
allocInfo.sType = VK_STRUCTURE_TYPE_MEMORY_ALLOCATE_INFO;
allocInfo.allocationSize = memRequirements.size;
allocInfo.memoryTypeIndex = findMemoryType(memRequirements.memoryTypeBits,
    VK_MEMORY_PROPERTY_HOST_VISIBLE_BIT | VK_MEMORY_PROPERTY_HOST_COHERENT_BIT);

内存分配现在和指定大小及类型一样简单了，二者都是来自顶点缓冲的内存要求和想要的属性。创建一个类成员来存储处理内存和分配的句柄，

VkDeviceMemory vertexBufferMemory;
...
if (vkAllocateMemory(device, &allocInfo, nullptr, &vertexBufferMemory) != VK_SUCCESS) {
    throw std::runtime_error("failed to allocate vertex buffer memory!");
}

如果内存分配成功，现在我们可以使用vkBindBufferMemory来将该内存和缓冲联系到一起：

vkBindBufferMemory(device, vertexBuffer, vertexBufferMemory, 0);

开始的三个参数不用解释，第四个是内存区域内的偏置。由于该内存是单独为该顶点缓冲分配的，该偏置自然就是0。如果该偏置不是0，那么它要求能被memRequirements.alignment整除。

当然，就和C++动态内存分配一样，内存应该在某个时候释放。绑定该缓冲对象的内存可能在缓冲一旦不使用的时候就被释放，所以我们在销毁缓冲后释放它：

vkFreeMemory(device, vertexBufferMemory, nullptr);

就在cleanup方法的vkDestroyBuffer之后调用。

现在是时候将顶点数据拷贝到缓冲中去了，就是使用vkMapMemory将缓冲内存映射到CPU可访问的内存：

void* data;
vkMapMemory(device, vertexBufferMemory, 0, bufferInfo.size, 0, &data);

该方法允许我们通过偏置和大小访问一片特定的内存资源，偏置和大小这里分别是0和bufferInfo.size。也可以指定特殊值VK_WHOLE_SIZE来映射所有内存。倒数第二个参数可以用于指定标记，但是当前API中还没有什么可用的，必须设置为0。最后的参数指定了指针映射内存的输出。

void* data;
vkMapMemory(device, vertexBufferMemory, 0, bufferInfo.size, 0, &data);
memcpy(data, vertices.data(), (size_t) bufferInfo.size);
vkUnmapMemory(device, vertexBufferMemory);

现在可以简单调用memcpy来拷贝顶点数据到映射的内存，用vkUnmapMemory来取消映射。不幸的是，驱动可能不会立即拷贝数据到缓冲内存，比如在缓冲的时候。也可能写入到缓冲在映射的内存中还不可见。

有两种方式来应对该问题：

使用一个连续的内存堆，也就是VK_MEMORY_PROPERTY_HOST_COHERENT_BIT标记的；

写入到映射内存后调用vkFlushMappedMemoryRanges，从映射内存读取之前调用vkInvalidateMappedMemoryRanges；

我们用第一种方法，能保证映射内存永远与分配内存的内容一致。记住这可能比显式应用清空的性能差一点，但是我们会在后面的章节说明为什么没关系。

清空内存区域或者使用连续内存堆意味着驱动将会知道我们写入到缓冲，但是不意味着它们在GPU上已经可见了。数据转移到GPU是一个在后台进行的操作，这些明细能告诉我们它保证下一个vkQueueSubmit调用之前能够完成。

现在剩下的就是渲染操作过程中绑定顶点缓冲。我们扩展createCommandBuffers方法来实现：

vkCmdBindPipeline(commandBuffers[i], VK_PIPELINE_BIND_POINT_GRAPHICS, graphicsPipeline);

VkBuffer vertexBuffers[] = { vertexBuffer };
VkDeviceSize offsets[] = { 0 };
vkCmdBindVertexBuffers(commandBuffers[i], 0, 1, vertexBuffers, offsets);

vkCmdDraw(commandBuffers[i], static_cast(vertices.size()), 1, 0, 0);

vkCmdBindVertexBuffers方法用于绑定顶点缓冲到绑定上，就和我们在之前章节中建立的类似。开始的两个参数，除了命令缓冲，指定了偏置和我们将要指定顶点缓冲的绑定数量。最后两个参数指定了顶点缓冲数组以及开始读取顶点数据的字节偏置。你应该改变vkCmdDraw来传递缓冲中顶点的个数而不是原来硬编码的3。

现在运行代码就能看到熟悉的三角形了，尝试改变顶部的顶点为白色，修改vertices数组如下：

const std::vector vertices = {
    {{0.0f, -0.5f}, {1.0f, 1.0f, 1.0f}},
    {{0.5f, 0.5f}, {0.0f, 1.0f, 0.0f}},
    {{-0.5f, 0.5f}, {0.0f, 0.0f, 1.0f}}
};

运行后三角形变成了下面这样：

下一章我们会用一个不同的方法拷贝顶点数据到顶点缓冲，也会有更好的性能，但是也会有更多工作量。

你可能感兴趣的:(Vulkan)

编译运行 llama.cpp (vulkan, Intel GPU SYCL) 穷人小水滴 llama.cpp AI Intel GPU SYCL vulkan A770
llama.cpp是一个运行AI(神经网络)语言大模型的推理程序,支持多种后端(backend),也就是不同的具体的运行方式,比如CPU运行,GPU运行等.但是编译运行llama.cpp并不是那么容易的,特别是对于SYCL后端(用于IntelGPU),坑那是一大堆.只有特定版本的llama.cpp,特定版本的Linux系统和GPU驱动程序,才可能成功运行,否则都是失败.能够运行的版本还不是最新版本
【GPU驱动开发】-GPU架构简介怪怪王 GPU驱动驱动开发 GPU AI chatgpt 架构
前言不必害怕未知，无需恐惧犯错，做一个Creator！GPU（GraphicsProcessingUnit，图形处理单元）是一种专门用于处理图形和并行计算的处理器。GPU系统架构通常包括硬件和软件层面的组件。一、总体流程应用程序请求图形操作：应用程序通过图形API（如OpenGL、Vulkan）发送图形操作请求。图形API调用GPU驱动程序：图形API将请求传递给GPU驱动程序。GPU驱动程序解释
Ubuntu20.04 编译ogre 黑不溜秋的三维引擎专栏 ogre 游戏引擎
一：编译Ogresudoapt-yinstalllibgles2-mesa-devlibvulkan-devsudoapt-yinstallglslang-devsudoapt-yinstalllibsdl2-devlibxt-devlibxaw7-devdoxygensudoapt-yinstallmercurialwgethttps://codeload.github.com/OGRECave
OPENGL NCNN GPU零拷贝实现陈立里 ncnn
概要OPENGL拿到的相机帧，通过有拷贝的方式进行GPU推理CPU占用率太高，而NCNN没有提供OPENGL零拷贝GPU推理的接口，因此只能自己实现整体流程主要方法是使用AndroidHardwareBuffer实现纹理的共享，在OPENGL上对相机数据进行预处理后，将纹理信息写入到AndroidHardwareBuffer，随后在vulkan上进行转格式，最后使用NCNN的GPU推理，实现GPU
NCNN GPU初始化加速——cache实现陈立里 ncnn
概要NCNN的CPU初始化速度很快，但是当使用GPU进行推理时，初始化往往要花费几秒甚至更长时间。其他框架例如MNN有载入cache的方式来进行加速，NCNN目前没有相关接口来实现加速，那么NCNN是否也可以加载cache来实现加速呢？整体流程通过测速以及查看NCNN的源码可以发现，在gpu.cpp源文件下的VulkanDevice::create_pipeline函数内的vkCreateComp
vulkan绘制多物体--Apple的学习笔记 applecai
为了解决vulkan如何创建多物体，而且可以作为独立个体单独变换的问题。找了官网一个hologram项目学习参考，此架构不错，将来可以考虑在此基础修改。总结学习到了一开始就创建多个物体的方法，就是用vector将他们拼接起来即可。学习到了用描述符绑定动态buffer的思路可以实现物体的单独变换。VK_DESCRIPTOR_TYPE_UNIFORM_BUFFER_DYNAMIC;//VK_DESCR
FFMPEG 之 DXVA2 硬解 dbyoung FFMPEG 视频 SDK ffmpeg DXVA2 硬解
一：FFMPEG支持的硬解方式有很多：DXVA2、D3D11VA、CUDA、QSV、OPENCL、DRM、VAAPI、VDPAU、VIDEOTOOLBOX、MEDIACODEC。有的支持Windows平台，有的支持linux平台，有的支持appleios平台，有的支持android平台。二：Windows平台，我们可以使用利用DXVA2、DX11、OpenGL、Vulkan、等技术，直接显示GPU
AMD Mantle API 学习笔记 -- Mantle简介蓝天和白云 Mantle Graphics Vulkan
最近一段时间准备学习新的下一代graphicsAPI，DX12和Vulkan。发现目前公开的资料不多，特别是Vulkan，kronos的速度也真慢，正式的Spec还没有出来。倒是LunarG出了个SDK和其在intel平台上实现的Vulkandriver，只是笔者一直没找到公开的代码。其实，无论DX12还是Vulkan都是来自AMD的Mantle，而AMD也已经放出了公开的MantleAPIRef
AMD Mantle API 学习笔记 -- Mantle初始化蓝天和白云 Graphics Vulkan mantle vulkan OpenGL
本系列文章是笔者研究mantle的一些心得；其目的是为了学习新的图形API标准Vulkan。因为Vulkan还没有正式发布，而它事实上是基于mantle的，所以研究mantle可以让我们对新一代图形标准（Vulkan和D3D12）有一个提前认识。在Vulkan正式发布后，笔者也会写一系列的文章来介绍Vulkan。事实上，mantle的API函数都是以gr开头的；而Vulkan很多API只是简单的替
【GPU驱动开发】- GPU架构流程怪怪王 GPU驱动驱动开发 GPU 架构
前言不必害怕未知，无需恐惧犯错，做一个Creator！一、总述GPU（GraphicsProcessingUnit，图形处理单元）是一种专门用于处理图形和并行计算的处理器。GPU系统架构通常包括硬件和软件层面的组件。总体流程：1.应用程序请求图形操作：应用程序通过图形API（如OpenGL、Vulkan）发送图形操作请求。2.图形API调用GPU驱动程序：图形API将请求传递给GPU驱动程序。3.
【Unity性能优化】ASTC压缩格式(Android) PangNanGua Unity性能优化 unity ASTC ETC2 TextureFormat Android
ASTC中ARM研发的一种贴图压缩格式，相对于PVRTC，ETC2他对贴图尺寸没有要求。iOS端游戏开发逐渐从PRVTC转到了ASTC。iOS9(A8架构)(iphone6)开始支持ASTC压缩格式。Android支持OpenGLES3.1和Vulkan设备。目前有约5%的Android尚不支持ASTC可以通过下面函数判断是否支持ASTC格式SystemInfo.SupportsTextureFo
计算机中丢失vulkan-1.dll,【已解决】进游戏提示 Vulkan-1.dll 文件错误！！！~~~ 云马宝淘
WinsockInitializedidCommonLocal::Init()time20:0.014s------InitializingFileSystem------Currentsearchpath:-C:/Users/MOD/SAVEDG~1/MachineGames/WolfensteinYoungblood/base/-D:/3DMGAME-Wolfenstein.Youngbloo
ubuntu建立vscode cmake opengl glfw调试环境--Apple的学习笔记 applecai
由于之前装vulkan，所以ubuntu重新安装为18.0464bit版本。所有内容我都要重装，包括vscode。一年前搭建ubuntuvscode比较折腾，所以今天我搜索下是否新版本有新方法。果然我的思路是对的，发现了更便捷的方法，最重要的是要找对资料。时代在进步，工具在优化，一切都在变的越来越高效!方法及步骤vscode的安装，通过软件中心搜索vscode进行安装即可。vscode的运行，需要
【GitHub项目推荐--DiligentEngine: 一个开源跨平台的底层图形库和渲染框架】【转载】旅之灵夫 GitHub项目推荐 github 开源图形渲染
DiligentEngine一个现代的Cross-PlatformLow-Level三维图形库Diligent引擎是一个轻量级的cross-platform图形API抽象库和呈现框架。它的设计充分利用了Direct3D12、Vulkan和Metal，同时通过Direct3D11、OpenGL和OpenGLES支持较旧的平台。Diligent引擎公开公共的front-endAPI，并在所有平台上使用
vulkan中的texture(VkImage、VkImageView、VkSampler、VkDeviceMemory）宗浩多捞 Vulkan c++游戏引擎
在Vulkan中，以下是这几个概念的简要说明以及它们之间的关系：Texture2D：纹理在vulkanAPI中并没有一个结构体来表示，它是着色器语言中（比如GLSL）的一种概念。在着色器中，sampler2D类型的变量表示一个二维纹理。VkImage：它是Vulkan中表示图像的对象，负责存储图像的元数据（metadata），但不存储像素的具体值，比如宽度、高度、格式等。类似于VkBuffer对象
极智AI | ubuntu 安装 ncnn 极智视界极智AI ncnn ubuntu 嵌入式深度学习人工智能
本教程详细记录了在ubuntu上安装腾讯推理框架ncnn的方法。文章目录1、安装依赖2、编译3、测试4、打开Vulkun1、安装依赖sudoaptinstallbuild-essentialgitcmakelibprotobuf-devprotobuf-compilerlibvulkan-devvulkan-utils 也需依赖opencv，这个源码编吧，可以看教程《【经验分享】ubuntu源码
Debian/Ubuntu安装带VULKAN的NCNN库 qq_35439382 深度学习 mnn 人工智能
1.安装基础件sudoapt-getinstallbuild-essentialgitcmakelibprotobuf-devprotobuf-compilerlibvulkan-devvulkan-utilslibopencv-devsudoapt-getinstalllibwayland-devlibxrandr-devsudoapt-getinstalllibvulkan1mesa-vulk
ncnn - ubuntu调用vulkan加速ncnn是的CMakeLists.txt和bashrc配置勤奋的学渣模型部署-ncnn ubuntu linux 运维
概述ncnn使用vulkan来加速时，需要先安装vulkan，然后再使用vulkan来编译ncnn，最后才是使用编译好的ncnn来推理模型。。这里的vulkan再Ubuntu中通常是直接解压安装，然后配置环境变量如下：exportVULKAN_SDK=/home/fwq/softs/1.2.182.0/x86_641.2.182.0是我使用的vulkan版本。。配置完上述路径后，source~/.
gdb调试命令美酒 + 咖啡 Linux gdb
在linux下使用gdb调试程序，记录一下常用的调试命令：#设置代码目录directory/home/code/#断点infobreak=>ib#查看断点bvulkan/core/init.c:1723#断文件行delete2#删除编号为2的断点,简写d2disable3#禁用编号为2的断点diable#禁用所有断点enable3#启用编号为3的断点enable#启用所有断点ignore13#设置
Vulkan vertex buffer绑定过程美酒 + 咖啡 vulkan Vulkan
代码实战我们用indirectdraw绘制6个不同位置的三角形，效果如下：重点：具备layout(location=xx)in格式描述的资源就是vertexbuffer。vsshader如下，inPos，inColor，instancePos则是vertextbuffer数据：//vs#version450layout(location=0)invec3inPos;layout(location=
vulkan example入门代码看完--Apple的学习笔记 applecai
主要是看vulkan初始化代码并且理解流程及关键参数配置。结合官方。总共280多页，现在看了一半了。并且结合example代码，收益匪浅，当前觉得swapchain、pipeling及allocationmemory肯能是之后要关注的重点配置模块。当前的example只是画一个三角形而已。先作了类图备忘。断断续续也学了1周了，新年休假继续看，直到我会制作简单的应用及一些小作品为止，为自己加油^V^
vulkan画正方形--Apple的学习笔记 applecai
官网的example是画三角形的二维彩色图片。然后官网的教程我还没有看到索引缓冲器，那个章节会将三角形变为正方形二维彩色图片。而我今天要做的是画线。之前以为vulkan的base图形只有三角形。原来还是有线的。画正方形我通过目前的vulkanspec及sample教程学习，验证下我否有能力画正方形了吗?试下吧修改代码1.inputAssembly.topology=VK_PRIMITIVE_TOP
OpenGL & DIR 庞白OS unity 游戏引擎
Mesa简介-CSDN博客Mesa,alsocalledMesa3DandTheMesa3DGraphicsLibrary,isanopensourcesoftwareimplementationofOpenGL,Vulkan,andothergraphicsAPIspecifications.Mesatranslatesthesespecificationstovendor-specificgr
Google Filament 源码学习（一）：Filament 编译 bluebird_ivan 图形图像渲染引擎 ubuntu 游戏引擎图形渲染
一、前言之前做过一段OpenGL开发，也看过vulkan,但都是一知半解，所以一直想找一个经典的、跨平台的渲染引擎来学习。直到找到Filament这个东东。Filament是Google开发的轻量级跨平台实时渲染引擎，支持PBR材质，可用于开发游戏渲染引擎或构建音视频编辑工程。希望后期能够逐步深入，在此做好笔记，希望通过此能够同大家一起从入门到精通。二、ubuntu平台编译1、开发环境准备
vulkan中的指令队列的大致原理宗浩多捞 Vulkan c++
在vulkan中，指令池vkCommandPool分配指令缓冲vkCommandBuffer，而指令缓冲用于记录计算、渲染指令，记录完后，把该指令缓冲提交给指令队列vkQueue，然后等待执行。实际上就可以简单理解为：每个指令一行有效代码、一个原子操作指令缓冲vkCommandBuffer一个函数指令队列vkQueue一个队列，每个元素是一个函数指针classCommandQueue{public
vulkan中从CPU到GPU传输数据，暂存缓冲区(staging buffer)的必要性宗浩多捞 Vulkan c++开发语言
“StagingBuffer”，可翻译成暂存缓冲区或临时缓冲区，在使用诸如Vulkan、DirectX等现代图形API时，经常用于充当主机和GPU之间的桥梁，以进行高效的数据传输。要明确知道，stagingbuffer是显存上开辟的以IndexBuffer的创建为例：主机端创建了索引数组（CPU端内存开辟），并填充数据调用API在显存上创建一块区域，用indexBuffer来指向目的：把CPU端的
vulkan中分配显存的流程（vkBuffer、vkDeviceMemory的关系）以及VMA库介绍宗浩多捞 Vulkan c++
在Vulkan中，VkBuffer和VkDeviceMemory是两个不同的概念，但它们通常是一起绑定在一起用的VkBuffer：表示一个缓冲区对象，用于存储数据，比如顶点数据、索引数据等。VkBuffer本身只是逻辑上的概念，它不包含实际的数据存储，也不关心数据在内存中的具体位置。VkDeviceMemory：设备内存对象（GPU显存），用于实际存储Vulkan缓冲区对象的数据。缓冲区需要分配显
windows安装配置ffmpeg 凡白翼昕
第一步：下载ffmpeg，可以在官网下载，也可以在其他地方找官网下载直通车：https://ffmpeg.org/download.html点进去有文件下载位置点进去后找到这一块区域：下载其中一个版本的zip文件下载后加压长这样：ffmpeg解压后名字：ffmpeg-N-99888-g5c7823ff1c-win64-gpl-shared-vulkan，这么长一串，我就改了一下名改成ffmpeg它
DirectX12_入门之三角形沉默的舞台剧 DirectX12 DirectX12
为了更加深刻的理解图形API之间的区别，从此文让我们正式开始DirectX12的学习之旅。之前了解过OpenGL、DX11与Vulkan，我们也简单的知道了这些图形API之间的区别和架构上的差异，我们现在来看一下DX12，从使用中了解它与Vulkan的异步架构之间的异同。具体代码参照DX12龙书github。一、准备工作首先需要先了解：DirectX12_基础知识；为了实现DX12这个目标的大致步
跟着cherno手搓游戏引擎【4】窗口抽象、GLFW配置 larito 游戏引擎
引入GLFW：在vendor里创建GLFW文件夹：在github上下载，把包下载到GLFW包下。GitHub-TheCherno/glfw:Amulti-platformlibraryforOpenGL,OpenGLES,Vulkan,windowandinput修改SRC/premake5.lua的配置：12、13、15、36、37、38、39、40行的代码是新加上去的：workspace"YO
JVM StackMapTable 属性的作用及理解 lijingyao8206 jvm 字节码 Class文件 StackMapTable
在Java 6版本之后JVM引入了栈图(Stack Map Table)概念。为了提高验证过程的效率，在字节码规范中添加了Stack Map Table属性，以下简称栈图，其方法的code属性中存储了局部变量和操作数的类型验证以及字节码的偏移量。也就是一个method需要且仅对应一个Stack Map Table。在Java 7版
回调函数调用方法百合不是茶 java
最近在看大神写的代码时,.发现其中使用了很多的回调 ,以前只是在学习的时候经常用到 ,现在写个笔记记录一下代码很简单: MainDemo :调用方法得到方法的返回结果
[时间机器]制造时间机器需要一些材料 comsci 制造
根据我的计算和推测,要完全实现制造一台时间机器,需要某些我们这个世界不存在的物质和材料... 甚至可以这样说,这种材料和物质,我们在反应堆中也无法获得......
开口埋怨不如闭口做事邓集海邓集海做人做事工作
“开口埋怨，不如闭口做事。”不是名人名言，而是一个普通父亲对儿子的训导。但是，因为这句训导，这位普通父亲却造就了一个名人儿子。这位普通父亲造就的名人儿子，叫张明正。　　　　张明正出身贫寒，读书时成绩差，常挨老师批评。高中毕业，张明正连普通大学的分数线都没上。高考成绩出来后，平时开口怨这怨那的张明正，不从自身找原因，而是不停地埋怨自己家庭条件不好、埋怨父母没有给他创造良好的学习环境。　　　　
jQuery插件开发全解析，类级别与对象级别开发 IT独行者 jquery 开发插件　函数
jQuery插件的开发包括两种：一种是类级别的插件开发，即给 jQuery添加新的全局函数，相当于给 jQuery类本身添加方法。 jQuery的全局函数就是属于 jQuery命名空间的函数，另一种是对象级别的插件开发，即给 jQuery对象添加方法。下面就两种函数的开发做详细的说明。 1 、类级别的插件开发类级别的插件开发最直接的理解就是给jQuer
Rome解析Rss 413277409 Rome解析Rss
import java.net.URL; import java.util.List; import org.junit.Test; import com.sun.syndication.feed.synd.SyndCategory; import com.sun.syndication.feed.synd.S
RSA加密解密无量加密解密 rsa
RSA加密解密代码代码有待整理 package com.tongbanjie.commons.util; import java.security.Key; import java.security.KeyFactory; import java.security.KeyPair; import java.security.KeyPairGenerat
linux 软件安装遇到的问题 aichenglong linux 遇到的问题 ftp
1 ftp配置中遇到的问题 500 OOPS: cannot change directory 出现该问题的原因:是SELinux安装机制的问题.只要disable SELinux就可以了修改方法:1 修改/etc/selinux/config 中SELINUX=disabled 2 source /etc
面试心得 alafqq 面试
最近面试了好几家公司。记录下；支付宝，面试我的人胖胖的，看着人挺好的；博彦外包的职位，面试失败；阿里金融，面试官人也挺和善，只不过我让他吐血了。。。由于印象比较深，记录下； 1，自我介绍 2，说下八种基本类型；（算上string。楼主才答了3种，哈哈，string其实不是基本类型，是引用类型） 3，什么是包装类，包装类的优点； 4，平时看过什么书？NND，什么书都没看过。。照样
java的多态性探讨百合不是茶 java
java的多态性是指main方法在调用属性的时候类可以对这一属性做出反应的情况 //package 1; class A{ public void test(){ System.out.println("A"); } } class D extends A{ public void test(){ S
网络编程基础篇之JavaScript-学习笔记 bijian1013 JavaScript
1.documentWrite <html> <head> <script language="JavaScript"> document.write("这是电脑网络学校"); document.close(); </script> </h
探索JUnit4扩展：深入Rule bijian1013 JUnit Rule 单元测试
本文将进一步探究Rule的应用，展示如何使用Rule来替代@BeforeClass，@AfterClass，@Before和@After的功能。在上一篇中提到，可以使用Rule替代现有的大部分Runner扩展，而且也不提倡对Runner中的withBefores()，withAfte
[CSS]CSS浮动十五条规则 bit1129 css
这些浮动规则，主要是参考CSS权威指南关于浮动规则的总结，然后添加一些简单的例子以验证和理解这些规则。 1. 所有的页面元素都可以浮动 2. 一个元素浮动后，会成为块级元素，比如<span>,a, strong等都会变成块级元素 3.一个元素左浮动，会向最近的块级父元素的左上角移动，直到浮动元素的左外边界碰到块级父元素的左内边界；如果这个块级父元素已经有浮动元素停靠了
【Kafka六】Kafka Producer和Consumer多Broker、多Partition场景 bit1129 partition
0.Kafka服务器配置 3个broker 1个topic，6个partition，副本因子是2 2个consumer，每个consumer三个线程并发读取 1. Producer package kafka.examples.multibrokers.producers; import java.util.Properties; import java.util.
zabbix_agentd.conf配置文件详解 ronin47 zabbix 配置文件
Aliaskey的别名，例如 Alias=ttlsa.userid:vfs.file.regexp[/etc/passwd,^ttlsa:.:([0-9]+),,,,\1]，或者ttlsa的用户ID。你可以使用key：vfs.file.regexp[/etc/passwd,^ttlsa:.: ([0-9]+),,,,\1]，也可以使用ttlsa.userid。备注: 别名不能重复，但是可以有多个
java--19.用矩阵求Fibonacci数列的第N项 bylijinnan fibonacci
参考了网上的思路，写了个Java版的： public class Fibonacci { final static int[] A={1,1,1,0}; public static void main(String[] args) { int n=7; for(int i=0;i<=n;i++){ int f=fibonac
Netty源码学习-LengthFieldBasedFrameDecoder bylijinnan java netty
先看看LengthFieldBasedFrameDecoder的官方API http://docs.jboss.org/netty/3.1/api/org/jboss/netty/handler/codec/frame/LengthFieldBasedFrameDecoder.html API举例说明了LengthFieldBasedFrameDecoder的解析机制，如下：实
AES加密解密 chicony 加密解密
AES加解密算法，使用Base64做转码以及辅助加密： package com.wintv.common; import javax.crypto.Cipher; import javax.crypto.spec.IvParameterSpec; import javax.crypto.spec.SecretKeySpec; import sun.misc.BASE64Decod
文件编码格式转换 ctrain 编码格式
package com.test; import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.IOException; import java.io.InputStream; import java.io.OutputStream;
mysql 在linux客户端插入数据中文乱码 daizj mysql 中文乱码
1、查看系统客户端，数据库，连接层的编码查看方法： http://daizj.iteye.com/blog/2174993 进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+------
好代码是廉价的代码 dcj3sjt126com 程序员读书
长久以来我一直主张：好代码是廉价的代码。当我跟做开发的同事说出这话时，他们的第一反应是一种惊愕，然后是将近一个星期的嘲笑，把它当作一个笑话来讲。当他们走近看我的表情、知道我是认真的时，才收敛一点。当最初的惊愕消退后，他们会用一些这样的话来反驳： “好代码不廉价，好代码是采用经过数十年计算机科学研究和积累得出的最佳实践设计模式和方法论建立起来的精心制作的程序代码。” 我只
Android网络请求库——android-async-http dcj3sjt126com android
在iOS开发中有大名鼎鼎的ASIHttpRequest库，用来处理网络请求操作，今天要介绍的是一个在Android上同样强大的网络请求库android-async-http，目前非常火的应用Instagram和Pinterest的Android版就是用的这个网络请求库。这个网络请求库是基于Apache HttpClient库之上的一个异步网络请求处理库，网络处理均基于Android的非UI线程，通
ORACLE 复习笔记之SQL语句的优化 eksliang SQL优化 Oracle sql语句优化 SQL语句的优化
转载请出自出处：http://eksliang.iteye.com/blog/2097999 SQL语句的优化总结如下 sql语句的优化可以按照如下六个步骤进行：合理使用索引避免或者简化排序消除对大表的扫描避免复杂的通配符匹配调整子查询的性能 EXISTS和IN运算符下面我就按照上面这六个步骤分别进行总结：
浅析：Android 嵌套滑动机制（NestedScrolling） gg163 android 移动开发滑动机制嵌套
谷歌在发布安卓 Lollipop版本之后，为了更好的用户体验，Google为Android的滑动机制提供了NestedScrolling特性 NestedScrolling的特性可以体现在哪里呢？ 比如你使用了Toolbar，下面一个ScrollView，向上滚
使用hovertree菜单作为后台导航 hvt JavaScript jquery .net hovertree asp.net
hovertree是一个jquery菜单插件，官方网址：http://keleyi.com/jq/hovertree/ ，可以登录该网址体验效果。 0.1.3版本：http://keleyi.com/jq/hovertree/demo/demo.0.1.3.htm hovertree插件包含文件： http://keleyi.com/jq/hovertree/css
SVG 教程（二）矩形天梯梦 svg
SVG <rect> SVG Shapes SVG有一些预定义的形状元素，可被开发者使用和操作：矩形 <rect> 圆形 <circle> 椭圆 <ellipse> 线 <line> 折线 <polyline> 多边形 <polygon> 路径 <path>
一个简单的队列 luyulong java 数据结构队列
public class MyQueue { private long[] arr; private int front; private int end; // 有效数据的大小 private int elements; public MyQueue() { arr = new long[10]; elements = 0; front
基础数据结构和算法九：Binary Search Tree sunwinner Algorithm
A binary search tree (BST) is a binary tree where each node has a Comparable key (and an associated value) and satisfies the restriction that the key in any node is larger than the keys in all
项目出现的一些问题和体会 Steven-Walker DAO Web servlet
第一篇博客不知道要写点什么，就先来点近阶段的感悟吧。这几天学了servlet和数据库等知识，就参照老方的视频写了一个简单的增删改查的，完成了最简单的一些功能，使用了三层架构。 dao层完成的是对数据库具体的功能实现，service层调用了dao层的实现方法，具体对servlet提供支持。 &
高手问答：Java老A带你全面提升Java单兵作战能力！ ITeye管理员 java
本期特邀《Java特种兵》作者：谢宇，CSDN论坛ID: xieyuooo 针对JAVA问题给予大家解答，欢迎网友积极提问，与专家一起讨论! 作者简介：淘宝网资深Java工程师，CSDN超人气博主，人称“胖哥”。 CSDN博客地址： http://blog.csdn.net/xieyuooo 作者在进入大学前是一个不折不扣的计算机白痴，曾经被人笑话过不懂鼠标是什么，