syddf_shadow

【Vulkan学习记录-基础篇-5】多线程渲染

现代的图形API都具备对多线程渲染友好的特性，所谓的多线程并不是指GPU端的多线程图像渲染，而是指在CPU提交DrawCall时所做的一系列工作可以并行化，也就是说多线程渲染其实是在CPU端提升程序的性能。

在使用D3D 11或者OpenGL的时候，每次提交DrawCall之前，都需要将相关的状态进行更新，将需要用的资源进行绑定，在提交DrawCall时，还要进行相关的参数检查等工作，这些看上去耗费的时间并没有太大的影响，而如果场景的几何体、材质种类非常多，用到的Shader数量比较多，每一帧的Pass比较多，就会导致有大量的DrawCall产生。那么每次在CPU端进行的这些操作的费时就很有可能会成为瓶颈。一种很自然的优化策略，就是将所有的CPU端的这些操作并行处理，即多线程地进行状态修改、参数检查等工作。但是传统的图形API对此并不友好，不管是D3D11还是OpenGL，它们都具有一个Context的概念，这个Context负责进行资源的绑定、状态修改、DrawCall调用，这样的模式对多线程十分不友好，如果想要实现多线程地提交，理论上是可以完成，但是非常麻烦，而且需要用到很多复杂同步原语，导致整体性能未必能达到理想的效果。

而现代的图形API则进行了一些模式上的更新，使得对多线程的支持更加友好。在Vulkan中的设计则主要体现在Queue和CommandBuffer上。在前几篇中有提到过，Vulkan中所有需要GPU执行的命令，只能通过CommandBuffer来完成，这些命令并不只包括DrawCall，对计算的调用，内存的操作，都需要用到CommandBuffer。而渲染所需要的所有状态（Shader和DescriptorSet等），都需要在CommandBuffer中进行绑定。每一个CommandBuffer，都有它独立的这些状态，在使用任意一个CommandBuffer时，都不可能避免这些操作，这与传统API中，如果不改变一个状态的话那么它将一直保持不变很不一样。而Queue则是在Vulkan中唯一一个可以向GPU提交命令的通道，而不是通过绑定在一个单一线程上的Context来完成。可以向Queue提交任务，而如果需要等待Queue中的某个任务结束的话，就需要手动的进行同步控制。用到上一篇所介绍的同步机制。

因此在Vulkan中的一种简单的多线程模式为：每个线程在每一帧都负责设置好自己的CommandBuffer，等待所有的线程将自己的CommandBuffer都设置好后，再将所有的CommandBuffer全部提交给Queue。

本文需要渲染的场景为：

这个场景由非常多的飞碟构成，观察到每个飞碟中间部分的颜色都不相同，也就是在渲染每一个飞碟时，都需要对渲染的状态进行更新。并且每个飞碟的位置在每一帧都需要进行更新。

下面就介绍这种多线程模式是如何具体实现的：
首先需要手动实现一下Thread：

class Thread
{
private:
	bool destroying = false;
	std::thread worker;
	std::queue<std::function<void()>> jobQueue;
	std::mutex queueMutex;
	std::condition_variable condition;

	// Loop through all remaining jobs
	void queueLoop()
	{
		while (true)
		{
			std::function<void()> job;
			{
				std::unique_lock<std::mutex> lock(queueMutex);
				condition.wait(lock, [this] { return !jobQueue.empty() || destroying; });
				if (destroying)
				{
					break;
				}
				job = jobQueue.front();
			}

			job();

			{
				std::lock_guard<std::mutex> lock(queueMutex);
				jobQueue.pop();
				condition.notify_one();
			}
		}
	}

public:
	Thread()
	{
		worker = std::thread(&Thread::queueLoop, this);
	}

	~Thread()
	{
		if (worker.joinable())
		{
			wait();
			queueMutex.lock();
			destroying = true;
			condition.notify_one();
			queueMutex.unlock();
			worker.join();
		}
	}

	// Add a new job to the thread's queue
	void addJob(std::function<void()> function)
	{
		std::lock_guard<std::mutex> lock(queueMutex);
		jobQueue.push(std::move(function));
		condition.notify_one();
	}

	// Wait until all work items have been finished
	void wait()
	{
		std::unique_lock<std::mutex> lock(queueMutex);
		condition.wait(lock, [this]() { return jobQueue.empty(); });
	}
};

class ThreadPool
{
public:
	std::vector<std::unique_ptr<Thread>> threads;

	// Sets the number of threads to be allocted in this pool
	void setThreadCount(uint32_t count)
	{
		threads.clear();
		for (auto i = 0; i < count; i++)
		{
			threads.push_back(std::make_unique<Thread>());
		}
	}

	// Wait until all threads have finished their work items
	void wait()
	{
		for (auto &thread : threads)
		{
			thread->wait();
		}
	}
};

这里将每个Thread需要执行的任务放在了一个jobQueue中，在jobQueue中没有任何任务时，将当前线程睡眠，而当有新的任务加入进来以后，唤醒该线程执行任务。
ThreadPool负责创建Thread，在每一帧中通过Wait函数，来等待每个线程中的所有任务都结束。

多线程更新相关的数据为：

	struct PushConstantBlock
	{
		glm::mat4 mvp;
		glm::vec3 color;
	};

	struct ObjectData
	{
		glm::mat4 model;
		glm::vec3 pos;
		glm::vec3 rotation;
		float rotationDir;
		float rotationSpeed;
		float scale;
		float deltaT;
		float stateT = 0;
		bool visible = true;
	};

	struct ThreadData
	{
		VkCommandPool commandPool;
		std::vector<VkCommandBuffer> commandBufferVec;
		std::vector<PushConstantBlock> pushConstantBlockVec;
		std::vector<ObjectData> objectDataVec;
	};

注意到所有的飞碟，用的都是同一个Shader：

#version 450

layout (location = 0) in vec3 inPos;
layout (location = 1) in vec3 inNormal;
layout (location = 2) in vec3 inColor;

layout (std140, push_constant) uniform PushConsts 
{
	mat4 mvp;
	vec3 color;
} pushConsts;

layout (location = 0) out vec3 outNormal;
layout (location = 1) out vec3 outColor;
layout (location = 3) out vec3 outViewVec;
layout (location = 4) out vec3 outLightVec;

void main() 
{
	outNormal = inNormal;

	if ( (inColor.r == 1.0) && (inColor.g == 0.0) && (inColor.b == 0.0))
	{	
		outColor = pushConsts.color;
	}
	else
	{
		outColor = inColor;
	}
	
	gl_Position = pushConsts.mvp * vec4(inPos.xyz, 1.0);
	
    vec4 pos = pushConsts.mvp * vec4(inPos, 1.0);
    outNormal = mat3(pushConsts.mvp) * inNormal;
	//	vec3 lPos = ubo.lightPos.xyz;
	vec3 lPos = vec3(0.0);
    outLightVec = lPos - pos.xyz;
    outViewVec = -pos.xyz;
}

#version 450

layout (location = 0) in vec3 inNormal;
layout (location = 1) in vec3 inColor;
layout (location = 3) in vec3 inViewVec;
layout (location = 4) in vec3 inLightVec;

layout (location = 0) out vec4 outFragColor;


void main() 
{
	vec3 N = normalize(inNormal);
	vec3 L = normalize(inLightVec);
	vec3 V = normalize(inViewVec);
	vec3 R = reflect(-L, N);
	vec3 diffuse = max(dot(N, L), 0.0) * inColor;
	vec3 specular = pow(max(dot(R, V), 0.0), 8.0) * vec3(0.75);
	outFragColor = vec4(diffuse + specular, 1.0);	
}

可以看到飞碟中间颜色的差异是通过在VertexShader中将模型中具备特殊颜色顶点设置为指定颜色实现的。而FragmentShader则是一个比较简单的Phong着色。渲染每个飞碟时都需要更新VertexShader中的PushConsts，它的MVP矩阵决定了飞碟的位置，而color决定了飞碟中部的颜色。Shader中的其他内容都不需要在渲染时进行更新，看起来还是比较简单的。PushConstant的提交是在CommandBuffer内进行，所以每个线程的关键任务就是要对CommandBuffer做更新。

void UpdateCommandBuffer(int ind)
	{
		Update();
		VkCommandBufferInheritanceInfo inheritanceInfo = {};
		inheritanceInfo.sType = VK_STRUCTURE_TYPE_COMMAND_BUFFER_INHERITANCE_INFO;
		inheritanceInfo.renderPass = render_pass_;
		inheritanceInfo.framebuffer = frame_buffer_[ind];

		VkCommandBufferBeginInfo beginInfo = {};
		beginInfo.sType = VK_STRUCTURE_TYPE_COMMAND_BUFFER_BEGIN_INFO;
		beginInfo.pInheritanceInfo = &inheritanceInfo;
		beginInfo.flags = VK_COMMAND_BUFFER_USAGE_RENDER_PASS_CONTINUE_BIT;

		vkBeginCommandBuffer(ui_command_buffer_, &beginInfo);
		VkViewport viewport = {};
		viewport.width = width_;
		viewport.height = height_;
		viewport.minDepth = 0.0f;
		viewport.maxDepth = 1.0f;

		VkRect2D scissor = {};
		scissor.extent.width = width_;
		scissor.extent.height = height_;

		vkCmdSetViewport(ui_command_buffer_, 0, 1, &viewport);
		vkCmdSetScissor(ui_command_buffer_, 0, 1, &scissor);
		vkCmdBindPipeline(ui_command_buffer_, VK_PIPELINE_BIND_POINT_GRAPHICS, pipeline_);
		imgui_->draw(ui_command_buffer_);
		vkEndCommandBuffer(ui_command_buffer_);

		VkClearValue clearValues[2];
		clearValues[0].color = { 0.0f , 0.0f , 0.0f , 1.0f };
		clearValues[1].depthStencil = { 1.0f, 0 };
		VkRenderPassBeginInfo renderPassBeginInfo = {};
		renderPassBeginInfo.sType = VK_STRUCTURE_TYPE_RENDER_PASS_BEGIN_INFO;
		renderPassBeginInfo.renderArea.extent.width = width_;
		renderPassBeginInfo.renderArea.extent.height = height_;
		renderPassBeginInfo.framebuffer = frame_buffer_[ind];
		renderPassBeginInfo.clearValueCount = 2;
		renderPassBeginInfo.pClearValues = clearValues;
		renderPassBeginInfo.renderPass = render_pass_;

		vkBeginCommandBuffer(draw_command_buffer_[ind] , &beginInfo );
		vkCmdBeginRenderPass(draw_command_buffer_[ind], &renderPassBeginInfo, VK_SUBPASS_CONTENTS_SECONDARY_COMMAND_BUFFERS);

		for (uint32_t t = 0; t < thread_count; t++)
		{
			for (uint32_t i = 0; i < object_count / thread_count; i++)
			{
				thread_pool_.threads[t]->addJob([=] { UpdateThreadData(t, i, inheritanceInfo); });
			}
		}

		thread_pool_.wait();

		std::vector<VkCommandBuffer> commandBufferVec;
		for (uint32_t t = 0; t < thread_count; t++)
		{
			for (uint32_t i = 0; i < object_count / thread_count; i++)
			{
				commandBufferVec.push_back(threadDataVec[t].commandBufferVec[i]);
			}
		}
		commandBufferVec.push_back(ui_command_buffer_);
		vkCmdExecuteCommands( draw_command_buffer_[ind] , commandBufferVec.size(), commandBufferVec.data() );
		vkCmdEndRenderPass(draw_command_buffer_[ind]);
		vkEndCommandBuffer(draw_command_buffer_[ind]);
	}

这是在每一帧调用的总的更新函数，可以看到，所有线程的CommandBuffer，都是内嵌在一个大的CommandBuffer的一个RenderPass内部的。每个飞碟对应一个CommandBuffer，一个线程在一帧内要处理多个CommandBuffer。

	void UpdateThreadData(uint32_t threadIndex , uint32_t commandBufferIndex , VkCommandBufferInheritanceInfo inheritanceInfo )
	{
		ThreadData & threadData = threadDataVec[threadIndex];
		ObjectData & objectData = threadData.objectDataVec[commandBufferIndex];

		VkCommandBufferBeginInfo beginInfo = {};
		beginInfo.sType = VK_STRUCTURE_TYPE_COMMAND_BUFFER_BEGIN_INFO;
		beginInfo.flags = VK_COMMAND_BUFFER_USAGE_RENDER_PASS_CONTINUE_BIT;
		beginInfo.pInheritanceInfo = &inheritanceInfo;

		vkBeginCommandBuffer(threadData.commandBufferVec[commandBufferIndex], &beginInfo);
		VkViewport viewport = {};
		viewport.width = width_;
		viewport.height = height_;
		viewport.minDepth = 0.0f;
		viewport.maxDepth = 1.0f;

		VkRect2D scissor = {};
		scissor.extent.width = width_;
		scissor.extent.height = height_;

		vkCmdSetViewport(threadData.commandBufferVec[commandBufferIndex], 0, 1, &viewport);
		vkCmdSetScissor(threadData.commandBufferVec[commandBufferIndex], 0, 1, &scissor);
		vkCmdBindPipeline(threadData.commandBufferVec[commandBufferIndex], VK_PIPELINE_BIND_POINT_GRAPHICS, pipeline_);

		// Update Object Data
		objectData.rotation.y += 2.5f * objectData.rotationSpeed * frame_timer;
		if (objectData.rotation.y > 360.0f) {
			objectData.rotation.y -= 360.0f;
		}
		objectData.deltaT += 0.15f * frame_timer;
		if (objectData.deltaT > 1.0f)
			objectData.deltaT -= 1.0f;
		objectData.pos.y = sin(glm::radians(objectData.deltaT * 360.0f)) * 2.5f;
	
		objectData.model = glm::translate(glm::mat4(1.0f), objectData.pos);
		objectData.model = glm::rotate(objectData.model, -sinf(glm::radians(objectData.deltaT * 360.0f)) * 0.25f, glm::vec3(objectData.rotationDir, 0.0f, 0.0f));
		objectData.model = glm::rotate(objectData.model, glm::radians(objectData.rotation.y), glm::vec3(0.0f, objectData.rotationDir, 0.0f));
		objectData.model = glm::rotate(objectData.model, glm::radians(objectData.deltaT * 360.0f), glm::vec3(0.0f, objectData.rotationDir, 0.0f));
		objectData.model = glm::scale(objectData.model, glm::vec3(objectData.scale));

		// Update Push Constant 
		threadData.pushConstantBlockVec[commandBufferIndex].mvp = uboVS.projectionMatrix * uboVS.viewMatrix * objectData.model;
		vkCmdPushConstants(threadData.commandBufferVec[commandBufferIndex],
			pipeline_layout_,
			VK_SHADER_STAGE_VERTEX_BIT,
			0,
			sizeof(PushConstantBlock),
			&threadData.pushConstantBlockVec[commandBufferIndex]);

		VkBuffer vertBuffer = ufo.vertices->GetDesc().buffer;
		VkDeviceSize offset = 0;
		vkCmdBindVertexBuffers(threadData.commandBufferVec[commandBufferIndex], 0, 1, &vertBuffer, &offset);
		vkCmdBindIndexBuffer(threadData.commandBufferVec[commandBufferIndex], ufo.indices->GetDesc().buffer, 0, VK_INDEX_TYPE_UINT32);
		vkCmdDrawIndexed(threadData.commandBufferVec[commandBufferIndex], ufo.indexCount , 1, 0, 0, 0);
		vkEndCommandBuffer(threadData.commandBufferVec[commandBufferIndex]);
	}

上面则是每个线程所要执行的具体的任务，比较直观，在获取到飞碟对应的CommandBuffer后，先对飞碟本身的数据信息进行更新，然后对CommandBuffer进行重新写入，尽管感觉上我们只需要重新提交一次PushConstant命令，但是所有的其他不变的状态也需要再进行一次提交，比如VertexBuffer、IndexBuffer、Scissor、Viewport，这里就体现出与传统API的区别了，如果在D3D11中，我们只需要将某个ConstantBuffer修改一下，其他的都不需要动，然后直接提交DrawCall就行，但是在Vulkan中，每个CommandBuffer内的状态只要需要修改一点，那么其他所有的状态都要跟着再进行一次设定。

程序大体上就是如此，详细地可以参考源码：https://github.com/syddf/VulkanRenderExample
（参考了SaschaWillems的Samples：https://github.com/SaschaWillems/Vulkan）

Vulkan多线程录制Command Buffer高效指南你一身傲骨怎能输渲染管线 Command Buffer
文章摘要Vulkan支持多线程并行录制CommandBuffer以提升CPU效率，需遵循以下原则：每个线程使用独立CommandPool避免竞争合理分配渲染任务确保负载均衡避免线程间共享资源修改主线程统一提交所有CommandBuffer实现时需为每个线程创建独立CommandPool和CommandBuffer，任务分块后多线程并行录制，最后同步提交。注意资源隔离、同步机制及CommandPoo
Yuzu模拟器Vulkan模式配置指南与性能优化实战 mmoo_python 性能优化 windows
Yuzu模拟器Vulkan模式配置指南与性能优化实战前言：VulkanAPI为何成为模拟器性能突破口作为当前最热门的Switch模拟器，Yuzu团队近期向全体用户开放了VulkanAPI支持功能。这项技术革新不仅解决了长期困扰AMD显卡用户的兼容性问题，更通过底层渲染架构的革新，为复杂3D游戏带来显著性能提升。本文将深度解析Vulkan模式的配置流程，结合实际测试数据揭示性能优化秘诀，助力玩家畅玩
Vulkan工厂论：高性能渲染架构的终极秘密你一身傲骨怎能输渲染管线架构
文章摘要Vulkan通过"现代自动化工厂"模式打造高性能渲染引擎：多线程并行处理(多个工头)、批量提交指令(批量订单)、自主资源管理(智能仓库)、灵活管线配置(可调流水线)和高效同步机制。相比传统API"老式工厂"的单线程指挥模式，Vulkan让CPU(工头)和GPU(工人)协同更高效，消除等待时间，充分发挥硬件性能，实现极致渲染效率。这套平台无关的设计适用于各种系统环境，为高质量实时渲染提供基础
Vulkan 学习(18)---- 使用 ValidationLayer 小猪佩奇TONY Vulkan 学习学习 mfc c++
目录ValidationLayer简介启用ValidationLayerEnableValidationLayer检查扩展支持创建回调函数注册回调函数AndroidValidationLayerValidationLayer简介VulkanAPI的设计是按照最小化驱动程序的开销进行的，所以默认情况下VulkanAPI提供的错误检测的功能非常有限，很多基本的错误都没有被Vulkan显式进行处理，遇到
高性能AI核心板Z3588CV1：基于瑞芯微RK3588的旗舰级解决方案——8K视觉处理 · 6TOPS NPU算力 · 多场景边缘计算九鼎创展科技嵌入式硬件边缘计算 arm开发 android
RK3588处理器技术细节计算单元CPU：4×[email protected]（大核集群）4×[email protected]（能效集群）支持ARMDynamIQ混合架构，可实现任务智能调度GPU：Mali-G610MP4，支持OpenGLES3.2/2.0/1.1、Vulkan1.28KVPU视频编解码：H.265/H.264/AV1格式，支持60fps实时处理NPU：6TOPS算力（INT
Vulkan多管线渲染与绘制世界坐标轴Axis 程序员Xu vulkan 笔记图形学
一、多管线渲染设置vulkan图形管线要点vulkanAPI绘制不同的拓扑类型，比如三角形、线段、点都要重新设置图形管线。可以在初始化过程中设置多套不同的管线缓存起来，然后在绘制帧的时候绑定需要的管线进行绘制，这比每次绘制的时候重新创建管线性能要好得多。如果缓存了很多管线，每次绘制一个模型实例就绑定一次某个管线，那么性能也会不好。绘制的时候应该根据不同类型的管线对模型实例进行分组绘制，每绑定一种图
从零到一构建一个现代“C++游戏自研引擎”开发蓝图还债大湿兄游戏
当然不可能是真从零到一了，做为一个标题党，标题不牛对不起自己，因为游戏引擎涉及太多领域了，比如图形渲染、物理模拟、音频处理、网络通信等等。每个领域都有专业的解决方案，自己从头实现不仅效率低，而且质量难以保证。比如图形API抽象层可能需要支持不同的后端（OpenGL、Vulkan、Metal,dx等），物理引擎用Bullet或PhysX，音频用FMOD或OpenAL。这些库都是经过多年打磨的，稳定性
Vulkan 学习笔记16—集成 ImGUI 程序员Xu Vulkan学习学习笔记 chrome
Vulkan集成ImGUI学习笔记一、目录与文件部署从官网获取IMGUI代码库，在项目extern目录下新建imgui目录，将相关文件复制进去，构建出如下目录结构：.├──build├──extern│├──glfw│├──glm│└──imgui│├──backends││├──imgui_impl_glfw.cpp││├──imgui_impl_glfw.h││├──imgui_impl_vu
游戏引擎架构全景：从硬件到玩法的程序员之旅还债大湿兄游戏引擎架构
一、基石：硬件、OS与第三方王国硬件层：PS5的定制SSD、XboxSeriesX的GPU、高端PC的RTX显卡——这些是引擎的物理疆域。代码在此直面硅基世界的限制（内存带宽、浮点算力、缓存延迟）。操作系统：Windows调度线程、Linux管理文件句柄、游戏主机OS提供底层API。引擎需在此抽象层之上构建可控环境。第三方SDK：技术领域的“他山之石”。图形API：DirectX12/Vulkan
Vulkan学习笔记7—分层重构程序员Xu 学习笔记重构
一、Vulkan对象封装VkContext.h#pragmaonce#defineGLFW_INCLUDE_VULKAN#include#include#include#includenamespacerenderer{structQueueFamilyIndices{std::optionalgraphicsFamily;std::optionalpresentFamily;boolsameFa
Real-ESRGAN-ncnn-vulkan 使用教程陶名战Blanche
Real-ESRGAN-ncnn-vulkan使用教程项目地址:https://gitcode.com/gh_mirrors/re/Real-ESRGAN-ncnn-vulkan1.项目介绍Real-ESRGAN-ncnn-vulkan是基于NCNN框架实现的Real-ESRGAN算法，旨在开发适用于一般图像恢复的实用算法。该项目特别优化了对动漫图像的处理。Real-ESRGAN通过纯合成数据训练
【Vulkan项目实战笔记】3D Tiles渲染器1-脚手架搭建程序员Xu 笔记 3d 图形渲染
一、项目简介项目技术栈CesiumNative+DearImGui+Vulkan1.3三维地理可视化系统详细项目功能说明1.3DTiles渲染功能实现完整的3DTiles格式解析与加载引擎支持LOD(LevelofDetail)分层细节渲染可加载建筑模型、点云等3DTiles资产示例：加载城市级建筑3DTiles数据，实现流畅的缩放浏览2.WGS84椭球体渲染精确呈现地球椭球体模型支持WGS84坐
Vulkan学习笔记【一】创建窗口与实例 w还是晒太阳吧 Vulkan学习之路学习 c++opengl 图形渲染
Vulkan介绍Vulkan是作为一个跨平台的图形API设计的。以往许多图形API采用固定功能渲染管线设计，应用程序按照一定格式提交顶点数据，配置光照和着色选项。随着显卡架构逐渐成熟，提供了越来越多的可编程功能，这些功能被集成到原有的API中。造成驱动程序要做的工作越来越复杂，应用程序开发者要处理的兼容性问题也越来越多。随着移动浪潮到来，人们对移动GPU的要求也越来越高，但以往的图形API不能够进
Vulkan 学习笔记：创建Window Nemoxy Vulkan 学习图形渲染
为了使代码更加规范，且只在需要debug的时候添加validationlayer，添加宏定义BUILD_OPTIONS.h#pragmaonce#defineBUILD_ENABLE_VULKAN_DEBUG1#defineBUILD_ENABLE_VULKAN_RUNTIME_DEBUG1Render.cpp修改添加#ifdefine，将debug函数包含进去#include"Renderer.
附加模块--Qt OpenGL模块功能及架构笨笨马甲 Qt OpenGL qt 开发语言
一、模块功能：主要变化QtOpenGL模块的分离：在Qt6中，原来的QtOpenGL功能被拆分为多个模块传统的QtOpenGL模块(QGL*)已被标记为废弃新的图形架构：Qt6引入了基于QRhi(QtRenderingHardwareInterface)的新图形架构提供了对Vulkan、Metal、Direct3D和OpenGL的统一抽象主要OpenGL相关模块QtOpenGLCompatibil
Vulkan学习笔记3—物理设备-逻辑设备-窗口表面-交换链-图像视图程序员Xu Vulkan学习学习笔记
一、概览图新增初始化操作步骤描述：创建窗口表面；选择物理设备，查询支持图形和呈现的队列族；创建逻辑设备，根据队列族创建对应的队列（图形和呈现队列）；根据物理设备和窗口表面查询交换链支持，选择交换链表面格式、呈现模式、呈现范围；根据交换链图像创建图像视图。二、HelloTriangle新增成员变量和成员函数新增成员变量GLFWwindow*window;//GLFW窗口对象指针VkPhysicalD
Vulkan学习笔记2—画三角形基本步骤和验证层程序员Xu Vulkan学习学习笔记
一、定义个HelloTriangle类画三角形，鸟瞰整个过程的大致步骤创建一个VkInstance选择一个支持的显卡(VkPhysicalDevice)创建用于绘制和呈现的VkDevice和VkQueue创建一个窗口、窗口表面和交换链将交换链图像包装到VkImageView中创建一个指定渲染目标和用法的渲染通道为渲染通道创建帧缓冲区设置图形管线为每个可能的交换链图像分配并记录带有绘制命令的命令缓冲
【环境搭建】win10搭建vulkan .云哲. 环境搭建
1，准备需要下载三个包，分别是glm,glfw,vulkanglm，https://github.com/g-truc/glmglfw，https://www.glfw.org/download.htmlvulkan，https://vulkan.lunarg.com/sdk/home运行vulkan，安装sdkglm和glfw解压->vulkan目录的Third-Party。2，VS2015创建
WebGPU渲染引擎架构深度解析：从GPU硬件抽象到高效渲染
一、WebGPU的设计哲学：面向现代GPU的底层抽象WebGPU的核心目标是成为一个“薄而宽”的抽象层：“薄”(LowOverhead)：最小化驱动翻译：与WebGL(基于OpenGLES)不同，WebGPU的设计更贴近Vulkan、Metal、D3D12等现代原生API，直接映射到它们的核心概念（管道状态对象PSOs、命令缓冲区、描述符集/绑定组）。这显著减少了浏览器在驱动层进行的复杂翻译工作，
vulkan游戏引擎Makefile.testbed启动环境配置文件 Magnum Lehar 游戏引擎
1.makefile.testbed.windows.makDIR:=$(subst/,\,${CURDIR})BUILD_DIR:=binOBJ_DIR:=objASSEMBLY:=testbedEXTENSION:=.exeCOMPILER_FLAGS:=-g-MD-Werror=vla-Wno-missing-braces-fdeclspec#-fPICINCLUDE_FLAGS:=-Ien
vulkan游戏引擎test的核心代码实现 Magnum Lehar 游戏引擎 linux 算法
1.expect.h#include#include/***@brief**Expectsexpectedtobeeuqaltobeequaltoactual**/#defineexpect_should_be(expected,actual)\if(actual!=expected){\KERROR("-->Expected%%lld,butgot:%lld.File:%s:%d.",expec
【从Vulkan渲染器到自研游戏引擎】一、Vulkan渲染流程菲利Felicity 图形渲染游戏引擎图形渲染 c++
写在前面项目链接：https://gitlab.com/FeliHNU/vkguideengine笔者课余之时热爱游戏开发，大一也曾写过一款Unity小游戏拿了游戏创意大赛第一名。但在这个过程中深感自身水平不足，遂向底层图形API发起冲锋。先后跟随VulkanTutorial,VkGuide，学习了VulkanAPI，写了一个渲染器，希望能够成为未来开发自研引擎的坚实一步。运行环境macOS13.
Android系统Vulkan开发指南：下一代图形API 操作系统内核探秘 android 网络 ai
Android系统Vulkan开发指南：下一代图形API关键词：Android系统、Vulkan、图形API、开发指南、下一代图形技术摘要：本文旨在为开发者提供一份全面的Android系统Vulkan开发指南。首先介绍了Vulkan作为下一代图形API的背景和重要性，详细阐述了其核心概念、原理和架构。接着讲解了核心算法原理，并结合Python代码进行说明，同时给出相关数学模型和公式。通过实际的项目
讲一下鸿蒙游戏引擎-Unity
⚙️一、Unity对鸿蒙系统的核心支持1.跨平台兼容性多设备覆盖：支持将游戏发布至鸿蒙手机、平板、智能穿戴及车机等设备。统一代码库：开发者使用C#编写核心逻辑，通过Unity编辑器直接生成鸿蒙应用包（HAP）。渲染引擎适配：自研渲染管线自动适配鸿蒙图形接口（如OpenGLES/Vulkan），保障画面一致性。2.开发环境配置#基础环境搭建步骤（基于Unity2022LTS）npminstall-g
使用Vulkan技术在Android上提升游戏画质 ElainaQAQ android 游戏 microsoft
关于Vulkan技术在Android上提升游戏画质文章目录关于Vulkan技术在Android上提升游戏画质Vulkan的优势1.更高的性能代码示例：批处理命令2.多线程支持代码示例：多线程命令记录3.更好的内存管理代码示例：显式内存分配实际应用案例成功案例分析Android系统中的Vulkan支持检查设备支持配置AndroidManifest提升游戏画质的技术高动态范围成像（HDR）实现示例物理
手把手教你学PCIE--内存管理（2）-基本概念： UMD（用户模式驱动）、KMD（内核模式驱动）和 DDK（设备驱动开发工具包）之间的关系小蘑菇二号手把手教你学 PCIe 专栏简介驱动开发 pcie
目录示例背景步骤详解具体流程图示总结了更好地理解UMD（用户模式驱动）、KMD（内核模式驱动）和DDK（设备驱动开发工具包）之间的关系以及它们如何协同工作，我们可以考虑一个具体的示例：使用VulkanAPI提交一个简单的图形渲染作业到GPU。示例背景假设我们有一个使用VulkanAPI编写的应用程序，该应用程序希望在屏幕上渲染一个三角形。这个过程涉及到从高级的图形API调用到底层硬件执行的一系列步
vulkan游戏引擎的makefile启动环境实现 Magnum Lehar 游戏引擎
1.makefile.engine.windows.makDIR:=$(subst/,\,${CURDIR})BUILD_DIR:=binOBJ_DIR:=objASSEMBLY:=engineEXTENSION:=.dllCOMPILER_FLAGS:=-g-MD-Werror=vla-fdeclspec#-fPICINCLUDE_FLAGS:=-Iengine\src-I$(VULKAN_SD
vulkan游戏引擎renderer_frontend实现 Magnum Lehar 游戏引擎
1.renderer_frontend.h#pragmaonce#include"renderer_types.inl"structstatic_mesh_data;structplatform_state;b8renderer_initialize(constchar*application_name,structplatform_state*plat_state);voidrenderer_s
【godot游戏引擎学习笔记】初识界面知兀 Godot游戏引擎学习中 godot 游戏引擎笔记
个人笔记，学习自B站视频BV1ut42177r8目录渲染器的选择Forward+移动兼容编辑器页面浏览场景（左上角）文件浏览器（左下角）属性检查器（右侧）场景编辑器（中间）（顶部）2D和3D模式Script界面AssetLib渲染器的选择Forward+渲染器就是Godot为我们渲染游戏画面的工具，Godot4主要使用Vulkan渲染引擎进行画面渲染我们一般在制作3D游戏的时候，选择Forward
C++ 游戏开发详细流程笑非不退 C++游戏开发 C++游戏开发
第一阶段：项目规划与架构设计关键词：系统性、模块化、可扩展性1.1目标明确游戏类型：2D/2.5D/3D/VR平台选择：PC、主机、移动设备多人/单人：是否含网络模块（决定是否使用socket、UDP、P2P、Matchmaking等）1.2技术栈决定模块技术库/接口窗口/输入SDL2、GLFW、WinAPI渲染引擎OpenGL、Vulkan、DirectX音频系统OpenAL、FMOD网络通信E
Java常用排序算法/程序员必须掌握的8大排序算法 cugfy java
分类： 1）插入排序（直接插入排序、希尔排序） 2）交换排序（冒泡排序、快速排序） 3）选择排序（直接选择排序、堆排序） 4）归并排序 5）分配排序（基数排序）所需辅助空间最多：归并排序所需辅助空间最少：堆排序平均速度最快：快速排序不稳定：快速排序，希尔排序，堆排序。先来看看8种排序之间的关系： 1.直接插入排序（1
【Spark102】Spark存储模块BlockManager剖析 bit1129 manager
Spark围绕着BlockManager构建了存储模块，包括RDD，Shuffle，Broadcast的存储都使用了BlockManager。而BlockManager在实现上是一个针对每个应用的Master/Executor结构，即Driver上BlockManager充当了Master角色，而各个Slave上(具体到应用范围，就是Executor)的BlockManager充当了Slave角色
linux 查看端口被占用情况详解 daizj linux 端口占用 netstat lsof
经常在启动一个程序会碰到端口被占用，这里讲一下怎么查看端口是否被占用，及哪个程序占用，怎么Kill掉已占用端口的程序 1、lsof -i:port port为端口号 [root@slave /data/spark-1.4.0-bin-cdh4]# lsof -i:8080 COMMAND PID USER FD TY
Hosts文件使用周凡杨 hosts locahost
一切都要从localhost说起，经常在tomcat容器起动后，访问页面时输入http://localhost:8088/index.jsp，大家都知道localhost代表本机地址，如果本机IP是10.10.134.21，那就相当于http://10.10.134.21:8088/index.jsp，有时候也会看到http: 127.0.0.1:
java excel工具 g21121 Java excel
直接上代码，一看就懂，利用的是jxl： import java.io.File; import java.io.IOException; import jxl.Cell; import jxl.Sheet; import jxl.Workbook; import jxl.read.biff.BiffException; import jxl.write.Label; import
web报表工具finereport常用函数的用法总结（数组函数）老A不折腾 finereport web报表函数总结
ADD2ARRAY ADDARRAY(array,insertArray, start):在数组第start个位置插入insertArray中的所有元素，再返回该数组。示例： ADDARRAY([3,4, 1, 5, 7], [23, 43, 22], 3)返回[3, 4, 23, 43, 22, 1, 5, 7]. ADDARRAY([3,4, 1, 5, 7], "测试&q
游戏服务器网络带宽负载计算墙头上一根草服务器
家庭所安装的4M，8M宽带。其中M是指，Mbits/S 其中要提前说明的是： 8bits = 1Byte 即8位等于1字节。我们硬盘大小50G。意思是50*1024M字节，约为 50000多字节。但是网宽是以“位”为单位的，所以，8Mbits就是1M字节。是容积体积的单位。 8Mbits/s后面的S是秒。8Mbits/s意思是每秒8M位，即每秒1M字节。我是在计算我们网络流量时想到的
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans Spring 3 系列
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
高性能mysql 之选择存储引擎(一) annan211 mysql InnoDB MySQL引擎存储引擎
1 没有特殊情况，应尽可能使用InnoDB存储引擎。原因：InnoDB 和 MYIsAM 是mysql 最常用、使用最普遍的存储引擎。其中InnoDB是最重要、最广泛的存储引擎。她被设计用来处理大量的短期事务。短期事务大部分情况下是正常提交的，很少有回滚的情况。InnoDB的性能和自动崩溃恢复特性使得她在非事务型存储的需求中也非常流行，除非有非常
UDP网络编程百合不是茶 UDP编程局域网组播
UDP是基于无连接的,不可靠的传输与TCP/IP相反 UDP实现私聊,发送方式客户端,接受方式服务器 package netUDP_sc; import java.net.DatagramPacket; import java.net.DatagramSocket; import java.net.Ine
JQuery对象的val()方法执行结果分析 bijian1013 JavaScript js jquery
JavaScript中，如果id对应的标签不存在（同理JAVA中，如果对象不存在），则调用它的方法会报错或抛异常。在实际开发中，发现JQuery在id对应的标签不存在时，调其val()方法不会报错，结果是undefined。
http请求测试实例（采用json-lib解析） bijian1013 json http
由于fastjson只支持JDK1.5版本，因些对于JDK1.4的项目，可以采用json-lib来解析JSON数据。如下是http请求的另外一种写法，仅供参考。 package com; import java.util.HashMap; import java.util.Map; import
【RPC框架Hessian四】Hessian与Spring集成 bit1129 hessian
在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中介绍了基于Hessian的RPC服务的实现步骤，在那里使用Hessian提供的API完成基于Hessian的RPC服务开发和客户端调用，本文使用Spring对Hessian的集成来实现Hessian的RPC调用。定义模型、接口和服务器端代码 |---Model &nb
【Mahout三】基于Mahout CBayes算法的20newsgroup流程分析 bit1129 Mahout
1.Mahout环境搭建 1.下载Mahout http://mirror.bit.edu.cn/apache/mahout/0.10.0/mahout-distribution-0.10.0.tar.gz 2.解压Mahout 3. 配置环境变量 vim /etc/profile export HADOOP_HOME=/home
nginx负载tomcat遇非80时的转发问题 ronin47
　　nginx负载后端容器是tomcat（其它容器如WAS,JBOSS暂没发现这个问题）非８０端口，遇到跳转异常问题。解决的思路是：$host:port 详细如下：　　该问题是最先发现的，由于之前对nginx不是特别的熟悉所以该问题是个入门级别的： ? 1 2 3 4 5
java-17-在一个字符串中找到第一个只出现一次的字符 bylijinnan java
public class FirstShowOnlyOnceElement { /**Q17.在一个字符串中找到第一个只出现一次的字符。如输入abaccdeff，则输出b * 1.int[] count:count[i]表示i对应字符出现的次数 * 2.将26个英文字母映射：a-z <--> 0-25 * 3.假设全部字母都是小写 */ pu
mongoDB 复制集开窍的石头 mongodb
mongo的复制集就像mysql的主从数据库，当你往其中的主复制集(primary)写数据的时候，副复制集(secondary)会自动同步主复制集(Primary)的数据,当主复制集挂掉以后其中的一个副复制集会自动成为主复制集。提供服务器的可用性。和防止当机问题 mo
[宇宙与天文]宇宙时代的经济学 comsci 经济
宇宙尺度的交通工具一般都体型巨大，造价高昂。。。。。在宇宙中进行航行，近程采用反作用力类型的发动机，需要消耗少量矿石燃料，中远程航行要采用量子或者聚变反应堆发动机，进行超空间跳跃，要消耗大量高纯度水晶体能源以目前地球上国家的经济发展水平来讲，
Git忽略文件 Cwind git
有很多文件不必使用git管理。例如Eclipse或其他IDE生成的项目文件，编译生成的各种目标或临时文件等。使用git status时，会在Untracked files里面看到这些文件列表，在一次需要添加的文件比较多时（使用git add . / git add -u），会把这些所有的未跟踪文件添加进索引。 ==== ==== ==== 一些牢骚
MySQL连接数据库的必须配置 dashuaifu mysql 连接数据库配置
MySQL连接数据库的必须配置 1.driverClass：com.mysql.jdbc.Driver 2.jdbcUrl：jdbc:mysql://localhost:3306/dbname 3.user：username 4.password：password 其中1是驱动名；2是url，这里的‘dbna
一生要养成的60个习惯 dcj3sjt126com 习惯
一生要养成的60个习惯第1篇让你更受大家欢迎的习惯 1 守时，不准时赴约,让别人等,会失去很多机会。如何做到： ①该起床时就起床， ②养成任何事情都提前15分钟的习惯。 ③带本可以随时阅读的书，如果早了就拿出来读读。 ④有条理，生活没条理最容易耽误时间。 ⑤提前计划：将重要和不重要的事情岔开。 ⑥今天就准备好明天要穿的衣服。 ⑦按时睡觉，这会让按时起床更容易。 2 注重
[介绍]Yii 是什么 dcj3sjt126com PHP yii2
Yii 是一个高性能，基于组件的 PHP 框架，用于快速开发现代 Web 应用程序。名字 Yii （读作易）在中文里有“极致简单与不断演变”两重含义，也可看作 Yes It Is! 的缩写。 Yii 最适合做什么？ Yii 是一个通用的 Web 编程框架，即可以用于开发各种用 PHP 构建的 Web 应用。因为基于组件的框架结构和设计精巧的缓存支持，它特别适合开发大型应
Linux SSH常用总结 eksliang linux ssh SSHD
转载请出自出处：http://eksliang.iteye.com/blog/2186931 一、连接到远程主机格式： ssh name@remoteserver 例如： ssh [email protected] 二、连接到远程主机指定的端口格式： ssh name@remoteserver -p 22 例如： ssh i
快速上传头像到服务端工具类FaceUtil gundumw100 android
快速迭代用 import java.io.DataOutputStream; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.IOExceptio
jQuery入门之怎么使用 ini JavaScript html jquery Web css
jQuery的强大我何问起（个人主页：hovertree.com）就不用多说了，那么怎么使用jQuery呢？首先，下载jquery。下载地址：http://hovertree.com/hvtart/bjae/b8627323101a4994.htm，一个是压缩版本，一个是未压缩版本，如果在开发测试阶段，可以使用未压缩版本，实际应用一般使用压缩版本(min)。然后就在页面上引用。
带filter的hbase查询优化 kane_xie 查询优化 hbase RandomRowFilter
问题描述 hbase scan数据缓慢，server端出现LeaseException。hbase写入缓慢。问题原因直接原因是： hbase client端每次和regionserver交互的时候，都会在服务器端生成一个Lease,Lease的有效期由参数hbase.regionserver.lease.period确定。如果hbase scan需
java设计模式-单例模式 men4661273 java 单例枚举反射 IOC
单例模式1，饿汉模式 //饿汉式单例类.在类初始化时，已经自行实例化 public class Singleton1 { //私有的默认构造函数 private Singleton1() {} //已经自行实例化 private static final Singleton1 singl
mongodb 查询某一天所有信息的3种方法，根据日期查询 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
// mongodb的查询真让人难以琢磨，就查询单天信息，都需要花费一番功夫才行。 // 第一种方式： coll.aggregate([ {$project:{sendDate: {$substr: ['$sendTime', 0, 10]}, sendTime: 1, content:1}}, {$match:{sendDate: '2015-
二维数组转换成JSON tangqi609567707 java 二维数组 json
原文出处：http://blog.csdn.net/springsen/article/details/7833596 public class Demo { public static void main(String[] args) { String[][] blogL
erlang supervisor wudixiaotie erlang
定义supervisor时，如果是监控celuesimple_one_for_one则删除children的时候就用supervisor:terminate_child (SupModuleName, ChildPid)，如果shutdown策略选择的是brutal_kill，那么supervisor会调用exit(ChildPid, kill)，这样的话如果Child的behavior是gen_

【Vulkan学习记录-基础篇-5】多线程渲染

你可能感兴趣的:(Vulkan)