全面分析UE4游戏开发中的性能分析与优化

UE4游戏开发中的性能分析与优化

  • CPU端优化
  • 数据传输
  • GPU端优化

游戏性能优化是一个非常重要的话题,在游戏开发过程中,优化主要从三个方面入手,CPU端优化,数据传输过程和GPU端优化。
在游戏性能遇到瓶颈时,首先要明确是谁拖了后腿,在CPU端还是GPU端,游戏逻辑由CPU执行,如果是UE4蓝图或者C++代码执行效率低,则是CPU端需要优化,如果是渲染速度慢,则需要GPU端进行优化,如果是CPU向GPU发送指令过程慢,则说明要减少Draw Call(CPU向GPU发送渲染指令数量)数量。
游戏有“帧”的概念, 一帧的运行时间并不等于CPU渲染时间+CPU向GPU发送渲染指令时间+GPU渲染时间,因为这三项是由三个线程执行的,基本等于其中耗时最长的那一项,因此只要降低耗时最长的一项,就能有效提升帧速率。

全面分析UE4游戏开发中的性能分析与优化_第1张图片
由于上述三者之间执行由不同线程执行,但是只有CPU端处理完成后GPU才能进行渲染,因此有以下的执行顺序:
全面分析UE4游戏开发中的性能分析与优化_第2张图片
在第0帧时什么也没做,第一帧时CPU处理逻辑,第二帧时CPU线程继续处理逻辑,同时CPU开辟一个线程向GPU发送渲染指令(Draw Call),第三帧时GPU开始处理CPU第二帧发送过来的数据,因此GPU每一帧处理的数据都是CPU前一帧发送过来的数据,这样就达到了看似顺序执行的目的

CPU端优化

CPU端主要处理的逻辑有动画,物理,AI等
全面分析UE4游戏开发中的性能分析与优化_第3张图片
刚刚提到,CPU端主要处理逻辑,对性能影响最大的便是Tick,如果在Tick里做复杂逻辑,就会使帧速率变低,因此能用事件触发就用事件触发,毕竟游戏中大部分的逻辑都可以通过事件触发,不必每一帧都去刷新,如果必须在每一帧都刷新,比如旋转这种简单的逻辑,可以尝试使用Shader实现。或者使用TimeLine是一个很好的方案。
全面分析UE4游戏开发中的性能分析与优化_第4张图片

  • 如果程序上无法简化代码,那么尽量使用C++,而不用蓝图编写
  • 另一点是尽量使用内置函数,不要自己写了。
  • 在UE4里比较耗费性能的节点有Get All Actors Of Class,ForLoop,Spawn Actor等,尽量避免使用这些节点。或者不要在tick里用。

数据传输

Draw Call对性能的大致影响如下:数百万个顶点,大概3000次draw call,上万次draw call,帧数已经惨不忍睹了。
全面分析UE4游戏开发中的性能分析与优化_第5张图片
数据传输就是Draw Call了,如果想减少Draw Call,可以选择一下方案:

  • 共享材质,对不同的mesh尽量使用相同的材质,或者继承自相同的父材质,这样引擎可以对这些mesh打包发送给GPU做渲染,减少传送指令和数据次数。
  • 减少模型复杂度,减少顶点数量,这是最直接的方案
  • 使用LOD(层次细节),这是减少绘制mesh顶点数的有效方案,根据距离相机距离进行优化。
  • 利用遮挡剔除,减少绘制模型数量
  • 采用图集(常用于UI)
  • 采用常见的烘焙技术,如烘焙光,代替实时光照
  • 使用引擎自带的merge actors和HLODs
    HLOD的优点如下:
    全面分析UE4游戏开发中的性能分析与优化_第6张图片

GPU端优化

UE4的性能调试工具,和Unity的类似:
全面分析UE4游戏开发中的性能分析与优化_第7张图片
GPU端的优化主要就是简化shader运算了,我做了以下总结:

  • 优化shader,不要写太费的shader,尽量简化运算
  • 蓝图材质尽量避免使用if,用lerp代替
  • 尽量避免over draw
  • 尽量使用texture代替noise
  • 使用mipmap优化纹理寻址
  • 能在顶点着色器计算,就不在片元着色器计算
  • 尽量减少光照和阴影的开销

你可能感兴趣的:(游戏,UE4)