shader中浮点数取整性能问题

本来计划着抽空写一些高质量的文章,但是真的没空。只能晚上用手机打一些纯文字的东西,就当笔记备忘了。

最近在基于unity进行地形优化,好不容易用图集的方式将drawcall降下来,但立马陷入了另一个大坑。

将地形细节纹理合成图集后,需要在片段着色器中对uv重新缩放和偏移,找到纹理在图集中的区域。大致算法为:

uv = frac(uv) * scale + offset:

由于地形顶点uv经过变换后,取值范围会大于1,这对于镜像寻址模式的纹理没有影响,但是转换为图集后,就不能用镜像寻址模式,需要手动截取到[0, 1]区间内,这里用了frac函数来完成该操作。

在pc上没有发现任何性能问题,ios设备上也没有明显的变化,但是我的oppr9s确让人大跌眼镜,帧率不增反降。起初以为是纹理采样次数过多引起的,一步步排查,最终发现是frac函数造成了严重的性能损失。

只要一使用frac就直降30帧,相当的恐怖!于是我把frac换成了uv - floor(uv),还是很惨。换成uv - trunc(uv),还是很惨(注,int等同于trunc函数)。换成fmod(uv, 1),依旧很惨。

也就是说,这款手机的芯片对这几个浮点数函数的支持很糟糕,我怀疑可能就没做硬件支持,用软件模拟的。

无奈,只能用其他地形优化方案了。

总结一下,在部分安卓设备上(包括一些用户基数很大的手机),一些浮点数截取函数会对性能造成很大冲击。最后附上我这次测试发现的函数:

名称 作用
frac 截取浮点数的小数部分
floor 向下取整,即保留浮点数的整数部分
trunc 丢弃浮点数的小数部分
int 同trunc
fmod 浮点数求余

你可能感兴趣的:(shader)