在之前的编程练习中,我们实现了基础的光线追踪算法,具体而言是光线传输、光线与三角形求交。我们采用了这样的方法寻找光线与场景的交点:遍历场景中的所有物体,判断光线是否与它相交。在场景中的物体数量不大时,该做法可以取得良好的结果,但当物体数量增多、模型变得更加复杂,该做法将会变得非常低效。因此,我们需要加速结构来加速求交过程。在本次练习中,我们重点关注物体划分算法 Bounding Volume Hierarchy (BVH)。本练习要求你实现 Ray-Bounding Volume 求交与 BVH 查找。
首先,你需要从上一次编程练习中引用以下函数:
• Render() in Renderer.cpp: 将你的光线生成过程粘贴到此处,并且按照新框架更新相应调用的格式。
• Triangle::getIntersection in Triangle.hpp: 将你的光线-三角形相交函数粘贴到此处,并且按照新框架更新相应相交信息的格式。
在本次编程练习中,你需要实现以下函数:
• IntersectP(const Ray& ray, const Vector3f& invDir, const std::array
& dirIsNeg) in the Bounds3.hpp: 这个函数的 作用是判断包围盒 BoundingBox 与光线是否相交,你需要按照课程介绍的算法实现求交过程。
• getIntersection(BVHBuildNode* node, const Ray ray)in BVH.cpp: 建 立 BVH 之后,我们可以用它加速求交过程。该过程递归进行,你将在其中调用你实现的 Bounds3::IntersectP.
在进行本次作业之前,提前了解代码中BVH的建立过程将会更有助于完成我们的任务,首先看到一开始的入口函数Scene类的buildBVH,这个函数创建了一个BVHAccel类对象,加入所有物体,并把划分方法设置为Naive简单模式,最后保存到场景中
void Scene::buildBVH() {
printf(" - Generating BVH...\n\n");
this->bvh = new BVHAccel(objects, 1, BVHAccel::SplitMethod::NAIVE);
}
接下来看到BVHAccel的构建函数,看看它是怎么初始化的,可以看到,它在创建的同时开始了计时,并进入recursiveBuild函数开始了递归构建BVH树的过程
BVHAccel::BVHAccel(std::vector<Object*> p, int maxPrimsInNode,
SplitMethod splitMethod)
: maxPrimsInNode(std::min(255, maxPrimsInNode)), splitMethod(splitMethod),
primitives(std::move(p))
{
time_t start, stop;
time(&start);
if (primitives.empty())
return;
root = recursiveBuild(primitives);
time(&stop);
double diff = difftime(stop, start);
int hrs = (int)diff / 3600;
int mins = ((int)diff / 60) - (hrs * 60);
int secs = (int)diff - (hrs * 3600) - (mins * 60);
printf(
"\rBVH Generation complete: \nTime Taken: %i hrs, %i mins, %i secs\n\n",
hrs, mins, secs);
}
在recursiveBuild函数内部,首先是创建一个节点,然后遍历每个物体的getBounds方法获取包围它们的AABB的边界,然后通过Union函数把这些AABB合为一个大的AABB作为节点
BVHBuildNode* BVHAccel::recursiveBuild(std::vector<Object*> objects)
{
BVHBuildNode* node = new BVHBuildNode();
// Compute bounds of all primitives in BVH node
Bounds3 bounds;
for (int i = 0; i < objects.size(); ++i)
bounds = Union(bounds, objects[i]->getBounds());
...
创建完节点后,我们要根据当前AABB内物体的个数来决定划分的方法,如果只有一个物体,那么它就作为叶节点,并把它的子节点设为空
...
if (objects.size() == 1) {
// Create leaf _BVHBuildNode_
node->bounds = objects[0]->getBounds();
node->object = objects[0];
node->left = nullptr;
node->right = nullptr;
return node;
}
...
如果是有两个物体,那么就就将这两个物体分别放入两个子节点中进行遍历,这样就保证了每个节点最多只有一个物体了
...
else if (objects.size() == 2) {
node->left = recursiveBuild(std::vector{objects[0]});
node->right = recursiveBuild(std::vector{objects[1]});
node->bounds = Union(node->left->bounds, node->right->bounds);
return node;
}
...
如果大于两个物体,那么就要思考如何划分当前的BVH了,这里的做法是遍历物体,通过getBounds()的Centroid()方法找到所有物体的中心,并通过Union函数找到它们覆盖的范围,然后通过maxExtent()方法判断到底是哪个轴覆盖的范围大,返回0,就是x轴范围大,返回1就是y轴大,2就是z轴大
...
else {
Bounds3 centroidBounds;
int target = objects.size() / 2;
for (int i = 0; i < objects.size(); ++i)
centroidBounds =
Union(centroidBounds, objects[i]->getBounds().Centroid());
int dim = centroidBounds.maxExtent();
...
判断完后,根据不同的情况,将物体根据中心坐标分别按照z、y、z轴排序,
...
switch (dim) {
case 0:
std::sort(objects.begin(), objects.end(), [](auto f1, auto f2) {
return f1->getBounds().Centroid().x <
f2->getBounds().Centroid().x;
});
break;
case 1:
std::sort(objects.begin(), objects.end(), [](auto f1, auto f2) {
return f1->getBounds().Centroid().y <
f2->getBounds().Centroid().y;
});
break;
case 2:
std::sort(objects.begin(), objects.end(), [](auto f1, auto f2) {
return f1->getBounds().Centroid().z <
f2->getBounds().Centroid().z;
});
break;
}
...
排序完后将物体对半划分,分别放入两个子节点中进行递归,直到只剩一个物体为止,最后还要将当前节点的AABB赋值为两个子节点的Union,这就是代码中BVH划分的简单方法的全程
...
auto beginning = objects.begin();
auto middling = objects.begin() + (objects.size() / 2);
auto ending = objects.end();
auto leftshapes = std::vector<Object*>(beginning, middling);
auto rightshapes = std::vector<Object*>(middling, ending);
assert(objects.size() == (leftshapes.size() + rightshapes.size()));
node->left = recursiveBuild(leftshapes);
node->right = recursiveBuild(rightshapes);
node->bounds = Union(node->left->bounds, node->right->bounds);
}
return node;
}
首先是render函数和getIntersection函数的填写,基本只用把上次作业的代码复制过来就行了,需要注意的一点是,castRay函数被转移到了Scene类里面,还要把之前计算的光线通过定义ray类对象传入函数
void Renderer::Render(const Scene& scene)
{
std::vector<Vector3f> framebuffer(scene.width * scene.height);
float scale = tan(deg2rad(scene.fov * 0.5));
float imageAspectRatio = scene.width / (float)scene.height;
Vector3f eye_pos(-1, 5, 10);
int m = 0;
for (uint32_t j = 0; j < scene.height; ++j) {
for (uint32_t i = 0; i < scene.width; ++i) {
// generate primary ray direction
float x = (2 * (i + 0.5) / (float)scene.width - 1) *
imageAspectRatio * scale;
float y = (1 - 2 * (j + 0.5) / (float)scene.height) * scale;
Vector3f dir = Vector3f(x, y, -1); // Don't forget to normalize this direction!
dir = normalize(dir);
Ray ray(eye_pos, dir, 0);
framebuffer[m++] = scene.castRay(ray, 0);
...
在Intersection函数里面计算了三角形与光线的交点,其实基本计算过程都给出了,我们要做的就是把计算结果放入Intersection类对象,这个类包含了以下几种属性:
①happened:true为相交
②obj:相交的物体
③normal:相交点的法向量
④coords:相交点坐标
⑤m:相交点表面材质
只要注意把这些属性赋值正确就行
inline Intersection Triangle::getIntersection(Ray ray)
{
Intersection inter;
if (dotProduct(ray.direction, normal) > 0)
return inter;
double u, v, t_tmp = 0;
Vector3f pvec = crossProduct(ray.direction, e2);
double det = dotProduct(e1, pvec);
if (fabs(det) < EPSILON)
return inter;
double det_inv = 1. / det;
Vector3f tvec = ray.origin - v0;
u = dotProduct(tvec, pvec) * det_inv;
if (u < 0 || u > 1)
return inter;
Vector3f qvec = crossProduct(tvec, e1);
v = dotProduct(ray.direction, qvec) * det_inv;
if (v < 0 || u + v > 1)
return inter;
t_tmp = dotProduct(e2, qvec) * det_inv;
// TODO find ray triangle intersection
inter.happened = true;
inter.obj = this;
inter.distance = t_tmp;
inter.normal = normal;
inter.coords = ray(t_tmp);
inter.m = this->m;
return inter;
}
这个函数的作用是判断光线与AABB是否有交点,方便后续判断(如果没有交点,自然就不用继续对其子节点进行继续判断了)
需要注意的是,一开始是用的默认光线方向为正的方法计算,所以如果光线方向为负的话算得的tmin和tmax就反了,这里需要通过判断光线方向的正负来纠正算得的tmin和tmax
inline bool Bounds3::IntersectP(const Ray& ray, const Vector3f& invDir) const
{
// invDir: ray direction(x,y,z), invDir=(1.0/x,1.0/y,1.0/z), use this because Multiply is faster that Division
// dirIsNeg: ray direction(x,y,z), dirIsNeg=[int(x>0),int(y>0),int(z>0)], use this to simplify your logic
// TODO test if ray bound intersects
Vector3f tmin = (pMin - ray.origin) * invDir;
Vector3f tmax = (pMax - ray.origin) * invDir;
Vector3f dir = ray.direction;
if(dir.x < 0)
std::swap(tmin.x, tmax.x);
if(dir.y < 0)
std::swap(tmin.y, tmax.y);
if(dir.z < 0)
std::swap(tmin.z, tmax.z);
float ten, tex;
tex = fmin(tmax.x, fmin(tmax.y, tmax.z));
ten = fmax(tmin.x, fmax(tmin.y, tmin.z));
if(ten < tex && tex > 0)
return true;
return false;
}
这个函数的作用是获取光线与BVH的交点,而且根据作业的提示,是递归求交,所以这里我的实现思路是:若光线与这个AABB没有交点就直接返回,否则只有当前节点没有子节点了再进行求交,如果有子节点就继续对两个子节点进行递归
Intersection BVHAccel::getIntersection(BVHBuildNode* node, const Ray& ray) const
{
// TODO Traverse the BVH to find intersection
Intersection intersect, intersectl, intersectr;
if(!node->bounds.IntersectP(ray, ray.direction_inv))
return intersect;
if(node->left == nullptr && node->right == nullptr){
intersect = node->object->getIntersection(ray);
return intersect;
}
intersectl = getIntersection(node->left,ray);
intersectr = getIntersection(node->right,ray);
return intersectl.distance < intersectr.distance ? intersectl : intersectr;
}
作业给的SAH参考资料过于简略,所以这部分的内容还参考了:SAH算法
在建立BVH树的时候,框架代码里面的方法逻辑是比较粗暴的。
简单来说就是判断节点的包围盒在哪个轴上覆盖的范围大,然后根据对应轴坐标对所有物体排个序,然后取中间点作为分界,有点简单粗暴。下面我们介绍一种比较好的划分办法-SAH算法
直观的来说 SAH算法奖励三角形多的小节点,避免三角形少的大节点。看下图我们直观的就可以看出第三种划分方式是最好的。
SAH算法对于不同的划分办法会计算其cost,选取最优的那一种来划分
假设costs t_traversal = 1 and t_intersect = 2
对于我们之前提到的那个例子 我们可以定量的计算这三种划分方式的开销 如下图
首先,SAH对于物体数量为1和2的节点的处理方法基本与基础BVH划分方法相同,只有一个物体了就设置当前为叶节点,只有两个时就把两个物体分别给到两个子节点进行递归处理
BVHBuildNode* BVHAccel::recursiveSAH(std::vector<Object*> objects){
BVHBuildNode* node = new BVHBuildNode();
// Compute bounds of all primitives in BVH node
Bounds3 bounds;
for (int i = 0; i < objects.size(); ++i)
bounds = Union(bounds, objects[i]->getBounds());
if (objects.size() == 1) {
// Create leaf _BVHBuildNode_
node->bounds = objects[0]->getBounds();
node->object = objects[0];
node->left = nullptr;
node->right = nullptr;
return node;
}
else if (objects.size() == 2) {
node->left = recursiveSAH(std::vector{objects[0]});
node->right = recursiveSAH(std::vector{objects[1]});
node->bounds = Union(node->left->bounds, node->right->bounds);
return node;
}
...
对于两个以上物体的节点,还需要分两种情况讨论,这里认为物体数量小于12时,对半分的效率要大于用SAH查找划分的效率
...
else {
auto beginning = objects.begin();
auto ending = objects.end();
if(objects.size() < 12){
auto middling = objects.begin() +objects.size() / 2;
auto leftshapes = std::vector<Object*>(beginning, middling);
auto rightshapes = std::vector<Object*>(middling, ending);
node->left = recursiveSAH(leftshapes);
node->right = recursiveSAH(rightshapes);
node->bounds = Union(node->left->bounds, node->right->bounds);
}
...
如果物体数量大于12时,则正式开始SAH算法,首先分三种dim情况讨论,就是分别基于x、y、z轴来划分
...
else {
int bestChoice = 0;
double minCost = std::numeric_limits<double >::max();
int bestDim = 0;
for(int dim = 0; dim < 3; dim++){
switch (dim) {
case 0:
std::sort(objects.begin(), objects.end(), [](auto f1, auto f2) {
return f1->getBounds().Centroid().x <
f2->getBounds().Centroid().x;
});
break;
case 1:
std::sort(objects.begin(), objects.end(), [](auto f1, auto f2) {
return f1->getBounds().Centroid().y <
f2->getBounds().Centroid().y;
});
break;
case 2:
std::sort(objects.begin(), objects.end(), [](auto f1, auto f2) {
return f1->getBounds().Centroid().z <
f2->getBounds().Centroid().z;
});
break;
}
...
确定了划分轴以后该怎么确定分界线最好呢?这里遍历了5种选择,分别是在包围盒1/6到5/6处进行划分
...
auto l = (float)objects.size();
float nums[] = {1.0/6, 2.0/6, 3.0/6, 4.0/6, 5.0/6};
for(int i = 0; i < 5; i++)
nums[i] *= l;
...
...
for(int i = 0; i < 5; i++){
auto middling = objects.begin() + (int)nums[i];
auto leftshapes = std::vector<Object*>(beginning, middling);
auto rightshapes = std::vector<Object*>(middling, ending);
double leftBoxSize = computeSize(leftshapes);
double rightBoxSize = computeSize(rightshapes);
double cost = 2.f + (leftBoxSize * leftshapes.size() + rightBoxSize * rightshapes.size()) / bounds.SurfaceArea();
...
算完花费以后判断是否是当前最小的花费,是的话就记录分界线bestChoice和划分轴bestDim
...
if(cost < minCost){
bestChoice = (int)nums[i];
bestDim = dim;
}
}
}
...
这样,在遍历完所有情况以后整理结果,根据最后的bestDim将物体按照对应的轴排序(不再对z轴排序是因为遍历结束时就是按照z轴排序的),然后按照分界线将左右两组物体放进两个子节点中进行递归,这就是SAH的全部流程
...
if(bestDim == 0)
std::sort(objects.begin(), objects.end(), [](auto f1, auto f2) {
return f1->getBounds().Centroid().x <
f2->getBounds().Centroid().x;
});
if(bestDim == 1)
std::sort(objects.begin(), objects.end(), [](auto f1, auto f2) {
return f1->getBounds().Centroid().y <
f2->getBounds().Centroid().y;
});
auto middling = objects.begin() + bestChoice;
auto leftshapes = std::vector<Object*>(beginning, middling);
auto rightshapes = std::vector<Object*>(middling, ending);
node->left = recursiveSAH(leftshapes);
node->right = recursiveSAH(rightshapes);
node->bounds = Union(node->left->bounds, node->right->bounds);
}
return node;
}
}
在SAH的公式中提到的自定义computeSize函数就是求被物体组成的包围盒的面积
double BVHAccel::computeSize(std::vector<Object*> objects){
Bounds3 centroidBounds;
for (int i = 0; i < objects.size(); ++i)
centroidBounds =
Union(centroidBounds, objects[i]->getBounds());
return centroidBounds.SurfaceArea();
}
别忘了在BVHAccel构建函数的入口处添加对加速方法的判断
if(splitMethod == BVHAccel::SplitMethod::NAIVE)
root = recursiveBuild(primitives);
else
root = recursiveSAH(primitives);
(ps:该部分只是对老师上课提到的内容的补充,不作要求,感兴趣的朋友可以了解一下)
快速排序是对冒泡算法的一种改进:
任意选取一个数据(通常选用数组的第一个数)作为关键数据,然后将所有比它小的数都放到它左边,所有比它大的数都放到它右边,这个过程称为一趟快速排序。
假设一开始序列{xi}是:5,3,7,6,4,1,0,2,9,10,8。
此时,ref=5,i=1,j=10,从后往前找,第一个比5小的数是x8=2。
此时i=1,j=8,从前往后找,第一个比5大的数是x3=7,因此序列为:5,3,2,6,4,1,0,7,9,10,8。
此时,i=3,j=8,从第8位往前找,第一个比5小的数是x7=0。
此时,i=3,j=7,从第3位往后找,第一个比5大的数是x4=6,因此:5,3,2,0,4,1,6,7,9,10,8。
此时,i=4,j=7,从第7位往前找,第一个比5小的数是x6=1。
此时,i=4,j=6,从第4位往后找,直到第6位才有比5大的数,这时,i=j=6,ref成为一条分界线,它之前的数都比它小,之后的数都比它大,因此最后:1,3,2,0,4,5,6,7,9,10,8
对于前后两部分数,可以采用同样的方法来排序
这里给出一个按z轴排序的例子:
void BVHAccel::quicksort_z(int first, int last, int target, std::vector<Object*> &objects){
int i = first + 1, j = last;
while (true) {
while (j > first && objects[j]->getBounds().Centroid().z >= objects[first]->getBounds().Centroid().z)
j--;
while (i < last && objects[i]->getBounds().Centroid().z <= objects[first]->getBounds().Centroid().z)
i++;
if (i >= j)
break;
std::swap(objects[i],objects[j]);
}
std::swap(objects[j], objects[first]);
if(j > target)
quicksort_x(first, j - 1, target, objects);
if(j < target)
quicksort_x(j + 1, last, target, objects);
}
BVHBuildNode* BVHAccel::recursiveBuild(std::vector<Object*> objects)
{
BVHBuildNode* node = new BVHBuildNode();
// Compute bounds of all primitives in BVH node
Bounds3 bounds;
for (int i = 0; i < objects.size(); ++i)
bounds = Union(bounds, objects[i]->getBounds());
if (objects.size() == 1) {
// Create leaf _BVHBuildNode_
node->bounds = objects[0]->getBounds();
node->object = objects[0];
node->left = nullptr;
node->right = nullptr;
return node;
}
else if (objects.size() == 2) {
node->left = recursiveBuild(std::vector{objects[0]});
node->right = recursiveBuild(std::vector{objects[1]});
node->bounds = Union(node->left->bounds, node->right->bounds);
return node;
}
else {
Bounds3 centroidBounds;
int target = objects.size() / 2;
for (int i = 0; i < objects.size(); ++i)
centroidBounds =
Union(centroidBounds, objects[i]->getBounds().Centroid());
int dim = centroidBounds.maxExtent();
switch (dim) {
case 0:
quicksort_x(0, objects.size(), objects.size() / 2, objects);
break;
case 1:
quicksort_y(0, objects.size(), objects.size() / 2, objects);
break;
case 2:
quicksort_z(0, objects.size(), objects.size() / 2, objects);
break;
}
...
可见,SVH还是对BVH的加速作用有效果的,可能在物体分布的更不均匀的情况下效果能更好。
附上源代码,有兴趣的朋友可以自己尝试一下效果:
CSDN:【GAMES101】作业6
GITHUB:【GAMES101】作业合集