第22.2节 性能篇-纹理压缩

天下武功,唯快不破

最近网友问了关于点云、倾斜摄影数据的性能优化问题。本来想刀枪剑戟、斧钺勾叉给弄了,但是后来想性能其实是个系统问题,要在第22节分成数小节扎扎实实的讲一讲。

鸣谢

非常感谢王锐王大神的cookbook,我准备主要参考它里面关于性能的一章。也就是第8章。本节讲述性能优化的最基本的手段:压缩纹理。

本节资源

本文集包括本节所有资源包括模型代码都在此下载,按节的序号有文件或文件夹:
注意:务必使用浏览器打开:
链接:https://pan.baidu.com/s/13gwJLwo_LbRnN3Bl2NXXXw
提取码:xrf5

理论知识

1.我们都知道,纹理的存储是RGBA,这四个数字假如不压缩的话其占用的存储空间是相当大的,每个通道按0~255 一个字节来计算,一个像素RGBA是4个字节(byte),一个1024x1024这么大的图片会占用1024x1024x4=4M。如果不经压缩,一个GPU显存在4GB的显卡,也只能存储1024张1024x1024的图片。这显然不合常理。有时候我们在处理tiff图像时,指定不使用压缩,则随便一个大小出来就是几十个GB,那就是什么显卡也存不了了。
2.所以无论是CPU还是GPU都支持对纹理进行压缩。压缩的算法也一大摞,它们是针对不同的场景来使用的。纹理压缩之后,要以有效的降低CPU的内存和CPU的显存的使用。最关键的是还能有效的减少模型占用的存储空间。
3.理论上,压缩与解压消耗的是CPU与GPU的使用率,所以使用压缩会使计算量增加,会使内存和显存使用率降低。以下是分配了20x20=400个512x512的RGB的压缩前后的CPU/GPU使用率与显存内存占用率的对比。理论上这么些图片和像素占用的存储是300M。

image.png

可以看到可以对CPU/GPU端的存储使用明显下降,CPU使用率略升高,GPU因为是并行处理且对于图像压缩更加成熟,其使用率和显存都降低了,因此没有理由不使用纹理压缩。

实际实践

  • 我们只需要对texture使用以下语句就能按算法压缩的功能:
            texture->setInternalFormatMode(osg::Texture2D::USE_S3TC_DXT1_COMPRESSION);
            texture->setUnRefImageDataAfterApply(true);

第一句setInternalFormatMode是为了设置压缩格式。
第二句setUnRefImageDataAfterApply是图片传送到GPU端之后,CPU端就会释放掉。这也就是很多texture明明有东西,但是获取image想输出,结果发现image是0的原因。

  • 我们使用随机颜色,放入到申请的纹理当中。
    osg::ref_ptr image = new osg::Image;
    image->allocateImage(width, height, 1, GL_RGB, GL_UNSIGNED_BYTE);

    unsigned char* data = image->data();
    for (int y = 0; y < height; ++y)
    {
        for (int x = 0; x < width; ++x)
        {
            *(data++) = randomValue(0.0f, 255.0f);
            *(data++) = randomValue(0.0f, 255.0f);
            *(data++) = randomValue(0.0f, 255.0f);
        }
    }
    return image.release();

以下是全部代码


/* -*-c++-*- OpenSceneGraph Cookbook
 * Chapter 8 Recipe 2
 * Author: Wang Rui 
*/

#include 
#include 
#include 
#include 
#include 
#include 

#define COMPRESS_TEXTURE  // Comment this to disable compressing textures

float randomValue(float min, float max)
{
    return (min + (float)rand() / (RAND_MAX + 1.0f) * (max - min));
}

osg::Vec3 randomVector(float min, float max)
{
    return osg::Vec3(randomValue(min, max),
        randomValue(min, max),
        randomValue(min, max));
}

osg::Matrix randomMatrix(float min, float max)
{
    osg::Vec3 rot = randomVector(-osg::PI, osg::PI);
    osg::Vec3 pos = randomVector(min, max);
    return osg::Matrix::rotate(rot[0], osg::X_AXIS, rot[1], osg::Y_AXIS, rot[2], osg::Z_AXIS) *
        osg::Matrix::translate(pos);
}

osg::Image* createRandomImage(int width, int height)
{
    osg::ref_ptr image = new osg::Image;
    image->allocateImage(width, height, 1, GL_RGB, GL_UNSIGNED_BYTE);

    unsigned char* data = image->data();
    for (int y = 0; y < height; ++y)
    {
        for (int x = 0; x < width; ++x)
        {
            *(data++) = randomValue(0.0f, 255.0f);
            *(data++) = randomValue(0.0f, 255.0f);
            *(data++) = randomValue(0.0f, 255.0f);
        }
    }
    return image.release();
}

osg::Node* createQuads(unsigned int cols, unsigned int rows)
{
    osg::ref_ptr geode = new osg::Geode;
    for (unsigned int y = 0; y < rows; ++y)
    {
        for (unsigned int x = 0; x < cols; ++x)
        {
            osg::ref_ptr texture = new osg::Texture2D;
            texture->setImage(createRandomImage(512, 512));
#ifdef COMPRESS_TEXTURE
            texture->setInternalFormatMode(osg::Texture2D::USE_S3TC_DXT1_COMPRESSION);
            texture->setUnRefImageDataAfterApply(true);
#endif

            osg::Vec3 center((float)x, 0.0f, (float)y);
            osg::ref_ptr quad = osg::createTexturedQuadGeometry(
                center, osg::Vec3(0.9f, 0.0f, 0.0f), osg::Vec3(0.0f, 0.0f, 0.9f));
            quad->getOrCreateStateSet()->setTextureAttributeAndModes(0, texture.get());
            geode->addDrawable(quad.get());
        }
    }
    return geode.release();
}

int main(int argc, char** argv)
{
    osgViewer::Viewer viewer;
    viewer.setSceneData(createQuads(20, 20));
    viewer.addEventHandler(new osgViewer::StatsHandler);
    return viewer.run();
}

你可能感兴趣的:(第22.2节 性能篇-纹理压缩)