天天不在

Ogre2.0 全新功能打造新3D引擎

　　不知当初是在那看到,说是Ogre2.0浪费了一个版本号,当时也没多想,以为没多大更新,一直到现在想做一个编辑器时,忽然想到要看下最新版本的更新,不看不知道,一看吓一跳,所以说,网络上的话少信,你不认识别人,别人张嘴就来,对别人也没损失,还可以装B下,靠.

　　从现在Ogre2.1的代码来看,大约总结下,更新包含去掉过多的设计模式,SoA的数据结构(用于SIMD,DOD),新的线程模式,新的渲染流程与场景更新,新的材质管理系统,新的模型格式,新的合成器方案,更新是全方面的,可以说,Ogre2.x与Ogre1.x完全不是同一个引擎,不管是效率,还是从渲染新思路的使用上.

　　大体上参照二份主要文档,一份是OGRE.2.0.Proposal.Slides.odp,现在Ogre的维护者之一dark_sylinc比对其他的引擎以及相关测试写的Ogre2.0要修改的方向,一是Ogre 2.0 Porting Manual DRAFT.odt,移植手册,简单来说,Ogr2.0具体的修改位置与说明.非常有价值的二份文档,可以说,这是全新Ogre改动的精华,我们从这二份文档里,能学到如何针对C++游戏引擎级别的包含效率,可用性的重构.这是一个幸运的学习经历.

　　从https://bitbucket.org/sinbad/ogre下载最新版本,里面的DOC文件夹,有多份文档,我整理了下,每部分包含改动原因,改动位置,相关代码来说,因为全是英文文档,所以如果理解有错误,欢迎大家指出,不希望误导了大家.本文只针对新模型新功能,也就是加了v1命名空间的(Ogre1.x中的功能,有对应Ogre2.x版本),本文不会特别说明.

Ogre1.x中问题与建议

Cache末命中

　　看看作者的幻灯片,哈哈,图片特别形象生动.

　　这个是函数是判断模型是否在当前摄像机可见,如果可见,加入渲染通道.不过你去看现在的Ogre2.1的代码,这个方法没有变,不是因为没有改,是因为渲染流程变了,这个函数的功能被MovableObject::cullFrustum包含了,其中判断摄像机与模型AABB相交的算法也换了.

　　这个函数因为每桢都对每个模型来计算,如果Cache misses,损失有点大.

　　同样这个一般用来得到模型的世界坐标位置,也是每桢每个模型要计算的,如果Cache miss,同上.

　　那么如何改进,像上面,你不要那些判断,要么多计算,要么结果不对,作者给出的答案就是改进渲染流程,减少判断条件的出现.后面会细说.

低效的场景遍历和操作.

　　可以看到场景每次更新都在重复,检查是否需要更新,然后更新.很多不必要的变量和是否更新状态的跟踪,以及太多的判断,分别造成cache misses缓存不友好.(我去,if判断有这么大的破坏力?还是只是引擎级别的代码才会造成这样的影响,后面渲染流程中,原来很多if都去掉了).

　　然后指出Ogre的渲染流程中,其中SceneManager::_renderScene()调用太多次,如Shadow Map一次,合成器中的render_scene一次,然后他们还没有重复使用剔除的数据,每次renderScene,都重新剔除了一次.特别是合成器中多次调用render_scene,每次都会把渲染队列里的模型全部检查剔除一次,这是无效的操作.

　　综合这二点,渲染队队肯定要大改,如下是作者综合别的商业渲染引擎,给出的在Ogre2.0中新的实现建议,根据现在Ogre2.1我所看到的代码,已经实现如下图的功能.

　　这个图后面会简单说下其中的线程相关部分,这就是Ogre2.x的渲染流程了,从图中,我们可以看到新的合成器是Ogre核心中的一部分,已经不是可选组件了,当然新的合成器也有相当大的更新,功能更强大,更好用.其中更详细的部分,后面会专门写一篇介绍Ogre2.x新的渲染流程与合成器.

SIMD,DOD,SoA

　　在看如下内容时,先介绍一下什么是基于DOD的设计.DOD(面向数据设计),以及我们面向对象OOP常用的OOD(面向对象设计)

　　DOD与OOD之争: Data oriented design vs Object oriented design

　　Data-Oriented Design Data-Oriented Design 二什么是DOD,为什么要使用DOD,什么情况下用DOD

　　[译]基于数据的设计（Data-oriented design）这是CSDN上针对第一篇的翻译

　　有兴趣大家仔细读下,这里总结下DOD相对OOP的优势.简洁高效的并行化,缓存友好.

　　先看如下 http://stackoverflow.com/questions/12141626/data-oriented-design-in-oop 中提出的一个问题,二代码如下:

//DOD
void updateAims(float* aimDir, const AimingData* aim, vec3 target, uint count)
{
     for(uint i = 0; i < count; i++)
     {
          aimDir[i] = dot3(aim->positions[i], target) * aim->mod[i];
     }
}
//OOP
class Bot
{
    vec3 position;
    float mod;
    float aimDir;

    void UpdateAim(vec3 target)
    {
         aimDir = dot3(position, target) * mod;
    }
 };

 void updateBots(Bots* pBots, uint count, vec3 target)
 {
      for(uint i = 0; i < count; i++)
            pBots[i]->UpdateAim(target);
  }
};

DOD VS OOP

　　下面有人解释为什么第一段代码要高效,在第二段代码中,每次得到一个结构域,浪费更多带宽,以及更新无用数据到缓存中,缓存Miss高.第一种一次取一个float块,提高缓存有效利用.

　　如在游戏中最常见的操作,取得每个模型的MVP矩阵,而OOP告诉我们,要取的位置,先要取得模型.模型还包含许多其它的内容,但是是无用的,占用缓存空间,缓存命中变低.而DOD是把所有的字段存放在一起,一下取的所有位置,请看下面SoA.

　　下面再次提出二个概念,一个是SoA(Structure of Arrays,非你百度搜出来的SOA),一个是AoS(Arrays of Structure),暂时先说下,SoA是一种DOD里常用的数据组织方式,对应OOP里常用的AoS组织方法.

　　简单说下,SoA的组织方式,是把一组元素的每个字段连续保存,如下是我针对Ogre2.x里的代码改写的.

struct Vector3
{
    float x = 0;
    float y = 0;
    float z = 0;

    Vector3()
    {

    }


    Vector3(float nx, float ny, float nz)
    {
        x = nx;
        y = ny;
        z = nz;
    }

    float& operator [] (const size_t i)
    {
        assert(i >= 0 && i < 3);
        return *(&x + i);
    }
};
struct Quaternion
{
    float x;
    float y;
    float z;
    float w;
};
//OOD 面向对象设计 
struct Transform
{
    Vector3 pos;
    Vector3 scale;
    Quaternion orient;

    void move(Vector3 move)
    {
        for (int i = 0; i < 3; i++)
        {
            pos[i] += move[i];
        }
    }
};

//SIMD
struct ArrayVector3
{
    float x[4];
    float y[4];
    float z[4];

    ArrayVector3()
    {
        memset(x, 0, sizeof(float)* 4);
        memset(y, 0, sizeof(float)* 4);
        memset(z, 0, sizeof(float)* 4);
    }

    Vector3 getIndex(int index)
    {
        assert(index >= 0 && index < 4);
        return Vector3(x[index], y[index], z[index]);
    }

    void setIndex(int index, float fx, float fy, float fz)
    {
        assert(index >= 0 && index < 4);
        x[index] = fx;
        y[index] = fy;
        z[index] = fz;
    }
};
struct ArrayQuaternion
{
    float x[4];
    float y[4];
    float z[4];
    float w[4];
};
//SoA(Structure of Arrays)
struct ArrayTransformSoA
{
    ArrayVector3* pos;
    ArrayVector3* scale;
    ArrayQuaternion* orient;

    int mIndex = 0;

    ArrayTransformSoA()
    {
        pos = new ArrayVector3();
        scale = new ArrayVector3();
        orient = new ArrayQuaternion();
    }

    ~ArrayTransformSoA()
    {
        delete pos;
        delete scale;
        delete orient;
    }

    void move(Vector3 move)
    {
        //xxxxyyyyzzzz
        float *soa = reinterpret_cast<float*>(pos);
        for (int i = 0; i < 3; i++)
        {
            for (int j = 0; j < 4; j++)
            {
                soa[i * 4 + j] += move[i];
            }
        }
    }

    void setPos(float x, float y, float z)
    {
        pos->setIndex(mIndex, x, y, z);
    }

    Vector3 getPos()
    {
        return pos->getIndex(mIndex);
    }
};

void SoAVAoS()
{
    //AoS(Arrays of Structure)
    Transform aosArray[4];
    ArrayTransformSoA soaArray;

    Vector3 moveAdd(4.0f, 2.0f, 1.0f);
    for (int i = 0; i < 4; i++)
    {
        aosArray[i].move(moveAdd);
    }

    soaArray.move(moveAdd);

    for (int i = 0; i < 4; i++)
    {
        cout << aosArray[i].pos.x << endl;
        soaArray.mIndex = i;
        cout << soaArray.getPos().x << endl;
    }
    cout << "" << endl;
}

SIMD

　　下面的ArrayVector3和ArrayTransformSoA就是SoA相关组织方式与操作,这里上面注释写的是SIMD,因为这个组织方式确实是用于SIMD的,SIMD在这不多说,如果有机会,专门研究这个后再来详细说明,在这,我们只需要知道SSM2可以每下处理128位数据,在32位下,每下处理4个float数据,如上面的ArrayTransformSoA中的move方法中,第二个循环中对于使用SSM2指令来说,就是一个指令,简单来说速度提高4倍,可以说是一种最简单安全的并行处理,不要你来设线程,关心同步啥的.更具体点的说,在游戏中一下可以处理四个顶点进行操作,如移动,缩放,以及矩阵运算(当然这四个顶点也有限制,并不是所有都放一起,请看后面).同时如上图所示,这也是缓存友好的.

　　上面演示了常见SoA结构方法,可以看到,对于对象来说,他的存放不再是连续的了,如点的位置y和x相关了4*sizeof(float)个距离,在面向对象结构中,他们应该是相邻的.但是对于SoA来说,对象列表中的每个字段是相邻的,如上图所示应该是XXXXYYYYZZZZ这种内存布局方式,而不是XYZXYZXYZXYZ这种.前面说过,DOD也常用SoA结构,那这是不是就是Ogre中的DOD核心设计,不算,因为这种四个一组的只是专门为了SIMD的SoA结构,真正的DOD核心应该Ogre中的ArrayMemoryManager类,直接拖出这个方法可能看不明白,如下是我针对Ogre2.x中的ArrayMemoryManager改写的,只保留核心帮助大家理解.

//DOD 面向数据设计
class ArrayTransformManager
{
private:
    enum ElementType
    {
        Pos,
        Scale,
        Orient,
        ElementCount
    };
    int elements[ElementCount];
    vector<char*> memoryPool;
    int totalSize = 0;
    int maxMemory = 32;
    //当前
    int nextSlot = 0;
public:
    ArrayTransformManager()
    {
        elements[Pos] = 3 * sizeof(float);
        totalSize += elements[Pos];
        elements[Scale] = 3 * sizeof(float);
        totalSize += elements[Scale];
        elements[Orient] = 4 * sizeof(float);
        totalSize += elements[Orient];

        memoryPool.resize(ElementCount);
    }

    void initialize()
    {
        for (int i = 0; i < ElementCount; i++)
        {
            int byteCount = elements[0] * maxMemory;
            memoryPool[i] = new char[byteCount];
            memset(memoryPool[i], 0, byteCount);
        }
    }

    void createArrayTransform(ArrayTransformSoA &outTransform)
    {
        int current = nextSlot++;
        //current = 0,nextSlotIdx = 0,nextSlotBase = 0            
        //current = 3,nextSlotIdx = 3,nextSlotBase = 0
        //current = 4,nextSlotIdx = 0,nextSlotBase = 4
        //current = 5,nextSlotIdx = 1,nextSlotBase = 4
        //current = 7,nextSlotIdx = 3,nextSlotBase = 4
        //current = 8,nextSlotIdx = 0,nextSlotBase = 8        
        int nextSlotIdx = current % 4;
        int nextSlotBase = current - nextSlotIdx;

        outTransform.mIndex = nextSlotIdx;
        outTransform.pos = reinterpret_cast<ArrayVector3*>(
            memoryPool[Pos] + nextSlotBase*elements[Pos]);
        outTransform.scale = reinterpret_cast<ArrayVector3*>(
            memoryPool[Scale] + nextSlotBase*elements[Scale]);
        outTransform.orient = reinterpret_cast<ArrayQuaternion*>(
            memoryPool[Orient] + nextSlotBase*elements[Orient]);

        outTransform.setPos(nextSlotIdx, nextSlotIdx, nextSlotIdx);
    }
};

void TestDOD()
{
    ArrayTransformManager transformDOD;
    transformDOD.initialize();

    ArrayTransformSoA transform0;
    transformDOD.createArrayTransform(transform0);

    ArrayTransformSoA transform1;
    transformDOD.createArrayTransform(transform1);

    ArrayTransformSoA transform2;
    transformDOD.createArrayTransform(transform2);

    ArrayTransformSoA transform3;
    transformDOD.createArrayTransform(transform3);

    ArrayTransformSoA transform4;
    transformDOD.createArrayTransform(transform4);


    cout << transform0.getPos().x << endl;
    cout << transform1.getPos().x << endl;
    cout << transform2.getPos().x << endl;
    cout << transform3.getPos().x << endl;
    cout << transform4.getPos().x << endl;

}

ArrayTransformManager//对应Ogre中的ArrayMemoryManager

　　这个是结合了SMID的DOD设计,不看SMID部分,就看初始化部分,maxMemory表示最多存入多少个Transform,而elements表示Transform对应每个字段占多少位,memoryPool表示每个字段(连续的)在一起占多少个字段,其中调用createArrayTransform生成一个ArrayTransformSoA数据,每四个连续的ArrayTransformSoA的里的如Pos,Scale等地址一样,如上面那种图,不同的是对应mIndex,用于指明是当前在SoA中的索引.其实对比上面的ArrayVector3来看,组织数据应该算是一样的,不同之处是一下并排放maxMemory个数据,而ArrayVector3一下放四个vector3数据.总的来说,这就是SoA数据结构,分别用于SIMD与DOD.

　　幻灯片文档第一点与第二点主要包含二点,一是渲染流程(后文细说),二是SMID,DOD等基本数据格式与操作的改变.后面关于顶点格式与着色器先暂时不说了,大家有兴趣可以看下,对应代码还没查到,不知是否已经完成.

　　最后结束,还不忘指出Ogre中的设计模式被过度使用,说明OOD的多态太浪费,并且用宏来控制一些virtual_l0 ,virtual_l1 ,virtual_l2 来控制多态级别,默认已经不启用虚函数,如SceneNode::getPosition(),SceneNode::setPosition默认不能重载,如果定义了SceneNode的子类,并重载了如上函数,你需要自己设定多态级别,并自己编译.嗯,Ogre1.x最出名的多设计模式使用也随着渲染流程的改变而去掉很多.相信大家看到相关更新后,都会说这改的太大了吧.

　　"We don't care really how long it takes" Ogre采用OOD带来的好处,在客户级别上的.

Ogre2.x移植手册:

模型,场景和节点:

　　1.Ogre2.0后,Ogre很多对象去掉name,改用IdObejct,这个更多意义就是很多原来的聚合关系都是用的map来表示,name当key,现在为IdObejct,且为自动生成,所以相关id意思不大,相关聚合关系用的是Ogre开发人员自己写的一个轻量级仿vector的类FastArray.

　　The Sorted Vector pattern Part I

　　The Sorted Vector pattern Part II

　　因为我们场景中,更多如更新所有模型的位置,AABB等,能快速迭代是我们最大的要求,并且vector更节省空间,内存块连续(AoS,SMID,DOD).相反,map的优势如快速查找,随机删除与添加并不常用.所以像Ogre1.x中很多map的用法并不明智.

　　其中,Ogre内部更多聚合关系使用的是FastArray,FastArray是针对std::vector的轻量级实现,去掉了其中的大量边界检查与迭代器验证.沿用大部分std::vector的功能,如std::for_each正常工作,也有同标准不一样的,如FastArray<int> myArray(5),不会自动初始化这里面的5个数据是0.注释中默认不建议我们用,因为如前面所说,和标准std::vector不同,这个类主打效率,针对边界检查与相关验证全部去掉,除非我们知道我们应该怎么用.

　　2.如何查看如MovableObject与Node里的数据.

　　认真看过前面SoA部分的,这部分都不用细说了,Node里的位置信息用Transform保存,MovableObject的信息用ObjectData保存,对应的信息是四个一组用于SIMD指令加速,所以一个Node对应的Transform其实有4个Transform信息,这4个Transform位置在内存中数据如下XXXXYYYYZZZZ,根据Transform的mIndex(0,4]找出对应数据.

　　避免SIMD不能正常计算,以及大量的非空判断,Transform中如果只有三个node,最后一个node不设为null,为虚拟指针代替,这也是DOD常用的一个方法.

　　3.在Ogre1.x中,MovableObject只有附加到SceneNode后,才算是在场景中,而Ogre2.x就没有这个概念了,Node只算是MovableObject用来操作与保存相关位置信息.其实说起来,应该是和渲染流程的改变有变,原来的渲染流程中,通过Node一级一级查找下去所有的MoveableObject是否在视截体范围内,而现在生成一个MovableObject后,在对应的ObjectMemoryManager(同前面所讲,分配SoA结构) 保留指针,而在场景进行剔除时,根据ObjectMemoryManager来的,所以说MovableObject一直在场景中.但是Node保留位置信息,没有位置信号,一样不能在场景中渲染.

　　在Attaching/Detaching操作后,会自动调用对应setVisible,Attaching后,自动设visible为true,也可以设为flase,Detaching后,自动设visible为false,如果手动设true,会出现错误.

　　如果你Attaching一个SceneNode后,你再次Attaching另一个SceneNode时,需要先Detaching.否则断言错误.

　　4.所有的MovableObject都需要SceneNode,包含灯光与摄像机,所有的都需要附加到SceneNode中才行,很简单,原来如Light与Camera与一般的MovableObject有些区别,一是不渲染自己,二是有自己的位置信息,但是现在SceneNode不用于渲染通道,只是保存位置信息,自然和一般的MovableObject一样用SceneNode来保存位置信息了,灯光与摄像机也都必须附加到SceneNode上才有位置信息.

　　5. 改变Node的局部坐标位置,并不能马上得到对应的全局位置.不同于Ogre1.x版本,如setPosition会设置一个flag表示父节点要更新,而调用getDerivedPosition后,检查到flag就去更新父节点了.这是一个不友好的Cache设计.在Ogre2.x中,去掉了上面的一些flag,更新不会更新父节点,所有节点的更新都在每桢中的updateAllTransforms,就是说如果你setPosition后,你需要当前桢运行之后(调用updateAllTransforms)后才能得到getDerivedPosition的正确值.当然如果你一定现在要,可以用getDerivedPositionUpdated,当然这就是走老路了,如果可能,请更新你的设计.同时原Ogre1.x中的getDerivedPosition在Ogre2.x分成了二个方法,也去掉了if判断.

　　6.Node和MovableObject区分成动态与静态,静态就是告诉Ogre,我不会每桢去更新位置.这样Ogre能做的优化一是节省CPU,不用每桢去更新相应位置和相应AABB,二是告诉GPU,某些模型可以合并批次渲染.其中动态模型只能附加到动态节点上,静态模型只能附加到静态模型上.动态节点可以包含静态子节点,而静态节点不可以包含动态子节点(根节点除外),原因很简单,静态节点不常更新,你放个动态子节点在我里面,是让我更新了还是不更新了.

　　7.在Ogre2.0以前,我们知道最后用于渲染的只是Renderable与Pass,其中在场景可见性检查模型时, MovableObject把当下的所有Renderable加入RenderQueue,用户可以不通过MovableObject也能把Renderable加入RenderQueue,在Ogre2.1后,必需把Renderable与对应的MovableObject一起加入RenderQueue,因为新的渲染系统中的渲染模型,渲染中要求的Lod等级,骨骼动画,MVP矩阵等都直接保存在MovableObject.就如Ogre2.1以后MVP矩阵是直接保存在对应MovableObject中,不再是通过Renderable的getWorldTransforms获取.详细请查看相关QueuedRenderable引用相关信息.

　　此外去掉原Ogre2.0在场景可见性检查时要得到是否可以接收阴影用到的访问者模式,让修改的人来说,这个模式花费太大,不值得.当然Ogre2.0以后的阴影相关全部改变,只支持shadow map,以及shadow map很多变种技术.模版阴影去掉支持,可以看到MovableObject不再是ShadowCaster的子类,这个类包装模版阴影相关.

　　再一个就是新模型和VAO的引进,原来的VBO的类也改成相应VaoManager.具体后文详细分析.

SIMD,DOD,Thread:

　　SIMD与DOD设计前面有说,在这里,只是简单说几个类.所在文件都在OgreMain/Math/Array/SSE2下.

　　如下这段代码是前面我说的针对Ogre2.x中抽取的,主要是根据相关Ogre中SIMD与DOD设计中改写的,帮助理解.

//SIMD
struct ArrayVector3
{
    float x[4];
    float y[4];
    float z[4];

    ArrayVector3()
    {
        memset(x, 0, sizeof(float)* 4);
        memset(y, 0, sizeof(float)* 4);
        memset(z, 0, sizeof(float)* 4);
    }

    Vector3 getIndex(int index)
    {
        assert(index >= 0 && index < 4);
        return Vector3(x[index], y[index], z[index]);
    }

    void setIndex(int index, float fx, float fy, float fz)
    {
        assert(index >= 0 && index < 4);
        x[index] = fx;
        y[index] = fy;
        z[index] = fz;
    }
};
struct ArrayQuaternion
{
    float x[4];
    float y[4];
    float z[4];
    float w[4];
};
//SoA(Structure of Arrays)
struct ArrayTransformSoA
{
    ArrayVector3* pos;
    ArrayVector3* scale;
    ArrayQuaternion* orient;

    int mIndex = 0;

    ArrayTransformSoA()
    {
        pos = new ArrayVector3();
        scale = new ArrayVector3();
        orient = new ArrayQuaternion();
    }

    ~ArrayTransformSoA()
    {
        delete pos;
        delete scale;
        delete orient;
    }

    void move(Vector3 move)
    {
        //xxxxyyyyzzzz
        float *soa = reinterpret_cast<float*>(pos);
        for (int i = 0; i < 3; i++)
        {
            for (int j = 0; j < 4; j++)
            {
                soa[i * 4 + j] += move[i];
            }
        }
    }

    void setPos(float x, float y, float z)
    {
        pos->setIndex(mIndex, x, y, z);
    }

    Vector3 getPos()
    {
        return pos->getIndex(mIndex);
    }
};

void SoAVAoS()
{
    //AoS(Arrays of Structure)
    Transform aosArray[4];
    ArrayTransformSoA soaArray;

    Vector3 moveAdd(4.0f, 2.0f, 1.0f);
    for (int i = 0; i < 4; i++)
    {
        aosArray[i].move(moveAdd);
    }

    soaArray.move(moveAdd);

    for (int i = 0; i < 4; i++)
    {
        cout << aosArray[i].pos.x << endl;
        soaArray.mIndex = i;
        cout << soaArray.getPos().x << endl;
    }
    cout << "" << endl;
}

//DOD 面向数据设计
class ArrayTransformManager
{
private:
    enum ElementType
    {
        Pos,
        Scale,
        Orient,
        ElementCount
    };
    int elements[ElementCount];
    vector<char*> memoryPool;
    int totalSize = 0;
    int maxMemory = 32;
    //当前
    int nextSlot = 0;
public:
    ArrayTransformManager()
    {
        elements[Pos] = 3 * sizeof(float);
        totalSize += elements[Pos];
        elements[Scale] = 3 * sizeof(float);
        totalSize += elements[Scale];
        elements[Orient] = 4 * sizeof(float);
        totalSize += elements[Orient];

        memoryPool.resize(ElementCount);
    }

    void initialize()
    {
        for (int i = 0; i < ElementCount; i++)
        {
            int byteCount = elements[0] * maxMemory;
            memoryPool[i] = new char[byteCount];
            memset(memoryPool[i], 0, byteCount);
        }
    }

    void createArrayTransform(ArrayTransformSoA &outTransform)
    {
        int current = nextSlot++;
        //current = 0,nextSlotIdx = 0,nextSlotBase = 0            
        //current = 3,nextSlotIdx = 3,nextSlotBase = 0
        //current = 4,nextSlotIdx = 0,nextSlotBase = 4
        //current = 5,nextSlotIdx = 1,nextSlotBase = 4
        //current = 7,nextSlotIdx = 3,nextSlotBase = 4
        //current = 8,nextSlotIdx = 0,nextSlotBase = 8        
        int nextSlotIdx = current % 4;
        int nextSlotBase = current - nextSlotIdx;

        outTransform.mIndex = nextSlotIdx;
        outTransform.pos = reinterpret_cast<ArrayVector3*>(
            memoryPool[Pos] + nextSlotBase*elements[Pos]);
        outTransform.scale = reinterpret_cast<ArrayVector3*>(
            memoryPool[Scale] + nextSlotBase*elements[Scale]);
        outTransform.orient = reinterpret_cast<ArrayQuaternion*>(
            memoryPool[Orient] + nextSlotBase*elements[Orient]);

        outTransform.setPos(nextSlotIdx, nextSlotIdx, nextSlotIdx);
    }
};

void TestDOD()
{
    ArrayTransformManager transformDOD;
    transformDOD.initialize();

    ArrayTransformSoA transform0;
    transformDOD.createArrayTransform(transform0);

    ArrayTransformSoA transform1;
    transformDOD.createArrayTransform(transform1);

    ArrayTransformSoA transform2;
    transformDOD.createArrayTransform(transform2);

    ArrayTransformSoA transform3;
    transformDOD.createArrayTransform(transform3);

    ArrayTransformSoA transform4;
    transformDOD.createArrayTransform(transform4);


    cout << transform0.getPos().x << endl;
    cout << transform1.getPos().x << endl;
    cout << transform2.getPos().x << endl;
    cout << transform3.getPos().x << endl;
    cout << transform4.getPos().x << endl;

}

帮助理解Ogre中的SIMD,DOD

　　1.ArrayVector3 对应ArrayVector3.是SIMD要求的SoA结构,用于使用SSE2指令.

　　2.Transform 对应ArrayTransformSoA.用于Node的位置信息.

　　3.ArrayMemoryManager对应ArrayTransformManager.用于生成DOD数据结构内存排列.

　　当然ArrayMemoryManager本身的功能要复杂的多,如删除插槽,追踪已被删除插槽,添加时自动选择删除插槽,队列中空白插槽太多后的自动清理.模拟的ArrayTransformManager都是没有的.

　　线程在Ogre2.x中再也不是一个可有可无的功能,也不是一个玩具,也不是简单的逻辑一个线程,渲染一个线程这种简单用法.因为Ogre2.x中使用位置太多,如下只列出SceneManager::updateSceneGraph()中关于新的线程的使用,我们来看下基本情况.

　　先看如下代码.

void SceneManager::startWorkerThreads()
{
#if OGRE_PLATFORM != OGRE_PLATFORM_EMSCRIPTEN
    mWorkerThreadsBarrier = new Barrier( mNumWorkerThreads+1 );
    mWorkerThreads.reserve( mNumWorkerThreads );
    for( size_t i=0; i<mNumWorkerThreads; ++i )
    {
        ThreadHandlePtr th = Threads::CreateThread( THREAD_GET( updateWorkerThread ), i, this );
        mWorkerThreads.push_back( th );
    }
#endif
}

unsigned long updateWorkerThread( ThreadHandle *threadHandle )
{
    SceneManager *sceneManager = reinterpret_cast<SceneManager*>( threadHandle->getUserParam() );
    return sceneManager->_updateWorkerThread( threadHandle );
}
THREAD_DECLARE( updateWorkerThread );

unsigned long SceneManager::_updateWorkerThread( ThreadHandle *threadHandle )
{
#if OGRE_PLATFORM != OGRE_PLATFORM_EMSCRIPTEN
    size_t threadIdx = threadHandle->getThreadIdx();
    while( !mExitWorkerThreads )
    {
        mWorkerThreadsBarrier->sync();
        if( !mExitWorkerThreads )
        {
#else
    size_t threadIdx = 0;
#endif
            switch( mRequestType )
            {
            case CULL_FRUSTUM:
                cullFrustum( mCurrentCullFrustumRequest, threadIdx );
                break;
            case UPDATE_ALL_ANIMATIONS:
                updateAllAnimationsThread( threadIdx );
                break;
            case UPDATE_ALL_TRANSFORMS:
                updateAllTransformsThread( mUpdateTransformRequest, threadIdx );
                break;
            case UPDATE_ALL_BOUNDS:
                updateAllBoundsThread( *mUpdateBoundsRequest, threadIdx );
                break;
            case UPDATE_ALL_LODS:
                updateAllLodsThread( mUpdateLodRequest, threadIdx );
                break;
            case UPDATE_INSTANCE_MANAGERS:
                updateInstanceManagersThread( threadIdx );
                break;
            case BUILD_LIGHT_LIST01:
                buildLightListThread01( mBuildLightListRequestPerThread[threadIdx], threadIdx );
                break;
            case BUILD_LIGHT_LIST02:
                buildLightListThread02( threadIdx );
                break;
            case USER_UNIFORM_SCALABLE_TASK:
                mUserTask->execute( threadIdx, mNumWorkerThreads );
                break;
            default:
                break;
            }
#if OGRE_PLATFORM != OGRE_PLATFORM_EMSCRIPTEN
            mWorkerThreadsBarrier->sync();
        }
    }
#endif

    return 0;
}

void SceneManager::fireWorkerThreadsAndWait(void)
{
#if OGRE_PLATFORM == OGRE_PLATFORM_EMSCRIPTEN
    _updateWorkerThread( NULL );
#else
    mWorkerThreadsBarrier->sync(); //Fire threads
    mWorkerThreadsBarrier->sync(); //Wait them to complete
#endif
}

void SceneManager::updateSceneGraph()
{
    //TODO: Enable auto tracking again, first manually update the tracked scene nodes for correct math. (dark_sylinc)
    // Update scene graph for this camera (can happen multiple times per frame)
    /*{
        // Auto-track nodes
        AutoTrackingSceneNodes::iterator atsni, atsniend;
        atsniend = mAutoTrackingSceneNodes.end();
        for (atsni = mAutoTrackingSceneNodes.begin(); atsni != atsniend; ++atsni)
        {
            (*atsni)->_autoTrack();
        }
        // Auto-track camera if required
        camera->_autoTrack();
    }*/

    OgreProfileGroup("updateSceneGraph", OGREPROF_GENERAL);

    // Update controllers 
    ControllerManager::getSingleton().updateAllControllers();

    highLevelCull();
    _applySceneAnimations();
    updateAllTransforms();
    updateAllAnimations();
#ifdef OGRE_LEGACY_ANIMATIONS
    updateInstanceManagerAnimations();
#endif
    updateInstanceManagers();
    updateAllBounds( mEntitiesMemoryManagerUpdateList );
    updateAllBounds( mLightsMemoryManagerCulledList );

    {
        // Auto-track nodes
        AutoTrackingSceneNodeVec::const_iterator itor = mAutoTrackingSceneNodes.begin();
        AutoTrackingSceneNodeVec::const_iterator end  = mAutoTrackingSceneNodes.end();

        while( itor != end )
        {
            itor->source->lookAt( itor->target->_getDerivedPosition() + itor->offset,
                                     Node::TS_WORLD, itor->localDirection );
            itor->source->_getDerivedPositionUpdated();
            ++itor;
        }
    }

    {
        // Auto-track camera if required
        CameraList::const_iterator itor = mCameras.begin();
        CameraList::const_iterator end  = mCameras.end();
        while( itor != end )
        {
            (*itor)->_autoTrack();
            ++itor;
        }
    }

    buildLightList();

    //Reset the list of render RQs for all cameras that are in a PASS_SCENE (except shadow passes)
    uint8 numRqs = 0;
    {
        ObjectMemoryManagerVec::const_iterator itor = mEntitiesMemoryManagerCulledList.begin();
        ObjectMemoryManagerVec::const_iterator end  = mEntitiesMemoryManagerCulledList.end();
        while( itor != end )
        {
            numRqs = std::max<uint8>( numRqs, (*itor)->_getTotalRenderQueues() );
            ++itor;
        }
    }

    CameraList::const_iterator itor = mCameras.begin();
    CameraList::const_iterator end  = mCameras.end();
    while( itor != end )
    {
        (*itor)->_resetRenderedRqs( numRqs );
        ++itor;
    }

    // Reset these
    mStaticMinDepthLevelDirty = std::numeric_limits<uint16>::max();
    mStaticEntitiesDirty = false;

    for( size_t i=0; i<OGRE_MAX_SIMULTANEOUS_LIGHTS; ++i )
        mAutoParamDataSource->setTextureProjector( 0, i );
}

void SceneManager::updateAllTransformsThread( const UpdateTransformRequest &request, size_t threadIdx )
{
    Transform t( request.t );
    const size_t toAdvance = std::min( threadIdx * request.numNodesPerThread,
                                        request.numTotalNodes );

    //Prevent going out of bounds (usually in the last threadIdx, or
    //when there are less nodes than ARRAY_PACKED_REALS
    const size_t numNodes = std::min( request.numNodesPerThread, request.numTotalNodes - toAdvance );
    t.advancePack( toAdvance / ARRAY_PACKED_REALS );

    Node::updateAllTransforms( numNodes, t );
}
//-----------------------------------------------------------------------
void SceneManager::updateAllTransforms()
{
    mRequestType = UPDATE_ALL_TRANSFORMS;
    NodeMemoryManagerVec::const_iterator it = mNodeMemoryManagerUpdateList.begin();
    NodeMemoryManagerVec::const_iterator en = mNodeMemoryManagerUpdateList.end();

    while( it != en )
    {
        NodeMemoryManager *nodeMemoryManager = *it;
        const size_t numDepths = nodeMemoryManager->getNumDepths();

        size_t start = nodeMemoryManager->getMemoryManagerType() == SCENE_STATIC ?
                                                    mStaticMinDepthLevelDirty : 1;

        //Start from the first level (not root) unless static (start from first dirty)
        for( size_t i=start; i<numDepths; ++i )
        {
            Transform t;
            const size_t numNodes = nodeMemoryManager->getFirstNode( t, i );

            //nodesPerThread must be multiple of ARRAY_PACKED_REALS
            size_t nodesPerThread = ( numNodes + (mNumWorkerThreads-1) ) / mNumWorkerThreads;
            nodesPerThread        = ( (nodesPerThread + ARRAY_PACKED_REALS - 1) / ARRAY_PACKED_REALS ) *
                                    ARRAY_PACKED_REALS;

            //Send them to worker threads (dark_sylinc). We need to go depth by depth because
            //we may depend on parents which could be processed by different threads.
            mUpdateTransformRequest = UpdateTransformRequest( t, nodesPerThread, numNodes );
            fireWorkerThreadsAndWait();
            //Node::updateAllTransforms( numNodes, t );
        }

        ++it;
    }

    //Call all listeners
    SceneNodeList::const_iterator itor = mSceneNodesWithListeners.begin();
    SceneNodeList::const_iterator end  = mSceneNodesWithListeners.end();

    while( itor != end )
    {
        (*itor)->getListener()->nodeUpdated( *itor );
        ++itor;
    }
}

SceneManager::updateSceneGraph

　　我们先假设有n个工作线程.如下是针对这段代码的分析:

　　Barrier类型mWorkerThreadsBarrier对象:同步主线程与工作线程,用二个信号量来模拟.( 我们用来互换信号量。否则，如果多个工作线程中如果一个，造成这一困在当前线程的同步点,最终会死锁）。

　　mNumThreads:工作线程与主线程之和,n+1

　　mLockCount:当前锁定线程数.

　　工作线程执行方法updateWorkerThread -> _updateWorkerThread(死循环)

　　主线程里fireWorkerThreadsAndWait与工作线程中的_updateWorkerThread都会调用二次mWorkerThreadsBarrier->sync()方法.如下我们简化mWorkerThreadsBarrier->sync()为sync方法,如没做特殊说明,sync都是指mWorkerThreadsBarrier->sync().

　　创建Barrier对象mWorkerThreadsBarrier,信号量为0.

　　创建n个工程线程,因为当前信号量的值为0,所以在工作线程_updateWorkerThread循环中第一次的sync方法会引起当前信号量WaitForSingleObject堵塞.最终锁定线程数mLockCount为n.

　　主线程更新场景时,假设到了如上面的updateSceneGraph->updateAllTransforms后,更新标识为CULL_FRUSTUM,调用fireWorkerThreadsAndWait中的第一次sync方法后,达到mWorkerThreadsBarrier中的条件mLockCount== mNumThreads,此时重置当前信号量为工作线程数n(然后切换成下一个信号量,下一个信号量值为0).这样当前信号量下的工作线程就可以执行工作(_updateWorkerThread->updateAllAnimationsThread).

　　当主线程和n个工作线程纷纷通过第一个sync方法,执行任务,各达到线程中第二次sync方法前,前n个线程(主线程可能也在里面了)来到下一个信号量前面,这个信号量的值为0,所以大家都等着,等到最后一个线程也执行完了,到二次sync方法,此时和第三步差不多,因为mLockCount== mNumThreads, 此时重置当前信号量为工作线程数n(然后切换成下一个信号量,下一个信号量值为0).这样当前信号量下所有线程都纷纷跨过第二次sync方法.工作线程就是执行完当前循环,进到下一个循环里的第一次sync这里.这样又到当前信号量这里来了,因信号量为0,所以WaitForSingleObject堵塞.和第2步状态.

　　然后重复这个过程,一些平等关系的更新就可以用工作线程更新,等主线程调用fireWorkerThreadsAndWait的第一个sync方法.然后重复下去.不过要指出的是,线程的顺序是不确定的,不仅仅是说第四步最后到达的是不确定的,也有可能在第三步中,因为主线程执行fireWorkerThreadsAndWait后,接着执行fireWorkerThreadsAndWait的第一个sync可能还在工作线程第二个sync到时第下一个循环的第一个sync之前完成.但是这个其实是没有关系,因为我们要求的同步也不麻烦,只有一齐开始,然后等到一齐结束,这个是满足的.

　　这只是Ogre中新线程方案中的一例,这个过程我们可以看到Ogre中的渲染过程中,所有节点更新,所有动画,所有模型AABB全部是多线程开动的,这些方法内部数据的组合也多是DOD对应的SOA结构,前面DOD链接中说明DOD优势就有更容易的并行化以及更好的缓存命中.前面的幻灯片文档里有专门针对DOD与OOD缓存命中的比较.

HLMS:只是简介

　　Ogre2.0已经放弃FFP了,不过本来就是一个应该早放弃的东东,在Ogre1.9就能用RTSS组件替换FFP了,不过在Ogre2.0是真真完全没有,相关API都没有了,那是不是说要简单渲染一个模型都要写着色器代码了,或是一定要用到RTSS,这都不是,我们需要用到最新的高级材质系统HLMS.HLMS可以说是组合原来的material和RTSS的新的核心功能,使用更方便与灵活,高效.　

　　在说明新的HLMS时,我认为有必要先讲解一下渲染流水线,这是博友亮亮的园子OpenGL管线（用经典管线代说着色器内部）,本文FFP与可编程管线都有说明,对比如上,HLMS采用分块方案,这样有很多好处,第一每块状态可以重复使用,减少内存和带宽,提高cache命中.第二D3D和OpenGL都是状态机模式,使用块模式,可以组合相同块一起渲染,减少状态切换,提高渲染效率.这也是为什么作者说原来的Material是低效的,不建议使用,还有作者特意说明,这种分块模式看起来像是D3D11中的,但是作者本身是一个OpenGL fan,他开发这个HLMS一直都是在OpenGL下,只能说,作者说D3D11开发者想到一起了.

　　Macroblocks是光栅化状态，它们包含深度的读/写设置，剔除模式。Blendblocks就像D3D11混合状态，含混合模式及其影响因素。Samplerblocks就像D3D11在GL3 +或采样状态采样对象，包含过滤信息，纹理寻址模式（包，卡，等），纹理的设置，等等。

　　Macroblocks块: 包含逐片断处理中的深度检查,还有剔除模型,显示模式,类似如D3D11中的ID3D11RasterizerState.

　　Blendblocks块: 逐片断处理中的Alpha混合操作.类似ID3D11BlendState.

　　Samplerblocks块:纹理块的属性集合.类似D3D11_SAMPLER_DESC.

　　Datablocks块:这个OgreMain里没怎么体现出来,应该去看OgreHlmsPbs,对应文件夹Media\Hlms\Pbs中,可以看下是怎么回事. Datablocks与Renderable结合一起填充着色器代码,如RTSS一样.

　　包含上面所有块,承载着相当于原Material项.举例如原来Ogre1.x老模型Renderable原来是setMaterial,现在新模型Renderable使用setDatablock.

　　原来Material中,如表面颜色等影响顶点着色器与片断着色器之间属性分被分配到Datablocks,刚开始看到alaph_test等相关设置在里面还疑惑了下,后面直接在Media\Hlms\Pbs里查看,如glsl中的PixelShader_ps.glsl可以直接根据相应alaph_test设置已经可以丢弃片断,和逐片断处理中的AlphaTest一样,这里有点还是没搞清楚,是逐片断处理放弃AlphaTest了还是提前到片断着色器中处理了,毕竟逐片断处理是在片断着色器之后. 逐片断处理别的处理如上也是单独分块的.

总结:　　

　　这些都只是对应二份文档的一小部分翻译,只是简单介绍Ogre2.x中一部分新功能,从这一小部分,我们已经可以看到,这是一个完全不同的Ogre引擎,如下几点后面会具体分析.

　　1.新的渲染流程.

　　2.新模型格式以及VAO的引进

　　3.HLMS详解.

　　4.新合成器详解.

　　5.新线程详解.

　　当然Ogre2.1事实还是半完成状态,相关文章会尽量使用最新版本进行分析.最后,不得不说句,TMD果然只能用C++或C来设计游戏引擎,如上优化如果用C#来做,肯定比用C++都来的麻烦.

你可能感兴趣的:(Ogre2.0 全新功能打造新3D引擎)

yy自动语音接待机器人_行业头部品牌如何使用语音机器人打造智能服务？邓柯 yy自动语音接待机器人
点击上方蓝字关注沃丰科技对于各种规模的企业来说，人工智能的发展正在成为最具影响力的技术之一。从早期开始，就已经影响了客户体验。企业为了实现业绩最大化，满足客户日益变化的需求，企业只能依靠增加更多的客服人员来提高效率，并且对客服人员进行持续的培训。无论是增加人员还是加强培训，都会导致企业的运营成本和管理成本的增加。客户意向的不确定性，客服人员根本无法统计客户说的每句话，从而导致跟踪记录不真实。除此之
车牌识别系统-车牌OCR识别接口-小程序端车牌识别api wt_cs 发票识别大数据
在城市规模不断扩张，机动车保有量持续攀升的背景下，城市交通管理面临着前所未有的挑战。从拥堵治理到违法管控，从停车管理到通行效率提升，每一个环节都考验着城市管理者的智慧。而车牌识别接口作为智能交通系统的关键技术，凭借其强大的功能，在缓解城市交通压力、提升管理效率方面发挥着重要作用。在传统交通执法模式下，人工巡逻与手动录入不仅效率低下，还容易受到人为疏忽的影响。在交通流量大的路段，难以实现实时监控与精
智慧指路机器人是否支持公共广播功能？ csssnxy 机器人
哇哦！部分叁仟智慧指路机器人简直超乎想象地厉害！它们不仅能精准指引方向，还神奇地支持公共广播功能。想象一下，在熙熙攘攘的大型商场、交通枢纽，或是热闹非凡的活动现场，机器人不仅能为人们指明道路，还能通过广播及时发布重要信息，是不是特别酷炫？不过呀，这一超棒的公共广播功能，可不是所有叁仟智慧指路机器人都能轻松拥有的，它并非标配。机器人是否支持这一功能，主要取决于其设计用途和功能定制情况。如果应用场景有
广东新政激发产业活力，凡拓数创以全场景AI3D方案领跑机器人赛道 Zlssszls 人工智能机器人
随着广东“十二条措施”的落地，人工智能与机器人产业迎来新一轮发展机遇。凡拓数创作为专精特新“小巨人”企业，近期入选“2024广州AI最具市场价值企业”，其AI3D空间智能技术已成功应用于工业仿真、智能导览等场景，助力机器人厂商实现研发效率提升40%，成为政策与产业协同创新的典范。作为国家级专精特新“小巨人”企业、广州AI最具市场价值企业，凡拓数创依托自主研发的FTE数字孪生引擎及AI多模态技术，以
智能舵机：AI融合下的自动化新纪元高德诚人工智能自动化运维
在自动化的浪潮中，智能舵机以其独特的魅力和卓越的性能，正引领着自动化产业迈向新的高度。今天，让我们一起走进智能舵机的世界，感受AI技术为其带来的无限可能。一、智能舵机：自适应控制的先锋智能舵机，这个听起来就充满科技感的名词，其实是通过集成高精度传感器和先进算法，实现了自适应控制的神奇装置。它不再仅仅是一个简单的执行机构，而是能够根据环境变化实时调整姿态，确保精准控制的智能设备。在智能舵机内部，集成
展会邀请|卓翼飞思实验室邀您共赴第62届高博会飞思实验室人工智能
由中国高等教育学会主办的第62届中国高等教育博览会将于2024年11月15-17日在重庆隆重举办，作为高等教育领域的高品质、综合性、专业化品牌展会，旨在全面展示我国高等教育的新发展、新成果，为进一步推进高等教育现代化贡献智慧与力量。届时，卓翼飞思实验室将携无人智能教学解决方案及相关硬件产品在本次展会精彩亮相，诚邀您莅临现场，共谱产教深度融合新篇章！展会时间：2024年11月15-17日展会地点：重
【从零实现Json-Rpc框架】- 项目实现 - 零碎功能接口篇 JhonKI json rpc 网络协议
博客主页：https://blog.csdn.net/2301_779549673博客仓库：https://gitee.com/JohnKingW/linux_test/tree/master/lesson欢迎点赞收藏⭐留言如有错误敬请指正！本文由JohnKi原创，首发于CSDN未来很长，值得我们全力奔赴更美好的生活✨文章目录前言️‍一、简单日志宏实现1.1意义:快速定位程序运行逻辑出错的位置。1
在Electron+Vue应用中实现文件自动监视与更新功能接着奏乐接着舞。 electron electron vue.js javascript
引言在现代编辑器中，当文件在外部被修改时（比如被其他编辑器或程序更改），编辑器能够自动检测到这些变更并更新显示内容，这是一个非常实用的功能。本文将详细介绍如何在基于Electron和Vue的应用中实现这一功能，让你的编辑器始终保持文件内容的最新状态。实现效果当用户打开一个文件后，如果该文件在外部被修改（例如通过VSCode、Notepad++等其他编辑器），我们的应用将自动检测到变更并更新编辑器显
Transformer劲敌变队友？腾讯、英伟达都在用的Mamba-Transformer混合架构要火！ that's boy transformer 架构深度学习 midjourney AI编程 AI写作 AI作画
Transformer“单打独斗”的时代要结束了？Mamba-Transformer强势来袭！在过去的一两年里，Transformer架构一直是AI大模型领域的“霸主”，但它也面临着来自新兴架构的不断挑战。在众多“挑战者”中，Mamba无疑是最受瞩目的一个。然而，最近的风向似乎变了。Mamba和Transformer不再是“水火不容”的竞争对手，而是开始走向融合，携手打造更强大的AI模型！腾讯、英
使用Python爬虫按图搜索1688商品（拍立淘） API小爬虫 python 爬虫图搜索算法
在电商领域，按图搜索商品（如1688的“拍立淘”功能）已成为一种非常实用的功能，尤其适合用户通过图片快速查找相似商品。1688开放平台提供了按图搜索商品的API接口，允许开发者通过图片获取相关的商品信息。本文将详细介绍如何使用Python爬虫技术调用1688的按图搜索API接口，并解析返回的数据。一、准备工作1.注册1688开放平台账号首先，你需要在1688开放平台注册一个开发者账号，并申请相应的
linux inotify api, 监控文件事件 yinhezhanshen linux 运维服务器
Linux的‌inotify‌（inodenotify）是一种内核子系统，允许应用程序‌实时监控文件或目录的变化‌（如创建、修改、删除等）。相比传统的轮询（polling）机制，inotify通过事件驱动的方式显著提升了效率，是构建文件同步工具、配置热加载、日志监控等功能的底层核心。自内核2.6.13起，Linux开始提供inotify机制，以允许应用程序监控文件事件。使用步骤：1、使用inoti
清晰易懂的Trae实现为AI编程从安装到实战开发ToDoList Tee xm AI编程 windows macos
一、Trae简介与核心优势Trae是字节跳动推出的国内首个AI原生集成开发环境（AIIDE），它不同于传统的代码编辑器或AI插件，而是将AI能力深度集成到整个开发流程中，实现"人与AI协同编程"的全新体验。作为一款真正的AI原生IDE，Trae具备以下核心优势：全场景AI支持：从代码生成、补全到Bug修复、优化建议，覆盖开发全生命周期强大的上下文理解：能理解整个项目代码结构，而不仅是单个文件多模型
richeditor-android：打造Android移动应用的富文本编辑体验 Kingston Chang
本文还有配套的精品资源，点击获取简介：在移动应用开发中，richeditor-android为Android平台提供了一个功能强大的富文本编辑器，旨在提供与H5端类似的编辑体验，使开发者能够快速实现专业的文字编辑功能。框架以用户体验为中心，提供简洁的API、高度定制化能力和丰富的预设样式。集成简单，支持文本编辑的常见操作，并且经过性能优化确保在各种Android设备上流畅运行。通过设置回调、自定义
Python 数据库自动化操作指南老胖闲聊 Python python 数据库自动化
本指南详细讲解如何使用Python操作MySQL、Oracle和MicrosoftSQLServer数据库，涵盖常用库、基础操作、高级功能及完整代码示例。目录MySQL操作详解Oracle操作详解MicrosoftSQLServer操作详解通用注意事项一、MySQL操作详解1.常用库mysql-connector-python（官方驱动）安装：pipinstallmysql-connector-p
CAPL函数-10网络与总线函数正当少年 CAPL CAPL
CAPL提供了丰富的网络和总线控制函数，用于管理CAN、LIN、FlexRay等总线通信。以下是主要功能的分类和详细说明：一、总线通信控制函数1.总线启停控制startBus()-启动指定总线startBus("CAN",1);//启动CAN1总线stopBus()-停止指定总线stopBus("LIN",2);//停止LIN2总线resetBus()-复位总线控制器resetBus("FlexR
详细介绍ASSERT() 程工助力英语中国话 Visual C++2017 从入门到精通 MFC ASSERT
书籍：《VisualC++2017从入门到精通》的2.7字符串环境：visualstudio2022内容：IsEmpty()函数**ASSERT()宏详解**ASSERT()是C/C++中用于调试的关键宏，主要用于在开发阶段验证程序逻辑的正确性。当条件不满足时，它会触发断言失败，帮助开发者快速定位问题。以下是其核心功能、使用场景及注意事项的详细解析：1.基本功能条件检查：ASSERT(expr)会
MFC TRACE 宏的使用说明程工助力英语中国话 Visual C++2017 从入门到精通 mfc TRACE 宏
书籍：《VisualC++2017从入门到精通》的2.7字符串环境：visualstudio2022内容：几个字符串类型->（将单字节char*转换为宽字节wchar_t*）（将宽字节wchar_t*转换为单字节char*）问题：AfxMessageBox()显示的内容不正常，想要添加日志查看。以下是关于MFCTRACE宏的详细使用说明，涵盖其功能、参数、示例及注意事项：1.基本功能TRACE是M
什么是架构，以及当前市面主流架构类型有哪些？ encoding-console 架构系统架构硬件架构数据库架构网络架构
什么是架构，以及当前市面主流架构有哪些在计算机领域，架构通常指系统设计的整体框架，定义了各组件之间的交互方式、功能划分以及技术规范。不同的架构层级（如硬件、软件、网络）有不同的架构类型。以下是核心概念和当前主流架构的分类说明：一、硬件架构：1.1硬件架构的概念即计算机硬件系统设计和组织方式，主要体现在处理器指令集和内存管理上。1.2硬件架构的主流类型1.2.1X86架构由Intel和AMD主导，主
Java全栈面试宝典：JVM与Spring核心模块深度解析 Aphelios380 面试算法 java 面试 jvm spring 开发语言
目录一、JVM核心机制进阶问题10：元空间vs永久代：内存管理的代际革命技术演进对比表技术演进关键点问题11：JVM性能调优三剑客参数解析核心参数详解问题12：堆与栈的六大核心差异内存结构对比图二、Spring框架全景解析Spring核心价值三大支柱Spring模块架构全景图核心模块矩阵模块依赖关系Spring高频面试题集锦1.Spring的核心功能是什么？2.Spring中常用的设计模式？3.S
Java 基础入门代码示例解析 Aphelios380 java 学习 RBAC
在Java编程的学习过程中，理解函数（方法）的使用以及简单系统功能的实现是非常重要的基础。本文将对一系列Java代码进行详细解析，这些代码涵盖了菜单驱动的功能选择、数据查询以及简单的RBAC（基于角色的访问控制）系统模拟等内容。目录一、三国群英系统功能实现二、数字操作功能实现三、人物信息查询功能实现四、RBAC系统模拟实现因为上篇全是RBAC系统&Java的概念，太空洞，所以补充了这篇关于RBAC
H5DS编辑器教程——帧动画爱趣五科技编辑器前端安全
面对信息爆炸和用户注意力碎片化的挑战，传统静态H5内容逐渐显出力不从心。帧动画功能的出现，为企业H5注入了动态生命力，其核心价值不仅在于技术层面的创新，更在于它精准解决了企业在信息传达、用户体验、品牌塑造等方面的深层需求。且帧动画功能成为企业级H5的“刚需”。使用工具：H5DS编辑器如何制作帧动画？1.添加素材且选中，点击“图层动画”→“添加帧动画”2.在帧动画设置里调整第1关键帧（即初始关键帧）
036-Python GUI 编程（Tkinter）小宝哥Code Python基础及AI开发 python 开发语言
Tkinter是Python标准库中的图形用户界面（GUI）开发工具，提供了创建窗口、按钮、文本框等基本控件的功能。由于其简单易用且与Python一起发布，Tkinter是快速开发桌面应用的首选工具之一。1.Tkinter基本概念1.1Tkinter的组成Tkinter提供了一个图形化界面的框架，主要包括以下几个核心概念：Tk：主窗口，是所有控件的容器。控件（Widget）：比如按钮、标签、文本框
H5DS编辑器教程——H5页面触发动画实战指南爱趣五科技编辑器
在H5页面设计中，触发动画通过动态交互提升用户体验，成为吸引注意力的关键手段。H5DS编辑器作为一款高效的可视化工具，提供了丰富的动画制作功能，即使是零基础用户也能轻松实现专业级效果。使用工具：H5DS编辑器触发动画？1.添加多个素材，选中按钮，点击“图层交互”→“添加事件”→“触发动画”2.在触发动画的配置里选择“图表”（要被触发动画的素材），点击“确定”即可3.通过“预览/发布”进行查看效果，
MLIR笔记（2） wuhui_gdnt MLIR笔记 mlir 笔记编译 llvm
3.LVM有趣的代码3.1.dyn_cast()与cast()C++支持类型间的自动转换（如operator=声明的转换），但在转换的调用链里自动转换只能调用一次，这固然是避免给编译器带来过分的复杂性，但更重要的是允许自动转换接力调用几乎很难避免出现递归调用，而且调用链过长会很快失去控制，给人带来意想不到的结果。但是，C++原生的类型转换系统对于LLVM/MLIR来说局限性太大，因此，LLVM打造
yolo模型学习笔记——4——yolov4相比与yolov3的优点 Summit- YOLO 学习笔记
1.网络结构和架构的改变(1)yolov3使用darknet-53的主干网络，该网络基于残差结构(2)yolov4使用CSPDarknet53，增强版darknet-53，具有更高的计算效率和更好的特征提取能2.优化技术(1)yolov3使用了基础的数据增强技术（如翻转、裁剪、亮度调整等），并且使用了自适应锚框来匹配目标的大小(2)yolov41.Mosaic数据增强这是一种新的数据增强方法，通过
uniapp用法--uni.navigateTo 使用与参数携带的方式示例（包含复杂类型参数）碧海饮冰前端
一、基本用法‌功能特性‌保留当前页面，将新页面推入导航栈顶部（适用于非tabBar页面跳转）‌。可通过uni.navigateBack返回原页面‌34。‌代码示例uni.navigateTo({url:'/pages/detail/detail?key=value'//目标页面路径及参数});二、可携带参数类型‌基础类型参数‌‌字符串/数值‌：直接拼接在URL后，如url:'/pages/page
检索增强生成RAG与MxRAG 人工智能自然语言处理华为
一、引言在自然语言处理领域，RAG（Retrieval-AugmentedGeneration）技术正逐渐引起广泛关注。它结合了信息检索和语言生成的优势，为解决各种自然语言处理任务提供了新A。本文将详细介绍RAG的流程及技术分析，帮助读者更好地理解这一创新技术，并介绍在昇腾的解决方案，帮助你快速高效实现部署。二、RAG技术概述RAG是一种将检索与生成相结合的技术，旨在利用外部知识源来增强语言模型的
Apipost vs Apifox/Postman：SocketIO调试效率深度评测
《Apipost协议支持深度解析，高效解决SocketIO调试难题》实时通信调试工具可能已「过时」！许多主流工具如Apifox不支持SocketIO协议，导致调试效率低下。而Apipost作为国产工具，原生支持SocketIO，提供自定义事件管理、连接状态可视化等功能，极大提升了实时通信开发的效率和准确性。选择正确的工具，告别「伪实时」调试，提升团队协作与维护效率。颠覆认知！你的实时通信调试工具可
Java Collection API增强功能系列之二 List.of、Set.of、Map.of 茶本无香 java list 开发语言
Java9集合工厂方法：用List.of、Set.of、Map.of创建安全不可变集合Java9引入了革命性的集合工厂方法List.of、Set.of和Map.of，彻底改变了开发者创建小型不可变集合的方式。这些方法不仅语法简洁，还在安全性和性能上实现了质的飞跃。本文将深入解析这些工厂方法的核心特性，并通过对比传统方式，展示其在实际开发中的优势。一、新工厂方法概览1.方法家族方法签名说明示例Lis
AI对前端岗位的影响 Shero.李建业框架与库的最新进展前端
AI对前端岗位的影响随着人工智能（AI）技术的迅猛发展，其在各个领域都展现出了巨大的潜力和影响力。前端开发作为IT行业中的一个重要领域，也不例外地受到了AI技术的深刻影响。AI在前端开发中的应用和影响已经逐渐显现出来，它不仅改变了前端开发的方式和流程，也对前端开发人员的职业发展和技能要求提出了新的挑战。本文将探讨AI对前端岗位的影响，分析其带来的变革和挑战，以及前端开发人员需要做出的应对和适应。一
java短路运算符和逻辑运算符的区别 3213213333332132 java基础
/* * 逻辑运算符——不论是什么条件都要执行左右两边代码 * 短路运算符——我认为在底层就是利用物理电路的“并联”和“串联”实现的 * 原理很简单，并联电路代表短路或（||），串联电路代表短路与（&&）。 * * 并联电路两个开关只要有一个开关闭合，电路就会通。 * 类似于短路或（||），只要有其中一个为true（开关闭合）是
Java异常那些不得不说的事白糖_ java exception
一、在finally块中做数据回收操作比如数据库连接都是很宝贵的，所以最好在finally中关闭连接。 JDBCAgent jdbc = new JDBCAgent(); try{ jdbc.excute("select * from ctp_log"); }catch(SQLException e){ ... }finally{ jdbc.close();
utf-8与utf-8(无BOM)的区别 dcj3sjt126com PHP
BOM——Byte Order Mark，就是字节序标记在UCS 编码中有一个叫做"ZERO WIDTH NO-BREAK SPACE"的字符，它的编码是FEFF。而FFFE在UCS中是不存在的字符，所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前，先传输字符"ZERO WIDTH NO-BREAK SPACE"。这样如
JAVA Annotation之定义篇周凡杨 java 注解 annotation 入门注释
Annotation: 译为注释或注解 An annotation, in the Java computer programming language, is a form of syntactic metadata that can be added to Java source code. Classes, methods, variables, pa
tomcat的多域名、虚拟主机配置 g21121 tomcat
众所周知apache可以配置多域名和虚拟主机，而且配置起来比较简单，但是项目用到的是tomcat，配来配去总是不成功。查了些资料才总算可以，下面就跟大家分享下经验。很多朋友搜索的内容基本是告诉我们这么配置：在Engine标签下增面积Host标签，如下： <Host name="www.site1.com" appBase="webapps"
Linux SSH 错误解析（Capistrano 的cap 访问错误 Permission ） 510888780 linux capistrano
1.ssh -v hdfs@192.168.18.133 出现 Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password). 错误运行状况如下： OpenSSH_5.3p1, OpenSSL 1.0.1e-fips 11 Feb 2013 debug1: Reading configuratio
log4j的用法 Harry642 java log4j
一、前言： log4j 是一个开放源码项目，是广泛使用的以Java编写的日志记录包。由于log4j出色的表现，当时在log4j完成时，log4j开发组织曾建议sun在jdk1.4中用log4j取代jdk1.4 的日志工具类，但当时jdk1.4已接近完成，所以sun拒绝使用log4j，当在java开发中
mysql、sqlserver、oracle分页，java分页统一接口实现 aijuans oracle jave
定义：pageStart 起始页，pageEnd 终止页,pageSize页面容量 oracle分页：　　　　select * from ( select mytable.*,rownum num from (实际传的SQL) where rownum<=pageEnd) where num>=pageStart sqlServer分页：
Hessian 简单例子 antlove java Web service hessian
hello.hessian.MyCar.java package hessian.pojo; import java.io.Serializable; public class MyCar implements Serializable { private static final long serialVersionUID = 473690540190845543
数据库对象的同义词和序列百合不是茶 sql 序列同义词 ORACLE权限
回顾简单的数据库权限等命令; 解锁用户和锁定用户 alter user scott account lock/unlock; //system下查看系统中的用户 select * dba_users; //创建用户名和密码 create user wj identified by wj; identified by //授予连接权和建表权 grant connect to
使用Powermock和mockito测试静态方法 bijian1013 持续集成单元测试 mockito Powermock
实例： package com.bijian.study; import static org.junit.Assert.assertEquals; import java.io.IOException; import org.junit.Before; import org.junit.Test; import or
精通Oracle10编程SQL(6)访问ORACLE bijian1013 oracle 数据库 plsql
/* *访问ORACLE */ --检索单行数据 --使用标量变量接收数据 DECLARE v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; BEGIN select ename,sal into v_ename,v_sal from emp where empno=&no; dbms_output.pu
【Nginx四】Nginx作为HTTP负载均衡服务器 bit1129 nginx
Nginx的另一个常用的功能是作为负载均衡服务器。一个典型的web应用系统，通过负载均衡服务器，可以使得应用有多台后端服务器来响应客户端的请求。一个应用配置多台后端服务器，可以带来很多好处：负载均衡的好处增加可用资源增加吞吐量加快响应速度，降低延时出错的重试验机制 Nginx主要支持三种均衡算法： round-robin l
jquery-validation备忘白糖_ jquery css F#Firebug
留点学习jquery validation总结的代码： function checkForm(){ validator = $("#commentForm").validate({// #formId为需要进行验证的表单ID errorElement :"span",// 使用"div"标签标记错误，默认:&
solr限制admin界面访问（端口限制和http授权限制） ronin47 限定Ip访问
solr的管理界面可以帮助我们做很多事情，但是把solr程序放到公网之后就要限制对admin的访问了。可以通过tomcat的http基本授权来做限制，也可以通过iptables防火墙来限制。我们先看如何通过tomcat配置http授权限制。第一步：在tomcat的conf/tomcat-users.xml文件中添加管理用户，比如： <userusername="ad
多线程-用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 bylijinnan java 多线程
public class IncDecThread { private int j=10; /* * 题目:用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 * 两个问题： * 1、线程同步--synchronized * 2、线程之间如何共享同一个j变量--内部类 */ public static
买房历程 cfyme
2015-06-21: 万科未来城，看房子 2015-06-26: 办理贷款手续，贷款73万，贷款利率5.65=5.3675 2015-06-27: 房子首付,签完合同 2015-06-28，央行宣布降息 0.25，就2天的时间差啊，没赶上。首付，老婆找他的小姐妹接了5万，另外几个朋友借了1-
[军事与科技]制造大型太空战舰的前奏 comsci 制造
天气热了........空调和电扇要准备好.......... 最近,世界形势日趋复杂化,战争的阴影开始覆盖全世界.......... 所以,我们不得不关
dateformat dai_lm DateFormat
"Symbol Meaning Presentation Ex." "------ ------- ------------ ----" "G era designator (Text) AD" "y year
Hadoop如何实现关联计算 datamachine mapreduce hadoop 关联计算
选择Hadoop，低成本和高扩展性是主要原因，但但它的开发效率实在无法让人满意。以关联计算为例。假设：HDFS上有2个文件，分别是客户信息和订单信息，customerID是它们之间的关联字段。如何进行关联计算，以便将客户名称添加到订单列表中？ &nbs
用户模型中修改用户信息时，密码是如何处理的 dcj3sjt126com yii
当我添加或修改用户记录的时候对于处理确认密码我遇到了一些麻烦，所有我想分享一下我是怎么处理的。场景是使用的基本的那些(系统自带)，你需要有一个数据表(user)并且表中有一个密码字段(password),它使用 sha1、md5或其他加密方式加密用户密码。面是它的工作流程: 当创建用户的时候密码需要加密并且保存，但当修改用户记录时如果使用同样的场景我们最终就会把用户加密过的密码再次加密，这
中文 iOS/Mac 开发博客列表 dcj3sjt126com Blog
本博客列表会不断更新维护，如果有推荐的博客，请到此处提交博客信息。本博客列表涉及的文章内容支持定制化Google搜索，特别感谢 JeOam 提供并帮助更新。本博客列表也提供同步更新的OPML文件（下载OPML文件），可供导入到例如feedly等第三方定阅工具中，特别感谢 lcepy 提供自动转换脚本。这里有导入教程。
js去除空格，去除左右两端的空格蕃薯耀去除左右两端的空格 js去掉所有空格 js去除空格
js去除空格，去除左右两端的空格 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>&g
SpringMVC4零配置--web.xml hanqunfeng springmvc4
servlet3.0+规范后，允许servlet，filter，listener不必声明在web.xml中，而是以硬编码的方式存在，实现容器的零配置。 ServletContainerInitializer：启动容器时负责加载相关配置 package javax.servlet; import java.util.Set; public interface ServletContainer
《开源框架那些事儿21》：巧借力与借巧力 j2eetop 框架 UI
同样做前端UI，为什么有人花了一点力气，就可以做好？而有的人费尽全力，仍然错误百出？我们可以先看看几个故事。故事1：巧借力，乌鸦也可以吃核桃有一个盛产核桃的村子，每年秋末冬初，成群的乌鸦总会来到这里，到果园里捡拾那些被果农们遗落的核桃。核桃仁虽然美味，但是外壳那么坚硬，乌鸦怎么才能吃到呢？原来乌鸦先把核桃叼起，然后飞到高高的树枝上，再将核桃摔下去，核桃落到坚硬的地面上，被撞破了，于是，
JQuery EasyUI 验证扩展可怜的猫 jquery easyui 验证
最近项目中用到了前端框架-- EasyUI，在做校验的时候会涉及到很多需要自定义的内容，现把常用的验证方式总结出来，留待后用。以下内容只需要在公用js中添加即可。使用类似于如下： <input class="easyui-textbox" name="mobile" id="mobile&
架构师之httpurlconnection----------读取和发送(流读取效率通用类) nannan408
1.前言. 如题. 2.代码. /* * Copyright (c) 2015, S.F. Express Inc. All rights reserved. */ package com.test.test.test.send; import java.io.IOException; import java.io.InputStream
Jquery性能优化 r361251 JavaScript jquery
一、注意定义jQuery变量的时候添加var关键字这个不仅仅是jQuery，所有javascript开发过程中，都需要注意，请一定不要定义成如下： $loading = $('#loading'); //这个是全局定义，不知道哪里位置倒霉引用了相同的变量名，就会郁闷至死的二、请使用一个var来定义变量如果你使用多个变量的话，请如下方式定义： . 代码如下: var page
在eclipse项目中使用maven管理依赖 tjj006 eclipse maven
概览: 如何导入maven项目至eclipse中建立自有Maven Java类库服务器建立符合maven代码库标准的自定义类库 Maven在管理Java类库方面有巨大的优势，像白衣所说就是非常“环保”。我们平时用IDE开发都是把所需要的类库一股脑的全丢到项目目录下，然后全部添加到ide的构建路径中，如果用了SVN/CVS，这样会很容易就把
中国天气网省市级联页面 x125858805 级联
1、页面及级联js <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> &l