weixin_39735166

cuda nvcc版本不一致_CUDA微架构与指令集（2）-SASS指令集概述

今天来聊一聊CUDA的SASS指令集。官方没有看到SASS的全称，有人说是Streaming ASSembly。SASS是CUDA中对应GPU的机器码的硬件指令集。CUDA中还有另一个更上层的虚拟指令集PTX（Parallel Thread eXecution）。我大概总结了两者的一些区别和联系：

指令集性质：SASS指令集与SM架构有直接对应关系，一旦硬件架构设计完成就不再改变。注意不一定是一一对应，因为一些架构的改变可能仅表现为某些指令的性能变化，但SASS指令集本身（包括编码和功能）并没有变化。典型的例子是Maxwell和Pascal两者的SASS几乎是完全一样的，当然其实二者的底层硬件架构可能也是高度雷同，但毕竟是两个版本。PTX与硬件架构只有比较弱的耦合关系，它本质上是从SASS上抽象出来的一种更上层的软件编程模型，介于CUDA C/C++和SASS之间。PTX也有版本，但只与PTX本身所支持的功能有关，更类似于C99，C++11这种语言版本，与硬件架构未必有对应关系。PTX是一种抽象语言，理论上说，每个版本都可以支持任意版本的SASS指令集，而且可以通过软件升级维护进行扩展和调整。但是由于某些PTX功能与硬件SASS指令的强相关性，导致某些特定架构上的实现可能会受到限制，甚至完全不支持。所以PTX除了自身的软件版本以外，也有.target语句来指定目标架构的sm版本（称为virtual architecture），相当于表示当前PTX文件只能使用某个sm支持的feature。

兼容性：CUDA C/C++程序编译完成后，一般NVCC会同时生成PTX和SASS代码，当然用户也可以指定只生成其中一种。SASS前面已经说过，是机器码的硬件指令集，编译的SM版本与当前GPU的SM版本不对应的话是不能运行的。但PTX可以被driver中的jit编译器编译成与当前GPU对应的SASS代码。这样就实现了代码的可移植性和向后兼容。前提是driver的版本要够新，能支持当前的GPU，同时PTX文件的版本要支持那个架构。所以买了一块最新的卡，以前的程序如果内嵌了PTX还是能跑的，只是需要更新一下驱动。从功能上讲，PTX是向后兼容的。但SASS不一定，有可能前一代架构的指令由于某种原因被废弃了。比如说32bit整数的乘法，在Kepler中有IMAD指令，但Maxwell和Pascal里一般都用三个16bit整数乘法指令XMAD来实现，在Turing中又用回了IMAD指令。Maxwell和Pascal也许还有IMAD指令（也许是性能不好，不确定），但XMAD应该是前后几代都没有用了。所以SASS的功能是可以随着需求而增删的。只要PTX提供了足够的向后兼容性（也就是这个功能可以由其他指令完成），那整个程序就可以实现向后兼容。注意：PTX可以向后兼容，那能不能兼容更早的架构呢？我测试过几次，感觉是不行，一般会报209错误cudaErrorNoKernelImageForDevice，即使实际运行需要的feature在当前显卡上是能支持的。所以一般建议编译成PTX的时候，gencode的版本低一些比较好，现在CUDA 11好像最低支持到compute_30（对应sm30），意味着更早的芯片就不能跑了。

当然，PTX的兼容性也有一些成本。尽管PTX是比较接近汇编的语言，其JIT编译还是会消耗一些时间。如果Kernel运行时间本来很短，那这个成本就会相对更高。不过driver会对之前的编译结果做一些cache，所以重复运行的overhead并不大。但是这个cache一般重启后也会消失，所以下次用还是要重新编译。而如果编译时在FatBinary中已经有对应的SASS版本，就不再有jit的这个overhead了。

官方支持：PTX是NVIDIA官方支持的最底层，有相关的文档（见Parallel Thread Execution ISA）和完善的工具链（NVCC，cuobjdump，PTXAS等等），也可以在driver api中load，甚至支持cuda C中inline PTX assembly。而SASS这层只有非常简略的介绍SASS Instruction Set Reference，虽然其中也提供了一些工具如nvdisasm和cuobjdump做一些分析，但也非常局限。Debug上两者倒是差别不大，NSight功能比较完善了，现在应该是可以支持cuda C/PTX/SASS三个层级的debug。

对于大多数用户来讲，如果需要基于PTX开发，是有完整的官方文档和工具链的，而且在官方论坛上也可以得到一定的支持。但是要基于SASS开发则基本需要白手起家，因为连基本的官方汇编器都没有。因为官方只提供了简单的反汇编器（nvdisasm和cuobjdump），control codes之类也不会显示。不过有一些第三方的汇编器，如asfermi，maxas等等，但因为是非官方版本，功能有限且容易出错，仅做研究用，产品代码一般并不推荐。

PTX的兼容性是NVIDIA能够进行快速架构迭代的重要手段。从某种意义上讲，功能是刚性需求，性能是弹性需求。所以兼容性都是保证功能可以延续，但性能则可以根据需要调整。SASS可以根据硬件实现和市场需求来选择最合适的指令集，而PTX则在它基础上构建相对稳定的feature列表。假如某个feature价值很高，SASS可以专门为他设计一条高性能指令，即使实现这个指令开销很大也值得。但如果后来这个功能重要性下降，那就可以把这条硬件指令删掉，用其他指令来凑成这个功能，从而把这个硬件指令的开销省下来。也有的时候是找到了某个功能更好的实现方式，从而替换了原来的指令，而两者的用法可以相同，也可以不同，但在PTX层是可以完全一致的。同时，编译器的发展也为SASS的发展演化提供了很大的帮助。从Kepler开始，NVIDIA就可以将一些控制逻辑交给编译器来做，有人称为control codes，将来会细讲。在Kepler中，每条指令是64bit，每8条指令中有一条会专门编码control codes。到了Maxwell和Pascal，则是每4条指令中有一条control codes。到了Volta和Turing架构，每条指令长度由64bit变成了128bit，这样每条指令都能够编码control codes。这些改变对大多数的用户程序几乎都是透明的，这就得益于PTX所提供的兼容性。如果说SASS要像X86那样必须完全支持先前版本的所有二进制程序，那势必背上沉重的历史包袱，功能更新和迭代速度上显然就会受到极大限制了。

我们可以写个简单的CUDA C程序（存为cudatest.cu）来看看具体的代码生成：

#include "cuda_runtime.h"

__global__ void func(int c, int* a)
{
    int idx = threadIdx.x + blockIdx.x * blockDim.x;
    a[idx] *= c;
}

int main()
{
    return 0;
}

然后用nvcc来编译。我这里用的cuda 10.2 on win8.1，我这里已经把nvcc所在目录加到了环境变量。注意环境变量中还要有相应的C/C++编译器，比如VS的cl等，否则nvcc会报错。编译命令如下：

nvcc cudatest.cu -o cudatest -gencode=arch=compute_30,code="sm_30,compute_30" -gencode=arch=compute_52,code="sm_52,compute_52" -gencode=arch=compute_75,code="sm_75,compute_75"

这里写了很多-gencode=*，用来控制具体要生成哪些PTX和SASS代码。 arch=compute_30表示基于compute_30的virtual GPU architecture，但它只是我们前面提到的控制使用feature的子集，并不控制是否生成具体PTX代码。后面的code="sm_30,compute_30"才表示代码生成列表。其中sm_30表示基于sm_30的架构生成相应SASS代码，compute_30表示基于compute_30的虚拟架构生成相应PTX代码，这个必须与前面arch=*一致。前面也提到了PTX有向后兼容性，所以这里也可以基于compute_30生成多个架构的SASS代码，比如code="sm_30,sm_50,sm_75"等等，注意这里不写compute_30表示不再生成对应PTX代码了，也就是说其他sm版本就跑不了这个程序了。

多个-gencode=*可以支持多个虚拟架构列表，而每个都可以按这个逻辑来控制代码生成。所有的代码生成后会被打包成FatBinary，内嵌在程序中供调用。程序运行时driver会去判断是否有编译好的对应架构的SASS版本，如果没有就从可选的PTX中JIT编译一个（印象中是挑可用的最高版本）。如果是没有合适的PTX文件，比如它最低支持的是compute_50，但是我只有sm_35的卡，那运行程序就会返回209错误cudaErrorNoKernelImageForDevice。注意：CUDA里很多错误是不造成CPU运行中断或抛出异常的，需要手动check返回值。运行kernel没有返回值，就只好用cudaGetLastError来检查错误，当然这里要记得要先做cudaDeviceSynchronize()。

NVCC支持的选项很多，有兴趣的同学可以自己去看文档。在VS里控制代码生成比较简单，只需要把项目属性中CUDA C/C++的device下的CodeGeneration改掉就行，多个就用分号隔开。比如上面的就可以直接写compute_30,sm_30;compute_52,sm_52;compute_75,sm_75。如果只是单个cu文件要改，那就在那个cu文件对应的属性中改。

编译完成后，我们可以把生成的SASS和PTX代码dump出来看一下：

cuobjdump -ptx cudatest.exe > cudatest.ptx
cuobjdump -sass cudatest.exe > cudatest.sass

其中PTX代码节选如下。因为这里没有用到太多版本相关的feature，所以对应compute_30/compute_52/compute_75的三个版本基本就没啥变化，只是target不一样而已，所以这里我只列了一个。最前面的.version 6.5表示PTX ISA的版本，具体版本变化可以看PTX的官方文档。

.version 6.5
.target sm_30
.address_size 64

.visible .entry _Z4funciPi(
.param .u32 _Z4funciPi_param_0,
.param .u64 _Z4funciPi_param_1
)
{
.reg .b32 %r<8>;
.reg .b64 %rd<5>;

ld.param.u32 %r1, [_Z4funciPi_param_0];
ld.param.u64 %rd1, [_Z4funciPi_param_1];
cvta.to.global.u64 %rd2, %rd1;

mov.u32 %r2, %tid.x;
mov.u32 %r3, %ctaid.x;
mov.u32 %r4, %ntid.x;

mad.lo.s32 %r5, %r4, %r3, %r2;
mul.wide.s32 %rd3, %r5, 4;
add.s64 %rd4, %rd2, %rd3;
ld.global.u32 %r6, [%rd4];
mul.lo.s32 %r7, %r6, %r1;
st.global.u32 [%rd4], %r7;

ret;
}

再来看生成的SASS代码，注意这里我们先只关注反汇编后的机器代码部分（相当于常说的.text部分）。实际上为了保证模块的正常载入和kernel的运行，还需要一些其他信息，这些其实是放在对应cubin文件的其他section中，以后有机会再讲。首先是sm_30也就是Kepler架构的SASS代码：

arch = sm_30
code version = [1,7]
producer = 
host = windows
compile_size = 64bit

    code for sm_30
        Function : _Z4funciPi
    .headerflags    @"EF_CUDA_SM30 EF_CUDA_PTX_SM(EF_CUDA_SM30)"
                                                                          /* 0x2282c28042823307 */
        /*0008*/                   MOV R1, c[0x0][0x44];                  /* 0x2800400110005de4 */
        /*0010*/                   S2R R0, SR_TID.X;                      /* 0x2c00000084001c04 */
        /*0018*/                   S2R R3, SR_CTAID.X;                    /* 0x2c0000009400dc04 */
        /*0020*/                   IMAD R0, R3, c[0x0][0x28], R0;         /* 0x20004000a0301ca3 */
        /*0028*/                   MOV32I R3, 0x4;                        /* 0x180000001000dde2 */
        /*0030*/                   ISCADD R2.CC, R0, c[0x0][0x148], 0x2;  /* 0x4001400520009c43 */
        /*0038*/                   IMAD.HI.X R3, R0, R3, c[0x0][0x14c];   /* 0x208680053000dce3 */
                                                                          /* 0x20000002e04283f7 */
        /*0048*/                   LD.E R0, [R2];                         /* 0x8400000000201c85 */
        /*0050*/                   IMUL R4, R0, c[0x0][0x140];            /* 0x5000400500011ca3 */
        /*0058*/                   ST.E [R2], R4;                         /* 0x9400000000211c85 */
        /*0060*/                   EXIT;                                  /* 0x8000000000001de7 */
        /*0068*/                   BRA 0x68;                              /* 0x4003ffffe0001de7 */
        /*0070*/                   NOP;                                   /* 0x4000000000001de4 */
        /*0078*/                   NOP;                                   /* 0x4000000000001de4 */
        .....................

然后是sm_52也就是Maxwell架构的SASS代码：

arch = sm_52
code version = [1,7]
producer = 
host = windows
compile_size = 64bit

    code for sm_52
        Function : _Z4funciPi
    .headerflags    @"EF_CUDA_SM52 EF_CUDA_PTX_SM(EF_CUDA_SM52)"
                                                                                   /* 0x001c7c00e22007f6 */
        /*0008*/                   MOV R1, c[0x0][0x20] ;                          /* 0x4c98078000870001 */
        /*0010*/                   S2R R0, SR_TID.X ;                              /* 0xf0c8000002170000 */
        /*0018*/                   S2R R2, SR_CTAID.X ;                            /* 0xf0c8000002570002 */
                                                                                   /* 0x001fd840fec20ff1 */
        /*0028*/                   XMAD R0, R2.reuse, c[0x0] [0x8], R0 ;           /* 0x4e00000000270200 */
        /*0030*/                   XMAD.MRG R3, R2.reuse, c[0x0] [0x8].H1, RZ ;    /* 0x4f107f8000270203 */
        /*0038*/                   XMAD.PSL.CBCC R2, R2.H1, R3.H1, R0 ;            /* 0x5b30001800370202 */
                                                                                   /* 0x001fc800fcc207f1 */
        /*0048*/                   SHR R0, R2.reuse, 0x1e ;                        /* 0x3829000001e70200 */
        /*0050*/                   ISCADD R2.CC, R2, c[0x0][0x148], 0x2 ;          /* 0x4c18810005270202 */
        /*0058*/                   IADD.X R3, R0, c[0x0][0x14c] ;                  /* 0x4c10080005370003 */
                                                                                   /* 0x081fd860fe2007b5 */
        /*0068*/                   LDG.E R0, [R2] ;                                /* 0xeed4200000070200 */
        /*0070*/                   XMAD R5, R0.reuse, c[0x0] [0x140], RZ ;         /* 0x4e007f8005070005 */
        /*0078*/                   XMAD.MRG R6, R0.reuse, c[0x0] [0x140].H1, RZ ;  /* 0x4f107f8005070006 */
                                                                                   /* 0x001ffc00fe2007f2 */
        /*0088*/                   XMAD.PSL.CBCC R0, R0.H1, R6.H1, R5 ;            /* 0x5b30029800670000 */
        /*0090*/                   STG.E [R2], R0 ;                                /* 0xeedc200000070200 */
        /*0098*/                   EXIT ;                                          /* 0xe30000000007000f */
                                                                                   /* 0x001f8000fc0007ff */
        /*00a8*/                   BRA 0xa0 ;                                      /* 0xe2400fffff07000f */
        /*00b0*/                   NOP;                                            /* 0x50b0000000070f00 */
        /*00b8*/                   NOP;                                            /* 0x50b0000000070f00 */
        .....................

最后是sm_75，也就是Turing架构的SASS代码：

arch = sm_75
code version = [1,7]
producer = 
host = windows
compile_size = 64bit

    code for sm_75
        Function : _Z4funciPi
    .headerflags    @"EF_CUDA_SM75 EF_CUDA_PTX_SM(EF_CUDA_SM75)"
        /*0000*/                   MOV R1, c[0x0][0x28] ;                 /* 0x00000a0000017a02 */
                                                                          /* 0x000fd00000000f00 */
        /*0010*/                   S2R R2, SR_TID.X ;                     /* 0x0000000000027919 */
                                                                          /* 0x000e220000002100 */
        /*0020*/                   MOV R5, 0x4 ;                          /* 0x0000000400057802 */
                                                                          /* 0x000fc60000000f00 */
        /*0030*/                   S2R R3, SR_CTAID.X ;                   /* 0x0000000000037919 */
                                                                          /* 0x000e240000002500 */
        /*0040*/                   IMAD R2, R3, c[0x0][0x0], R2 ;         /* 0x0000000003027a24 */
                                                                          /* 0x001fc800078e0202 */
        /*0050*/                   IMAD.WIDE R2, R2, R5, c[0x0][0x168] ;  /* 0x00005a0002027625 */
                                                                          /* 0x000fd400078e0205 */
        /*0060*/                   LDG.E.SYS R0, [R2] ;                   /* 0x0000000002007381 */
                                                                          /* 0x000ea400001ee900 */
        /*0070*/                   IMAD R5, R0, c[0x0][0x160], RZ ;       /* 0x0000580000057a24 */
                                                                          /* 0x004fd000078e02ff */
        /*0080*/                   STG.E.SYS [R2], R5 ;                   /* 0x0000000502007386 */
                                                                          /* 0x000fe2000010e900 */
        /*0090*/                   EXIT ;                                 /* 0x000000000000794d */
                                                                          /* 0x000fea0003800000 */
        /*00a0*/                   BRA 0xa0;                              /* 0xfffffff000007947 */
                                                                          /* 0x000fc0000383ffff */
        /*00b0*/                   NOP;                                   /* 0x0000000000007918 */
                                                                          /* 0x000fc00000000000 */
        /*00c0*/                   NOP;                                   /* 0x0000000000007918 */
                                                                          /* 0x000fc00000000000 */
        /*00d0*/                   NOP;                                   /* 0x0000000000007918 */
                                                                          /* 0x000fc00000000000 */
        /*00e0*/                   NOP;                                   /* 0x0000000000007918 */
                                                                          /* 0x000fc00000000000 */
        /*00f0*/                   NOP;                                   /* 0x0000000000007918 */
                                                                          /* 0x000fc00000000000 */
        .....................

对比一下可以发现三个版本的SASS的一些差异：

1. 一个显著的区别就是control codes的变化，Kepler是1+7，Maxwell是1+3，两者反汇编后指令编码前没有对应指令文本的那些行，就是control codes。Turing的control codes是内嵌在每条指令中，但并没有占用完整的64bit。所以Turing的反汇编中的无文本的指令行其实有很多bit也是参与指令编码的，不都是control codes。

2. 即使对于最简单的指令NOP, Kepler中的编码是0x4000000000001de4，Maxwell是0x50b0000000070f00，Turing是0x0000000000007918，0x000fc00000000000（第二个64bit中含有control code）。所以尽管反汇编后的指令助记词没变化，但实际上ISA还是不一样的，只是支持同样的指令功能而已。

3. Kepler中的int32的乘法用的是IMAD和IMUL，而Maxwell中都用的三个XMAD来组合，Turing中用回了IMAD。但如果看算地址常用的形式：uint64+int32*int32，Kepler和Maxwell都用的是类似LEA的ISCADD指令，Turing中用的是IMAD.WIDE。这些都是同样的功能在不同版本的SASS中采用了不同的实现，而它们对应的PTX代码是一模一样的。

这次就先讲这么多吧~ 下次讲讲SASS的分类和基本的指令发射逻辑。有些东西我也没有研究得很仔细，仅供参考~ 如果有什么问题，欢迎各位批评指正~

【React】List使用QueueAnim动画效果不生效——QueueAnim与函数组件兼容性问题 Yvette-W React react.js list 前端前端框架 javascript
版本：“antd-mobile”:“^5.37.1”,“rc-queue-anim”:“^2.0.0”,问题在使用QueueAnim时，如果动画的子元素是AntDesignMobile中的组件（如List.Item），可能会遇到动画不生效的问题，并且会看到类似以下警告：Warning:Functioncomponentscannotbegivenrefs.Attemptstoaccessthisr
HTML5！进击2025web蓝桥杯复习之路 Deepsleep. html5 前端 html
#HTML5全面解析##目录1.[HTML5简介](#1-html5-简介)2.[基本标签](#2-基本标签)3.[新特性](#3-新特性)4.[本地存储](#4-本地存储)5.[总结](#5-总结)---##1.HTML5简介HTML5是HTML的第五个主要版本，2014年由W3C正式发布。主要特性包括：-语义化标签-多媒体支持-图形绘制（Canvas/SVG）-本地存储能力-WebWorker
What's new in dubbo-go v3.3.0
我们dubbogo社区很高兴地宣布发布最新版本v3.3.0！这一版本带来了多个Bug修复、新特性以及代码优化，显著提升了dubbogo的稳定性与功能性。版本亮点在本次更新中，我们对多个核心组件进行了改进，以解决服务发现、注册中心相关的问题，并优化内存管理，减少内存泄漏。此外，我们增强了底层通信库的错误处理能力，并提升了系统的整体稳定性，为Go开发者提供更强大、更可靠的微服务开发体验。本次更新的主要
人品大爆发，还是全面介绍一下Squirrel语言！！ steel_de_lee 语言虚拟机 lua float 文档 lambda
rel="File-List"href="file:///C:%5CDOCUME%7E1%5Cibm%5CLOCALS%7E1%5CTemp%5Cmsohtml1%5C01%5Cclip_filelist.xml">使用了Squirrel一段时间，对这个新语言也有所了解了，还是决定写一个语言本身的介绍，算是在国内抛砖引玉吧。我目前使用的是Squirrel2.2版，这是一个稳定的版本，文档也比较齐全
Orange 单体架构 - 快速启动 mmd0308 Orange 开源项目架构开源
1后端服务1.1基础设施组件说明版本MySQLMySQL数据库服务5.7/8+JavaJava17redis-stackRedis向量数据库最新版本Node安装Node22.11.0+1.2orange-dependencies-parent项目Maven依赖版本管理1.2.1项目克隆GitHubgitclonehttps://github.com/hengzq/orange-dependenci
云计算习题「已注销」
云计算一、单选题二、多选题三、实操题单选题多选题实操题一、单选题下面哪个是软件代码版本控制软件？（B）A.projectB.SVNC.notepad++D.Xshell为满足金融业务的监管和安全要求，平台不需要考虑下列哪个应用?（A）A.文档版本管理B.防火墙策略C.安全漏洞扫描D.多租户安全隔离以下哪一个是项目收尾过程的正确顺序？（C）A.得到正式验收、解散团队、写出经验教训、结束合同B.写出经
SAP-ABAP：SAP生产业务（PP模块）全流程深度解析爱喝水的鱼丶 VIP详情查看专栏 SAP ABAP 开发运维运维系统架构
SAP生产业务（PP模块）全流程深度解析一、生产主数据架构体系1.主数据矩阵物料主数据工艺路线工作中心生产版本MRP运行2.核心主数据表数据对象表结构关键字段事务码物料主数据MARAMATNR,MTART,DISMMMM01工艺路线PLKO/PLPOPLNNR(路由号),VORNR(工序)CA01工作中心CRHD/CRTXARBPL(工作中心),KAPAR(能力)CR01BOMMAST/STPOS
基于Redis分布锁+事务补偿解决数据不一致性问题 yiridancan 并发编程 Redis 分布式 redis 数据库缓存
基于Redis的分布式设备库存服务设计与实现概述本文介绍一个基于Redis实现的分布式设备库存服务方案，通过分布式锁、重试机制和事务补偿等关键技术，保证在并发场景下库存操作的原子性和一致性。该方案适用于物联网设备管理、分布式资源调度等场景。代码实现importjava.util.HashMap;importjava.util.Map;importorg.slf4j.Logger;importorg
MySQL密码修改的全部方式一篇详解 1加1等于 MySQL mysql 数据库
本文将详细介绍多种修改MySQL密码的方式。本文目录一、alteruser语句操作步骤二、setpassword操作步骤三、直接修改mysql.user表操作步骤一、alteruser语句当你以root用户或者拥有足够权限的用户登录MySQL时，可以使用ALTERUSER语句来修改密码。这种方式适用于MySQL5.7及以上版本，简单直接，且符合MySQL的标准操作规范。操作步骤首先，使用以下命令登
vggt 3d重建相机位姿，新视角生成 AI算法网奇 3D视觉人工智能深度学习
vggt动态追踪实时重建https://github.com/facebookresearch/vggtimporttorchfromvggt.models.vggtimportVGGTfromvggt.utils.load_fnimportload_and_preprocess_imagesdevice="cuda"iftorch.cuda.is_available()else"cpu"dtyp
图神经网络实战——分层自注意力网络盼小辉丶图神经网络从入门到项目实战神经网络人工智能深度学习
图神经网络实战——分层自注意力网络0.前言1.分层自注意力网络1.1模型架构1.2节点级注意力1.3语义级注意力1.4预测模块2.构建分层自注意力网络相关链接0.前言在异构图数据集上，异构图注意力网络的测试准确率为78.39%，比之同构版本有了较大提高，但我们还能进一步提高准确率。在本节中，我们将学习一种专门用于处理异构图的图神经网络架构，分层自注意力网络(hierarchicalself-att
华为云计算产品系列 | 云上迁移工具RainBow实战详解降世神童云计算技术专栏华为华为云云计算
华为云计算产品系列|云上迁移工具RainBow实战详解1.迁移方案2.迁移流程3.迁移实验3.1.Windows系统迁移3.2.Linux系统迁移3.3.存储层迁移1.迁移方案 RainBow可以将物理机或者虚拟机上的业务迁移到华为的虚拟化平台和私有云平台（6.5.1以上支持），还可以实现低版本私有云迁移到高版本私有云。 Rainbow是华为自研迁移工具，支持X86架构下主流的Linux、Wi
【技巧分享】开发环境配置Python、R、Stata A线上仓库 python 开发语言
自用，看心情更新~版本更新2024-03-131.0版本2024-09-25FIX:1.conda命令ADD：1.python调用r命令2.r系统配置2025-01-22更新VSCode调用Statado文件目录版本更新Python环境配置Cheatsheet基础配置可选：环境配置：conda命令包管理R环境配置基础配置R命令Python调用Method1:`rpy2`Stata环境配置基础配置P
Windows 图形显示驱动开发-WDDM 2.7功能- 支持跨适配器资源扫描 (CASO) 程序员王马 windows图形显示驱动开发 windows 驱动开发
Microsoft计算驱动程序模型概述在Windows10版本1903（WDDM2.6）及更高版本中，Microsoft计算驱动程序模型（MCDM）可用于为支持仅计算功能的设备编写驱动程序。MCDM驱动程序或仅计算驱动程序是Windows显示驱动程序模型2.0+（WDDM）的缩减子集。在WDDM术语中，驱动程序必须将自身播发为“仅呈现”设备，而无需显示功能。“呈现设备”的内核支持很灵活，因为设备执
手把手教你完成 MATLAB 的下载安装与激活（详细图文教程）徐浪老师徐浪老师大讲堂 matlab 开发语言
引言MATLAB是当前最流行的科学计算软件之一，被广泛应用于工程、数学、金融等多个领域。对于新用户而言，下载安装MATLAB可能会遇到一些困惑。本文将以详细步骤、清晰截图的形式，为您介绍MATLAB的下载、安装及激活的完整过程。一、下载安装前的准备工作在开始下载安装之前，请确保以下事项已准备妥当：1.系统需求MATLAB对系统配置有一定要求，具体包括：操作系统：Windows10或更新版本，mac
pycharm中使用anaconda部署python环境_pycharm部署配置anaconda环境教程 weixin_39796652
本篇文章小编给大家分享一下pycharm部署配置anaconda环境教程，小编觉得挺不错的，现在分享给大家供大家参考，有需要的小伙伴们可以来看看。pycharm部署anaconda环境Pycharm：python编辑器，社区版本Anaconda：开源的python发行版本(专注于数据分析的python版本)，包含大量的科学包环境基本指令(准备工作)：conda--version查看anaconda
Android安全通信实现 Ya-Jun android 安全
Android安全通信实现前言在移动应用开发中，网络通信安全至关重要。本文将详细介绍Android平台上的安全通信实现方案，包括HTTPS协议、证书验证、双向认证等核心技术，帮助开发者构建安全可靠的网络通信机制。一、HTTPS基础知识1.1HTTPS原理HTTPS（超文本传输安全协议）是HTTP协议的安全版本，通过SSL/TLS协议进行加密通信，确保数据传输的安全性。1.1.1SSL/TLS协议工
Electron打包文件生成.exe文件打开即可使用糕冷小美n electron javascript 前端
1、Electron打包，包括需要下载的内容和环境配置步骤注意：Electron是一个使用JavaScript、HTML和CSS构建跨平台桌面应用程序的框架首先需要电脑环境有Node.js和npm我之前的文章有关nvm下载node的说明也可以去官网下载检查是否有node和npm环境命令node-vnpm-v输出版本号，说明安装成功2、创建Electron项目2.1创建项目目录打开命令行工具，创建一
雷军从 6 楼扔涂有防弹涂层西瓜，西瓜完好无损，这种防弹涂层是什么材质？用在车上效果怎么样？日记成书热门实事材质网络运维
雷军展示的“防弹涂层”是一种基于第四代高分子材料聚脲（Polyurea）的升级技术，其核心特性是通过纳米级交联结构形成弹性防护层，兼具柔韧性与刚性，能够有效吸收冲击能量并抵御尖锐物体的穿刺。以下是关于该涂层材质及在车用场景中的详细分析：一、防弹涂层的材质与技术特性材料本质该涂层属于聚脲材料的升级版本，由异氰酸酯与氨基化合物反应生成。其分子链结构密集交错，形成类似“钢筋网”的防护层，可瞬间形变吸收冲
使用GitHub API进行智能文档加载 fgayif github python
GitHub是一个强大的开发者平台，提供了代码存储、管理和分享的功能。它采用Git软件，增强了分布式版本控制，同时提供了访问控制、错误跟踪、软件功能请求、任务管理、持续集成和项目的wiki等功能。随着AI技术的发展，我们可以利用GitHub的API实现智能文档加载，以便更好地进行代码管理和分析。下面我将介绍如何使用GitHubAPI进行文档加载，并通过实用的代码示例来帮助大家理解。技术背景介绍Gi
CentOS7 python安装Ta-lib 0.6.x【talib不能直接安装，必须先安装ta_lib之c++库才可以】 weixin_43343144 服务器运维
正常流程：CentOS7python安装Ta-lib【talib不能直接安装，必须先安装ta_lib之c++库才可以】_centos7安装ta-lib-CSDN博客不同的版本参考如下！参考官方文档：ta-lib·PyPI务必下载匹配版本的【ta-lib-0.6.4-src.tar.gz】才可以正常安装$wgethttps://github.com/ta-lib/ta-lib/releases/do
基于Python PYQT5 的相机定时采集图像程序，GUI打包独立运行夏时summer time python qt 数码相机相机
基于PythonPYQT5编写相机定时采集图像及手动采集版本介绍Python3.6pyqt55.15.4pyqt5-tools5.15.4.3.2另外就是常用的cv2和numpy包fromPyQt5importQtCore,QtGui,QtWidgetsfromPyQt5importQtCore,QtGui,QtWidgetsimportcv2importnumpyasnpfromdatetime
若依集成knife4j实现swagger文档增强 Roc-xb knife4j
knife4j的前身是swagger-bootstrap-ui，为了契合微服务的架构发展,由于原来swagger-bootstrap-ui采用的是后端Java代码+前端Ui混合打包的方式,在微服务架构下显的很臃肿,因此项目正式更名为knife4j。目录一、单体版本1、ruoyi-admin\pom.xml模块添加整合依赖2、SwaggerController.java修改跳转访问地址二、前后端分离
区块链环境配置自用 Xmas190 其它区块链
FabricLab1.Fabric环境搭建与基本操作2.Fabric链码基础3.Fabric项目架构Fabric实践一：环境搭建与基本操作一、Fabric环境搭建本文用于指导Fabric在基于Ubuntu的Linux系统中的安装与配置，如有未安装过的同学可以参考本指南自行配置。相关组件版本号：名称版本Ubuntu16.04Fabric1.4Docker20.10.5Docker-compose1.
Mac下载python并安装小小酥*
下载pythonPython官网：https://www.python.org/进入官网后点击download，选择MacOSX版本2.安装MAC系统一般都自带有Python2.x版本的环境，你也可以在链接https://www.python.org/downloads/mac-osx/上下载最新版安装。3.设置环境变量程序和可执行文件可以在许多目录，而这些路径很可能不在操作系统提供可执行文件的搜
npm错误 gyp错误 vs版本不对 msvs_version不兼容澎湖Java架构师前端 html npm node.js 前端
npm错误gyp错误vs版本不对msvs_version不兼容windowsSDK报错执行更新GYP语句第一种方案第二种方案执行更新GYP语句npminstall-gnode-gyp最新的GYP好像已经不支持Python2.7版本，npm会提示你更新都3.*.*版本安装Node.js的时候一定要勾选以下这个，会自动检测安装缺少的环境第一种方案管理员运行CMD（PowerShell也行）执行更新工具
npm error gyp info 计算机辅助工程 npm 前端 node.js
在使用npm安装Node.js包时，可能会遇到各种错误，其中gyp错误是比较常见的一种。gyp是Node.js的一个工具，用于编译C++代码。这些错误通常发生在需要编译原生模块的npm包时。下面是一些常见的原因和解决方法：常见原因及解决方法Python未安装或版本不兼容：Node.js使用Python来运行gyp。确保你的系统上安装了Python，并且版本与node-gyp兼容。通常推荐使用Pyt
sqlmap笔记君如尘网络安全-渗透笔记笔记
1.运行环境sqlmap是用Python编写的，因此首先需要确保你的系统上安装了Python。sqlmap支持Python2.6、2.7和Python3.4及以上版本。2.常用命令通用格式：bythonsqlmap.py-r注入点地址--参数-rpost请求-uget请求--level=测试等级--risk=测试风险-v显示详细信息级别-p针对某个注入点注入-threads更改线程数，加速--ba
JDK8新特性陈天在睡觉知识点总结 JavaSE java JDK8 javase 八股文后端
JDK8是官方发布的一个大版本,提供了很多新特性功能给开发者使用,包含语言、编译器、库、工具和JVM等方面的十多个新特性。本文将介绍编码过程中常用的一些新特性。一、Lambda表达式1.优点简化匿名内部类的写法，允许你以简洁的方式表示可传递给方法或存储在变量中的代码块，用更加简洁和表达性的语法来编写匿名函数，从而简化了对函数式接口的实现，使代码更加简洁紧凑。提高了代码的可读性和可维护性，尤其是在处
spark explain如何使用 fzip Spark spark 执行计划
在Spark中，explain是分析SQL或DataFrame执行计划的核心工具，通过不同模式可展示查询优化和执行的详细信息，默认情况下，这个语句只提供关于物理计划的信息。以下是具体使用方法及不同模式的作用：1.explain的基本语法在Spark3.0及以上版本，explain支持多种模式参数，通过mode指定输出格式：#DataFrame调用方式df.explain(mode="simple"
对股票分析时要注意哪些主要因素？会飞的奇葩猪股票分析云掌股吧
　　众所周知，对散户投资者来说，股票技术分析是应战股市的核心武器，想学好股票的技术分析一定要知道哪些是重点学习的，其实非常简单，我们只要记住三个要素：成交量、价格趋势、振荡指标。一、成交量　　大盘的成交量状态。成交量大说明市场的获利机会较多，成交量小说明市场的获利机会较少。当沪市的成交量超过150亿时是强市市场状态，运用技术找综合买点较准；
【Scala十八】视图界定与上下文界定 bit1129 scala
Context Bound，上下文界定，是Scala为隐式参数引入的一种语法糖，使得隐式转换的编码更加简洁。隐式参数首先引入一个泛型函数max，用于取a和b的最大值 def max[T](a: T, b: T) = { if (a > b) a else b } 因为T是未知类型，只有运行时才会代入真正的类型，因此调用a >
C语言的分支——Object-C程序设计阅读有感 darkblue086 apple c 框架 cocoa
自从1972年贝尔实验室Dennis Ritchie开发了C语言，C语言已经有了很多版本和实现，从Borland到microsoft还是GNU、Apple都提供了不同时代的多种选择，我们知道C语言是基于Thompson开发的B语言的，Object-C是以SmallTalk-80为基础的。和C++不同的是，Object C并不是C的超集，因为有很多特性与C是不同的。 Object-C程序设计这本书
去除浏览器对表单值的记忆周凡杨 html 记忆 autocomplete form 浏览
&n
java的树形通讯录 g21121 java
最近用到企业通讯录，虽然以前也开发过，但是用的是jsf，拼成的树形，及其笨重和难维护。后来就想到直接生成json格式字符串，页面上也好展现。 // 首先取出每个部门的联系人 for (int i = 0; i < depList.size(); i++) { List<Contacts> list = getContactList(depList.get(i
Nginx安装部署 510888780 nginx linux
Nginx ("engine x") 是一个高性能的 HTTP 和反向代理服务器，也是一个 IMAP/POP3/SMTP 代理服务器。 Nginx 是由 Igor Sysoev 为俄罗斯访问量第二的 Rambler.ru 站点开发的，第一个公开版本0.1.0发布于2004年10月4日。其将源代码以类BSD许可证的形式发布，因它的稳定性、丰富的功能集、示例配置文件和低系统资源
java servelet异步处理请求墙头上一根草ｊａｖａ异步返回ｓｅｒｖｌｅｔ
servlet3.0以后支持异步处理请求，具体是使用AsyncContext ，包装httpservletRequest以及httpservletResponse具有异步的功能， final AsyncContext ac = request.startAsync(request, response); ac.s
我的spring学习笔记8-Spring中Bean的实例化 aijuans Spring 3
在Spring中要实例化一个Bean有几种方法： 1、最常用的（普通方法） <bean id="myBean" class="www.6e6.org.MyBean" /> 使用这样方法，按Spring就会使用Bean的默认构造方法，也就是把没有参数的构造方法来建立Bean实例。（有构造方法的下个文细说） 2、还
为Mysql创建最优的索引 annan211 mysql 索引
索引对于良好的性能非常关键，尤其是当数据规模越来越大的时候，索引的对性能的影响越发重要。索引经常会被误解甚至忽略，而且经常被糟糕的设计。索引优化应该是对查询性能优化最有效的手段了，索引能够轻易将查询性能提高几个数量级，最优的索引会比较好的索引性能要好2个数量级。 1 索引的类型 (1) B-Tree 不出意外，这里提到的索引都是指 B-
日期函数百合不是茶 oracle sql 日期函数查询
ORACLE日期时间函数大全 TO_DATE格式(以时间:2007-11-02 13:45:25为例) Year: yy two digits 两位年显示值:07 yyy three digits 三位年显示值:007
线程优先级 bijian1013 java thread 多线程 java多线程
多线程运行时需要定义线程运行的先后顺序。线程优先级是用数字表示，数字越大线程优先级越高，取值在1到10，默认优先级为5。实例： package com.bijian.study; /** * 因为在代码段当中把线程B的优先级设置高于线程A,所以运行结果先执行线程B的run()方法后再执行线程A的run()方法 * 但在实际中，JAVA的优先级不准，强烈不建议用此方法来控制执
适配器模式和代理模式的区别 bijian1013 java 设计模式
一.简介适配器模式：适配器模式（英语：adapter pattern）有时候也称包装样式或者包装。将一个类的接口转接成用户所期待的。一个适配使得因接口不兼容而不能在一起工作的类工作在一起，做法是将类别自己的接口包裹在一个已存在的类中。 &nbs
【持久化框架MyBatis3三】MyBatis3 SQL映射配置文件 bit1129 Mybatis3
SQL映射配置文件一方面类似于Hibernate的映射配置文件，通过定义实体与关系表的列之间的对应关系。另一方面使用<select>,<insert>,<delete>，<update>元素定义增删改查的SQL语句，这些元素包含三方面内容 1. 要执行的SQL语句 2. SQL语句的入参，比如查询条件 3. SQL语句的返回结果
oracle大数据表复制备份个人经验 bitcarter oracle 大表备份大表数据复制
前提：数据库仓库A（就拿oracle11g为例）中有两个用户user1和user2,现在有user1中有表ldm_table1,且表ldm_table1有数据5千万以上，ldm_table1中的数据是从其他库B（数据源）中抽取过来的，前期业务理解不够或者需求有变，数据有变动需要重新从B中抽取数据到A库表ldm_table1中。
HTTP加速器varnish安装小记 ronin47 http varnish 加速
上午共享的那个varnish安装手册，个人看了下，有点不知所云，好吧~看来还是先安装玩玩！苦逼公司服务器没法连外网，不能用什么wget或yum命令直接下载安装，每每看到别人博客贴出的在线安装代码时，总有一股羡慕嫉妒“恨”冒了出来。。。好吧，既然没法上外网，那只能麻烦点通过下载源码来编译安装了！ Varnish 3.0.4下载地址： http://repo.varnish-cache.org/
java-73-输入一个字符串，输出该字符串中对称的子字符串的最大长度 bylijinnan java
public class LongestSymmtricalLength { /* * Q75题目：输入一个字符串，输出该字符串中对称的子字符串的最大长度。 * 比如输入字符串“google”，由于该字符串里最长的对称子字符串是“goog”，因此输出4。 */ public static void main(String[] args) { Str
学习编程的一点感想 Cb123456 编程感想 Gis
写点感想，总结一些，也顺便激励一些自己.现在就是复习阶段，也做做项目. 本专业是GIS专业，当初觉得本专业太水，靠这个会活不下去的，所以就报了培训班。学习的时候，进入状态很慢，而且当初进去的时候，已经上到Java高级阶段了，所以.....，呵呵，之后有点感觉了，不过，还是不好好写代码，还眼高手低的，有
[能源与安全]美国与中国 comsci 能源
现在有一个局面：地球上的石油只剩下N桶，这些油只够让中国和美国这两个国家中的一个顺利过渡到宇宙时代，但是如果这两个国家为争夺这些石油而发生战争，其结果是两个国家都无法平稳过渡到宇宙时代。。。。而且在战争中，剩下的石油也会被快速消耗在战争中，结果是两败俱伤。。。在这个大
SEMI-JOIN执行计划突然变成HASH JOIN了的原因分析 cwqcwqmax9 oracle
甲说： A B两个表总数据量都很大，在百万以上。 idx1 idx2字段表示是索引字段 A B 两表上都有 col1字段表示普通字段 select xxx from A where A.idx1 between mmm and nnn and exists (select 1 from B where B.idx2 =
SpringMVC-ajax返回值乱码解决方案 dashuaifu Ajax springMVC response 中文乱码
SpringMVC-ajax返回值乱码解决方案一：（自己总结，测试过可行） ajax返回如果含有中文汉字，则使用：（如下例：） @RequestMapping(value="/xxx.do") public @ResponseBody void getPunishReasonB
Linux系统中查看日志的常用命令 dcj3sjt126com OS
因为在日常的工作中，出问题的时候查看日志是每个管理员的习惯，作为初学者，为了以后的需要，我今天将下面这些查看命令共享给各位 cat tail -f 日志文件说明 /var/log/message 系统启动后的信息和错误日志，是Red Hat Linux中最常用的日志之一 /var/log/secure 与安全相关的日志信息 /var/log/maillog 与邮件相关的日志信
[应用结构]应用 dcj3sjt126com PHP yii2
应用主体应用主体是管理 Yii 应用系统整体结构和生命周期的对象。每个Yii应用系统只能包含一个应用主体，应用主体在入口脚本中创建并能通过表达式 \Yii::$app 全局范围内访问。补充: 当我们说"一个应用"，它可能是一个应用主体对象，也可能是一个应用系统，是根据上下文来决定[译：中文为避免歧义，Application翻译为应
assertThat用法 eksliang JUnit assertThat
junit4.0 assertThat用法一般匹配符1、assertThat( testedNumber, allOf( greaterThan(8), lessThan(16) ) ); 注释： allOf匹配符表明如果接下来的所有条件必须都成立测试才通过，相当于“与”（&&） 2、assertThat( testedNumber, anyOf( g
android点滴2 gundumw100 应用服务器 android 网络应用 OS HTC
如何让Drawable绕着中心旋转？ Animation a = new RotateAnimation(0.0f, 360.0f, Animation.RELATIVE_TO_SELF, 0.5f, Animation.RELATIVE_TO_SELF,0.5f); a.setRepeatCount(-1); a.setDuration(1000); 如何控制Andro
超简洁的CSS下拉菜单 ini html Web 工作 html5 css
效果体验：http://hovertree.com/texiao/css/3.htmHTML文件： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>简洁的HTML+CSS下拉菜单-HoverTree</title>
kafka consumer防止数据丢失 kane_xie kafka offset commit
kafka最初是被LinkedIn设计用来处理log的分布式消息系统，因此它的着眼点不在数据的安全性（log偶尔丢几条无所谓），换句话说kafka并不能完全保证数据不丢失。尽管kafka官网声称能够保证at-least-once，但如果consumer进程数小于partition_num，这个结论不一定成立。考虑这样一个case，partiton_num=2
@Repository、@Service、@Controller 和 @Component mhtbbx DAO spring bean prototype
@Repository、@Service、@Controller 和 @Component 将类标识为Bean Spring 自 2.0 版本开始，陆续引入了一些注解用于简化 Spring 的开发。@Repository注解便属于最先引入的一批，它用于将数据访问层 (DAO 层 ) 的类标识为 Spring Bean。具体只需将该注解标注在 DAO类上即可。同时，为了让 Spring 能够扫描类
java 多线程高并发读写控制误区 qifeifei java thread
先看一下下面的错误代码，对写加了synchronized控制，保证了写的安全，但是问题在哪里呢？ public class testTh7 { private String data; public String read(){ System.out.println(Thread.currentThread().getName() + "read data "
mongodb replica set(副本集)设置步骤 tcrct java mongodb
网上已经有一大堆的设置步骤的了，根据我遇到的问题，整理一下，如下：首先先去下载一个mongodb最新版，目前最新版应该是2.6 cd /usr/local/bin wget http://fastdl.mongodb.org/linux/mongodb-linux-x86_64-2.6.0.tgz tar -zxvf mongodb-linux-x86_64-2.6.0.t
rust学习笔记 wudixiaotie 学习笔记
1.rust里绑定变量是let，默认绑定了的变量是不可更改的，所以如果想让变量可变就要加上mut。 let x = 1; let mut y = 2; 2.match 相当于erlang中的case，但是case的每一项后都是分号，但是rust的match却是逗号。 3.match 的每一项最后都要加逗号，但是最后一项不加也不会报错，所有结尾加逗号的用法都是类似。 4.每个语句结尾都要加分

cuda nvcc版本不一致_CUDA微架构与指令集（2）-SASS指令集概述

你可能感兴趣的:(cuda,nvcc版本不一致)