Briwisdom

基于矩阵乘的CUDA编程优化过程

背景：网上很多关于矩阵乘的编程优化思路，本着看理论分析万遍，不如实际代码写一遍的想法，大概过一下优化思路。

矩阵乘的定义如下，约定矩阵的形状及存储方式为: A[M, K], B[K, N], C[M, N]。

$C_{i,j}=\sum_{k=0}^{n}A_{ik}\times B_{kj}$

CPU篇

朴素实现方法

按照常规的思路，实现矩阵乘时如下的3层for循环。

#define OFFSET(row, col, ld) ((row) * (ld) + (col))
void cpuSgemm(float *a, float *b, float *c, const int M, const int N, const int K) 
{
    for (int m = 0; m < M; m++) {
        for (int n = 0; n < N; n++) {
            float psum = 0.0;
            for (int k = 0; k < K; k++) {
                psum += a[OFFSET(m, k, K)] * b[OFFSET(k, n, N)];
            }
            c[OFFSET(m, n, N)] = psum;
        }
    }
}

数据访存连续的优化

矩阵B的存储默认为N方向连续，所以可以将上面的第2，3层循环互换顺序，这样B的取数就不会跨行了，而是连续取数，达到访问连续的效果。

void cpuSgemm_1(float *a, float *b, float *c, const int M, const int N, const int K) 
{
    for (int m = 0; m < M; m++) {
        for (int k = 0; k < K; k++) {
            for (int n = 0; n < N; n++)
            {
                c[OFFSET(m, n, N)] += a[OFFSET(m, k, K)] * b[OFFSET(k, n, N)];
            }           
        }
    }
}

数据重排/数据复用的优化

上面将M，N，K的for循环调整为M，K，N的循环顺序，导致我们K方向累加不能缓存了，增加了多次访问C矩阵的开销，所以我们不放先直接将B矩阵转置处理，然后再按照原始的M，N，K的for循环来处理。

void cpuSgemm_2(float *a, float *b, float *c, const int M, const int N, const int K) 
{
    float* b1=(float*) malloc(sizeof(float)*K*N);
    for(int i=0; i

 
  性能表现 
          如下是测试CPU环境下这几种方法的时间情况，其中M=N=512, K =256。可以发现经过优化后的代码在时间上是逐步减少的。 
          CPU的优化思路还有其他的，比如循环展开，intrinsic函数，基于cache的矩阵切分等，注意本文并没有都实现出来。 
  cpuSgemm, Time measured: 416889 microseconds.
cpuSgemm_1, Time measured: 405259 microseconds.
cpuSgemm_2, Time measured: 238786 microseconds. 
  GPU篇 
  grid线程循环矩阵乘法 
          输出矩阵C有M*N个点，每个点是K个数的乘积和，所以可以定义每个线程计算K个点的乘积和，即grid线程循环矩阵乘法。 
  __global__ void matrix_multiply_gpu_0(float*a, float*b, float*c, int M, int N, int K)
{
    int tidx =threadIdx.x;
    int bidx = blockIdx.x;
    int idx = bidx * blockDim.x +tidx;
    int row = idx/N;
    int col = idx%N;
    if(row
 
  block线程循环矩阵乘法 
          grid内线程循环的矩阵乘法有如下缺憾：一个block内线程可能需要计算C矩阵不同行的矩阵元素，block内thread对相应的A矩阵访存不一致，导致无法广播和额外的访存开销，导致执行时间增加。 
          针对这个问题，可以做如下改进：每个block计算C矩阵的一行，block内的thread以固定跳步步长blockDim.x的方法循环计算C矩阵的一行，每一行启动一个block，共计M个block。 
  __global__ void matrix_multiply_gpu_1(float*a, float*b, float*c, int M, int N, int K)
{
    int tidx =threadIdx.x;
    int bidx = blockIdx.x;

    float tmp;
    for(;bidx
 
  行共享存储矩阵乘法 
          共享存储与L1 Cache同级，其访存延迟较全局存储小一个量级。用共享存储代替全局存储是GPU最重要的优化手段之一。采用共享存储优化的关键是数据复用，数据复用次数越多，共享存储优化可获得的收益也越高。 
          在block循环乘法中，1个block内所有thread都会用到A矩阵的一行，此时与B矩阵每一列相乘，A矩阵中该行复用了N次。故可以考虑将A矩阵的一行读入shared memory，运算时候从shared memory读取相应的数据。 
          注意代码中TILE_WIDTH>=K。 
  #define TILE_WIDTH 256
__global__ void matrix_multiply_gpu_2(float*a, float*b, float*c, int M, int N, const int K)
{
    __shared__ float data[TILE_WIDTH];
    int tid = threadIdx.x;
    int row = blockIdx.x;
    int i,j;
    for(i=tid; i
 
  分块共享存储矩阵乘法 
          根据上面共享存储的理解，我们很自然的想到把B矩阵也考虑数据复用，所以可以同时把A，B矩阵都分成棋盘似的小尺寸的数据块，从全局内存读取到共享内存，这样可以有效降低数据访问时间，充分复用矩阵乘的局部数据。 
  #define TILE_SIZE 32
__global__ void matrix_multiply_gpu_3(float*a, float*b, float*c, int M, int N, const int K)
{
    __shared__ float matA[TILE_SIZE][TILE_SIZE];
	__shared__ float matB[TILE_SIZE][TILE_SIZE];
	
	int bx = blockIdx.x;
	int by = blockIdx.y;
	int tx = threadIdx.x;
	int ty = threadIdx.y;
	
    int Col = bx * TILE_SIZE + tx;
	int Row = by * TILE_SIZE + ty;
	
	float Pervalue = 0.0;
	for(int i = 0;i < K / TILE_SIZE;i++)  
	{
		matA[ty][tx] = a[Row * K + (i * TILE_SIZE + tx)];
		matB[ty][tx] = b[Col + (i * TILE_SIZE + ty) * N];
		__syncthreads();
	
		for(int k = 0;k < TILE_SIZE;k++) 
			Pervalue += matA[ty][k] * matB[k][tx];
		__syncthreads();
	}
	
	c[Row * N + Col] = Pervalue;
    
} 
  性能表现 
  利用nvprof工具，统计各个核函数的执行时间如下，可以发现每一步优化思路都能直观的带来的性能提升。 
   
  完整代码: 
  GitHub - Briwisdom/study_CUDA_examples: some demos for study CUDA program. 
  #include 
#include 

using namespace std;

#define OFFSET(row, col, ld) ((row) * (ld) + (col))

void initDate(float *arr,int Len, bool randFlag=true)
{
    if (randFlag)
    {
        for (int i = 0; i < Len; i++) {
            arr[i] = rand()/1000000;
        }
    }
    else
    {
        float value =0.0;
        for (int i = 0; i < Len; i++) {
            arr[i] = value;
        }
    }  
}

void compare_result(float *x, float *y, int n, char *name)
{
    int cnt=0;
    for (int i=0; i(end0 - begin0);
    printf("%s, Time measured: %d microseconds.\n", name, int(elapsed0.count()/repeat));
}

__global__ void matrix_multiply_gpu_0(float*a, float*b, float*c, int M, int N, int K)
{
    int tidx =threadIdx.x;
    int bidx = blockIdx.x;
    int idx = bidx * blockDim.x +tidx;
    int row = idx/N;
    int col = idx%N;
    if(row>>(d_a, d_b, d_c0, M, N, K);
    cudaMemcpy(c_gpu_0, d_c0, sizeof(float)*M*N, cudaMemcpyDeviceToHost);
    compare_result(c, c_gpu_0,  M*N,"gpu_0");
    cudaFree(d_c0);

    cudaMemcpy(d_c1, c_gpu_1, sizeof(float)*M*N, cudaMemcpyHostToDevice);
    matrix_multiply_gpu_1<<>>(d_a, d_b, d_c1, M, N, K);
    cudaMemcpy(c_gpu_1, d_c1, sizeof(float)*M*N, cudaMemcpyDeviceToHost);
    compare_result(c, c_gpu_1,  M*N,"gpu_1");
    cudaFree(d_c1);

    cudaMemcpy(d_c2, c_gpu_2, sizeof(float)*M*N, cudaMemcpyHostToDevice);
    matrix_multiply_gpu_2<<>>(d_a, d_b, d_c2, M, N, K);
    cudaMemcpy(c_gpu_2, d_c2, sizeof(float)*M*N, cudaMemcpyDeviceToHost);
    compare_result(c, c_gpu_2,  M*N,"gpu_2");
    cudaFree(d_c2);

    threadnum=32;
    dim3 gridSize(M / threadnum,N / threadnum);
	dim3 blockSize(threadnum,threadnum);
    cudaMemcpy(d_c3, c_gpu_3, sizeof(float)*M*N, cudaMemcpyHostToDevice);
    matrix_multiply_gpu_3<<>>(d_a, d_b, d_c3, M, N, K);
    cudaMemcpy(c_gpu_3, d_c3, sizeof(float)*M*N, cudaMemcpyDeviceToHost);
    compare_result(c, c_gpu_3,  M*N,"gpu_3");
    cudaFree(d_c3);


    free(a);
    free(b);
    free(c);
    free(c1);
    free(c2);
    free(c_gpu_0);
    free(c_gpu_1);
    free(c_gpu_2);
    free(c_gpu_3);
    cudaFree(d_a);
    cudaFree(d_b);

}


    
        你可能感兴趣的:(性能测试,CUDA编程,matmul,矩阵乘)
        
            
                
                    梯度下降法理论理解
                        伶星37
机器学习人工智能
                        梯度下降法：看似原始却透露着机器学习的本质前提：在研究梯度下降方法之前，你要理解矩阵运算（解析解）的方法矩阵运算目前的缺点只能进行对线性函数经行分析，无法对复杂的函数经行分析什么是梯度，以及梯度向量梯度下降的形象例子以及基本思想有三个兄弟被困在山上，得要死，他们目标是看谁尽快找到山谷中的水源老大比较后选择最陡的方向随便探索一下，就朝较低处走去探测几下就走陡峭的方向梯度下降算法的核心思想就是沿着负梯
                    
                    《Astro 3.0 岛屿架构实战：用「零JS」打造百万PV内容网站》
                        前端极客探险家
架构javascript开发语言
                        文章目录一、传统内容站点的性能困局1.1企业级项目性能调研（N=200+）1.2Astro核心优势矩阵二、十分钟构建高性能内容站点2.1项目初始化2.2核心配置文件三、六大企业级场景实战3.1场景一：多框架组件混用3.2场景二：交互增强型Markdown四、性能优化深度解析4.1优化前后数据对比4.2关键优化策略五、企业级架构方案5.1内容站点技术栈5.2流量突增应对方案六、调试与监控体系6.1性
                    
                    揭秘:矩阵短视频源码系统功能设计!!!
                        程序员~17734800326
短视频矩阵矩阵矩阵源码java前端数据库python算法
                        矩阵短视频系统源码功能设计一、原始功能设计概述矩阵系统源码系统旨在为企业提供一套全面的短视频管理解决方案，涵盖从内容创作到发布的全流程。通过集成多种先进技术和工具，支持多平台账号统一管理、高效内容剪辑与批量生成、多样化的发布方式以及详尽的数据统计分析，助力企业在短视频领域实现规模化运营。二、核心功能模块跨平台账号整合：该模块允许企业对其在抖音、快手、B站等多个主流短视频平台上的多个账户进行集中授权
                    
                    练1：编写一个 NumPy 程序来创建一个 10x10 矩阵，其中边界上的元素是 1，内部元素是 0。练2:编写一个 NumPy 程序来创建一个 4x4 矩阵，其中 0 和 1 交错，主对角线都是0.
                        weixin_57738499
numpy矩阵线性代数
                        importnumpyasnp'''练习1：编写一个NumPy程序来创建一个10x10矩阵，其中边界上的元素是1，内部元素是0。'''x1=np.ones((10,10))#创建一个10行10列全1的数组x1[1:-1,1:-1]=0print(x1)'''练习2:编写一个NumPy程序来创建一个4x4矩阵，其中0和1交错，主对角线都是0。'''x2=np.zeros((4,4))x2[::2,1
                    
                    最大矩阵面积问题
                        syzyc
杂项最大矩阵面积问题
                        问题概述最大矩阵面积问题有两种：在一个网格图中，一些格子里有障碍，求在网格图中规划一个矩形，使得它不会覆盖任何一个障碍格且面积最大。在一个平面直角坐标系中，先给你规定一个大矩形（一般左下角是(0,0)(0,0)(0,0)，右上角是(MaxX,MaxY)(MaxX,MaxY)(MaxX,MaxY)），有一些障碍点，求在这个大矩形中规划一个小矩形，使得它不会覆盖每一个障碍点（障碍点可在矩形边缘）。具体
                    
                    SAP-ABAP：SAP生产业务（PP模块）全流程深度解析
                        爱喝水的鱼丶
VIP详情查看专栏SAPABAP开发运维运维系统架构
                        SAP生产业务（PP模块）全流程深度解析一、生产主数据架构体系1.主数据矩阵物料主数据工艺路线工作中心生产版本MRP运行2.核心主数据表数据对象表结构关键字段事务码物料主数据MARAMATNR,MTART,DISMMMM01工艺路线PLKO/PLPOPLNNR(路由号),VORNR(工序)CA01工作中心CRHD/CRTXARBPL(工作中心),KAPAR(能力)CR01BOMMAST/STPOS
                    
                    # LeetCode题解：最大正方形面积
                        小学仔
java动态规划算法leetcode矩阵
                        ##题目描述在一个由`'0'`和`'1'`组成的二维矩阵中，找到只包含`'1'`的最大正方形，并返回其面积。**示例**：```输入：matrix=[["1","0","1","0","0"],["1","0","1","1","1"],["1","1","1","1","1"],["1","0","0","1","0"]]输出：4```解释：最大正方形的边长为2，面积为4。---##解题思路##
                    
                    R语言基础常用代码总结
                        WhyteHighmore
代码r语言开发语言
                        基础代码#基础操作ls()#变量列表rm(var.3)cat()#多个输出sink("r_test.txt",split=TRUE)#读写文件分开始与结束#路径操作getwd():获取当前工作目录setwd():设置当前工作目录#基础运算10%/%3#整除<−、=、<<−#左赋值1%in%a#判断元素是否在向量里E%*%t(E)#用于矩阵与它转置的矩阵相乘#数学函数sqrt(n)#n的平方根exp
                    
                    AF3 rot_matmul 和 rot_vec_mul函数解读
                        qq_27390023
生物信息学深度学习pytorchpython
                        AlphaFold3rigid_utils模块的rot_matmul和rot_vec_mul函数实现了手动计算两个旋转矩阵的乘法A×B以及矩阵-向量乘法R×t，避免了直接用矩阵乘法的AMP（AutomaticMixedPrecision）问题。源代码：defrot_matmul(a:torch.Tensor,b:torch.Tensor)->torch.Tensor:"""Performsmatr
                    
                    算法训练（leetcode）第四十六天 | 110. 字符串接龙、105. 有向图的完全可达性、106. 岛屿的周长
                        Star Patrick
刷题日记算法leetcode职场和发展
                        刷题记录*110.字符串接龙105.有向图的完全可达性邻接矩阵邻接表106.岛屿的周长深搜简化代码*110.字符串接龙题目地址使用广搜。本题相当于求最短路径，因此使用广搜。如何应用广搜是一个难点，因为题目给的是字符串而非图的表示（邻接矩阵、邻接表），因此需要自行构建连接关系。题目要求每一步只能修改一个字符，因此从起始字符串开始，对字符串中的每一个字符进行修改，修改后在输入的字符串列表中查找是否存在
                    
                    【深度学习与大模型基础】第7章-特征分解与奇异值分解
                        lynn-66
深度学习与大模型基础算法机器学习人工智能
                        一、特征分解特征分解（EigenDecomposition）是线性代数中的一种重要方法，广泛应用于计算机行业的多个领域，如机器学习、图像处理和数据分析等。特征分解将一个方阵分解为特征值和特征向量的形式，帮助我们理解矩阵的结构和性质。1.特征分解的定义对于一个n×n的方阵A，如果存在一个非零向量v和一个标量λ，使得：则称λ为矩阵A的特征值，v为对应的特征向量。特征分解将矩阵A分解为：其中：Q是由特征
                    
                    【论文阅读】Persistent Homology Captures the Generalization of Neural Networks Without A Validation Set
                        开心星人
论文阅读论文阅读
                        将神经网络表征为加权的无环图，直接根据模型的权重矩阵构造PD。计算相邻batch的权重矩阵PD之间的距离。比较同调收敛性与神经网络的验证精度变化趋势摘要机器学习从业者通常通过监控模型的某些指标来估计其泛化误差，并在训练数值收敛之前停止训练，以防止过拟合。通常，这种误差度量或任务相关的指标是通过一个验证集（holdoutset）来计算的。因为这些数据没有直接用于更新模型参数，通常假设模型在验证集上的
                    
                    前端性能优化-知识点
                        甲亿
前端性能优化
                        Web性能优化意义1.减少整体加载时间：减小文件体积、减少HTTP请求、使用预加载。2.使网站尽快可用：仅加载首屏内容，其他内容根据需要进行懒加载。3.平滑和交互性：使用CSS替代JS动画、减少UI重绘。4.加载表现形式：使用加载动画、进度条、骨架屏等过渡信息，让用户感觉到页面加载更快。5.性能监测：性能指标、性能测试、性能监控持续优化等Web性能指标RAIL性能模型Response(响应)：快速
                    
                    IT项目管理第二章作业
                        是努力站桩的奶酪呀~
javapython
                        在管理具体项目时,项目管理团队应该根据具体需要裁剪()。A.组织过程资产B.组织结构C.组织文化D.事业环境因素在以下哪种组织中,项目经理能对项目资源进行最有力的控制?A.项目型组织B.项目指挥部组织C.强矩阵组织D.平衡式矩阵组织项目的技术工作已经全部完成,产品也通过了最终验收,接着应该开展以下哪一项工作?A.写项目总结B.遣散团队成员C.更新问题日志D.举办庆功宴在下列哪一种组织结构中,项目成
                    
                    图像质量评价学习笔记02：IQA模型性能评价指标（PLCC、SROCC、KROCC、RMSE）
                        可靠的豆包蟹同志
图像质量评估IQA图像处理计算机视觉人工智能算法
                        性能好的图像质量评价（IQA）算法，其质量评测分数会与主观质量分数高度一致，IQA有许多评价指标，为了衡量方法测试结果与主观评价之间的一致性，视频质量专家组VQEG（VideoQualityExpertsGroup，目前国际上对视频质量进行标准化及性能测试的权威组织）提出了四个可以验证客观评价结果和主观评价结果之间的紧密程度的四个指标：PLCC、SROCC、KROCC和RMSE，也是目前最常用的I
                    
                    机器学习knnlearn1
                        XW-ABAP
机器学习机器学习人工智能
                        importmatplotlib.pyplotaspltimportnumpyasnpimportoperator#定义一个函数用于创建数据集defcreateDataSet():#定义特征矩阵，每个元素是一个二维坐标点，代表不同策略数据点的坐标group=np.array([[20,3],[15,5],[18,1],[5,17],[2,15],[3,20]])#定义每个数据点对应的标签，用于区分
                    
                    软考 中级软件设计师 考点知识点笔记总结 day06
                        莫问alicia
软考中级软件设计师笔记数据结构算法
                        文章目录6、树和二叉树6.1、树的基本概念6.2、二叉树的基本概念6.3、二叉树的遍历6.4、查找二叉树（二叉排序树）BST6.5、构造霍夫曼树+6.6、线索二叉树6.7、平衡二叉树7、图7.1、存储结构-邻接矩阵7.2、存储结构-邻接表7.3、图的遍历7.4、拓扑排序7.5、最小生成树普利姆算法7.6、克鲁斯卡尔算法6、树和二叉树6.1、树的基本概念结点的度：一个结点的度是指该结点拥有的子树数量
                    
                    《基于自适应正负样本对比学习的特征提取框架》-核心公式提炼简洁版 2022年neural networks
                        阳光明媚大男孩
学习深度学习人工智能论文笔记
                        论文源地址以下是从文档中提取的关于“基于对比学习的特征提取框架（CL-FEFA）”中正负样本对比学习实现的技术细节，包括详细的数学公式、特征提取过程以及特征表示方式的说明。1.正负样本的定义与构造在CL-FEFA框架中，正负样本的定义是动态且自适应的，基于特征提取的结果，而不是预先固定的。这种自适应性是CL-FEFA区别于传统对比学习（如SimCLR、SupCon）的一个关键点。定义方式：指示矩阵
                    
                    1242: 二维数组输出（2）
                        呱呱呱~
算法
                        题目描述输入一个整数N，输出一个N行N列的二维矩阵，矩阵中的元素按列用1——N*N顺序填充。输入一个整数N（Nusingnamespacestd;intmain(){intN;cin>>N;//创建一个NxN的二维数组intmatrix[N][N];//按列填充数字for(intcol=0;col
                    
                    【广度优先搜索】1995: 细胞 cell
                        呱呱呱~
宽度优先算法
                        题目描述【问题描述】一矩形阵列由数字0到9组成，数字1到9代表细胞，细胞的定义为沿细胞数字上下左右还是细胞数字为同一细胞，求所给矩形阵列的细胞个数。如下阵列有4个细胞。0234500067103456050020456006710000000089Input【输入格式】整数m、n（m行n列）矩阵【输入样例】4100234500067103456050020456006710000000089Out
                    
                    A800核心加速技术深度剖析
                        智能计算研究中心
其他
                        内容概要作为第三代异构计算架构的典型代表，A800通过深度融合通用计算单元与专用加速模块，构建了高度灵活的资源调度体系。其核心突破在于将矩阵运算、并行任务分发与内存访问路径进行系统性重构，解决了传统架构中计算密度与能效失衡的行业痛点。通过实测数据显示，在典型AI训练场景下，A800相较于前代架构实现了3.2倍的吞吐量提升，同时单位功耗下的指令执行效率优化达47%。技术维度第二代架构A800架构提升
                    
                    重要重要！！fisher矩阵是怎么计算和更新的，以及计算过程中参数的物理含义
                        ZhangJiQun&MXP
教学2021论文2024大模型以及算力矩阵概率论线性代数windows微信机器学习
                        fisher矩阵是怎么计算和更新的，以及计算过程中参数的物理含义Fisher信息矩阵（FisherInformationMatrix,FIM）用于衡量模型参数估计的不确定性，其计算和更新在统计学、机器学习和优化中具有重要作用。以下是其计算和更新的关键步骤：一、Fisher矩阵的计算定义Fisher矩阵的元素表示对数似然函数关于参数的二阶导数的期望值的负数，即：Fi,j=−
                    
                    短视频矩阵系统源码新发布技术方案有那几种？
                        Yxh18137784554
短视频矩阵开发矩阵算法架构
                        短视频矩阵系统从21年发展到现在经历了历史性的发展高潮经过各平台的反复变化政策，短视频矩阵系统目前做的为数不多的同梯队的筷子科技、云罗抖去推、超级编导都选用的是什么方式的代发解决方案呢？今天小编就来给我的技术粉们分享下一下几种常见的开发方案#短视频矩阵系统##短视频矩阵系统还能用吗？##短视频矩阵系统源码##短视频矩阵系统代发/托管发都有什么解决方案?短视频矩阵系统源码新发布的技术方案通常有以下几
                    
                    事务回滚核心技术
                        KBkongbaiKB
java
                        一、事务回滚的数学本质与核心挑战1.1事务状态机模型操作执行持久化完成系统故障事务回滚ActivePartiallyCommittedCommittedFailedAborted1.2核心技术挑战矩阵问题维度单机事务分布式事务原子性保证存储引擎WAL日志二阶段提交协议隔离性实现MVCC多版本控制全局锁调度机制可见性管理事务ID版本链向量时钟同步回滚触发条件SQL执行异常/死锁网络分区/节点故障二、
                    
                    深度学习篇---对角矩阵&矩阵的秩&奇异矩阵
                        Ronin-Lotus
程序代码篇深度学习篇深度学习矩阵人工智能线性代数
                        文章目录前言一、对角矩阵（DiagonalMatrix）1.1定义1.2特性行列式运算简化1.3应用领域深度学习信号处理量子力学经济学二、矩阵的秩（RankofaMatrix）2.1定义2.2特性满秩降秩影响2.3应用领域深度学习图像压缩推荐系统控制理论三、奇异矩阵（SingularMatrix）3.1定义3.2特性秩不足行列式为零3.3应用领域深度学习正则化损失函数结构工程统计学数值计算四、跨领
                    
                    matlab两矩阵相似性,两个矩阵同时相似对角化MATLAB程序.docx
                        weixin_39870664
matlab两矩阵相似性
                        两个矩阵同时相似对角化MATLAB程序摘要：使用Matlab语言设计出实现两个复矩阵同时相似对角化的计算机程序。关键词：同时相似对角化；Matlab；程序矩阵对角化是重要的数学方法，但因其计算过程繁琐，人们往往望之生畏，尤其是多个矩阵同时对角化问题，因此本文设计出判断及计算两个复矩阵能否同时相似对角化的Matlab程序，用此能够方便地解决两个复矩阵同时相似对角化问题。1.理论基础定义［1］：设A、
                    
                    【数学建模】熵权法
                        烟锁池塘柳0
数学建模数学建模算法
                        熵权法介绍熵权法是一种常用的用于多指标决策问题中的权重确定方法，它通过对决策矩阵的熵值进行计算，来自动地评估各个指标的权重。熵值能够反映各个指标的不确定性，熵值越小，表明该指标的信息量越大，反之亦然。熵权法可以避免人为设定权重的问题，通过熵权法确定的权重是一个客观量，只和数据本身的性质有关。熵权法在多目标优化问题中具有广泛的应用。文章目录熵权法介绍1.熵权法的基本原理2.熵权法步骤步骤1：标准化决
                    
                    Python列表的创建
                        只是没遇到
python
                        Python3列表序列是Python中最基本的数据结构。序列中的每个值都有对应的位置值，称之为索引，第一个索引是0，第二个索引是1，依此类推。Python有6个序列的内置类型，但最常见的是列表和元组。列表都可以进行的操作包括索引，切片，加，乘，检查成员。此外，Python已经内置确定序列的长度以及确定最大和最小的元素的方法。列表是最常用的Python数据类型，它可以作为一个方括号内的逗号分隔值出现
                    
                    【MATLAB】
                        不掉发的小刘
MATLABmatlab开发语言
                        数学计算与运算基础数学函数函数名功能示例sin(x)正弦函数sin(pi/2)→1cos(x)余弦函数cos(0)→1sqrt(x)平方根sqrt(4)→2exp(x)指数函数exp(1)→e≈2.718log(x)自然对数log(e)→1abs(x)绝对值abs(5)→5线性代数函数名功能示例A\b解线性方程组Ax=bA=21;11,b=3;2,x=A\b→x=1;1det(A)矩阵行列式det
                    
                    线性代数介绍
                        ZhuBin365
其它机器学习线性代数人工智能
                        线性代数介绍线性代数是数学的一个重要分支，它研究向量空间、线性变换和线性方程组。其概念抽象，应用广泛，是现代科学技术中不可或缺的数学工具。本篇将详细解释线性代数中的核心概念，包括行列式、矩阵、向量与向量空间、线性方程组、特征值与特征向量以及二次型，力求深入浅出，帮助读者全面理解。一、行列式(Determinants)行列式是线性代数中一个fundamental的概念，它是一个将方阵映射到一个标量的
                    
                                对于规范和实现，你会混淆吗？
                                    yangshangchuan
HotSpot
                                    昨晚和朋友聊天，喝了点咖啡，由于我经常喝茶，很长时间没喝咖啡了，所以失眠了，于是起床读JVM规范，读完后在朋友圈发了一条信息： 
 
 JVM Run-Time Data Areas：The Java Virtual Machine defines various run-time data areas that are used during execution of a program. So
                                
                                android 网络
                                    百合不是茶
网络
                                    android的网络编程和java的一样没什么好分析的都是一些死的照着写就可以了,所以记录下来  方便查找   ,  服务器使用的是TomCat 
  
服务器代码;  servlet的使用需要在xml中注册 
package servlet;

import java.io.IOException;
import java.util.Arr
                                
                                [读书笔记]读法拉第传
                                    comsci
读书笔记
                                     
 
      1831年的时候,一年可以赚到1000英镑的人..应该很少的... 
 
      要成为一个科学家,没有足够的资金支持,很多实验都无法完成 
 
      但是当钱赚够了以后....就不能够一直在商业和市场中徘徊......
                                
                                随机数的产生
                                    沐刃青蛟
随机数
                                    c++中阐述随机数的方法有两种： 
  
一是产生假随机数（不管操作多少次，所产生的数都不会改变） 
  
       这类随机数是使用了默认的种子值产生的，所以每次都是一样的。 
  
	//默认种子
	for (int i = 0; i < 5; i++)
	{
		cout<<
                                
                                PHP检测函数所在的文件名
                                    IT独行者
PHP函数
                                    很简单的功能，用到PHP中的反射机制，具体使用的是ReflectionFunction类，可以获取指定函数所在PHP脚本中的具体位置。 创建引用脚本。 
代码： 
     
[php]   
view plain 
copy    
 
 // Filename: functions.php    
 <?php&nbs
                                
                                银行各系统功能简介
                                    文强chu
金融
                                    银行各系统功能简介     　   业务系统   核心业务系统     业务功能包括：总账管理、卡系统管理、客户信息管理、额度控管、存款、贷款、资金业务、国际结算、支付结算、对外接口等       清分清算系统     以清算日期为准，将账务类交易、非账务类交易的手续费、代理费、网络服务费等相关费用，按费用类型计算应收、应付金额，经过清算人员确认后上送核心系统完成结算的过程       国际结算系
                                
                                Python学习1(pip django 安装以及第一个project)
                                    小桔子
pythondjangopip
                                        最近开始学习python,要安装个pip的工具。听说这个工具很强大，安装了它，在安装第三方工具的话so easy!然后也下载了，按照别人给的教程开始安装，奶奶的怎么也安装不上！ 
第一步：官方下载pip-1.5.6.tar.gz, https://pypi.python.org/pypi/pip easy! 
第二部：解压这个压缩文件，会看到一个setup.p
                                
                                php 数组
                                    aichenglong
PHP排序数组循环多维数组
                                    1 php中的创建数组 
 $product = array('tires','oil','spark');//array()实际上是语言结构而不  是函数 
2 如果需要创建一个升序的排列的数字保存在一个数组中，可以使用range()函数来自动创建数组 
 $numbers=range(1,10)//1 2 3 4 5 6 7 8 9 10 
 $numbers=range(1,10,
                                
                                安装python2.7
                                    AILIKES
python
                                    安装python2.7 
1、下载可从 http://www.python.org/进行下载#wget https://www.python.org/ftp/python/2.7.10/Python-2.7.10.tgz 
2、复制解压 
#mkdir -p /opt/usr/python 
#cp  /opt/soft/Python-2
                                
                                java异常的处理探讨
                                    百合不是茶
JAVA异常
                                    //java异常  
/* 
1，了解java 中的异常处理机制，有三种操作 
a,声明异常  
b,抛出异常  
c,捕获异常 
2，学会使用try-catch-finally来处理异常 
3，学会如何声明异常和抛出异常 
4，学会创建自己的异常 
  
*/ 
  
//2，学会使用try-catch-finally来处理异常 
  
                                
                                getElementsByName实例
                                    bijian1013
element
                                    实例1： 
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/x
                                
                                探索JUnit4扩展：Runner
                                    bijian1013
java单元测试JUnit
                                            参加敏捷培训时，教练提到Junit4的Runner和Rule，于是特上网查一下，发现很多都讲的太理论，或者是举的例子实在是太牵强。多搜索了几下，搜索到两篇我觉得写的非常好的文章。 
        文章地址：http://www.blogjava.net/jiangshachina/archive/20
                                
                                [MongoDB学习笔记二]MongoDB副本集
                                    bit1129
mongodb
                                    1. 副本集的特性 
  1)一台主服务器(Primary),多台从服务器(Secondary) 
  2)Primary挂了之后，从服务器自动完成从它们之中选举一台服务器作为主服务器，继续工作，这就解决了单点故障，因此，在这种情况下，MongoDB集群能够继续工作 
  3)挂了的主服务器恢复到集群中只能以Secondary服务器的角色加入进来 
  
2
                                
                                【Spark八十一】Hive in the spark assembly
                                    bit1129
assembly
                                    Spark SQL supports most commonly used features of HiveQL. However, different HiveQL statements are executed in different manners: 
 
  1. DDL statements (e.g. CREATE TABLE, DROP TABLE, etc.)
                                
                                Nginx问题定位之监控进程异常退出
                                    ronin47

                                    nginx在运行过程中是否稳定，是否有异常退出过？这里总结几项平时会用到的小技巧。 
1. 在error.log中查看是否有signal项，如果有，看看signal是多少。 
比如，这是一个异常退出的情况： 
$grep signal error.log

2012/12/24 16:39:56 [alert] 13661#0: worker process 13666 exited on s
                                
                                No grammar constraints (DTD or XML schema).....两种解决方法
                                    byalias
xml
                                    方法一：常用方法   关闭XML验证 
工具栏：windows => preferences => xml => xml files => validation => Indicate when no grammar is specified:选择Ignore即可。 
 
方法二：（个人推荐） 
添加 内容如下 
<?xml version=
                                
                                Netty源码学习-DefaultChannelPipeline
                                    bylijinnan
netty
                                    package com.ljn.channel;

/**
 * ChannelPipeline采用的是Intercepting Filter 模式
 * 但由于用到两个双向链表和内部类，这个模式看起来不是那么明显，需要仔细查看调用过程才发现
 * 
 * 下面对ChannelPipeline作一个模拟，只模拟关键代码：
 */
public class Pipeline {
 
                                
                                MYSQL数据库常用备份及恢复语句
                                    chicony
mysql
                                      
备份MySQL数据库的命令，可以加选不同的参数选项来实现不同格式的要求。 
mysqldump -h主机 -u用户名 -p密码 数据库名 > 文件 
 
备份MySQL数据库为带删除表的格式，能够让该备份覆盖已有数据库而不需要手动删除原有数据库。 
mysqldump -–add-drop-table -uusername -ppassword databasename > ba
                                
                                小白谈谈云计算--基于Google三大论文
                                    CrazyMizzz
Google云计算GFS
                                        之前在没有接触到云计算之前，只是对云计算有一点点模糊的概念，觉得这是一个很高大上的东西，似乎离我们大一的还很远。后来有机会上了一节云计算的普及课程吧，并且在之前的一周里拜读了谷歌三大论文。不敢说理解，至少囫囵吞枣啃下了一大堆看不明白的理论。现在就简单聊聊我对于云计算的了解。 
    我先说说GFS 
  &n
                                
                                hadoop 平衡空间设置方法
                                    daizj
hadoopbalancer
                                    在hdfs-site.xml中增加设置balance的带宽，默认只有1M： 
<property> 
  <name>dfs.balance.bandwidthPerSec</name> 
    <value>10485760</value> 
    <description&g
                                
                                Eclipse程序员要掌握的常用快捷键
                                    dcj3sjt126com
编程
                                       判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。   曾有人在豆瓣评
《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个
程序员图书列表，目的也就是通过读书，让程序员变懒。     程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得
                                
                                Android学习之路
                                    dcj3sjt126com
Android学习
                                    转自：http://blog.csdn.net/ryantang03/article/details/6901459 
以前有J2EE基础，接触JAVA也有两三年的时间了，上手Android并不困难，思维上稍微转变一下就可以很快适应。以前做的都是WEB项目，现今体验移动终端项目，让我越来越觉得移动互联网应用是未来的主宰。 
下面说说我学习Android的感受，我学Android首先是看MARS的视
                                
                                java 遍历Map的四种方法
                                    eksliang
javaHashMapjava 遍历Map的四种方法
                                    转载请出自出处： 
http://eksliang.iteye.com/blog/2059996 
 
package com.ickes;

import java.util.HashMap;
import java.util.Iterator;
import java.util.Map;
import java.util.Map.Entry;
/**
 * 遍历Map的四种方式

                                
                                【精典】数据库相关相关
                                    gengzg
数据库
                                    package C3P0; 
import java.sql.Connection; 
import java.sql.SQLException; 
import java.beans.PropertyVetoException; 
import com.mchange.v2.c3p0.ComboPooledDataSource; 
public class DBPool{       
                                
                                自动补全
                                    huyana_town
自动补全
                                    <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml&quo
                                
                                jquery在线预览PDF文件，打开PDF文件
                                    天梯梦
jquery
                                    最主要的是使用到了一个jquery的插件jquery.media.js，使用这个插件就很容易实现了。 
  
核心代码 
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.
                                
                                ViewPager刷新单个页面的方法
                                    lovelease
androidviewpagertag刷新
                                      使用ViewPager做滑动切换图片的效果时，如果图片是从网络下载的，那么再子线程中下载完图片时我们会使用handler通知UI线程，然后UI线程就可以调用mViewPager.getAdapter().notifyDataSetChanged()进行页面的刷新，但是viewpager不同于listview，你会发现单纯的调用notifyDataSetChanged()并不能刷新页面
                                
                                利用按位取反（~）从复合枚举值里清除枚举值
                                    草料场
enum
                                    以 C# 中的 System.Drawing.FontStyle 为例。  
  
如果需要同时有多种效果， 
如：“粗体”和“下划线”的效果，可以用按位或（|） 
FontStyle style = FontStyle.Bold | FontStyle.Underline; 
  
如果需要去除 style 里的某一种效果， 
                                
                                Linux系统新手学习的11点建议
                                    刘星宇
编程工作linux脚本
                                    　　随着Linux应用的扩展许多朋友开始接触Linux，根据学习Windwos的经验往往有一些茫然的感觉：不知从何处开始学起。这里介绍学习Linux的一些建议。 
 
　　一、从基础开始：常常有些朋友在Linux论坛问一些问题，不过，其中大多数的问题都是很基础的。例如：为什么我使用一个命令的时候，系统告诉我找不到该目录，我要如何限制使用者的权限等问题，这些问题其实都不是很难的，只要了解了 Linu
                                
                                hibernate dao层应用之HibernateDaoSupport二次封装
                                    wangzhezichuan
DAOHibernate
                                    /** 
 * <p>方法描述:sql语句查询 返回List<Class> </p> 
 * <p>方法备注: Class 只能是自定义类 </p> 
 * @param calzz 
 * @param sql 
 * @return 
 * <p>创建人：王川</p> 
 * <p>创建时间：Jul
                                
                
            
        
    


    
        
            按字母分类：
            ABCDEFGHIJKLMNOPQRSTUVWXYZ其他
        
    


    
        
            首页 -
            关于我们 -
            站内搜索 -
            Sitemap -
            侵权投诉
        
        版权所有 IT知识库 CopyRight © 2000-2050 E-COM-NET.COM , All Rights Reserved.