yangxianpku

基于OpenCL的直方图均衡化图像增强

一、背景介绍
二、直方图均衡化简介

2.1 直方图归一化
2.2 直方图均衡化数学思想
2.3 直方图均衡化离散算法

三、OpenCL实现

3.1 kernel函数文件
3.2 cpp文件程序
3.3 运行效果图
3.4 程序说明

一、背景介绍

偶然一次机会，帮助一个留学生做一个期末大作业吧，之前一直用CUDA，毕竟CUDA的生态环境还是好一些，然后CUDA的API也相对高层一些，OpenCL的的API真的是太底层了，写了半天代码还没开始分配内存，选择一个平台下的设备、查询一个设备参数都好复杂. 当然不是说API底层些就不好，只是说开发效率效率相对低些. 比如，C语言比Python底层多了吧，不依然活得好好的，没有死掉瑟，而且貌似变异型语言的工程师都有点鄙视Python工程师(不是我说的哈，勿喷)。

话说回来，要不是这帮他做作业，我也不知道啥时候能用上OpenCL，反正钱也挣了，也学习到了，一举两得。OpenCL当然相比CUDA也是有优势的，比如我写这个程序的时候发现OpenCL竟然支持全局同步，这真的是让第一次写OpenCL的我，垂死病中惊坐起啊。当然OpenCL的跨平台，估计也是很多粉丝选择它的原因之一吧，不光支持各厂家的GPU，还支持CPU和FPGA，貌似搞金融的人使用OpenCL+FPGA是个不错的选择. 当然这个说法不准确，不是说支持各家GPU和FPGA，只能说各硬件厂商根据OpenCL标准进行了给予各自硬件的实现。因此OpenCL更多的是一个标准和规范而不是一个编程语言活一个变成框架. 好吧，废话就不多说了。

二、直方图均衡化简介

图像增强有很多方法，基于空域的、基于频域的、基于特征工程的以及基于深度学习的等等。我就简单讲解下基于直方图均衡化的算法理论吧，有点班门弄斧请莫见笑。

首先还是说一下图像增强的初衷吧。很多时候，我们获取到的图像，由于光线、角度、镜头物理状况、镜头像素、分辨率等各种原因，导致我们得到的图像不是特别清晰，这时我们需要使用数学的方法将图像进行增强，使得图像更清晰逼真。图像不清晰往往是由于图像的对比度不够，因为图像的灰度值集中在了某一个区间，而不是分布在一个较大的范围内。因此，我们要设计一种算法，把原本图像的灰度范围扩大，而不改变图像本身要展示给我们的内容信息。

2.1 直方图归一化

图像的灰度级别(彩色图也同理，只是有多个颜色通道)取值通常在0_{255之间共256个取值，为了方便处理，我们通常将其约束到0}1的范围内，具体算法很简单，如下：
$counts=\frac{counts}{M*N}$

2.2 直方图均衡化数学思想

为了便于分析，我们首先考虑灰度范围为0~1的情况，此时归一化的直方图即为概率密度函数：
$\quad 0\le x\le 1$
由概率密度函数的性质，有一下关系
$\int_{x=0}^{1}p(x)dx=1$
设均衡化前的概率密度函数为 $p_{r}(r)$ ,转换后的概率密度函数为 $p_{s}(s)$ ,转换函数(映射关系)为 $s = f (r)$ ,由概率理论知识得到
$p_{s}(s)=p_{r}(r)\frac{dr}{ds}$
因为我们想让转换后的图像灰度值在0~255区间比较均匀的分布，因此最理想的状态就是每个灰度级别下的像素点个数相近(概率相等)，因此我们假设 $p_{s}(s)=1$ ,则原式必须满足：
$KaTeX parse error: Undefined control sequence: \farc at position 9: p_r(r)=\̲f̲a̲r̲c̲{ds}{ds}$
等式两边积分，得
$s=f(r)=\int_{0}^{r}p_{r}(u)du$
该式被称为图像的累积分布函数(CDF)。

2.3 直方图均衡化离散算法

上式实在灰度值取[0,1]范围内的情况下推导出来的，对于[0,255]的情况，只要乘以最大灰度值 $D_{max}$ (对于灰度图即255)即可，此时灰度均衡的转换公式变为
$D_B=f(D_A)=D_{max}\int_{0}^{D_A} P_{D_A}(u)du$
其中， $D_B$ 为转换后的灰度值， $D_A$ 为转换前的灰度值。对于离散灰度级，相应的公式转换为
$D_B=f(D_A)=\frac{D_{max}}{A_0}\sum_{i=0}^{D_A}H_i$
式中， $H_i$ 为第 $i$ 级灰度的像素个数， $A_0$ 为图像的面积，即图像像素的总数。

三、OpenCL实现

程序主要有两个文件组成，一个是cpp文件，一个是OpenCL kenrel核函数文件，这里直接上代码。

3.1 kernel函数文件

/*
hist          总的直方图
local_hist    每个工作组内的局部直方图
data_per_item 每个工作项处理的像素个数
all_byte_size 图像大小，byte级别
*/
#pragma OPENCL EXTENSION cl_khr_global_uchar_base_atomics:enable      // 开启原子操作(基本原子操作在本地内存中的32位整数)
#pragma OPENCL EXTENSION cl_khr_local_uchar_base_atomics:enable       // 这个还是很重要的，不然会提示不支持原子操作的函数
#pragma OPENCL EXTENSION cl_khr_global_int32_base_atomics:enable
#pragma OPENCL EXTENSION cl_khr_local_int32_base_atomics:enable
__kernel void imgToHist(__global const uchar* imgMat, __global int* hist,
	__local int* local_hist, uint data_per_item, uint all_byte_size)
{
	int l_idx = get_local_id(0);
	int g_idx = get_global_id(0);
	local_hist[l_idx] = 0;                     // 局部直方图数据初始化，这个需要工作组大小为256
	barrier(CLK_LOCAL_MEM_FENCE);              // 局部同步，即等到共享(局部)内存更新完毕

	int item_offset = g_idx * data_per_item;   // 每个工作项处理的像素点位置偏移
	for (unsigned int i = item_offset; i < item_offset + data_per_item && i < all_byte_size; i++) {
		atomic_inc(local_hist + imgMat[i]);
		//atomic_add(local_hist+imgMat[i], 1);
	}

	// 全局同步,等待全部线程都执行到这里
	// 这个功能还是很牛逼的，因为CUDA就不支持全局同步，为了全局同步只能重启kernel，这个会有不少的性能影响
	// 这也是我目前发现的唯一OpenCL比CUDA牛逼的地方
	// 另外OpenCL的原子操作好像比CUDA功能全一些
	barrier(CLK_GLOBAL_MEM_FENCE);            

	// 将每个工作组中的共享内存中的局部直方图合并，整理成为全局直方图
	if (l_idx < 256) {                        
		atomic_add(hist + l_idx, local_hist[l_idx]);
	}
}

// 直方图均衡化，这个地方因为问题本身可并行性不强，所以这个函数的执行效率跟串行一致，甚至更低一些
/*
   hist     全局直方图
   hist_eq  均衡化后的直方图
   imgSize  图像像素点个数
*/
__kernel void histEq(__global const int* hist, __global int* hist_eq, const int imgSize)
{
	int l_idx = get_local_id(0);
	//if (l_idx >= 256) return;
	for (int i = 0; i <= l_idx; i++)
		hist_eq[l_idx] += hist[i];
	hist_eq[l_idx] = hist_eq[l_idx] * 255 / imgSize;
}

// 将均衡化的直方图用到图像上
__kernel void histEqToImg(__global uchar* imgMat, __global int* hist_eq)
{
	int g_idx = get_global_id(0);
	imgMat[g_idx] = hist_eq[imgMat[g_idx]];
}

3.2 cpp文件程序

#include 
#include 
#include "Utils.h"                  //   大神写的一个工具库，对OpenCL常用工具的一层warp，地址：https://github.com/gcielniak/OpenCL-Tutorials/tree/master/include
#include "CImg.h"                   //  一个跨平台的图像处理库工具

using namespace cimg_library;
using namespace std;

int platform_id = 0;                // 平台序号：如Intel CPU/GPU平台，NVIDIA CUDA平台等
int device_id = 0;                  // 设备id，因为一个系统中，一个平台下可能有几个设备，比如NVIDIA平台下我就有3张显卡
string img_filename = "test.ppm";   // 图像数据

void print_help();                  // 帮助函数声明
cl_uint histEqual();                // 基于OpenCL的直方图均衡化实现
cl_device_id getdevice(int platform_id, int device_id);     // 通过平台id和设备id获取一个OpenCL设备对象

int main(int argc, char **argv)
{
	for (int i = 1; i < argc; i++) {
		if ((strcmp(argv[i], "-p") == 0) && (i < (argc - 1))) { platform_id = atoi(argv[++i]); }
		else if ((strcmp(argv[i], "-d") == 0) && (i < (argc - 1))) { device_id = atoi(argv[++i]); }
		else if (strcmp(argv[i], "-l") == 0) { std::cout << ListPlatformsDevices() << std::endl; }
		else if ((strcmp(argv[i], "-f") == 0) && (i < (argc - 1))) { img_filename = argv[++i]; }
		else if (strcmp(argv[i], "-h") == 0) { print_help(); return 0; }
	}

	histEqual();
	return 0;
}

void print_help() {
	std::cerr << "Application usage:" << std::endl;
	std::cerr << "  -p : select platform " << std::endl;
	std::cerr << "  -d : select device" << std::endl;
	std::cerr << "  -l : list all platforms and devices" << std::endl;
	std::cerr << "  -f : input image file (default: test.ppm)" << std::endl;
	std::cerr << "  -h : print this message" << std::endl;
}

cl_uint histEqual()
{
	cl_int err = 0;
	cl_device_id dev = getdevice(platform_id, device_id);
	size_t max_item_per_group = 0;
	// 获取单个工作组内工作项的最大取值
	clGetDeviceInfo(dev, CL_DEVICE_MAX_WORK_GROUP_SIZE, sizeof(max_item_per_group), &max_item_per_group, NULL);

	// 从图像数据文件中读取数据，注意这里使用的类型为unsigned char
	// 另外，CImg图像除了有x,y,depth之外，还有一个spectrum维度，我到现在都不知道是啥，
	// 当初不知道这个时写程序还走了许多弯路，现在直接把图转化为灰度图
	CImg<unsigned char> img_input_spectrum(img_filename.c_str());
	int h = img_input_spectrum.height();
	int w = img_input_spectrum.width();

	int size_per_item = 32;                                                // 设置让每个工作项处理32个像素点                                    
	int global_work_item_size = ceil(w*h / (float)size_per_item);
	global_work_item_size = ceil(global_work_item_size / 256.0f) * 256;    // 设置全局工作项的大小

	CImg<unsigned char> img_input(w, h, 1, 1, 0);                          // 初始化一个灰度图
	cimg_forXY(img_input_spectrum, x, y)                                   // 设置灰度图像的灰度值，这个有点像匿名函数的节奏？
	{
		img_input(x, y) = img_input_spectrum(x, y);
	}

	//std::cout<< img_input.height() <<", "<< img_input.width() <<"," << img_input.size() << std::endl;
	//std::cout << img_input.depth() << std::endl;
	//std::cout << img_input.spectrum() << std::endl;
	CImgDisplay disp_input(img_input, "input");                            // 显示图像

	cimg::exception_mode(0);                                               // 设置CImg的异常处理模式
	try {

		cl::Context context = GetContext(platform_id, device_id);          // 根据平台和设备获取上下文
		std::cout << "Runing on " << GetPlatformName(platform_id) << ", " << GetDeviceName(platform_id, device_id) << std::endl;
		cl::CommandQueue queue(context);                                   // 创建队列
		cl::Program::Sources sources;
		AddSources(sources, "img_hist_equal.cl");                          // 获取源码
		cl::Program program(context, sources);                             // 创建程序

		try {
			program.build();                                               // 编译程序
		}
		catch (const cl::Error& err) {                                     // 编译异常处理
			std::cout << "Build Status: " << program.getBuildInfo<CL_PROGRAM_BUILD_STATUS>(context.getInfo<CL_CONTEXT_DEVICES>()[0]) << std::endl;
			std::cout << "Build Options:\t" << program.getBuildInfo<CL_PROGRAM_BUILD_OPTIONS>(context.getInfo<CL_CONTEXT_DEVICES>()[0]) << std::endl;
			std::cout << "Build Log:\t " << program.getBuildInfo<CL_PROGRAM_BUILD_LOG>(context.getInfo<CL_CONTEXT_DEVICES>()[0]) << std::endl;
			throw err;
		}

		// 声明设备内存，用于存放输入图像，处理结果(输出)也存在这里
		cl::Buffer dev_img_input(context, CL_MEM_READ_ONLY, sizeof(unsigned char)*w*h);   
		cl::Buffer hist(context, CL_MEM_READ_WRITE, sizeof(int) * 256);     // 全局直方图分配内存
		cl::Buffer hist_eq(context, CL_MEM_READ_WRITE, sizeof(int) * 256);  // 局部直方图分配空间，局部内存类似CUDA的共享内存
		queue.enqueueWriteBuffer(dev_img_input, CL_TRUE, 0, w*h * sizeof(unsigned char), &img_input.data()[0]);   // 数据从host拷贝到OpenCL设备(这里是GPU)


		// Step-1 计算灰度图像的直方图
		cl::Kernel kernel1 = cl::Kernel(program, "imgToHist");              // 加载程序中指定名字的kernel函数
		err = kernel1.setArg(0, dev_img_input);
		err = kernel1.setArg(1, hist);
		err = kernel1.setArg(2, sizeof(int) * 256, NULL);                   // 局部内存(共享内存)不需要传递值
		err = kernel1.setArg(3, size_per_item);
		kernel1.setArg(4, w*h);
		err = queue.enqueueNDRangeKernel(kernel1, cl::NullRange, cl::NDRange(global_work_item_size), cl::NDRange(256));

		// Step-2 将直方图均衡化，即通过直方图均衡化算法，将每个像素原本的灰度值变为均衡化后的灰度值
		cl::Kernel kernel2 = cl::Kernel(program, "histEq");
		kernel2.setArg(0, hist);
		kernel2.setArg(1, hist_eq);
		kernel2.setArg(2, w*h);
		err = queue.enqueueNDRangeKernel(kernel2, cl::NullRange, cl::NDRange(256), cl::NDRange(256));

		// Step-3 通过均衡化后的直方图得到输出图像
		cl::Kernel kernel3 = cl::Kernel(program, "histEqToImg");
		kernel3.setArg(0, dev_img_input);
		kernel3.setArg(1, hist_eq);
		err = queue.enqueueNDRangeKernel(kernel3, cl::NullRange, cl::NDRange(img_input.size()), cl::NullRange);

		// 数据的传输和转换，方便生成图像格式
		vector<unsigned char> output_buffer(img_input.size());
		err = queue.enqueueReadBuffer(dev_img_input, CL_TRUE, 0, w*h * sizeof(unsigned char), &output_buffer.data()[0]);

		CImg<unsigned char> output_img(output_buffer.data(), w, h, 1, 1);
		CImgDisplay disp_output(output_img, "output");

		while (!disp_input.is_closed() && !disp_output.is_closed() && !disp_input.is_keyESC() && !disp_output.is_keyESC()) {
			disp_input.wait(5000);                                       // 图像显示窗口暂留时间
			disp_output.wait(5000);
		}
		return 0;
	}
	catch (const cl::Error& err) {
		std::cerr << "ERROR: " << err.what() << ", " << getErrorString(err.err()) << std::endl;
		return -1;
	}
	catch (CImgException& err) {
		std::cerr << "ERROR: " << err.what() << std::endl;
		return -1;
	}
}


cl_device_id getdevice(int platform_id, int device_id)
{
	cl_platform_id *platforms;
	cl_device_id *devices;
	cl_uint platform_size, device_size;
	int err;
	err = clGetPlatformIDs(0, NULL, &platform_size);
	platforms = (cl_platform_id*)malloc(sizeof(platform_id)*platform_size);
	err = clGetPlatformIDs(1, platforms, NULL);

	err = clGetDeviceIDs(platforms[platform_id], CL_DEVICE_TYPE_ALL, 0, NULL, &device_size);
	devices = (cl_device_id*)malloc(sizeof(cl_device_id)*device_size);
	err = clGetDeviceIDs(platforms[platform_id], CL_DEVICE_TYPE_ALL, sizeof(cl_device_id)*device_size, devices, NULL);
	cl_device_id dev(devices[0]); // = devices[device_id];
	free(platforms); free(devices);

	return dev;
}

3.3 运行效果图

运行结果如下：

3.4 程序说明

程序中会用到两个库工具，一个是对OpenCL的包装，一个是CImg跨平台图像处理库，两者均可在网上下载.
下载地址
程序中会用到一个数据文件，也可以从上述地址对应的项目去下载;
另外，我也没有做根CPU串行的执行效率相对比，因为我写的CUDA并行程序真的是太多了，真的是不想再弄了，有热心的读者可以自己测试，然后提交给我，万分感激！

在服务器计算节点中使用 jupyter Lab ranshan567 程序人生
JupyterLab是一个基于网页的交互式开发环境,用于科学计算、数据分析和机器学.jupyterlab是jupyternotebook的下一代产品,集成了更多功能,使用起来更方便.在进行数据分析及可视化时，个人电脑不能满足大数据的分析需求，就需要用到高性能计算机集群资源，然而计算机集群的计算节点往往没有联网功能，所以在计算机集群中使用jupyterLab需要进行一些配置。具体的步骤如下：
如何搭建一个渲染农场炫云云渲染渲染农场渲染解决方案
在影视特效、动画制作、建筑设计等领域，渲染农场作为高性能计算集群的应用，扮演着至关重要的角色。它通过将大量的渲染任务分配到多个计算节点上并行处理，极大地提升了渲染效率，缩短了项目周期。搭建一个渲染农场是一个复杂的事情，要考虑很多因素，本文将详细介绍如何搭建一个基本的渲染农场，包括前期规划、硬件选择、软件配置、网络设置、运维管理等方面。一、前期规划与需求分析1.明确渲染需求，在搭建渲染农场之前，首先
英伟达A100算力卡性能及应用算力资源比较多算力英伟达大模型人工智能 gpu算力语言模型大数据推荐算法
英伟达A100是一款高性能计算卡，基于英伟达Ampere架构，专为数据中心和高性能计算领域设计。以下是关于A100的性能参数及应用的详细介绍：性能参数架构与制程：架构：Ampere制程：7纳米核心与频率：CUDA核心数：6912个Tensor核心数：432个Boost时钟频率：1.41GHz性能：FP32性能：19.5TFLOPSFP64性能：9.7TFLOPSTensor性能：624.6TFLO
2024国外类脑智能企业汇总细节的温柔 OpenSNN推文人工智能
Intel官网:Intel:https://www.intel.com企业介绍:Intel是全球领先的半导体公司，致力于开发高性能计算技术。产品及介绍:HalaPoint:这是世界上最大的类脑智能系统，利用Intel的Loihi2处理器，支持高达20千万亿次操作每秒（petaops），显著提高AI工作负载的效率和可持续性，应用于科学和工程问题解决、物流、智能城市基础设施管理和大型语言模型（LLM）
Solarflare内核旁路技术深度解析 FIN技术铺服务器网络金融
网络性能的优化对于各种应用场景来说至关重要。尤其对于那些对延迟和吞吐量要求极高的领域，如金融交易和高性能计算，传统的网络处理模式往往成为瓶颈。而Solarflare的内核旁路技术，则以其独特的创新方式，为这些场景带来了革命性的改变。本文将介绍Solarflare内核旁路技术的原理、应用场景和优势，及其在现实中的应用价值。一、Solarflare内核旁路技术原理Solarflare内核旁路技术是一种
【笔试】03 yogurt=b 笔试记录数据库数据结构
FLOPSFLOPS是FloatingPointOperationsPerSecond的缩写，意为每秒浮点运算次数。它是衡量计算机性能的指标，特别是用于衡量计算机每秒能够执行多少浮点运算。在高性能计算领域，FLOPS被广泛用来评估超级计算机、CPU、GPU和其他处理器的计算能力。FLOPS数值越高，计算机执行涉及浮点数的计算能力越强。SQL子查询可以用在FROM子句的数据源SELECT*FROM(
布隆过滤器：大数据的高效守门员（在 Spring Boot 项目中实现布隆过滤器）无理 Java #Java spring boot 后端 java 布隆过滤器面试
文章目录手写SpringBoot启动器：实现布隆过滤器布隆过滤器基本概念布隆过滤器原理应用场景SpringBoot实现示例添加依赖示例代码解析总结手写SpringBoot启动器：实现布隆过滤器在大数据和高性能计算领域，布隆过滤器（BloomFilter）作为一种概率型数据结构，以其独特的空间效率和快速查询能力脱颖而出。它能够在允许一定误报率的前提下，大幅减少存储需求，特别适合于处理海量数据集中的元
GPU算力租用平台推荐 hong161688 gpu算力
在当前快速发展的AI和深度学习领域，GPU算力租用平台成为了研究者、开发者及企业不可或缺的工具。这些平台提供了灵活、高效、可扩展的GPU资源，帮助用户解决计算资源不足的问题，加速模型训练、推理及高性能计算等任务。以下是对几个主流GPU算力租用平台的详细推荐，旨在为用户提供全面的选择和参考。一、国内GPU算力租用平台1.阿里云（AlibabaCloud）平台概述：阿里云作为中国领先的云计算服务提供商
c++调用python和numpy混合编程 AIVoyager c++python c++python numpy
目录1.cmake配置2.python脚本3.c++头文件初始化4.c++调用python中的函数，实现功能参考在现代软件开发中，跨语言编程和混合编程的需求日益增长。C++作为一种高效、强大的编程语言，广泛应用于底层开发、游戏引擎、高性能计算等领域。而Python则因其简洁的语法、丰富的库和易于学习的特性，在数据科学、机器学习、Web开发等领域占据重要地位。NumPy是Python中一个用于数值计
国货之光|暴雨机推出面向大模型训练的AI服务器 BAOYUCompany 人工智能服务器运维
当前，“百模大战”带来了算力需求的爆发，尤其是以ChatGPT为代表的多模态AI大模型，‌其参数规模和训练数据量均达到了前所未有的规模。‌GPT-3.5、‌GPT-4等模型的参数规模突破了万亿级别，‌训练数据量达到了TB级别，‌这使得大模型训练成为了一个计算密集型的任务，对算力的需求极高。‌近日，暴雨重磅推出基于安全架构的训练型AI服务器envadio，适用于大模型训练、高性能计算、数据分析等多种
高性能计算（HPC）与超级计算给生活加糖！科技
1.引言随着科技的飞速发展，计算需求在各个领域中不断增加。高性能计算和超级计算成为了解决复杂科学问题、处理大规模数据的关键工具。无论是在气象模拟、基因组研究、物理模拟，还是在金融分析和人工智能训练中，HPC和超级计算都发挥着至关重要的作用。2.高性能计算（HPC）概述高性能计算通常是指利用并行处理的方式，使用多个处理器同时执行计算任务，以大幅提高计算效率和处理能力。HPC系统通常由多个节点（节点由
GPGPU 朝朝暮暮Quake 其他
1、GPGPU(general-purposegraphicsprocessorunitsarchitecture，通用图像处理器）:是一种利用处理图形任务的图形处理器来计算原本由中央处理器处理的通用计算任务。这些通用计算常常与图形处理没有任何关系。从传统上来说用于处理图形计算，但越来越用于高性能计算、人工智能领域等。由于现代图形处理器强大的并行处理能力和可编程流水线，令流处理器可以处理非图形数据
重磅！RISC-V+OpenHarmony平板电脑发布问界前讯业界资讯
仟江水商业电讯（8月18日北京委托发布）RISC-V作为历史上全球发展速度最快、创新最为活跃的开放指令架构，正在不断拓展高性能计算领域的边界。OpenHarmony是由开放原子开源基金会孵化并运营的开源项目，已成为发展速度最快的智能终端开源操作系统，成为下一代智能终端操作系统根社区。开放RISC-V指令架构结合开源OpenHarmony操作系统，实现了移动终端设备从硬件到软件的全栈开源开放创新。经
黑神话：悟空游戏用的什么服务器？ petaexpress 游戏服务器运维
黑神话：悟空游戏用的什么服务器？《黑神话：悟空》游戏使用的是基于云计算的强大服务器，具体型号和配置未公开。这些服务器在游戏发布初期就表现出极强的处理能力和稳定性，尽管同时在线人数一度突破百万，但整体运行仍然十分稳定。下面将详细介绍相关技术细节和性能表现：1.服务器的基本配置高性能计算：根据Steam平台的记录，《黑神话：悟空》在开售不到一小时内，同时在线玩家数量便突破了100万，峰值达到了140万
阿里云服务器X86计算、Arm计算、GPU/FPGA/ASIC、弹性裸金属服务器、高性能计算架构区别阿里云最新优惠和活动汇总
在我们选购阿里云服务器的时候，云服务器架构有X86计算、ARM计算、GPU/FPGA/ASIC、弹性裸金属服务器、高性能计算可选，有的用户并不清楚他们之间有何区别，本文主要简单介绍下不同类型的云服务器有何不同，主要特点及适用场景有哪些。云服务器架构选择.png1、x86计算架构x86计算架构的云服务器实例规格有计算型c7、计算型c8i、AMD计算型c8a、通用型g7、性能增强通用型g8ae、内存型
GPU算力租用平台推荐 bigbig猩猩 gpu算力
在探讨GPU算力租用平台时，我们首先需要了解GPU算力在当今科技领域中的重要性。GPU（图形处理单元）不仅在图形渲染方面发挥关键作用，还在深度学习、高性能计算、科学模拟等多个领域展现出强大的计算能力。随着这些领域对算力需求的不断增长，GPU算力租用平台应运而生，为用户提供灵活、高效的计算资源解决方案。以下是一些值得推荐的GPU算力租用平台，它们各具特色，能够满足不同用户的需求。一、国内外知名GPU
大模型开源，让人工智能更普惠智能助手观察大模型开源人工智能大模型
人工智能的发展，离不开大模型支撑。而开源模型的出现，则让更多的企业和开发者能够利用这些模型，来构建出更加智能的应用。那么，什么是大模型呢？大模型顾名思义，指的是规模较大的深度学习模型，通常需要运行在高性能计算机上。这些模型包含了数以亿计的参数，可以处理自然语言处理、图像识别、语音识别等多个领域的任务。一般来说，大型模型的训练需要耗费大量的计算资源和时间。不过，随着云计算的发展和开源社区的成熟，越来
服务器虚拟化和云平台,云平台和服务器虚拟化区别木子Hui 服务器虚拟化和云平台
云平台和服务器虚拟化区别内容精选换一换云硬盘(ElasticVolumeService,EVS)可以为云服务器提供高可靠、高性能、规格丰富并且可弹性扩展的块存储服务，可满足不同场景的业务需求，适用于分布式文件系统、开发测试、数据仓库以及高性能计算等场景。云服务器包括弹性云服务器和裸金属服务器。云硬盘类似PC中的硬盘，需要挂载至云服务器使用，无法单独使用。您可以对已挂载的用户可以为虚拟IP地址绑定一
算法部署优化工程师面试题整理发狂的小花 C/C++面试宝典算法面试性能优化计算机视觉
原文来自【知乎-高性能计算方向面试问题总结】个人简介：一个全栈工程师的升级之路！个人专栏：C/C++面试整理CSDN主页发狂的小花人生秘诀：学习的本质就是极致重复!目录整体情况简介高性能计算基础AI框架知识算法题一些比较零碎的问题推荐参考资料整体情况简介面试中的问题基本上分成以下几类：基础的八股文：C/C++，OS，计算机体系结构等。这一部分略，网上已经有很多总结了。高性能计算基础知识：这一部分是
云聚高性能，论道“新超算” 中国云报人工智能大数据编程语言微软机器学习
点击上方关注我们!业界最具影响力的年度高性能计算盛会——2020CCF全国高性能计算学术年会（CCFHPCCHINA2020）9月28-30日在中原古都郑州通过云端线下线上同步隆重举行。本次大会的主题是“新超算新基建新经济”。CCFHPCCHINA2020由中国计算机学会主办，中国计算机学会高性能计算专业委员会、郑州大学、郑州航空港经济综合实验区共同承办，北京并行科技股份有限公司协办。为期三天的盛
cuda。小小娱乐 python
CUDA是由NVIDIA推出的通用并行计算架构，它允许开发人员利用NVIDIA的GPU进行高效的计算。1.高性能计算：CUDA使得GPU能够执行高度并行的计算任务，这对于需要处理大量数据的应用程序来说是非常有用的。GPU拥有成百上千个流处理器，可以同时执行多个计算任务。2.编程框架：CUDA提供了一个编程框架，支持多种编程语言，如C、C++、Fortran、Python等，使得开发者可以使用这些语
day2-理解 linux 云计算 Faith丶信仰 linux 云计算运维
1.解释服务器是什么；服务器是一种高性能计算机，它的主要功能是提供计算服务和资源给其他计算机使用。在网络环境中，服务器扮演着重要的角色，它们可以存储和管理大量的数据，处理网络请求，提供应用程序运行的环境，以及提供文件、邮件、数据库等各种服务。2.解释服务器机房是什么；服务器机房是一个专门设计用于计算机服务器持续运行的封闭空间，通常装有空调以保证其环境稳定。这些机房类似于一个小型数据中心，大小可以从
C++从0实现百万并发Reactor服务器(吾爱分享) c++
C++从0实现百万并发Reactor服务器//xia仔ke：百度网盘C++从0实现百万并发的前景与未来发展趋势C++作为一门高效、底层且功能强大的编程语言，一直在系统级开发、游戏引擎、嵌入式系统等领域占据着重要地位。随着互联网和高性能计算的飞速发展，对于并发处理能力的需求日益增强，C++在实现百万并发方面的前景与未来发展趋势备受关注。一、C++实现百万并发的前景性能优势：C++以其接近底层的特性和
Ubuntu搭建计算集群 xk6891 ubuntu linux 运维
计算机硬件和技术的发展使得高性能模拟和计算在生活和工作中的作用逐渐显现出来，无论是计算化学，计算物理和当下的人工智能都离不开高性能计算。笔者工作主要围绕计算化学和物理开展，亦受限于自身知识和技术所限，文中只是浅显地尝试了整个搭建工作的步骤，很多细节没有深入，还望大家多指导，参考《计算化学集群构建入门》张鋆博士。同时集群搭建可以分为硬件和软件两部分，硬件可以参考北京科音自然科学研究中心内容，这里仅是
集群及LVS简介、LVSNAT模式原理、LVSNAT模式配置、LVSDR模式原理、LVSDR模式配置、LVS错误排查 Mick方 lvs java 开发语言
集群将很多机器组织到一起，作为一个整体对外提供服务集群在扩展性、性能方面都可以做到很灵活集群分类：负载均衡集群：LoadBalance高可用集群：HighAvailability高性能计算：HighPerformanceComputingLVSLVS：LinuxVirtualServer，Linux虚拟服务器实现负载均衡集群作者：章文嵩。国防科技大学读博士期间编写LVS的工作模式：NAT：网络地址
人工智能专题：量子汇编语言和量子中间表示发展白皮书人工智能学派量子计算
今天分享的是人工智能系列深度研究报告：《人工智能专题：量子汇编语言和量子中间表示发展白皮书》。（报告出品方：量子信息网络产业联盟）报告共计：78页量子计算与量子编程概述随着社会生产力的发展，人们对高性能计算提出了更高的要求面对摩尔定律的逐渐失效，科学家和工程师正全力研究发展新的计算技术，推动算力发展。量子计算以量子比特为基本计算单元，利用量子叠加等原理实现并行计算，能在某些计算困难问题上提供指数级
腾讯云与IBM共同打造“高性能计算服务解决方案“ 小信瑞 LSF任务调度系统计算资源管理高性能计算云计算混合云高性能计算 HPC 人工智能任务调度系统系统 IBM LSF
腾讯云与IBM共同打造"高性能计算服务解决方案"腾讯云与IBM达成战略合作，对优势产品及服务进行深度集成，基于腾讯云产品及服务，共同打造"腾讯-IBM混合云与人工智能解决方案"。双方通过更为紧密的嵌入式解决方案的深度合作，为客户创造性地提供定制化解决方案，促进新一代高性能计算高质量、可持续的发展！在今天的"人工智能时代"，与AI技术并驾齐驱的是服务于AI算法训练及推理的"高性能计算"HPC技术。H
Linux在云计算领域的重要作用 CC学妹经验分享笔记
在云计算领域，Linux扮演着至关重要的角色。以下是Linux在云计算领域中的重要作用：稳定性和安全性：Linux操作系统具有稳定性和安全性，可以有效地保护用户的数据安全。它具有各种安全功能，可以防止未经授权的访问，保护用户的数据不被入侵和篡改。强大的性能和可扩展性：Linux具有强大的性能和可扩展性，可以满足云计算中大规模数据处理和高性能计算的需求。Linux还具有灵活的定制性，可以根据不同的需
盛科交换机配置基于DSCP的RoCEv2-无损网络 Songxwn 网络
简介当前HPC高性能计算、分布式存储、AI人工智能等应用采用RoCEv2网络替代传统的TCP/IP网络，来降低CPU的处理和延迟，提升应用的性能。然而，这些分布式高性能应用的特点是“多打一”的Incast流量模型，对于以太交换机，Incast流量易造成交换机内部队列缓存的瞬时突发拥塞甚至丢包，将会带来应用时延的增加和吞吐的下降，从而损害分布式应用的性能。因此，针对RoCEv2流量实现的智能流量分析
通过遵循最佳做法来提高 EDA 和 HPC 应用程序的 Azure NetApp 文件性能大隐隐于野 #NFS专栏 azure microsoft nfs
介绍AzureNetApp文件是一项托管存储解决方案，适用于各种方案，包括高性能计算(HPC)基础结构。低延迟和每秒高I/O操作数(IOPS)对于大规模企业而言是一种很好的组合。假设你就职于一家半导体公司。你的任务是设计公司的集成电路芯片，其需要很多电子设计自动化(EDA)模拟。你在本地没有足够的容量用于此项目，因此你决定使用Azure来满足那些HPC模拟需求。管理层希望你能够及时且经济高效地完成
xml解析小猪猪08 xml
1、DOM解析的步奏准备工作： 1.创建DocumentBuilderFactory的对象 2.创建DocumentBuilder对象 3.通过DocumentBuilder对象的parse(String fileName)方法解析xml文件 4.通过Document的getElem
每个开发人员都需要了解的一个SQL技巧 brotherlamp linux linux视频 linux教程 linux自学 linux资料
对于数据过滤而言CHECK约束已经算是相当不错了。然而它仍存在一些缺陷，比如说它们是应用到表上面的，但有的时候你可能希望指定一条约束，而它只在特定条件下才生效。使用SQL标准的WITH CHECK OPTION子句就能完成这点，至少Oracle和SQL Server都实现了这个功能。下面是实现方式： CREATE TABLE books ( id &
Quartz——CronTrigger触发器 eksliang quartz CronTrigger
转载请出自出处：http://eksliang.iteye.com/blog/2208295 一.概述 CronTrigger 能够提供比 SimpleTrigger 更有具体实际意义的调度方案，调度规则基于 Cron 表达式，CronTrigger 支持日历相关的重复时间间隔（比如每月第一个周一执行），而不是简单的周期时间间隔。二.Cron表达式介绍 1）Cron表达式规则表 Quartz
Informatica基础 18289753290 Informatica Monitor manager workflow Designer
1. 1）PowerCenter Designer：设计开发环境，定义源及目标数据结构；设计转换规则，生成ETL映射。 2）Workflow Manager：合理地实现复杂的ETL工作流，基于时间，事件的作业调度 3）Workflow Monitor：监控Workflow和Session运行情况，生成日志和报告 4）Repository Manager：
linux下为程序创建启动和关闭的的sh文件，scrapyd为例酷的飞上天空 scrapy
对于一些未提供service管理的程序每次启动和关闭都要加上全部路径，想到可以做一个简单的启动和关闭控制的文件下面以scrapy启动server为例，文件名为run.sh： #端口号，根据此端口号确定PID PORT=6800 #启动命令所在目录 HOME='/home/jmscra/scrapy/' #查询出监听了PORT端口
人--自私与无私永夜-极光
今天上毛概课,老师提出一个问题--人是自私的还是无私的,根源是什么? 从客观的角度来看,人有自私的行为,也有无私的
Ubuntu安装NS-3 环境脚本随便小屋 ubuntu
将附件下载下来之后解压，将解压后的文件ns3environment.sh复制到下载目录下（其实放在哪里都可以，就是为了和我下面的命令相统一）。输入命令： sudo ./ns3environment.sh >>result 这样系统就自动安装ns3的环境，运行的结果在result文件中，如果提示 com
创业的简单感受 aijuans 创业的简单感受
2009年11月9日我进入a公司实习，2012年4月26日，我离开a公司，开始自己的创业之旅。今天是2012年5月30日，我忽然很想谈谈自己创业一个月的感受。当初离开边锋时，我就对自己说：“自己选择的路，就是跪着也要把他走完”，我也做好了心理准备，准备迎接一次次的困难。我这次走出来，不管成败
如何经营自己的独立人脉 aoyouzi 如何经营自己的独立人脉
独立人脉不是父母、亲戚的人脉，而是自己主动投入构造的人脉圈。“放长线，钓大鱼”，先行投入才能产生后续产出。现在几乎做所有的事情都需要人脉。以银行柜员为例，需要拉储户，而其本质就是社会人脉，就是社交！很多人都说，人脉我不行，因为我爸不行、我妈不行、我姨不行、我舅不行……我谁谁谁都不行，怎么能建立人脉？我这里说的人脉，是你的独立人脉。以一个普通的银行柜员
JSP基础百合不是茶 jsp 注释隐式对象
1,JSP语句的声明 <%! 声明 %> 　　声明：这个就是提供java代码声明变量、方法等的场所。表达式 <%= 表达式 %> 　　这个相当于赋值，可以在页面上显示表达式的结果，程序代码段/小型指令　<% 程序代码片段 %> 2,JSP的注释
web.xml之session-config、mime-mapping bijian1013 java web.xml servlet session-config mime-mapping
session-config 1.定义： <session-config> <session-timeout>20</session-timeout> </session-config> 2.作用：用于定义整个WEB站点session的有效期限，单位是分钟。 mime-mapping 1.定义： <mime-m
互联网开放平台（1） Bill_chen 互联网 qq 新浪微博百度腾讯
现在各互联网公司都推出了自己的开放平台供用户创造自己的应用，互联网的开放技术欣欣向荣，自己总结如下： 1.淘宝开放平台(TOP) 网址：http://open.taobao.com/ 依赖淘宝强大的电子商务数据，将淘宝内部业务数据作为API开放出去，同时将外部ISV的应用引入进来。目前TOP的三条主线： TOP访问网站：open.taobao.com ISV后台：my.open.ta
【MongoDB学习笔记九】MongoDB索引 bit1129 mongodb
索引可以在任意列上建立索引索引的构造和使用与传统关系型数据库几乎一样,适用于Oracle的索引优化技巧也适用于Mongodb 使用索引可以加快查询,但同时会降低修改,插入等的性能内嵌文档照样可以建立使用索引测试数据 var p1 = { "name":"Jack", "age&q
JDBC常用API之外的总结白糖_ jdbc
做JAVA的人玩JDBC肯定已经很熟练了，像DriverManager、Connection、ResultSet、Statement这些基本类大家肯定很常用啦，我不赘述那些诸如注册JDBC驱动、创建连接、获取数据集的API了，在这我介绍一些写框架时常用的API，大家共同学习吧。 ResultSetMetaData获取ResultSet对象的元数据信息
apache VelocityEngine使用记录 bozch VelocityEngine
VelocityEngine是一个模板引擎，能够基于模板生成指定的文件代码。使用方法如下： VelocityEngine engine = new VelocityEngine();// 定义模板引擎 Properties properties = new Properties();// 模板引擎属
编程之美-快速找出故障机器 bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; public class TheLostID { /*编程之美假设一个机器仅存储一个标号为ID的记录，假设机器总量在10亿以下且ID是小于10亿的整数，假设每份数据保存两个备份，这样就有两个机器存储了同样的数据。 1.假设在某个时间得到一个数据文件ID的列表，是
关于Java中redirect与forward的区别 chenbowen00 java servlet
在Servlet中两种实现： forward方式：request.getRequestDispatcher(“/somePage.jsp”).forward(request, response); redirect方式：response.sendRedirect(“/somePage.jsp”); forward是服务器内部重定向，程序收到请求后重新定向到另一个程序，客户机并不知
[信号与系统]人体最关键的两个信号节点 comsci 系统
如果把人体看做是一个带生物磁场的导体,那么这个导体有两个很重要的节点,第一个在头部,中医的名称叫做百汇穴, 另外一个节点在腰部,中医的名称叫做命门如果要保护自己的脑部磁场不受到外界有害信号的攻击,最简单的
oracle 存储过程执行权限 daizj oracle 存储过程权限执行者调用者
在数据库系统中存储过程是必不可少的利器，存储过程是预先编译好的为实现一个复杂功能的一段Sql语句集合。它的优点我就不多说了，说一下我碰到的问题吧。我在项目开发的过程中需要用存储过程来实现一个功能，其中涉及到判断一张表是否已经建立，没有建立就由存储过程来建立这张表。 CREATE OR REPLACE PROCEDURE TestProc IS fla
为mysql数据库建立索引 dengkane mysql 性能索引
前些时候，一位颇高级的程序员居然问我什么叫做索引，令我感到十分的惊奇，我想这绝不会是沧海一粟，因为有成千上万的开发者（可能大部分是使用MySQL的）都没有受过有关数据库的正规培训，尽管他们都为客户做过一些开发，但却对如何为数据库建立适当的索引所知较少，因此我起了写一篇相关文章的念头。最普通的情况，是为出现在where子句的字段建一个索引。为方便讲述，我们先建立一个如下的表。
学习C语言常见误区如何看懂一个程序如何掌握一个程序以及几个小题目示例 dcj3sjt126com c 算法
如果看懂一个程序，分三步 1、流程 2、每个语句的功能 3、试数如何学习一些小算法的程序尝试自己去编程解决它，大部分人都自己无法解决如果解决不了就看答案关键是把答案看懂，这个是要花很大的精力，也是我们学习的重点看懂之后尝试自己去修改程序，并且知道修改之后程序的不同输出结果的含义照着答案去敲调试错误
centos6.3安装php5.4报错 dcj3sjt126com centos6
报错内容如下: Resolving Dependencies --> Running transaction check ---> Package php54w.x86_64 0:5.4.38-1.w6 will be installed --> Processing Dependency: php54w-common(x86-64) = 5.4.38-1.w6 for
JSONP请求 flyer0126 jsonp
使用jsonp不能发起POST请求。 It is not possible to make a JSONP POST request. JSONP works by creating a <script> tag that executes Javascript from a different domain; it is not pos
Spring Security（03）——核心类简介 234390216 Authentication
核心类简介目录 1.1 Authentication 1.2 SecurityContextHolder 1.3 AuthenticationManager和AuthenticationProvider 1.3.1 &nb
在CentOS上部署JAVA服务 java--hhf java jdk centos Java服务
本文将介绍如何在CentOS上运行Java Web服务，其中将包括如何搭建JAVA运行环境、如何开启端口号、如何使得服务在命令执行窗口关闭后依旧运行第一步：卸载旧Linux自带的JDK ①查看本机JDK版本 java -version 结果如下 java version "1.6.0"
oracle、sqlserver、mysql常用函数对比[to_char、to_number、to_date] ldzyz007 oracle mysql SQL Server
oracle &n
记Protocol Oriented Programming in Swift of WWDC 2015 ningandjin protocol WWDC 2015 Swift2.0
其实最先朋友让我就这个题目写篇文章的时候，我是拒绝的，因为觉得苹果就是在炒冷饭，把已经流行了数十年的OOP中的“面向接口编程”还拿来讲，看完整个Session之后呢，虽然还是觉得在炒冷饭，但是毕竟还是加了蛋的，有些东西还是值得说说的。通常谈到面向接口编程，其主要作用是把系统设计和具体实现分离开，让系统的每个部分都可以在不影响别的部分的情况下，改变自身的具体实现。接口的设计就反映了系统
搭建 CentOS 6 服务器(15) - Keepalived、HAProxy、LVS rensanning keepalived
（一）Keepalived （1）安装 # cd /usr/local/src # wget http://www.keepalived.org/software/keepalived-1.2.15.tar.gz # tar zxvf keepalived-1.2.15.tar.gz # cd keepalived-1.2.15 # ./configure # make &a
ORACLE数据库SCN和时间的互相转换 tomcat_oracle oracle sql
SCN（System Change Number 简称 SCN）是当Oracle数据库更新后，由DBMS自动维护去累积递增的一个数字，可以理解成ORACLE数据库的时间戳，从ORACLE 10G开始，提供了函数可以实现SCN和时间进行相互转换；　　用途：在进行数据库的还原和利用数据库的闪回功能时，进行SCN和时间的转换就变的非常必要了；　　操作方法：　　1、通过dbms_f
Spring MVC 方法注解拦截器 xp9802 spring mvc
应用场景，在方法级别对本次调用进行鉴权，如api接口中有个用户唯一标示accessToken,对于有accessToken的每次请求可以在方法加一个拦截器，获得本次请求的用户，存放到request或者session域。 python中，之前在python flask中可以使用装饰器来对方法进行预处理，进行权限处理先看一个实例,使用@access_required拦截： ?

基于OpenCL的直方图均衡化图像增强