C++ vs Python向量运算速度评测

本文的起源来自最近一个让我非常不爽的事。

我最近在改一个开源RNN工具包currennt（http://sourceforge.net/projects/currennt/），想用它实现RNNLM功能。

currennt使用了大量的面向对象的编程技巧，可以使用GPU，向量运算使用了thrust库（https://code.google.com/p/thrust/）。

RNNLM（http://rnnlm.org/）也有相应开源实现，非常算法风格的代码，向量运算就是自己使用数组实现的。

结果……大出我的语料，在不使用GPU的情况下，currennt慢成狗！我不断的修改，直到最后几乎完全在currennt里重写了一个RNNLM……速度才终于一致了。这花费了我大量时间，最关键的是我根本没打算花这些时间，算是计划外开销。

所以这里干脆对常用的几种向量运算做个评测，下回遇到至少心里有数。

参与评测的向量实现包括：

C++ array
C++ STL vector
C++ thrust(CPU)
C++ thrust(GPU)
python
python numpy

评测指标包括：

创建、填充向量
向量点乘，相乘
矩阵相乘

测试环境：

Intel Xeon CPU [email protected] x24

VS2010

python 2.7.6 (32bit)

thrust v1.5

numpy 1.8.1

C++ array

创建全0向量：0.000s，几乎不占用时间

int vector_size=100000000;

float* vector=(float*)calloc(vector_size,sizeof(float));

创建+填充向量：0.140s

int vector_size=100000000;

float* vector=(float*)calloc(vector_size,sizeof(float));

for (int i=0;i<vector_size;++i){

	vector[i]=0.01;

}

向量点乘：0.390s

float sum=0;

for(int i=0;i<vector_size;++i){

	sum+=vector1[i]*vector2[i];

}

向量相乘：0.265s

float sum=0;

for(int i=0;i<vector_size;++i){

	vector3[i]=vector1[i]*vector2[i];

}

矩阵乘向量：0.344s

int matrix1_colnum=50000;

int matrix1_rownum=2000;

int matrix1_size=matrix1_colnum*matrix1_rownum;

float* vector1=(float*)calloc(matrix1_size,sizeof(float));

for (int i=0;i<matrix1_size;++i){

	vector1[i]=0.01;

}



float* vector2=(float*)calloc(matrix1_colnum,sizeof(float));

for (int i=0;i<matrix1_colnum;++i){

	vector2[i]=0.02;

}



start_t=clock();

float* vector3=(float*)calloc(matrix1_rownum,sizeof(float));

for(int row=0;row<matrix1_rownum;++row){

	for(int col=0;col<matrix1_colnum;++col){

		vector3[row]+=vector1[row*matrix1_colnum+col]*vector2[col];

	}

}

end_t=clock();

矩阵乘矩阵：0.749

（耗费时间与matrix1_rownum*matrix1_colnum*matrix2_colnum成正比）

int matrix1_rownum=200;

int matrix1_colnum=5000;

int matrix1_size=matrix1_colnum*matrix1_rownum;

float* vector1=(float*)calloc(matrix1_size,sizeof(float));

for (int i=0;i<matrix1_size;++i){

	vector1[i]=0.01;

}



int matrix2_rownum=5000;

int matrix2_colnum=200;

int matrix2_size=matrix2_rownum*matrix2_colnum;

float* vector2=(float*)calloc(matrix2_size,sizeof(float));

for (int i=0;i<matrix2_size;++i){

	vector2[i]=0.02;

}



int matrix3_size=matrix1_rownum*matrix2_colnum;

float* vector3=(float*)calloc(matrix3_size,sizeof(float));

start_t=clock();

for(int row1=0;row1<matrix1_rownum;++row1){

	for(int col2=0;col2<matrix2_colnum;++col2){

		for(int col1=0;col1<matrix1_colnum;++col1){

			vector3[row1*matrix2_colnum+col2]+=vector1[row1*matrix1_colnum+col1]*vector2[col1*matrix2_colnum+col2];

		}

	}

}

end_t=clock();

C++ STL vector

创建全0向量：0.140s

int vect_size=100000000;
vector<float> vector(vect_size);

创建+填充向量：0.140s

int vect_size=100000000;

vector<float> vector(vect_size,0.01);

向量点乘：0.375s

int vect_size=100000000;

vector<float> vector1(vect_size,0.01);

vector<float> vector2(vect_size,0.02);

start_t=clock();

float sum=0;

for(int i=0;i<vect_size;++i){

	sum+=vector1[i]*vector2[i];

}

end_t=clock();

向量相乘：0.250s

int vect_size=100000000;

vector<float> vector1(vect_size,0.01);

vector<float> vector2(vect_size,0.02);

vector<float> vector3(vect_size);

start_t=clock();

for(int i=0;i<vect_size;++i){

	vector3[i]=vector1[i]*vector2[i];

}

end_t=clock();

矩阵乘向量：0.390s

int matrix1_colnum=50000;

int matrix1_rownum=2000;

int matrix1_size=matrix1_colnum*matrix1_rownum;

vector<float> vector1(matrix1_size,0.01);

vector<float> vector2(matrix1_colnum,0.02);

vector<float> vector3(matrix1_rownum);

start_t=clock();

for(int row=0;row<matrix1_rownum;++row){

	for(int col=0;col<matrix1_colnum;++col){

		vector3[row]+=vector1[row*matrix1_colnum+col]*vector2[col];

	}

}

end_t=clock();

矩阵乘法：0.827s

int matrix1_rownum=200;

int matrix1_colnum=5000;

int matrix1_size=matrix1_colnum*matrix1_rownum;

vector<float> vector1(matrix1_size,0.01);



int matrix2_rownum=5000;

int matrix2_colnum=200;

int matrix2_size=matrix2_rownum*matrix2_colnum;

vector<float> vector2(matrix2_size,0.02);



int matrix3_size=matrix1_rownum*matrix2_colnum;

vector<float> vector3(matrix3_size);

start_t=clock();

for(int row1=0;row1<matrix1_rownum;++row1){

	for(int col2=0;col2<matrix2_colnum;++col2){

		for(int col1=0;col1<matrix1_colnum;++col1){

			vector3[row1*matrix2_colnum+col2]+=vector1[row1*matrix1_colnum+col1]*vector2[col1*matrix2_colnum+col2];

		}

	}

}

end_t=clock();

C++ thrust(CPU)

创建全0向量：0.140s

int vect_size=100000000;

thrust::host_vector<float> vector1(vect_size);

创建+填充向量：0.140s

int vect_size=100000000;

thrust::host_vector<float> vector1(vect_size，0.01);

填充向量：0.078s

thrust::fill(vector1.begin(),vector1.end(),0.01);

向量点乘：0.359s

int vect_size=100000000;

thrust::host_vector<float> vector1(vect_size,(float)0.1);

thrust::host_vector<float> vector2(vect_size,(float)0.2);

thrust::host_vector<float> vector3(vect_size,(float)0.2);



start_t=clock();

thrust::transform(vector1.begin(),vector1.end(),vector2.begin(),vector3.begin(),thrust::multiplies<float>());

float sum=thrust::reduce(vector3.begin(),vector3.end(),(float)0,thrust::multiplies<float>());

end_t=clock();

向量相乘：0.187s

int vect_size=100000000;

thrust::host_vector<float> vector1(vect_size,(float)0.1);

thrust::host_vector<float> vector2(vect_size,(float)0.2);

thrust::host_vector<float> vector3(vect_size);

start_t=clock();

thrust::transform(vector1.begin(),vector1.end(),vector2.begin(),vector3.begin(),thrust::multiplies<float>());

end_t=clock();

矩阵乘向量：0.110s

struct matrixXvect_func

{

	thrust::host_vector<float>* matrix;

	thrust::host_vector<float>* vector;

	int matrix_rownum;

	int matrix_colnum;



	__host__ __device__

	float operator()(const int& idx) const{

		float t=0;

		for(int col=0;col<matrix_colnum;++col){

			t+=(*matrix)[idx*matrix_colnum+col]* (*vector)[col];

		}

		return t;

	}

};


int matrix1_rownum=2000;
int matrix1_colnum=50000;

int matrix1_size=matrix1_colnum*matrix1_rownum;



thrust::host_vector<float> vector1(matrix1_size,(float)0.1);

thrust::host_vector<float> vector2(matrix1_colnum,(float)0.2);

thrust::host_vector<float> vector3(matrix1_rownum);



start_t=clock();



matrixXvect_func fn;

fn.matrix=&vector1;

fn.vector=&vector2;

fn.matrix_rownum=matrix1_rownum;

fn.matrix_colnum=matrix1_colnum;



thrust::transform(

            thrust::counting_iterator<int>(0),

            thrust::counting_iterator<int>(0) + matrix1_rownum,

            vector3.begin(),

            fn

            );



end_t=clock();

矩阵乘矩阵：0.655s

struct matrixXmatrix_func

{

	thrust::host_vector<float>* matrix1;

	thrust::host_vector<float>* matrix2;

	int matrix1_rownum;

	int matrix1_colnum;

	int matrix2_rownum;

	int matrix2_colnum;



	__host__ __device__

	float operator()(const int& idx) const{

		int rownum=idx/matrix2_colnum;

		int colnum=idx%matrix2_colnum;

		float t=0;

		for(int col=0;col<matrix1_colnum;++col){

			t+=(*matrix1)[rownum*matrix1_colnum+col]* (*matrix2)[col*matrix2_colnum+colnum];

		}

		return t;

	}

};



int matrix1_rownum=200;

int matrix1_colnum=5000;

int matrix1_size=matrix1_colnum*matrix1_rownum;

thrust::host_vector<float> vector1(matrix1_size,(float)0.1);



int matrix2_rownum=5000;

int matrix2_colnum=200;

int matrix2_size=matrix2_rownum*matrix2_colnum;

thrust::host_vector<float> vector2(matrix2_size,(float)0.2);



int matrix3_size=matrix1_rownum*matrix2_colnum;

thrust::host_vector<float> vector3(matrix3_size);



start_t=clock();



matrixXmatrix_func fn;

fn.matrix1=&vector1;

fn.matrix2=&vector2;

fn.matrix1_rownum=matrix1_rownum;

fn.matrix1_colnum=matrix1_colnum;

fn.matrix2_rownum=matrix2_rownum;

fn.matrix2_colnum=matrix2_colnum;



thrust::transform(

            thrust::counting_iterator<int>(0),

            thrust::counting_iterator<int>(0) + matrix3_size,

            vector3.begin(),

            fn

            );



end_t=clock();

C++ thrust(GPU)

创建全0向量：0.140s

int vect_size=1000000;

thrust::device_vector<float> vector1(vect_size);

创建+填充向量：0.140s

int vect_size=1000000;

thrust::device_vector<float> vector1(vect_size,0.1);

CPU向量赋值：0.141s

int vect_size=1000000;

thrust::host_vector<float> vector1(vect_size,0.1);

start_t=clock();

thrust::device_vector<float> vector2=vector1;

end_t=clock();

填充向量：0.000s

int vect_size=1000000;

thrust::device_vector<float> vector(vect_size);

start_t=clock();

thrust::fill(vector.begin(),vector.end(),(float)0.1);

end_t=clock();

向量点乘：0.016s

int vect_size=100000000;

thrust::device_vector<float> vector1(vect_size,(float)0.1);

thrust::device_vector<float> vector2(vect_size,(float)0.2);

thrust::device_vector<float> vector3(vect_size,(float)0.2);

 

start_t=clock();

thrust::transform(vector1.begin(),vector1.end(),vector2.begin(),vector3.begin(),thrust::multiplies<float>());

float sum=thrust::reduce(vector3.begin(),vector3.end(),(float)0,thrust::multiplies<float>());

end_t=clock();

向量相乘：0.000s

int vect_size=100000000;

thrust::device_vector<float> vector1(vect_size,(float)0.1);

thrust::device_vector<float> vector2(vect_size,(float)0.2);

thrust::device_vector<float> vector3(vect_size);

start_t=clock();

thrust::transform(vector1.begin(),vector1.end(),vector2.begin(),vector3.begin(),thrust::multiplies<float>());

end_t=clock();

矩阵乘向量（实现1）：0.530s

int matrix1_rownum=2000;

int matrix1_colnum=50000;

int matrix1_size=matrix1_colnum*matrix1_rownum;

 

thrust::device_vector<float> vector1(matrix1_size,(float)0.1);

thrust::device_vector<float> vector2(matrix1_colnum,(float)0.2);

thrust::device_vector<float> tmp(matrix1_colnum);

thrust::device_vector<float> vector3(matrix1_rownum);

 

start_t=clock();

for(int row=0;row<matrix1_rownum;++row){

	thrust::transform(vector1.begin()+row*matrix1_colnum,vector1.begin()+(row+1)*matrix1_colnum,vector2.begin(),tmp.begin(),thrust::multiplies<float>());

	vector3[row]=thrust::reduce(tmp.begin(),tmp.end(),(float)0,thrust::multiplies<float>());

}

end_t=clock();

矩阵乘向量（实现2）CUBLAS，待试

矩阵乘矩阵CUBLAS，待试

Python

直接使用python的list实现上述功能实在太慢……而且由于无法指定float类型，其默认使用16位double类型来表示小数，使用10^8会超出list索引上限……故只使用10^7实验，速度差距可以自行换算。

大致估算python的向量运算比c++慢50倍，矩阵运算慢1000。

初始化向量并赋值：1.51s

vector_size=10000000

vector=[]

for i in range(vector_size):

	vector.append(0.1)

向量点乘:1.75s

vector_size=10000000
vector1=[]

for i in range(vector_size):

	vector1.append(0.1)

vector2=[]

for i in range(vector_size):

	vector2.append(0.1)

start_t=time.time()

sum=0

for i in range(vector_size):

	sum+=vector1[i]*vector2[i]

end_t=time.time()

向量相乘：2.39

vector_size=10000000

vector1=[]

for i in range(vector_size):

	vector1.append(0.1)

vector2=[]

for i in range(vector_size):

	vector2.append(0.1)

vector3=[]

for i in range(vector_size):

	vector3.append(0.1)

start_t=time.time()

for i in range(vector_size):

	vector3[i]=vector1[i]*vector2[i]

end_t=time.time()

矩阵乘向量：3.06s

matrix1_rownum=2000

matrix1_colnum=5000

matrix1_size=matrix1_rownum*matrix1_colnum

vector1=[]

for i in range(matrix1_size):

	vector1.append(0.1)

vector2=[]

for i in range(matrix1_colnum):

	vector2.append(0.1)

vector3=[]

for i in range(matrix1_rownum):

	vector3.append(0.1)

start_t=time.time()

for row in range(matrix1_rownum):

	for col in range(matrix1_colnum):

		vector3[row]=vector1[row*matrix1_colnum+col]*vector2[col]

end_t=time.time()

矩阵相乘：11.37s

matrix1_rownum=200

matrix1_colnum=500

matrix1_size=matrix1_rownum*matrix1_colnum

vector1=[]

for i in range(matrix1_size):

	vector1.append(0.1)

matrix2_rownum=500

matrix2_colnum=200

matrix2_size=matrix2_rownum*matrix2_colnum

vector2=[]

for i in range(matrix2_size):

	vector2.append(0.1)

matrix3_size=matrix1_rownum*matrix2_colnum

vector3=[]

for i in range(matrix3_size):

	vector3.append(0.1)

start_t=time.time()

for row in range(matrix1_rownum):

	for col in range(matrix2_colnum):

		for i in range(matrix1_colnum):

			vector3[row*matrix2_colnum+col]+=vector1[row*matrix1_colnum+i]*vector2[i*matrix2_colnum+col]

end_t=time.time()

当然实际进行向量运算没人会拿python的list数据结构进行运算，这里只是好奇定量测一下list到底有多慢……

Python numpy

创建全0向量：0.0s

vector_size=100000000

vector=numpy.zeros(vector_size)

创建+填充向量：0.25s

vector_size=100000000

vector=numpy.zeros(vector_size)

vector.fill(0.01)

向量点乘：0.125s(由于python是32位……内存原因，数据规模减半)

vector_size=50000000

vector1=numpy.zeros(vector_size)

vector1.fill(0.01)

vector2=numpy.zeros(vector_size)

vector2.fill(0.02)

start_t=time.time()

sum=numpy.inner(vector1,vector2)

end_t=time.time()

向量相乘：0.234s

vector_size=50000000

vector1=numpy.zeros(vector_size)

vector1.fill(0.01)

vector2=numpy.zeros(vector_size)

vector2.fill(0.02)

start_t=time.time()

vector3=numpy.multiply(vector1,vector2)

end_t=time.time()

矩阵乘向量：0.094s

matrix1_rownum=2000

matrix1_colnum=50000

matrix1_size=matrix1_rownum*matrix1_colnum

vector1=numpy.zeros(matrix1_size)

vector1.fill(0.01)



vector2=numpy.zeros(matrix1_colnum)

vector2.fill(0.02)



start_t=time.time()

vector1=vector1.reshape(matrix1_rownum,matrix1_colnum)

vector2=vector2.reshape(matrix1_colnum,1)

vector3=numpy.dot(vector1,vector2)

end_t=time.time()

矩阵乘矩阵：23.16s（numpy.dot出乎意料的慢，使用numpy.matrix类时间为11.73s，依旧很慢而且占用更大内存，在创建matrix对象时也要0.4s）

matrix1_rownum=2000

matrix1_colnum=50000

matrix1_size=matrix1_rownum*matrix1_colnum

vector1=numpy.zeros(matrix1_size)

vector1.fill(0.01)

matrix2_rownum=50000

matrix2_colnum=1000

matrix2_size=matrix2_rownum*matrix2_colnum

vector2=numpy.zeros(matrix2_size)

vector2.fill(0.02)

start_t=time.time()

vector1=vector1.reshape(matrix1_rownum,matrix1_colnum)

vector2=vector2.reshape(matrix2_rownum,matrix2_colnum)

vector3=numpy.dot(vector1,vector2)

end_t=time.time()

Python 中的特殊注释及字符存储机制 svtvtvt python 开发语言 pycharm 数据结构
目录一、Python特殊注释及其作用1.'#!/usr/bin/python'（Shebang2.'#-*-coding:utf-8-*-'（字符编码声明）3.其他特殊注释二、Python中字符的存储机制1.计算机的最小存储单元2.常见字符编码方案3.Python中字符的存储三、中文乱码的原因及解决方法1.源文件的编码与Python的编码不一致2.编码与解码不一致3.终端或控制台编码问题4.操作系
Python的ORM框架SQLAlchemy入门教程 searchwang
SQLAlchemy是python操作数据库的一个库。能够进行orm映射，SQLAlchemy“采用简单的Python语言，为高效和高性能的数据库访问设计，实现了完整的企业级持久模型”SQLAlchemy的理念是，SQL数据库的量级和性能重要于对象集合；而对象集合的抽象又重要于表和行。一安装SQLAlchemy复制代码代码如下:pipinstallsqlalchemy导入如果没有报错则安装成功复制
【python】pathlib模块 m 宽 python
#!/usr/bin/envpython#coding:utf-8#In[2]:frompathlibimportPath#In[3]:#创建路径c_path=Path("C:/")print(c_path)#In[4]:#当前目录cwd=Path.cwd()print(cwd)#In[5]:#用户目录Path.home()#In[6]:#父目录cwd.parent#In[7]:#子目录fpath
斗地主老是输？一起用Python做个AI出牌器！姬姬姬姬姬姬 python 人工智能
前言最近在网上看到一个有意思的开源项目，基于快手团队开发的开源AI斗地主——DouZero做的一个“成熟”的AI，项目开源地址【https://github.com/tianqiraf/DouZero_For_HappyDouDiZhu–tianqiraf】。今天我们就一起来学习下是如何制作一个基于DouZero的出牌器，看看AI是如何来帮助斗地主的！一、核心功能设计首先这款出牌器是基于DouZe
深入解析Java跨平台原理 KBkongbaiKB java 开发语言
一、操作系统屏障的本质挑战源代码编译方式直接编译为机器码Windows的可执行文件.exeLinux的可执行文件.elfmacOS的可执行文件.machJava独特的中间格式字节码文件.classJVM虚拟机1.1传统语言的平台困局语言类型编译方式执行依赖跨平台能力C/C++直接生成机器码特定操作系统❌不可直接移植Python解释型执行Python解释器✅但性能较低Java字节码中间件JVM虚拟机
Python中的可变类型和不可变类型 svtvtvt python 开发语言
在Python中，数据类型可以分为可变类型（mutable）和不可变类型（immutable）。理解这两种类型的区别和特性对于编写高效、易于维护的代码至关重要。在本篇文章中，我们将详细探讨这两类数据类型的定义、行为以及它们之间的差异。目录一、概述二、不可变类型（ImmutableTypes）1.int（整数）2.float（浮点数）3.str（字符串）4.tuple（元组）5.frozenset（
python：一次简单的爬虫 wstkqzl python 爬虫开发语言
importrequestsimportparselimporttimefromparselimportSelector#第一章链接https://www.qu04.cc/book/45808/2.html#第二章链接https://www.qu04.cc/book/45808/3.html#小说目录：https://www.qu04.cc/book/45808/url="https://www.
pip install速度慢怎么解决滴答滴答滴嗒滴 pip python
如果您发现使用pipinstall安装Python包的速度很慢，可以尝试以下方法来解决：（1）更换镜像源：您可以使用国内的镜像源，通常国内镜像源的速度更快。例如，清华大学、阿里云、网易等都提供了Python镜像源。您可以通过在终端中运行以下命令来更改镜像源：pipconfigsetglobal.index-urlhttps://pypi.tuna.tsinghua.edu.cn/simple或者p
使用multiprocessing实现进程间共享内存培根芝士 Python python
在Python中，可以使用多种方法来实现几个进程之间的通信。简单消息传递：使用multiprocessing.Queue或multiprocessing.Pipe。共享简单数据：使用multiprocessing.Value或multiprocessing.Array。共享复杂数据：使用multiprocessing.Manager。进程间信号控制：使用multiprocessing.Event。
Python 机器学习基础之学习基础环境搭建仙魁XAN Python 机器学习基础+实战案例 python 学习开发语言机器学习 machine learning
Python机器学习基础之学习基础环境搭建目录Python机器学习基础之学习基础环境搭建一、简单介绍二、什么是机器学习三、python环境的搭建1、Python安装包下载2、这里以下载Python3.10.9为例3、安装Python3.10.94、检验python是否安装成功，win+R快捷打开运行，输入cmd，打开cmd四、Pycharm环境搭建1、下载Pycharm安装包2、安装Pycharm
Win7 64 位 Vcode Python安装与环境配置 qq_40094167 机器学习 python 数据挖掘
一、对于win764位的Python版本，官网目前是Python3.8.10。千万不要装错哈哈二、Vcode版本，可以直接在官网或者360软件管家安装，都比较方便。但安装之前请先安装Python，然后安装Vcode。三、Vcode插件配置，本人插件配置多数是根据之前liunx系统配置的，里面许多关键字颜色和大小个人比较喜欢。@1codeRunner即代码运行@2RainbowBrackets彩虹花
大型语言模型：让Python更聪明的秘密武器 qq_39605374 语言模型 python 数据库 Python
Python是一种广泛使用的编程语言，而大型语言模型则为Python开发者提供了一个强大的工具。大型语言模型可以理解人类语言，并生成具有逻辑和连贯性的文本。它能够回答用户的问题、提供解决方案，并帮助开发者提高他们的编程技能。让我们来探索一下如何使用大型语言模型作为Python编程的秘密武器。大型语言模型可以通过使用Python编写的API进行访问。下面是一个简单的示例，演示了如何使用Python与
GEE下载REMA strip和mosaic数据的python脚本 WiIsonEdwards python windows linux
EarthEngineDataCatalog：https://developers.google.com/earth-engine/datasets/catalog搜索REMA：importeeimportgeemapimportosimportwarnings#忽略所有警告warnings.filterwarnings("ignore")#下载REMAStrips数据（2m和8m）defdown
华为OD机试题库清单以及考点说明，2025.3.16切换2025A卷（Python/JS/C/C++）哪吒搬砖工逆袭Java架构师华为od python javascript 2025A卷华为OD机试
专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。2024年8月14日，华为官方已经将华为OD机试（D卷）切换为E卷。目前正在考的是E卷，按照华为OD往常的操作，E卷题目是由往
华为OD机试 - 字符串分割转换（Python/JS/C/C++ 2024 E卷 100分）哪吒华为od python javascript
一、题目描述给定一个非空字符串QS，其被N个‘;’分隔成N+1个子串，给定正整数数组K，要求除第一个子串外，其余的子串每K个字符组成新的子串，并‘-’分隔。对于新组成的每一个子串，如果它含有的小写字母比大写字母多，则将这个子串的所有大写字母转换为小写Q字母；反之，如果它含有的大写字母比小写字母多，则将这个子串的所有小写字母转换为大写字母；大小写字母的数量相等时，不做转换。二、输入描述输入为两行，第
Python 数据分析实战：电动汽车行业发展态势与市场策略洞察萧十一郎@ python python 数据分析开发语言
目录一、案例背景二、代码实现2.1数据收集与导入2.2数据探索性分析2.3数据清洗2.4数据分析2.4.1市场规模与增长趋势2.4.2消费者需求分析2.4.3企业竞争格局2.4.4政策影响分析2.4.5构建消费者购买意愿预测模型三、主要的代码难点解析3.1数据收集与导入3.2数据清洗-缺失值处理3.3数据清洗-异常值处理3.4数据分析-消费者需求分析3.5数据分析-构建消费者购买意愿预测模型四、可
python实现http协议 ajie1117 python http 开发语言
在Python中，可以使用socket库实现一个简单的HTTP服务器和客户端，手动处理HTTP请求和响应。下面是一个Python版本的HTTP服务器和客户端示例。一、使用socket实现HTTP服务器HTTP服务器的基本原理是监听指定端口，等待客户端请求，解析HTTP请求，并返回HTTP响应。简单的HTTP服务器importsocketdefrun_http_server(host='127.0.
华为OD机试 - 日志采集系统（Python/JS/C/C++ 2024 E卷 100分）哪吒华为od python javascript
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述日志采集是运维系统的的核心组件。日志是按行生成，每行记做一条，由
用Python抓取网页标题：使用`requests`库的实用指南清水白石008 python Python题库 python 开发语言
用Python抓取网页标题：使用requests库的实用指南在数据获取的时代，网页抓取（WebScraping）成为了一项重要的技能。无论是获取新闻标题、产品价格，还是数据分析，网页抓取都能提供丰富的信息。本文将详细介绍如何使用Python的requests库编写一个简单的爬虫，抓取某个网站的标题。我们将通过实例和代码片段，使整个过程清晰易懂，帮助你快速上手网页抓取。一、了解网页抓取网页抓取是指通
Python从0到100（三十四）：Python中的urllib模块使用指南是Dream呀 python 开发语言
1.urllib模块概述在Python中，除了广泛使用的requests模块之外，urllib模块也是处理HTTP请求的重要工具。urllib模块在Python2中分为urllib和urllib2两个模块，而在Python3中，它们被合并为一个urllib模块。本文将重点介绍Python3中的urllib模块及其使用方法。2.urllib模块的基本方法介绍2.1urllib.request.url
python nginx部署_nginx部署python应用 weixin_39611070 python nginx部署
2.nginx配置文件如下：#位于/nginx/conf/nginx.conf#usernobody;worker_processes1;events{worker_connections1024;}http{includemime.types;default_typeapplication/octet-stream;sendfileon;keepalive_timeout185;server{l
python 使用Nginx和uWSGI来运行Python应用 weixin_33738555 运维 python 操作系统
参考：http://zmrenwu.com/post/20/uWSGI是一个Web应用服务器，它具有应用服务器，代理，进程管理及应用监控等功能。它支持WSGI协议，同时它也支持自有的uWSGI协议，该协议据说性能非常高，而且内存占用率低，为mod_wsgi的一半左右，我没有实测过。它还支持多应用的管理及应用的性能监控。虽然uWSGI本身就可以直接用来当Web服务器，但一般建议将其作为应用服务器配合
Python数据可视化与地理空间分析 CrMylive. 信息可视化 python 开发语言
一、引言数据可视化与地理空间分析是数据科学领域中的两个重要领域，其中数据可视化侧重于将数据转换成可视化的图表，而地理空间分析则关注于如何在地理空间内处理与分析数据。Python作为一种高效、灵活、易用的编程语言，近年来在数据科学领域越来越受到欢迎。本文将以Python为工具，在数据可视化与地理空间分析方面进行详细探讨，并给出一些相关实例。二、数据可视化数据可视化是指利用图表、图形和其他视觉元素来展
Python中常见的抓取图片的方法 qq_31397725 python 开发语言
在Python中，抓取图片的方法可以根据你的具体需求和使用场景有所不同。以下是一些常见的方法：使用requests库从URL下载图片：这是最常见的方法，适用于从网络上的URL下载图片。你可以使用requests库发送HTTP请求，然后将响应的内容保存到本地文件中。使用selenium库抓取网页中的图片：如果你需要从一个动态加载的网页中抓取图片，selenium可以帮助你模拟浏览器行为，等待页面加载
如何运用python爬虫爬取图片素材网站的图片？（附完整代码）大懒猫软件 vue.js python 网络爬虫图像处理 bash
在当今数字化时代，高质量的图片资源对于设计师、开发者以及任何需要视觉素材的用户来说都至关重要。壁纸社作为一个提供丰富壁纸资源的网站，涵盖了从普通高清到4K、5K甚至8K超高清的多种分辨率，满足了不同用户的需求。然而，手动下载这些壁纸不仅耗时，而且效率低下。因此，开发一个自动化爬虫程序，批量下载高质量壁纸，不仅能节省时间，还能提高工作效率。本文将详细介绍如何使用Python爬虫技术从壁纸社爬取并保存
【网络爬虫】(2) requests模块，案例：网络图片爬取，附Python代码立Sir 网络爬虫爬虫 python
1.基本原理1.1requests模块requests是Python中一个非常流行的HTTP客户端库，用于发送所有的HTTP请求类型。它基于urllib，但比urllib更易用。中文文档地址：Requests:让HTTP服务人类—Requests2.18.1文档（1）requests.get(url,**kwargs)requests.get()函数是requests库中用于发送HTTPGET请求
python-leetcode-除自身以外数组的乘积 Joyner2018 python leetcode 算法职场和发展
238.除自身以外数组的乘积-力扣（LeetCode）classSolution:defproductExceptSelf(self,nums:List[int])->List[int]:n=len(nums)#初始化结果数组answer=[1]*n#计算前缀乘积prefix=1foriinrange(n):answer[i]=prefixprefix*=nums[i]#计算后缀乘积，同时更新结果
PyTorch 深度学习博客 Zoro｜ PyTorch Deep Learning 人工智能
PyTorch深度学习博客欢迎来到我的PyTorch深度学习博客！在这里，我将分享使用PyTorch学习和实践深度学习项目的点滴经验。本博客适用于初学者和有一定基础的开发者，旨在帮助大家快速搭建环境、掌握核心概念，并通过实例了解实际应用。环境配置为了确保项目的稳定性和兼容性，我选择了Python3.9环境，并在conda创建的虚拟环境中运行最新且稳定的PyTorch版本2.6.0。1.创建Pyth
基于Geopandas的地理空间数据可视化与分析方法研究一键难忘信息可视化 Geopandas python
地理空间数据可视化是数据科学中重要的应用之一。通过有效地展示地理信息，我们能够深入理解空间数据的分布和模式。Python的Geopandas库为地理空间数据处理和可视化提供了强大的支持，它基于pandas并集成了shapely、fiona等多个库，能够方便地进行地理数据的读取、处理和展示。本文将介绍如何使用Geopandas进行地理空间数据可视化，示范数据处理的基本流程，并通过具体的代码实例，深入
Python关键字参数详解 qq_39605374 python 开发语言
Python关键字参数详解在Python中，函数的参数可以分为两类：位置参数和关键字参数。本文将重点讲解Python中关键字参数的使用方法及其优势。1.什么是关键字参数？关键字参数是指在调用函数时，显式地通过“参数名=参数值”的形式进行传参。以下是一个简单的例子：defgreet(name,age):print("Hello,mynameis",name,"andIam",age,"yearsol
Spring中@Value注解，需要注意的地方无量 spring bean @Value xml
Spring 3以后,支持@Value注解的方式获取properties文件中的配置值，简化了读取配置文件的复杂操作 1、在applicationContext.xml文件(或引用文件中)中配置properties文件 <bean id="appProperty" class="org.springframework.beans.fac
mongoDB 分片开窍的石头 mongodb
mongoDB的分片。要mongos查询数据时候先查询configsvr看数据在那台shard上，configsvr上边放的是metar信息，指的是那条数据在那个片上。由此可以看出mongo在做分片的时候咱们至少要有一个configsvr,和两个以上的shard（片）信息。第一步启动两台以上的mongo服务 &nb
OVER(PARTITION BY)函数用法 0624chenhong oracle
这篇写得很好，引自 http://www.cnblogs.com/lanzi/archive/2010/10/26/1861338.html OVER(PARTITION BY)函数用法 2010年10月26日 OVER(PARTITION BY)函数介绍开窗函数 &nb
Android开发中，ADB server didn't ACK 解决方法一炮送你回车库 Android开发
首先通知：凡是安装360、豌豆荚、腾讯管家的全部卸载，然后再尝试。一直没搞明白这个问题咋出现的，但今天看到一个方法，搞定了！原来是豌豆荚占用了 5037 端口导致。参见原文章：一个豌豆荚引发的血案——关于ADB server didn't ACK的问题简单来讲，首先将Windows任务进程中的豌豆荚干掉，如果还是不行，再继续按下列步骤排查。 &nb
canvas中的像素绘制问题换个号韩国红果果 JavaScript canvas
pixl的绘制，1.如果绘制点正处于相邻像素交叉线，绘制x像素的线宽，则从交叉线分别向前向后绘制x/2个像素，如果x/2是整数，则刚好填满x个像素，如果是小数，则先把整数格填满，再去绘制剩下的小数部分，绘制时，是将小数部分的颜色用来除以一个像素的宽度，颜色会变淡。所以要用整数坐标来画的话（即绘制点正处于相邻像素交叉线时），线宽必须是2的整数倍。否则会出现不饱满的像素。 2.如果绘制点为一个像素的
编码乱码问题灵静志远 java jvm jsp 编码
1、JVM中单个字符占用的字节长度跟编码方式有关，而默认编码方式又跟平台是一一对应的或说平台决定了默认字符编码方式；2、对于单个字符：ISO-8859-1单字节编码，GBK双字节编码，UTF-8三字节编码；因此中文平台(中文平台默认字符集编码GBK)下一个中文字符占2个字节，而英文平台(英文平台默认字符集编码Cp1252(类似于ISO-8859-1))。 3、getBytes()、getByte
java 求几个月后的日期 darkranger calendar getinstance
Date plandate = planDate.toDate(); SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd"); Calendar cal = Calendar.getInstance(); cal.setTime(plandate); // 取得三个月后时间 cal.add(Calendar.M
数据库设计的三大范式（通俗易懂） aijuans 数据库复习
关系数据库中的关系必须满足一定的要求。满足不同程度要求的为不同范式。数据库的设计范式是数据库设计所需要满足的规范。只有理解数据库的设计范式，才能设计出高效率、优雅的数据库，否则可能会设计出错误的数据库. 目前，主要有六种范式：第一范式、第二范式、第三范式、BC范式、第四范式和第五范式。满足最低要求的叫第一范式，简称1NF。在第一范式基础上进一步满足一些要求的为第二范式，简称2NF。其余依此类推。
想学工作流怎么入手 atongyeye jbpm
工作流在工作中变得越来越重要，很多朋友想学工作流却不知如何入手。很多朋友习惯性的这看一点，那了解一点，既不系统，也容易半途而废。好比学武功，最好的办法是有一本武功秘籍。研究明白，则犹如打通任督二脉。系统学习工作流，很重要的一本书《JBPM工作流开发指南》。本人苦苦学习两个月，基本上可以解决大部分流程问题。整理一下学习思路，有兴趣的朋友可以参考下。 1 首先要
Context和SQLiteOpenHelper创建数据库百合不是茶 android Context创建数据库
一直以为安卓数据库的创建就是使用SQLiteOpenHelper创建,但是最近在android的一本书上看到了Context也可以创建数据库,下面我们一起分析这两种方式创建数据库的方式和区别,重点在SQLiteOpenHelper 一:SQLiteOpenHelper创建数据库: 1,SQLi
浅谈group by和distinct bijian1013 oracle 数据库 group by distinct
group by和distinct只了去重意义一样，但是group by应用范围更广泛些，如分组汇总或者从聚合函数里筛选数据等。譬如：统计每id数并且只显示数大于3 select id ,count(id) from ta
vi opertion 征客丶 mac opration vi
进入 command mode （命令行模式）按 esc 键再按 shift + 冒号注：以下命令中带 $ 【在命令行模式下进行】，不带 $ 【在非命令行模式下进行】一、文件操作 1.1、强制退出不保存 $ q! 1.2、保存 $ w 1.3、保存并退出 $ wq 1.4、刷新或重新加载已打开的文件 $ e 二、光标移动 2.1、跳到指定行数字
【Spark十四】深入Spark RDD第三部分RDD基本API bit1129 spark
对于K/V类型的RDD,如下操作是什么含义？ val rdd = sc.parallelize(List(("A",3),("C",6),("A",1),("B",5)) rdd.reduceByKey(_+_).collect reduceByKey在这里的操作，是把
java类加载机制 BlueSkator java 虚拟机
java类加载机制 1.java类加载器的树状结构引导类加载器 ^ | 扩展类加载器 ^ | 系统类加载器 java使用代理模式来完成类加载，java的类加载器也有类似于继承的关系，引导类是最顶层的加载器，它是所有类的根加载器，它负责加载java核心库。当一个类加载器接到装载类到虚拟机的请求时，通常会代理给父类加载器，若已经是根加载器了，就自己完成加载。虚拟机区分一个Cla
动态添加文本框 BreakingBad 文本框
<script> var num=1; function AddInput() { var str=""; str+="<input
读《研磨设计模式》-代码笔记-单例模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ public class Singleton { } /* * 懒汉模式。注意，getInstance如果在多线程环境中调用，需要加上synchronized，否则存在线程不安全问题 */ class LazySingleton
iOS应用打包发布常见问题 chenhbc ios iOS发布 iOS上传 iOS打包
这个月公司安排我一个人做iOS客户端开发，由于急着用，我先发布一个版本，由于第一次发布iOS应用，期间出了不少问题，记录于此。 1、使用Application Loader 发布时报错：Communication error.please use diagnostic mode to check connectivity.you need to have outbound acc
工作流复杂拓扑结构处理新思路 comsci 设计模式工作算法企业应用 OO
我们走的设计路线和国外的产品不太一样，不一样在哪里呢？国外的流程的设计思路是通过事先定义一整套规则(类似XPDL)来约束和控制流程图的复杂度(我对国外的产品了解不够多，仅仅是在有限的了解程度上面提出这样的看法)，从而避免在流程引擎中处理这些复杂的图的问题，而我们却没有通过事先定义这样的复杂的规则来约束和降低用户自定义流程图的灵活性，这样一来，在引擎和流程流转控制这一个层面就会遇到很
oracle 11g新特性Flashback data archive daizj oracle
1. 什么是flashback data archive Flashback data archive是oracle 11g中引入的一个新特性。Flashback archive是一个新的数据库对象，用于存储一个或多表的历史数据。Flashback archive是一个逻辑对象，概念上类似于表空间。实际上flashback archive可以看作是存储一个或多个表的所有事务变化的逻辑空间。
多叉树:2-3-4树 dieslrae 树
平衡树多叉树,每个节点最多有4个子节点和3个数据项,2,3,4的含义是指一个节点可能含有的子节点的个数,效率比红黑树稍差.一般不允许出现重复关键字值.2-3-4树有以下特征: 1、有一个数据项的节点总是有2个子节点(称为2-节点) 2、有两个数据项的节点总是有3个子节点(称为3-节
C语言学习七动态分配 malloc的使用 dcj3sjt126com c language malloc
/* 2013年3月15日15:16:24 malloc 就memory(内存) allocate(分配)的缩写本程序没有实际含义，只是理解使用 */ # include <stdio.h> # include <malloc.h> int main(void) { int i = 5; //分配了4个字节静态分配 int * p
Objective-C编码规范[译] dcj3sjt126com 代码规范
原文链接 : The official raywenderlich.com Objective-C style guide 原文作者 : raywenderlich.com Team 译文出自 : raywenderlich.com Objective-C编码规范译者 : Sam Lau
0.性能优化-目录 frank1234 性能优化
从今天开始笔者陆续发表一些性能测试相关的文章，主要是对自己前段时间学习的总结，由于水平有限，性能测试领域很深，本人理解的也比较浅，欢迎各位大咖批评指正。主要内容包括：一、性能测试指标吞吐量、TPS、响应时间、负载、可扩展性、PV、思考时间 http://frank1234.iteye.com/blog/2180305 二、性能测试策略生产环境相同基准测试预热等 htt
Java父类取得子类传递的泛型参数Class类型 happyqing java 泛型父类子类 Class
import java.lang.reflect.ParameterizedType; import java.lang.reflect.Type; import org.junit.Test; abstract class BaseDao<T> { public void getType() { //Class<E> clazz =
跟我学SpringMVC目录汇总贴、PDF下载、源码下载 jinnianshilongnian springMVC
----广告-------------------------------------------------------------- 网站核心商详页开发掌握Java技术，掌握并发/异步工具使用，熟悉spring、ibatis框架；掌握数据库技术，表设计和索引优化，分库分表/读写分离；了解缓存技术，熟练使用如Redis/Memcached等主流技术；了解Ngin
the HTTP rewrite module requires the PCRE library 流浪鱼 rewrite
./configure: error: the HTTP rewrite module requires the PCRE library. 模块依赖性Nginx需要依赖下面3个包 1. gzip 模块需要 zlib 库 ( 下载: http://www.zlib.net/ ) 2. rewrite 模块需要 pcre 库 ( 下载: http://www.pcre.org/ ) 3. s
第12章 Ajax（中） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Optimize query with Query Stripping in Web Intelligence blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Optimize+query+with+Query+Stripping+in+Web+Intelligence and a very straightfoward video http://www.sdn.sap.com/irj/scn/events?rid=/library/uuid/40ec3a0c-936
Java开发者写SQL时常犯的10个错误 tomcat_oracle java sql
1、不用PreparedStatements 　　有意思的是，在JDBC出现了许多年后的今天，这个错误依然出现在博客、论坛和邮件列表中，即便要记住和理解它是一件很简单的事。开发者不使用PreparedStatements的原因可能有如下几个：　　他们对PreparedStatements不了解　　他们认为使用PreparedStatements太慢了　　他们认为写Prepar
世纪互联与结盟有感阿尔萨斯
10月10日，世纪互联与（Foxcon）签约成立合资公司，有感。全球电子制造业巨头（全球500强企业）与世纪互联共同看好IDC、云计算等业务在中国的增长空间，双方迅速果断出手，在资本层面上达成合作，此举体现了全球电子制造业巨头对世纪互联IDC业务的欣赏与信任，另一方面反映出世纪互联目前良好的运营状况与广阔的发展前景。众所周知，精于电子产品制造（世界第一），对于世纪互联而言，能够与结盟

C++ vs Python向量运算速度评测

你可能感兴趣的:(python)