hjimce

机器学习（十四）Libsvm学习笔记

Libsvm学习笔记

原文地址：http://blog.csdn.net/hjimce/article/details/46971039

作者：hjimce

LIBSVM软件包是台湾大学林智仁(Chih-Jen Lin)博士等用C++实现的LIBSVM库，可以说是使用最方便的SVM训练工具。可以解决分类问题(包括C-SVC、n-SVC)、回归问题(包括e-SVR、n-SVR)以及分布估计(one-class-SVM )等问题，提供了线性、多项式、径向基和S形函数四种常用的核函数供选择，可以有效地解决多类问题、交叉验证选择参数、对不平衡样本加权、多类问题的概率估计等。

但是，在Windows环境下，此软件包只提供DOS工具集(主要包括：训练工具svmtrain.exe，预测工具svmpredict.exe，缩放数据工具svmscale.exe和二维演示工具svmtoy.exe)，不过它的源码是开放的，因此我们可以直接调用源码。首先从网上下载libsvm工具包：

然后解压，

把svm.cpp和svm.h复制出来，因为对于我们做开发的，只需要这两个文件就可以了，然后把这两个文件放到vs的项目文件下，然后进行调用。

本篇博文主要讲，如何调用使用libsvm，我主要是通过两个简单的例子，演示如何调用libsvm。因为有了例子，学起来非常容易。

一、二分类测试案例

svm算法是学习训练算法，因此调用的步骤是：

1、数据归一化，数据归一化这一步libsvm好像没有提供函数，所以这一步要自己手动写一些代码，如果没有进行归一化，有的时候会出现问题。

2、数据训练

训练调用函数：

struct svm_model *svm_train(const struct svm_problem *prob, const struct svm_parameter *param);

只要学会这个函数的调用就可以实现训练了。

这个函数包含两个输入参数，第一个参数prob用于输入训练数据，包括输入特征X，训练数据标签y，训练样本的个数，具体svm_problem结构体的定义如下：

struct svm_problem
{
	int l;//训练数据的个数
	double *y;//训练数据的标签，y[i]表示第i个样本的标签
	struct svm_node **x;//训练数据的特征，x[i][j]表示第i个样本的第j个特征值
};

第二个参数，定义了svm算法的相关初始化参数，比如惩罚因子、核函数等，具体的结构体定义如下：

struct svm_parameter
{
	int svm_type;//svm的类型，包括分类、预测拟合等，如果想用svm进行分类那么可以选择C_SVC，如果想用于拟合预测那么可以选择EPSILON_SVR
	int kernel_type;//核函数类型，包括线性核函数、高斯核函数、S激活函数、多项式
	int degree;	/* for poly */
	double gamma;	/* for poly/rbf/sigmoid */
	double coef0;	/* for poly/sigmoid */

	/* these are for training only */
	double cache_size; /* in MB */
	double eps;	/* stopping criteria *///迭代误差终止条件
	double C;	/* for C_SVC, EPSILON_SVR and NU_SVR *///惩罚因子
	int nr_weight;		/* for C_SVC */
	int *weight_label;	/* for C_SVC */
	double* weight;		/* for C_SVC */
	double nu;	/* for NU_SVC, ONE_CLASS, and NU_SVR */
	double p;	/* for EPSILON_SVR */
	int shrinking;	/* use the shrinking heuristics */
	int probability; /* do probability estimates */
};

具体每个参数的含义，在svm.h文件的定义中，都用相关的注释。

因此进行训练的时候，需要对这两个结构体的相关参数非常清晰。

在上面输入训练数据后，我们一般是先调用下面这个函数：

const char *svm_check_parameter(const struct svm_problem *prob, const struct svm_parameter *param);

这个函数可以进行检验你输入的参数pro，para的格式是否正确，调用完后，才调用svm_train()函数，这样可以确保输入的数据和svm的参数设置没有错后在进行训练。

3、数据预测分类

通过调用svm_train()函数完成训练过程，将返回参数svm_model模型。接着如果要进行预测分类可以调用如下函数：

double svm_predict(const struct svm_model *model, const struct svm_node *x);

这个函数的第一个输入参数就是我们通过训练过程得到的svm_model，第二个参数就是*x就是输入特征，如x[i]表示第i维特征的数值。数据的返回值，如果你是二分类模型，那么将返回数据标签：-1.0，1.0。如果你是用于预测拟合，那么将返回预测到的数值。

开始写代码前，我觉得svm_node的格式需要说明一下：

struct svm_node //储存单一向量的单个特征
{
	int index; //索引
	double value; //值
};

svm_node是定义特征向量的标准输入格式。假设有三维的特征向量X=(10,1,3)，那么就需要使用语句：new svm_node*x=new svm_node[4]，来定义一个特征向量，然后特征就可以使用3个svm_node来保存：

index	1	2	3			-1
value	10	1	3			NULL

最后一个svm_node是结束的标志，其索引值为-1，数值随便。libsvm就是通过判断其索引是否为-1，来判别特征向量结束的。

OK，接着就用例子作为演示示例，下面是一个二分类的例子，通过输入一个人的身高和体重特征，判别其男性还是女性。下面的例子没有经过归一化，所以其实是不规范的，libsvm并没有进行内部归一化，要自己进行外部归一化好后，在调用libsvm，因为我选用了核函数为线性核函数，有没有归一化好像没啥影响，然而如果选择其他的核函数，那就会发现没有归一化会出现的问题了。

下面我先通过win32控制台，进行测试的一个例子：

#include "stdafx.h"
#include "svm/svm.h"
#include <iostream>
svm_parameter Initialize_svm_parameter()
{
	svm_parameter svmpara;//svm的相关参数
	svmpara.svm_type = C_SVC;
	svmpara.kernel_type = LINEAR;
	svmpara.degree = 3;
	svmpara.gamma = 0;	// 默认大小可选择特征的倒数 1/num_features，核函数中的gamma函数设置（只针对多项式/rbf/sigmoid核函数）
	svmpara.coef0 = 0;
	svmpara.nu = 0.5;
	svmpara.cache_size = 1;//缓存块大小
	svmpara.C = 1;
	svmpara.eps = 1e-3;
	svmpara.p = 0.1;
	svmpara.shrinking = 1;
	svmpara.probability = 0;
	svmpara.nr_weight = 0;
	svmpara.weight_label = NULL;
	svmpara.weight = NULL;
	return svmpara;
}
//二分类测试
//下面是通过人体身高和体重，进行性别的判别
int _tmain(int argc, _TCHAR* argv[])
{
	

	/*训练样本选取是学生的身高和体重：
		男1：身高：190cm，体重：70kg；
		男2：身高：180cm，体重：80kg；
		女1：身高：161cm，体重：80kg；
		女2：身高：161cm，体重：47kg；*/

	int sample_num=4;//训练样本个数为4
	int feature_dimn=2;//样本的特征维数为2
	double *y=new double[sample_num];
	double **x=new double *[sample_num];
	for (int i=0;i<sample_num;i++)
	{
		x[i]=new double[feature_dimn];
	}
	x[0][0]=190;x[0][1]=70;y[0]=-1;//训练样本1
	x[1][0]=180;x[1][1]=80;y[1]=-1;//训练样本2
	x[2][0]=161;x[2][1]=80;y[2]=1;//训练样本3
	x[3][0]=161;x[3][1]=47;y[3]=1;//训练样本4




//训练数据输入
	svm_parameter svmpara=Initialize_svm_parameter();//svm参数初始化
	svm_problem svmpro;//svm训练数据
	svmpro.l=sample_num;
	svmpro.y=y;//训练数据标签
	svmpro.x=new svm_node *[sample_num];//训练数据的特征向量
	for (int i=0;i<sample_num;i++)
	{
		svmpro.x[i]=new svm_node[feature_dimn+1];
		for (int j=0;j<feature_dimn;j++)
		{
			svm_node node_ij;
			node_ij.index=j+1;//需要注意的是svm_node的第一个数据的索引为1，数值为第一位特征值，我一开始这里搞错了，把索引搞成从0开始
			node_ij.value=x[i][j];
			svmpro.x[i][j]=node_ij;
		}
		svm_node node_last;//需要添加最后一维特征的索引为-1
		node_last.index=-1;
		svmpro.x[i][feature_dimn]=node_last;
	}






//验证输入的训练数据、初始化的参数是否有误
	const char *error_msg;
	error_msg = svm_check_parameter(&svmpro,&svmpara);
	if(error_msg)
	{
		std::cout<<error_msg;
		return 0;
	}
//数据训练
	svm_model *svmmodel=svm_train(&svmpro,&svmpara);

	
/*预测数据1：身高180cm，体重85kg；
预测数据2：身高161cm，体重50kg；*/
	svm_node *testX1=new svm_node[feature_dimn+1];
	testX1[0].index=1;
	testX1[0].value=180;
	testX1[1].index=2;
	testX1[1].value=85;
	testX1[2].index=-1;
	double testY1=svm_predict(svmmodel,testX1);
	std::cout<<"测试预测1："<<testY1<<std::endl;


	svm_node *testX2=new svm_node[feature_dimn+1];
	testX2[0].index=1;
	testX2[0].value=161;
	testX2[1].index=2;
	testX2[1].value=50;
	testX2[2].index=-1;
	double testY2=svm_predict(svmmodel,testX2);//分类预测函数
	std::cout<<"测试预测2："<<testY2<<std::endl;

	return 0;
}

最后的运行正确结果：

二、数据预测拟合案例

接着这个例子是要演示，使用libsvm进行如下图所示的数据拟合，通过数据输入二维的数据点，然后拟合出曲线，也就是相当于输入特征x，然后预测y值：

因此这个特征向量X是一维特征向量。

下面是通过svm进行数据拟合预测的类，为了方便我先把它它的调用封装成类，.cpp文件如下：

CLibsvm::CLibsvm(float C,float gamma,float epsilon)
{

	m_svmpara=Initialize_svm_parameter(C,gamma,epsilon);
}


CLibsvm::~CLibsvm(void)
{
}
svm_parameter CLibsvm::Initialize_svm_parameter(float C,float gamma,float epsilon)
{
	svm_parameter svmpara;//svm的相关参数
	svmpara.svm_type = EPSILON_SVR;
	svmpara.kernel_type =RBF;
	svmpara.degree = 3;
	svmpara.gamma = gamma;	// 默认大小可选择特征的倒数 1/num_features，核函数中的gamma函数设置（只针对多项式/rbf/sigmoid核函数）
	svmpara.coef0 = 0;
	svmpara.nu = 0.5;
	svmpara.cache_size = 1;//缓存块大小
	svmpara.C = C;
	svmpara.eps = 1e-3;
	svmpara.p = epsilon;
	svmpara.shrinking = 1;
	svmpara.probability = 0;
	svmpara.nr_weight = 0;
	svmpara.weight_label = NULL;
	svmpara.weight = NULL;
	return svmpara;
}
//拟合数据输入
void CLibsvm::TrainModel(vector<vec2>traindata)
{
	//Normalizedata(traindata,m_minpt,m_maxpt);
	int sample_num=traindata.size();//训练样本个数
	int feature_dimn=1;//样本的特征维数为1
	double *y=new double[sample_num];
	double **x=new double *[sample_num];
	for (int i=0;i<sample_num;i++)
	{
		x[i]=new double[feature_dimn];
	}

	for (int i=0;i<sample_num;i++)
	{
		y[i]=traindata[i][feature_dimn];
		for (int j=0;j<feature_dimn;j++)
		{
			x[i][j]=traindata[i][j];
		}
	}

//训练数据归一化
	//获取最大最小值
	GetMax_Min(y,sample_num,m_miny,m_maxy);//训练数据y的最大最小值获取
	m_minx=new double[feature_dimn];//特征最大最小值获取
	m_maxx=new double[feature_dimn];
	double *pdata=new double[sample_num];
	for (int j=0;j<feature_dimn;j++)
	{
		for (int i=0;i<sample_num;i++)
		{
			pdata[i]=x[i][j];	
		}
		GetMax_Min(pdata,sample_num,m_minx[j],m_maxx[j]);
	}
	//训练数据归一化
	for (int i=0;i<sample_num;i++)
	{
		y[i]=2*(y[i]-m_miny)/(m_maxy-m_miny)-1;
		for (int j=0;j<feature_dimn;j++)
		{
			x[i][j]=2*(x[i][j]-m_minx[j])/(m_maxx[j]-m_minx[j])-1;
		}
	}



//训练数据输入
	svm_problem svmpro;//svm训练数据
	svmpro.l=sample_num;
	svmpro.y=new double[sample_num];
	svmpro.x=new svm_node *[sample_num];//训练数据的特征向量
	for (int i=0;i<sample_num;i++)
	{
		svmpro.y[i]=y[i];//用训练数据的y，作为输入标签
		svmpro.x[i]=new svm_node[feature_dimn+1];
		for (int j=0;j<feature_dimn;j++)
		{
			svm_node node_ij;
			node_ij.index=j+1;//需要注意的是svm_node的第一个数据的索引为1，数值为第一位特征值，我一开始这里搞错了，把索引搞成从0开始
			node_ij.value=x[i][j];
			svmpro.x[i][j]=node_ij;
		}
		svm_node node_last;//需要添加最后一维特征的索引为-1
		node_last.index=-1;
		svmpro.x[i][feature_dimn]=node_last;
	}
//验证输入的训练数据、初始化的参数是否有误
	const char *error_msg;
	error_msg = svm_check_parameter(&svmpro,&m_svmpara);
	if(error_msg)
	{
		AfxMessageBox(error_msg);
	}
//数据训练
	m_svmmodel=svm_train(&svmpro,&m_svmpara);
}
void CLibsvm::Predict(float x,float &y)
{

	x=2*(x-m_minx[0])/(m_maxx[0]-m_minx[0])-1;
	svm_node *testX1=new svm_node[1+1];
	testX1[0].index=1;
	testX1[0].value=x;
	testX1[1].index=-1;
	y=(svm_predict(m_svmmodel,testX1)+1)*(m_maxy-m_miny)*0.5+m_miny;


}
//数据归一化
void CLibsvm::GetMax_Min(double*pdata,int data_num,double &minpt,double&maxpt)
{

	double minx=1e10;
	double maxx=-1e10;
	for (int i=0;i<data_num;i++)
	{
		if (pdata[i]<minx)
		{
			minx=pdata[i];
		}
		if (pdata[i]>maxx)
		{
			maxx=pdata[i];
		}
	}
	minpt=minx;
	maxpt=maxx;
}

然后是头文件：

#pragma once
#include "svm/svm.h"
#include "Vec.h"
#include <vector>
class CLibsvm
{
public:
	CLibsvm(float C=1,float gamma=1,float epsilon=0.1);
	~CLibsvm(void);
	void TrainModel(vector<vec2>traindata);//数据训练
	void Predict(float x,float &y);//拟合预测函数

private:
	svm_parameter Initialize_svm_parameter(float C=1,float gamma=1,float epsilon=0.1);//参数初始化函数
	svm_parameter m_svmpara;
	svm_problem m_svmprob;
	std::vector<vec2>m_traindata;//二维拟合数据
	svm_model *m_svmmodel;
	void GetMax_Min(double*pdata,int data_num,double &minpt,double&maxpt);//获取数据归一化的最大最小值
	double *m_maxx;//归一化用的参数
	double *m_minx;
	double m_miny;
	double m_maxy;

};

OK，接着是封装好的这个类的调用：

	//m_controlpoint为训练数据，也就是鼠标输入蓝色的点
   	CLibsvm csvm(1);
	csvm.TrainModel(m_controlpoint);//二维数据点
/*
	CLibsvm csvm2(1,1);
	csvm2.TrainModel(m_controlpoint);*/
	float minx=1e10;
	float maxx=0;
	for (int i=0;i<m_controlpoint.size();i++)
	{
		if (m_controlpoint[i][0]<minx)
		{
			minx=m_controlpoint[i][0];
		}
		if (m_controlpoint[i][0]>maxx)
		{
			maxx=m_controlpoint[i][0];
		}
	}
	m_resultcurve.clear();
	for (int i=minx;i<maxx;i++)
	{
		float y=0;
		csvm.Predict(i,y);
		m_resultcurve.push_back(vec2(i,y));//绘制拟合曲线

		float y2=0;
/*
		csvm2.Predict(i,y2);
		m_resultcurve2.push_back(vec2(i,y2));*/
	}

接着分析一下CLibsvm构造函数的三个参数好如何选择：

首先第一个参数是惩罚因子，这个参数越大，拟合出来的曲线自然而然越精确，测试一下，测试代码如下：

	//m_controlpoint为训练数据，也就是鼠标输入蓝色的点
   	CLibsvm csvm(1);
	csvm.TrainModel(m_controlpoint);//二维数据点

	CLibsvm csvm2(100);
	csvm2.TrainModel(m_controlpoint);
	float minx=1e10;
	float maxx=0;
	for (int i=0;i<m_controlpoint.size();i++)
	{
		if (m_controlpoint[i][0]<minx)
		{
			minx=m_controlpoint[i][0];
		}
		if (m_controlpoint[i][0]>maxx)
		{
			maxx=m_controlpoint[i][0];
		}
	}
	m_resultcurve.clear();
	for (int i=minx;i<maxx;i++)
	{
		float y=0;
		csvm.Predict(i,y);
		m_resultcurve.push_back(vec2(i,y));//绘制拟合曲线

		float y2=0;

		csvm2.Predict(i,y2);
		m_resultcurve2.push_back(vec2(i,y2));
	}

通过分别选用C=1 和C=100的参数，得到如下绿色和红色结果曲线，红色的曲线为C=100得到的结果：

OK，接着测试一下，参数sigma对结果的影响，测试代码如下：

   	CLibsvm csvm(1,1);
	csvm.TrainModel(m_controlpoint);//二维数据点

	CLibsvm csvm2(1,100);
	csvm2.TrainModel(m_controlpoint);
	float minx=1e10;
	float maxx=0;
	for (int i=0;i<m_controlpoint.size();i++)
	{
		if (m_controlpoint[i][0]<minx)
		{
			minx=m_controlpoint[i][0];
		}
		if (m_controlpoint[i][0]>maxx)
		{
			maxx=m_controlpoint[i][0];
		}
	}
	m_resultcurve.clear();
	for (int i=minx;i<maxx;i++)
	{
		float y=0;
		csvm.Predict(i,y);
		m_resultcurve.push_back(vec2(i,y));//绘制拟合曲线

		float y2=0;

		csvm2.Predict(i,y2);
		m_resultcurve2.push_back(vec2(i,y2));
	}

上面的代码中，我分别选择sigma=1，sigma=100进行比较，结果如下：

可以看到与C一样，参数越大，对于训练数据，其误差越小。当然我们需要知道，对于机器学习算法来说，训练数据后的误差越小并不是越好，上面的结果其实是过拟合的。

参考文献：

1、http://blog.csdn.net/liulina603/article/details/8532837

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
一百九十四章. 自相矛盾巨木擎天
唉！就这么一夜，林子感觉就像过了很多天似的，先是回了阳间家里，遇到了那么多不可思议的事情儿。特别是小伙伴们，第二次与自己见面时，僵硬的表情和恐怖的气氛，让自己如坐针毡，打从心眼里难受！还有东子，他现在还好吗？有没有被人欺负？护城河里的小鱼小虾们，还都在吗？水不会真的干枯了吧？那对相亲相爱漂亮的太平鸟儿，还好吧！春天了，到了做窝、下蛋、喂养小鸟宝宝的时候了，希望它们都能够平安啊！虽然没有看见家人，也
【一起学Rust | 设计模式】习惯语法——使用借用类型作为参数、格式化拼接字符串、构造函数广龙宇一起学Rust #Rust设计模式 rust 设计模式开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、使用借用类型作为参数二、格式化拼接字符串三、使用构造函数总结前言Rust不是传统的面向对象编程语言，它的所有特性，使其独一无二。因此，学习特定于Rust的设计模式是必要的。本系列文章为作者学习《Rust设计模式》的学习笔记以及自己的见解。因此，本系列文章的结构也与此书的结构相同（后续可能会调成结构），基本上分为三个部分
每日一题——第八十四题互联网打工人no1 C语言程序设计每日一练 c语言
题目：编写函数1、输入10个职工的姓名和职工号2、按照职工由大到小顺序排列，姓名顺序也随之调整3、要求输入一个职工号，用折半查找法找出该职工的姓名#define_CRT_SECURE_NO_WARNINGS#include#include#defineMAX_EMPLOYEES10typedefstruct{intid;charname[50];}Empolyee;voidinputEmploye
四章-32-点要素的聚合彩云飘过
本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
日常演播练习0822 开阳春天
日常演播练习0822一、绕口令练习司小四和史小世，四月十四日十四时四十上集市，司小四买了四十四斤四两西红柿，史小世买了十四斤四两细蚕丝。司小四要拿四十四斤四两西红柿换史小世十四斤四两细蚕丝。史小世十四斤四两细蚕丝不换司小四四十四斤四两西红柿。司小四说我四十四斤四两西红柿可以增加营养防近视，史小世说我十四斤四两细蚕丝可以织绸织缎又抽丝。二、文本练习狗熊是动物街有名的美食家，它吃得多所以长得胖，它能吃
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
语文主题教学学习笔记之87 东哥杂谈
“语文主题教学”学习笔记之八十七（0125）今天继续学习小学语文主题教学的实践样态。板块三：教学中体现“书艺”味道。作为四大名著之一的《水浒传》，堪称我国文学宝库之经典。对从《水浒传》中摘选的单元，教师就要了解其原生态，即评书体特点。这也要求教师要了解一些常用的评书行话术语，然后在教学时适时地加入一些，让学生体味其文本中原有的特色。学生也要尽可能地通过朗读的方式，而不单是分析讲解的方式进行学习。细
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
《转介绍方法论》学习笔记小可乐的妈妈
一、高效转介绍的流程：价值观---执行----方案一）转介绍发生的背景：1、对象：谁向谁转介绍？全员营销，人人参与。①员工的激励政策、客户的转介绍诱因制作客户画像：a信任；支付能力；意愿度；便利度（根据家长具备四个特征的个数分为四类）B性格分类C职业分类D年龄性别②执行：套路，策略，方法，流程2、诱因：为什么要转介绍？认同信任；多方共赢；传递美好；零风险承诺打动人心，超越期待。选择做教育，就是选择
JAVA学习笔记之23种设计模式学习 victorfreedom Java技术设计模式 android java 常用设计模式
博主最近买了《设计模式》这本书来学习，无奈这本书是以C++语言为基础进行说明，整个学习流程下来效率不是很高，虽然有的设计模式通俗易懂，但感觉还是没有充分的掌握了所有的设计模式。于是博主百度了一番，发现有大神写过了这方面的问题，于是博主迅速拿来学习。一、设计模式的分类总体来说设计模式分为三大类：创建型模式，共五种：工厂方法模式、抽象工厂模式、单例模式、建造者模式、原型模式。结构型模式，共七种：适配器
辰辰日记四十四谷子
昨天是重阳节，当然我们都没有刻意提起这个节日，似乎并不重要，生长在城市，连爬山都不是寻常事。人人都是忙碌之人，虽然人人也都难以说清自己都在忙些什么。其实这一天以又是你外婆的生日。原来妈妈想好给外婆买一双鞋子，不过，这段时间外婆生病了。病得挺严重，无法睡眠，不能行走。辰辰，你一定不能想象这是一种什么情况，人怎么会无法睡觉，躺不下床。当人颈椎有伤，且血管不通畅就会这样。你一躺下就整个人头晕目眩。那就是
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
新能源汽车 BMS 学习笔记篇—BMS 基本定义及分类 WPG大大通其他笔记汽车 BMS 经验分享新能源电池
一、BMS定义1、概念：BMS（BatteryManagementSystem）即电池管理系统，其管理对象是二次电池（充电电池或蓄电池），其主要目的是电池的利用率，防止电池出现过度充电和过度放电，可应用于电动汽车、电瓶车、机器人、无人机等图片来源：腾讯网https://new.qq.com《标准普尔警告，电动汽车电池生产面临供应链和地缘政治风险》2、四大功能①感知和测量：检测电池的电压、电流、温度
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
高级UI<第二十四篇>：Android中用到的矩阵常识 NoBugException
（1）定义在数学中，矩阵（Matrix）是一个按照长方阵列排列的复数或实数集合。由m×n个数aij排成的m行n列的数表称为m行n列的矩阵，简称m×n矩阵。记作：图片.png这m×n个数称为矩阵A的元素，简称为元，数aij位于矩阵A的第i行第j列，称为矩阵A的(i,j)元，以数aij为(i,j)元的矩阵可记为(aij)或(aij)m×n，m×n矩阵A也记作Amn。元素是实数的矩阵称为实矩阵，元素是复
ArcGIS Pro SDK （十四）地图探索 5 时间与动画 WineMonk ArcGIS Pro SDK arcgis arcgis pro sdk gis c#
ArcGISProSDK（十四）地图探索5时间与动画文章目录ArcGISProSDK（十四）地图探索5时间与动画1时间1.1时间提前1个月1.2禁用地图中的时间。2动画2.1设置动画长度2.2缩放动画2.3相机关键帧2.4插值相机2.5插值时间2.6插值范围2.7创建摄像机关键帧2.8创建时间关键帧2.9创建范围关键帧2.10创建图层关键帧环境：VisualStudio2022+.NET6+Arc
史上最全git命令,git回滚,git命令大全騒周其他 git
git命令大全一、Git整体理解二、由暂存区本地仓库三、由本地仓->远程仓库四、冲突处理五、Git分支操作六、bug的分支七、feature分支八、暂存的使用九、远程仓的操作十、标签的使用十一、Git配置全局信息十二、Linux的一些简单操作和一些符号的解释十三、符号解释十四、显示安装详细信息十五、gitconfig十六、Gitclone十七、Gitinit十八、gitstatus十九、gitre
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
【道德经】第二十四章企者不立稀土永磁Amy
企者不立，跨者不行。自见者不明，自是者不彰，自伐者无功，自矜者不长。其于道也，曰余食赘行，物或恶之，故有道者不处也。踮起脚跟，想要站得高的人反而站不稳；跳跃式地前行的人反而走不远。自我显摆的人，反而难以显明；自以为是的人，其优点反而得不到彰显；自吹自擂的人，有功劳也没人承认；自高自大的人，难以成为领袖人物。
2023-02-04（周六）正月十四一方8897
昨天去拜访所有的亲戚，中午给舅妈过了五七，带了牛奶、燕麦和200元钱，接着给三舅、二姨捎了东西，由于初一去了四姨家，没给她带东西，回来的路上去看了大姨。然后找领导签字，和她聊了当前的困难和现状以及今后的打算，结果并不理想。回家路上给大爷拜年，半年多没见又和他聊了好久，快到家时接到ＹＨ电话，内心也有兴奋和欣喜。上楼后自己的心脏蹦蹦跳，好累。又开始憋气，到了厨房闻到油烟很不舒服，一夜回到解放前，乳房和
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
二十四、k8s 资源管理繁华依在 k8s kubernetes 容器云原生
目录一、资源配置范围管理LimitRange介绍1、LimitRange可以做什么：2、资源限制和请求的约束3、创建LimitsRange对象4、示例：创建一个pod5、测试用例测试1：测试2：测试3：二、资源服务质量管理（RequestsQos）1、Qos级别分类：1.1、Guaranteed：1.2、BestEffort：1.3、Burstable：2、Qos的工作特点3、示例三、资源配额管理
python中zeros用法_Python中的numpy.zeros()用法江平舟 python中zeros用法
numpy.zeros()函数是最重要的函数之一,广泛用于机器学习程序中。此函数用于生成包含零的数组。numpy.zeros()函数提供给定形状和类型的新数组,并用零填充。句法numpy.zeros(shape,dtype=float,order='C'参数形状：整数或整数元组此参数用于定义数组的尺寸。此参数用于我们要在其中创建数组的形状,例如(3,2)或2。dtype：数据类型(可选)此参数用于
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
解读Servlet原理篇二---GenericServlet与HttpServlet 周凡杨 java HttpServlet 源理 GenericService 源码
在上一篇《解读Servlet原理篇一》中提到，要实现javax.servlet.Servlet接口（即写自己的Servlet应用），你可以写一个继承自javax.servlet.GenericServletr的generic Servlet ，也可以写一个继承自java.servlet.http.HttpServlet的HTTP Servlet（这就是为什么我们自定义的Servlet通常是exte
MySQL性能优化 bijian1013 数据库 mysql
性能优化是通过某些有效的方法来提高MySQL的运行速度，减少占用的磁盘空间。性能优化包含很多方面，例如优化查询速度，优化更新速度和优化MySQL服务器等。本文介绍方法的主要有： a.优化查询 b.优化数据库结构
ThreadPool定时重试 dai_lm java ThreadPool thread timer timertask
项目需要当某事件触发时，执行http请求任务，失败时需要有重试机制，并根据失败次数的增加，重试间隔也相应增加，任务可能并发。由于是耗时任务，首先考虑的就是用线程来实现，并且为了节约资源，因而选择线程池。为了解决不定间隔的重试，选择Timer和TimerTask来完成 package threadpool; public class ThreadPoolTest {
Oracle 查看数据库的连接情况周凡杨 sql oracle 连接
首先要说的是，不同版本数据库提供的系统表会有不同，你可以根据数据字典查看该版本数据库所提供的表。 select * from dict where table_name like '%SESSION%'; 就可以查出一些表，然后根据这些表就可以获得会话信息 select sid,serial#,status,username,schemaname,osuser,terminal,ma
类的继承朱辉辉33 java
类的继承可以提高代码的重用行，减少冗余代码；还能提高代码的扩展性。Java继承的关键字是extends 格式:public class 类名（子类）extends 类名（父类）{ } 子类可以继承到父类所有的属性和普通方法，但不能继承构造方法。且子类可以直接使用父类的public和 protected属性，但要使用private属性仍需通过调用。子类的方法可以重写，但必须和父类的返回值类
android 悬浮窗特效肆无忌惮_ android
最近在开发项目的时候需要做一个悬浮层的动画，类似于支付宝掉钱动画。但是区别在于，需求是浮出一个窗口，之后边缩放边位移至屏幕右下角标签处。效果图如下：一开始考虑用自定义View来做。后来发现开线程让其移动很卡，ListView+动画也没法精确定位到目标点。后来想利用Dialog的dismiss动画来完成。自定义一个Dialog后，在styl
hadoop伪分布式搭建林鹤霄 hadoop
要修改4个文件 1: vim hadoop-env.sh 第九行 2: vim core-site.xml <configuration> &n
gdb调试命令 aigo gdb
原文：http://blog.csdn.net/hanchaoman/article/details/5517362 一、GDB常用命令简介 r run 运行.程序还没有运行前使用 c cuntinue
Socket编程的HelloWorld实例 alleni123 socket
public class Client { public static void main(String[] args) { Client c=new Client(); c.receiveMessage(); } public void receiveMessage(){ Socket s=null; BufferedRea
线程同步和异步百合不是茶线程同步异步
多线程和同步 : 如进程、线程同步，可理解为进程或线程A和B一块配合，A执行到一定程度时要依靠B的某个结果，于是停下来，示意B运行；B依言执行，再将结果给A；A再继续操作。所谓同步，就是在发出一个功能调用时，在没有得到结果之前，该调用就不返回，同时其它线程也不能调用这个方法多线程和异步:多线程可以做不同的事情,涉及到线程通知 &
JSP中文乱码分析 bijian1013 java jsp 中文乱码
在JSP的开发过程中，经常出现中文乱码的问题。首先了解一下Java中文问题的由来： Java的内核和class文件是基于unicode的，这使Java程序具有良好的跨平台性，但也带来了一些中文乱码问题的麻烦。原因主要有两方面，
js实现页面跳转重定向的几种方式 bijian1013 JavaScript 重定向
js实现页面跳转重定向有如下几种方式：一.window.location.href <script language="javascript"type="text/javascript"> window.location.href="http://www.baidu.c
【Struts2三】Struts2 Action转发类型 bit1129 struts2
在【Struts2一】 Struts Hello World http://bit1129.iteye.com/blog/2109365中配置了一个简单的Action，配置如下 <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configurat
【HBase十一】Java API操作HBase bit1129 hbase
Admin类的主要方法注释： 1. 创建表 /** * Creates a new table. Synchronous operation. * * @param desc table descriptor for table * @throws IllegalArgumentException if the table name is res
nginx gzip ronin47 nginx gzip
Nginx GZip 压缩 Nginx GZip 模块文档详见：http://wiki.nginx.org/HttpGzipModule 常用配置片段如下： gzip on; gzip_comp_level 2; # 压缩比例，比例越大，压缩时间越长。默认是1 gzip_types text/css text/javascript; # 哪些文件可以被压缩 gzip_disable &q
java-7.微软亚院之编程判断俩个链表是否相交给出俩个单向链表的头指针，比如 h1 ， h2 ，判断这俩个链表是否相交 bylijinnan java
public class LinkListTest { /** * we deal with two main missions: * * A. * 1.we create two joined-List(both have no loop) * 2.whether list1 and list2 join * 3.print the join
Spring源码学习-JdbcTemplate batchUpdate批量操作 bylijinnan java spring
Spring JdbcTemplate的batch操作最后还是利用了JDBC提供的方法，Spring只是做了一下改造和封装 JDBC的batch操作： String sql = "INSERT INTO CUSTOMER " + "(CUST_ID, NAME, AGE) VALUES (?, ?, ?)";
[JWFD开源工作流]大规模拓扑矩阵存储结构最新进展 comsci 工作流
生成和创建类已经完成,构造一个100万个元素的矩阵模型,存储空间只有11M大,请大家参考我在博客园上面的文档"构造下一代工作流存储结构的尝试",更加相信的设计和代码将陆续推出......... 竞争对手的能力也很强.......,我相信..你们一定能够先于我们推出大规模拓扑扫描和分析系统的....
base64编码和url编码 cuityang base64 url
import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; import java.io.PrintWriter; import java.io.StringWriter; import java.io.UnsupportedEncodingException;
web应用集群Session保持 dalan_123 session
关于使用 memcached 或redis 存储 session ，以及使用 terracotta 服务器共享。建议使用 redis，不仅仅因为它可以将缓存的内容持久化，还因为它支持的单个对象比较大，而且数据类型丰富，不只是缓存 session，还可以做其他用途，一举几得啊。1、使用 filter 方法存储这种方法比较推荐，因为它的服务器使用范围比较多，不仅限于tomcat ，而且实现的原理比较简
Yii 框架里数据库操作详解-[增加、查询、更新、删除的方法 'AR模式'] dcj3sjt126com 数据库
public function getMinLimit () { $sql = "..."; $result = yii::app()->db->createCo
solr StatsComponent（聚合统计） eksliang solr聚合查询 solr stats
StatsComponent 转载请出自出处：http://eksliang.iteye.com/blog/2169134 http://eksliang.iteye.com/ 一、概述 Solr可以利用StatsComponent 实现数据库的聚合统计查询，也就是min、max、avg、count、sum的功能二、参数
百度一道面试题 greemranqq 位运算百度面试寻找奇数算法 bitmap 算法
那天看朋友提了一个百度面试的题目：怎么找出{1,1,2,3,3,4,4,4,5,5,5,5} 找出出现次数为奇数的数字. 我这里复制的是原话，当然顺序是不一定的，很多拿到题目第一反应就是用map,当然可以解决，但是效率不高。还有人觉得应该用算法xxx,我是没想到用啥算法好...！还有觉得应该先排序... 还有觉
Spring之在开发中使用SpringJDBC ihuning spring
在实际开发中使用SpringJDBC有两种方式： 1. 在Dao中添加属性JdbcTemplate并用Spring注入； JdbcTemplate类被设计成为线程安全的，所以可以在IOC 容器中声明它的单个实例，并将这个实例注入到所有的 DAO 实例中。JdbcTemplate也利用了Java 1.5 的特定(自动装箱，泛型，可变长度
JSON API 1.0 核心开发者自述 | 你所不知道的那些技术细节 justjavac json
2013年5月，Yehuda Katz 完成了JSON API(英文，中文) 技术规范的初稿。事情就发生在 RailsConf 之后，在那次会议上他和 Steve Klabnik 就 JSON 雏形的技术细节相聊甚欢。在沟通单一 Rails 服务器库—— ActiveModel::Serializers 和单一 JavaScript 客户端库——&
网站项目建设流程概述 macroli 工作
一.概念网站项目管理就是根据特定的规范、在预算范围内、按时完成的网站开发任务。二.需求分析项目立项　　我们接到客户的业务咨询，经过双方不断的接洽和了解，并通过基本的可行性讨论够，初步达成制作协议，这时就需要将项目立项。较好的做法是成立一个专门的项目小组，小组成员包括：项目经理，网页设计，程序员，测试员，编辑/文档等必须人员。项目实行项目经理制。客户的需求说明书　　第一步是需
AngularJs 三目运算表达式判断 qiaolevip 每天进步一点点学习永无止境众观千象 AngularJS
事件回顾：由于需要修改同一个模板，里面包含2个不同的内容，第一个里面使用的时间差和第二个里面名称不一样，其他过滤器，内容都大同小异。希望杜绝If这样比较傻的来判断if-show or not，继续追究其源码。 var b = "{{", a = "}}"; this.startSymbol = function(a) {
Spark算子：统计RDD分区中的元素及数量 superlxw1234 spark spark算子 Spark RDD分区元素
关键字：Spark算子、Spark RDD分区、Spark RDD分区元素数量 Spark RDD是被分区的，在生成RDD时候，一般可以指定分区的数量，如果不指定分区数量，当RDD从集合创建时候，则默认为该程序所分配到的资源的CPU核数，如果是从HDFS文件创建，默认为文件的Block数。可以利用RDD的mapPartitionsWithInd
Spring 3.2.x将于2016年12月31日停止支持 wiselyman Spring 3
Spring 团队公布在2016年12月31日停止对Spring Framework 3.2.x（包含tomcat 6.x）的支持。在此之前spring团队将持续发布3.2.x的维护版本。请大家及时准备及时升级到Spring
fis纯前端解决方案fis-pure zccst JavaScript
作者：zccst FIS通过插件扩展可以完美的支持模块化的前端开发方案，我们通过FIS的二次封装能力，封装了一个功能完备的纯前端模块化方案pure。 1，fis-pure的安装 $ fis install -g fis-pure $ pure -v 0.1.4 2，下载demo到本地 git clone https://github.com/hefangshi/f

机器学习（十四）Libsvm学习笔记

你可能感兴趣的:(机器学习（十四）Libsvm学习笔记)