mustuo

数据挖掘学习日记7·k-means算法JAVA代码实现

算法回顾

聚类概念

聚类是一种无监督学习方法，使类内元素距离尽量相近，类间元素距离尽量远。

k-means算法流程

在数据集D中随机地选择k个对象，每个对象代表一个簇的初始均值或中心。其余每个对象根据与簇中心的欧氏距离，分配到最近的簇中。
迭代地改编簇内变差：对每个簇，根据上次迭代分配到的簇对象，重新计算均值（将对象的x值和y值分别取平均得到新的簇中心）。
将更新后的均值作为新的簇中心，重新分配所有对象。
迭代继续，直到分配稳定——本轮形成的簇与前一轮形成的簇相同（所有对象所属的类标签或所有簇中心不再改变）。

算法实现

基本思路与设计

编写三个类来实现算法：使用Point类来记录数据点，Kmeans类执行算法，Test类进行测试。

类图及类和属性含义如下所示（省略属性的getter和setter方法）：

Point类

public class Point {
	/*n维的坐标*/
	private ArrayList at = new ArrayList<>();
	/*所在簇编号*/
	private int clusterSetIndex;
    /*最大维数*/
    public static int maxLen = Integer.MIN_VALUE;

	public Point() {
	}
	
	/**
	 * 
	 *@desc:返回数据点的维数
	 *@return:int
	 *@trhows
	 */
	public int getLen() {
		return at.size();
	}

	public ArrayList getAt() {
		return at;
	}

	public void setAt(ArrayList at) {
		this.at = at;
	}

	public int getClusterSetIndex() {
		return clusterSetIndex;
	}

	public void setClusterSetIndex(int clusterSetIndex) {
		this.clusterSetIndex = clusterSetIndex;
	}
	
	
}

KMeans类

原始簇中心的选择

本实现代码中，采用随机产生的数据点编号作为原始簇中心，并在初始化后做第一次调整。

迭代终止条件

最小簇中心偏移量小于等于阈值时，迭代终止。

偏移量由原簇中心和对应新簇中心的欧氏距离得出。

public class KMeans {
	//簇包含数据点point-->数组
	//数据集包含若干簇cluster-->数组的集合
	/*原始数据集*/
	private ArrayList originalSet = new ArrayList<>();
	/*数据集*/
	private ArrayList> dataSet = new ArrayList<>();
	/*簇中心<原始数据集序号，数据点>*/
	private Map clusterSet = new HashMap<>();
	/*k*/
	private static final int K = 2;
	/*数据总量*/
	private static int sum = 0;
	private double threshold = 0.01;

	public KMeans() {
	}
	
	
	public double getThreshold() {
		return threshold;
	}


	public void setThreshold(double threshold) {
		this.threshold = threshold;
	}
	


	public ArrayList> getDataSet() {
		return dataSet;
	}


	/**
	 * 
	 *@desc:初始化，随机地选择簇中心，并将其余点归入最近的簇
	 *@return:void
	 *@trhows
	 */
	public void init() {
		Random rand = new Random();
		Set tSet =  new HashSet<>();
		//随机取k个数据点作为簇中心，记入簇中心集合中
		for(int i = 0;i clusterList = new ArrayList<>();
			dataSet.add(clusterList);
		}
		//计算剩余点与簇中心的距离，将数据点归入最邻近的簇
		for(int i=0;i cluster : dataSet) {
			//获取簇编号
			int index = dataSet.indexOf(cluster);
			Point centerPoint = new Point();
			centerPoint.setClusterSetIndex(dataSet.indexOf(cluster));
			/*n维计数器*/
			double counter[] = new double[cluster.get(0).getLen()];
			for(Point p : cluster) {
				for(int i=0;ithreshold;times++) {
			//清空工作数据集并初始化
			dataSet.clear();
			for(int i = 0;i clusterList = new ArrayList<>();
				dataSet.add(clusterList);
			}
			bias = Double.MAX_VALUE;
			//1.计算簇中心外的点与簇中心的距离，将数据点归入距离最近的簇
			for(int i=0;i cluster : dataSet) {
				//获取簇编号
				int index = dataSet.indexOf(cluster);
				Point centerPoint = new Point();
				centerPoint.setClusterSetIndex(dataSet.indexOf(cluster));
				/*n维计数器*/
				double counter[] = new double[Point.maxLen];
				for(Point p : cluster) {
					for(int i=0;iPoint.maxLen)
                Point.maxLen = tempStrs.length;
			Point p = new Point();
			p.setClusterSetIndex(0);
			for(String s : tempStrs) {
				p.getAt().add(Double.valueOf(s));
			}
			originalSet.add(p);
			sum++;
		}
	}

	/**
	 * 
	 *@desc:计算两个数据点的欧氏距离
	 *@param a
	 *@param b
	 *@return:double
	 *@trhows
	 */
	public double EuclideanDistance(Point a,Point b) {
		double sum = 0;
		for(int i=0;i

 
  Test类 
  在Test类的main方法中，调用KMeans类对象执行整个算法流程： 
   
   从文件中读取数据集； 
   算法初始化，生成原始簇和簇中心点； 
   开始迭代，不断更新簇和簇中心点，直到聚类各簇区域稳定； 
   算法终止，输出聚类结果 
   
  public class Test {

	/**
	 *@desc:一句话描述
	 *@param args
	 *@return:void
	 * @throws IOException 
	 *@trhows
	 */
	public static void main(String[] args) throws IOException {
		KMeans kMeans = new KMeans();
		kMeans.readData("\\k-means\\in.txt");
		kMeans.init();
		kMeans.kluster();
		for(ArrayList cluster: kMeans.getDataSet()) {
			System.out.println("第"+(kMeans.getDataSet().indexOf(cluster)+1)+"个簇"+"共包含"+cluster.size()+"个结点");
			for(Point p :cluster) {
				System.out.println("结点"+(cluster.indexOf(p)+1)+":"
									+p.getAt().toString());
			}
		}
	}

}
 
  数据集、参数与测试结果 
  数据集 
  使用了网上找到的一组纯数值型效性数据集作为测试集。数据集如下： 
  1 1
2 1
1 2
2 2
3 3
8 8
8 9
9 8
9 9 
  >> 数据来源 
  参数 
   
   k = 4 
   threshold = 0.01 
   
  测试结果 
  第1个簇共包含2个结点
结点1:[8.0, 9.0]
结点2:[9.0, 9.0]
第2个簇共包含1个结点
结点1:[3.0, 3.0]
第3个簇共包含2个结点
结点1:[8.0, 8.0]
结点2:[9.0, 8.0]
第4个簇共包含4个结点
结点1:[1.0, 1.0]
结点2:[2.0, 1.0]
结点3:[1.0, 2.0]
结点4:[2.0, 2.0] 
  其中，迭代过程如下： 
  原始簇中心编号
rand:6
rand:1
rand:5
rand:4
原始簇中心
[8.0, 9.0]
[2.0, 1.0]
[8.0, 8.0]
[3.0, 3.0]
点[1.0, 1.0]与点[8.0, 9.0]的距离：10.63014581273465
点[1.0, 1.0]与点[2.0, 1.0]的距离：1.0
点[1.0, 1.0]与点[8.0, 8.0]的距离：9.899494936611665
点[1.0, 1.0]与点[3.0, 3.0]的距离：2.8284271247461903
结点0属于簇1
点[2.0, 1.0]与点[8.0, 9.0]的距离：10.0
点[2.0, 1.0]与点[2.0, 1.0]的距离：0.0
点[2.0, 1.0]与点[8.0, 8.0]的距离：9.219544457292887
点[2.0, 1.0]与点[3.0, 3.0]的距离：2.23606797749979
结点1属于簇1
点[1.0, 2.0]与点[8.0, 9.0]的距离：9.899494936611665
点[1.0, 2.0]与点[2.0, 1.0]的距离：1.4142135623730951
点[1.0, 2.0]与点[8.0, 8.0]的距离：9.219544457292887
点[1.0, 2.0]与点[3.0, 3.0]的距离：2.23606797749979
结点2属于簇1
点[2.0, 2.0]与点[8.0, 9.0]的距离：9.219544457292887
点[2.0, 2.0]与点[2.0, 1.0]的距离：1.0
点[2.0, 2.0]与点[8.0, 8.0]的距离：8.48528137423857
点[2.0, 2.0]与点[3.0, 3.0]的距离：1.4142135623730951
结点3属于簇1
点[3.0, 3.0]与点[8.0, 9.0]的距离：7.810249675906654
点[3.0, 3.0]与点[2.0, 1.0]的距离：2.23606797749979
点[3.0, 3.0]与点[8.0, 8.0]的距离：7.0710678118654755
点[3.0, 3.0]与点[3.0, 3.0]的距离：0.0
结点4属于簇3
点[8.0, 8.0]与点[8.0, 9.0]的距离：1.0
点[8.0, 8.0]与点[2.0, 1.0]的距离：9.219544457292887
点[8.0, 8.0]与点[8.0, 8.0]的距离：0.0
点[8.0, 8.0]与点[3.0, 3.0]的距离：7.0710678118654755
结点5属于簇2
点[8.0, 9.0]与点[8.0, 9.0]的距离：0.0
点[8.0, 9.0]与点[2.0, 1.0]的距离：10.0
点[8.0, 9.0]与点[8.0, 8.0]的距离：1.0
点[8.0, 9.0]与点[3.0, 3.0]的距离：7.810249675906654
结点6属于簇0
点[9.0, 8.0]与点[8.0, 9.0]的距离：1.4142135623730951
点[9.0, 8.0]与点[2.0, 1.0]的距离：9.899494936611665
点[9.0, 8.0]与点[8.0, 8.0]的距离：1.0
点[9.0, 8.0]与点[3.0, 3.0]的距离：7.810249675906654
结点7属于簇2
点[9.0, 9.0]与点[8.0, 9.0]的距离：1.0
点[9.0, 9.0]与点[2.0, 1.0]的距离：10.63014581273465
点[9.0, 9.0]与点[8.0, 8.0]的距离：1.4142135623730951
点[9.0, 9.0]与点[3.0, 3.0]的距离：8.48528137423857
结点8属于簇0
初始簇中心
[8.5, 9.0]
[3.0, 3.0]
[8.5, 8.0]
[1.5, 1.5]
---------------------------------------------------------
第1次迭代
原始簇中心
[8.5, 9.0]
[3.0, 3.0]
[8.5, 8.0]
[1.5, 1.5]
点[1.0, 1.0]与点[8.5, 9.0]的距离：10.965856099730654
点[1.0, 1.0]与点[3.0, 3.0]的距离：2.8284271247461903
点[1.0, 1.0]与点[8.5, 8.0]的距离：10.259142264341596
点[1.0, 1.0]与点[1.5, 1.5]的距离：0.7071067811865476
结点0属于簇3
点[2.0, 1.0]与点[8.5, 9.0]的距离：10.307764064044152
点[2.0, 1.0]与点[3.0, 3.0]的距离：2.23606797749979
点[2.0, 1.0]与点[8.5, 8.0]的距离：9.5524865872714
点[2.0, 1.0]与点[1.5, 1.5]的距离：0.7071067811865476
结点1属于簇3
点[1.0, 2.0]与点[8.5, 9.0]的距离：10.259142264341596
点[1.0, 2.0]与点[3.0, 3.0]的距离：2.23606797749979
点[1.0, 2.0]与点[8.5, 8.0]的距离：9.604686356149273
点[1.0, 2.0]与点[1.5, 1.5]的距离：0.7071067811865476
结点2属于簇3
点[2.0, 2.0]与点[8.5, 9.0]的距离：9.5524865872714
点[2.0, 2.0]与点[3.0, 3.0]的距离：1.4142135623730951
点[2.0, 2.0]与点[8.5, 8.0]的距离：8.845903006477066
点[2.0, 2.0]与点[1.5, 1.5]的距离：0.7071067811865476
结点3属于簇3
点[3.0, 3.0]与点[8.5, 9.0]的距离：8.139410298049853
点[3.0, 3.0]与点[3.0, 3.0]的距离：0.0
点[3.0, 3.0]与点[8.5, 8.0]的距离：7.433034373659253
点[3.0, 3.0]与点[1.5, 1.5]的距离：2.1213203435596424
结点4属于簇1
点[8.0, 8.0]与点[8.5, 9.0]的距离：1.118033988749895
点[8.0, 8.0]与点[3.0, 3.0]的距离：7.0710678118654755
点[8.0, 8.0]与点[8.5, 8.0]的距离：0.5
点[8.0, 8.0]与点[1.5, 1.5]的距离：9.192388155425117
结点5属于簇2
点[8.0, 9.0]与点[8.5, 9.0]的距离：0.5
点[8.0, 9.0]与点[3.0, 3.0]的距离：7.810249675906654
点[8.0, 9.0]与点[8.5, 8.0]的距离：1.118033988749895
点[8.0, 9.0]与点[1.5, 1.5]的距离：9.924716620639604
结点6属于簇0
点[9.0, 8.0]与点[8.5, 9.0]的距离：1.118033988749895
点[9.0, 8.0]与点[3.0, 3.0]的距离：7.810249675906654
点[9.0, 8.0]与点[8.5, 8.0]的距离：0.5
点[9.0, 8.0]与点[1.5, 1.5]的距离：9.924716620639604
结点7属于簇2
点[9.0, 9.0]与点[8.5, 9.0]的距离：0.5
点[9.0, 9.0]与点[3.0, 3.0]的距离：8.48528137423857
点[9.0, 9.0]与点[8.5, 8.0]的距离：1.118033988749895
点[9.0, 9.0]与点[1.5, 1.5]的距离：10.606601717798213
结点8属于簇0
点[8.5, 9.0]与点[8.5, 9.0]的距离：0.0
点[3.0, 3.0]与点[1.5, 1.5]的距离：2.1213203435596424
点[8.5, 8.0]与点[8.5, 8.0]的距离：0.0
点[1.5, 1.5]与点[3.0, 3.0]的距离：2.1213203435596424
新的簇中心：
[8.5, 9.0]
[1.5, 1.5]
[8.5, 8.0]
[3.0, 3.0]
偏移量为：0.0 
  遗留问题和缺陷 
  代码缺陷 
  k-means算法的重点在于K值与阈值的选择。根据数据的分布，被分为某些数量的簇是无法实现的，这时候会出现某一或某几簇元素为零的情况。合适的做法是，先将数据进行可视化，分析合适的K值取值。 
  另外好像还有一种叫做“肘部法则”的K值选择方法，我去学习一下。 
  遗留问题 
  在每轮迭代中，都要重新计算新的簇中心，并与原来的簇中心比较，得出偏移量，以衡量整个聚类划分是否趋于稳定。 
  如何在具体代码中得出合理的偏移量，是一个亟待解决的问题。 
  最初，我使用的是计算各新的簇中心坐标和对应原簇中心之间距离的均值，但在测试特殊数据时成了死循环。 
  后又改用距离的最小值代表偏差距离，似乎有缺少鲁棒性之嫌。


    
        你可能感兴趣的:(JAVA,数据挖掘,算法)
        
            
                
                    机器学习与深度学习间关系与区别
                        ℒℴѵℯ心·动ꦿ໊ོ꫞
人工智能学习深度学习python
                        一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
                    
                    Long类型前后端数据不一致
                        igotyback
前端
                        响应给前端的数据浏览器控制台中response中看到的Long类型的数据是正常的到前端数据不一致前后端数据类型不匹配是一个常见问题，尤其是当后端使用Java的Long类型（64位）与前端JavaScript的Number类型（最大安全整数为2^53-1，即16位）进行数据交互时，很容易出现精度丢失的问题。这是因为JavaScript中的Number类型无法安全地表示超过16位的整数。为了解决这个问
                    
                    LocalDateTime 转 String
                        igotyback
java开发语言
                        importjava.time.LocalDateTime;importjava.time.format.DateTimeFormatter;publicclassMain{publicstaticvoidmain(String[]args){//获取当前时间LocalDateTimenow=LocalDateTime.now();//定义日期格式化器DateTimeFormatterformat
                    
                    Linux下QT开发的动态库界面弹出操作（SDL2）
                        13jjyao
QT类qt开发语言sdl2linux
                        需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
                    
                    Goolge earth studio 进阶4——路径修改与平滑
                        陟彼高冈yu
Googleearthstudio进阶教程旅游
                        如果我们希望在大约中途时获得更多的城市鸟瞰视角。可以将相机拖动到这里并创建一个新的关键帧。camera_target_clip_7EarthStudio会自动平滑我们的路径，所以当我们通过这个关键帧时，不是一个生硬的角度，而是一个平滑的曲线。camera_target_clip_8路径上有贝塞尔控制手柄，允许我们调整路径的形状。右键单击，我们可以选择“平滑路径”，这是默认的自动平滑算法，或者我们可
                    
                    基于社交网络算法优化的二维最大熵图像分割
                        智能算法研学社（Jack旭）
智能优化算法应用图像分割算法php开发语言
                        智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
                    
                    DIV+CSS+JavaScript技术制作网页（旅游主题网页设计与制作）云南大理
                        STU学生网页设计
网页设计期末网页作业html静态网页html5期末大作业网页设计web大作业
                        ️精彩专栏推荐作者主页:【进入主页—获取更多源码】web前端期末大作业：【HTML5网页期末作业(1000套)】程序员有趣的告白方式：【HTML七夕情人节表白网页制作(110套)】文章目录二、网站介绍三、网站效果▶️1.视频演示2.图片演示四、网站代码HTML结构代码CSS样式代码五、更多源码二、网站介绍网站布局方面：计划采用目前主流的、能兼容各大主流浏览器、显示效果稳定的浮动网页布局结构。网站程
                    
                    【华为OD机试真题2023B卷 JAVA&JS】We Are A Team
                        若博豆
java算法华为javascript
                        华为OD2023（B卷）机试题库全覆盖，刷题指南点这里WeAreATeam时间限制：1秒|内存限制：32768K|语言限制：不限题目描述：总共有n个人在机房，每个人有一个标号（1<=标号<=n），他们分成了多个团队，需要你根据收到的m条消息判定指定的两个人是否在一个团队中，具体的：1、消息构成为：abc，整数a、b分别代
                    
                    关于城市旅游的HTML网页设计——(旅游风景云南 5页)HTML+CSS+JavaScript
                        二挡起步
web前端期末大作业javascripthtmlcss旅游风景
                        ⛵源码获取文末联系✈Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业|游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作|HTML期末大学生网页设计作业，Web大学生网页HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScrip
                    
                    HTML网页设计制作大作业（div+css） 云南我的家乡旅游景点 带文字滚动
                        二挡起步
web前端期末大作业web设计网页规划与设计htmlcssjavascriptdreamweaver前端
                        Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
                    
                    121. 买卖股票的最佳时机
                        薄荷糖的味道_fb40

                        给定一个数组，它的第i个元素是一支给定股票第i天的价格。如果你最多只允许完成一笔交易（即买入和卖出一支股票），设计一个算法来计算你所能获取的最大利润。注意你不能在买入股票前卖出股票。示例1:输入:[7,1,5,3,6,4]输出:5解释:在第2天（股票价格=1）的时候买入，在第5天（股票价格=6）的时候卖出，最大利润=6-1=5。注意利润不能是7-1=6,因为卖出价格需要大于买入价格。示例2:输入:
                    
                    每日算法&面试题，大厂特训二十八天——第二十天（树）
                        肥学
⚡算法题⚡面试题每日精进java算法数据结构
                        目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
                    
                    node.js学习
                        小猿L
node.jsnode.js学习vim
                        node.js学习实操及笔记温故node.js，node.js学习实操过程及笔记~node.js学习视频node.js官网node.js中文网实操笔记githubcsdn笔记为什么学node.js可以让别人访问我们编写的网页为后续的框架学习打下基础，三大框架vuereactangular离不开node.jsnode.js是什么官网：node.js是一个开源的、跨平台的运行JavaScript的运行
                    
                    回溯算法-重新安排行程
                        chirou_
算法数据结构图论c++图搜索
                        leetcode332.重新安排行程这题我还没自己ac过，只能现在凭着刚学完的热乎劲把我对题解的理解记下来。本题我认为对数据结构的考察比较多，用什么数据结构去存数据，去读取数据，都是很重要的。classSolution{private:unordered_map>targets;boolbacktracking(intticketNum,vector&result){//1.确定参数和返回值//2
                    
                    Faiss：高效相似性搜索与聚类的利器
                        网络·魚
大数据faiss
                        Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
                    
                    nosql数据库技术与应用知识点
                        皆过客，揽星河
NoSQLnosql数据库大数据数据分析数据结构非关系型数据库
                        Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
                    
                    insert into select 主键自增_mybatis拦截器实现主键自动生成
                        weixin_39521651
insertintoselect主键自增mybatisdelete返回值mybatisinsert返回主键mybatisinsert返回对象mybatisplusinsert返回主键mybatisplus插入生成id
                        前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
                    
                    k均值聚类算法考试例题_k均值算法(k均值聚类算法计算题)
                        寻找你83497
k均值聚类算法考试例题
                        ?算法：第一步：选K个初始聚类中心，z1(1),z2(1)，…，zK(1)，其中括号内的序号为寻找聚类中心的迭代运算的次序号。聚类中心的向量值可任意设定，例如可选开始的K个.k均值聚类：---------一种硬聚类算法，隶属度只有两个取值0或1，提出的基本根据是“类内误差平方和最小化”准则；模糊的c均值聚类算法：--------一种模糊聚类算法，是.K均值聚类算法是先随机选取K个对象作为初始的聚类
                    
                    Java 重写(Override)与重载(Overload)
                        叨唧唧的

                        Java重写(Override)与重载(Overload)重写(Override)重写是子类对父类的允许访问的方法的实现过程进行重新编写,返回值和形参都不能改变。即外壳不变，核心重写！重写的好处在于子类可以根据需要，定义特定于自己的行为。也就是说子类能够根据需要实现父类的方法。重写方法不能抛出新的检查异常或者比被重写方法申明更加宽泛的异常。例如：父类的一个方法申明了一个检查异常IOExceptio
                    
                    简单了解 JVM
                        记得开心一点啊
jvm
                        目录♫什么是JVM♫JVM的运行流程♫JVM运行时数据区♪虚拟机栈♪本地方法栈♪堆♪程序计数器♪方法区/元数据区♫类加载的过程♫双亲委派模型♫垃圾回收机制♫什么是JVMJVM是JavaVirtualMachine的简称，意为Java虚拟机。虚拟机是指通过软件模拟的具有完整硬件功能的、运行在一个完全隔离的环境中的完整计算机系统（如：JVM、VMwave、VirtualBox）。JVM和其他两个虚拟机
                    
                    1分钟解决 -bash: mvn: command not found，在Centos 7中安装Maven
                        Energet!c
开发语言
                        1分钟解决-bash:mvn:commandnotfound，在Centos7中安装Maven检查Java环境1下载Maven2解压Maven3配置环境变量4验证安装5常见问题与注意事项6总结检查Java环境Maven依赖Java环境，请确保系统已经安装了Java并配置了环境变量。可以通过以下命令检查：java-version如果未安装，请先安装Java。1下载Maven从官网下载：前往Apach
                    
                    Python实现简单的机器学习算法
                        master_chenchengg
pythonpython办公效率python开发IT
                        Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
                    
                    Java企业面试题3
                        马龙强_
java
                        1.break和continue的作用(智*图)break：用于完全退出一个循环（如for,while）或一个switch语句。当在循环体内遇到break语句时，程序会立即跳出当前循环体，继续执行循环之后的代码。continue：用于跳过当前循环体中剩余的部分，并开始下一次循环。如果是在for循环中使用continue，则会直接进行条件判断以决定是否执行下一轮循环。2.if分支语句和switch分
                    
                    JVM、JRE和 JDK：理解Java开发的三大核心组件
                        Y雨何时停T
Javajava
                        Java是一门跨平台的编程语言，它的成功离不开背后强大的运行环境与开发工具的支持。在Java的生态中，JVM（Java虚拟机）、JRE（Java运行时环境）和JDK（Java开发工具包）是三个至关重要的核心组件。本文将探讨JVM、JDK和JRE的区别，帮助你更好地理解Java的运行机制。1.JVM：Java虚拟机（JavaVirtualMachine）什么是JVM？JVM，即Java虚拟机，是Ja
                    
                    推荐算法_隐语义-梯度下降
                        _feivirus_
算法机器学习和数学推荐算法机器学习隐语义
                        importnumpyasnp1.模型实现"""inputrate_matrix:M行N列的评分矩阵，值为P*Q.P:初始化用户特征矩阵M*K.Q:初始化物品特征矩阵K*N.latent_feature_cnt:隐特征的向量个数max_iteration:最大迭代次数alpha:步长lamda:正则化系数output分解之后的P和Q"""defLFM_grad_desc(rate_matrix,l
                    
                    K近邻算法_分类鸢尾花数据集
                        _feivirus_
算法机器学习和数学分类机器学习K近邻
                        importnumpyasnpimportpandasaspdfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportaccuracy_score1.数据预处理iris=load_iris()df=pd.DataFrame(data=ir
                    
                    Java面试题精选：消息队列(二)
                        芒果不是芒
Java面试题精选javakafka
                        一、Kafka的特性1.消息持久化：消息存储在磁盘，所以消息不会丢失2.高吞吐量：可以轻松实现单机百万级别的并发3.扩展性：扩展性强，还是动态扩展4.多客户端支持：支持多种语言（Java、C、C++、GO、）5.KafkaStreams（一个天生的流处理）:在双十一或者销售大屏就会用到这种流处理。使用KafkaStreams可以快速的把销售额统计出来6.安全机制：Kafka进行生产或者消费的时候会
                    
                    数据结构 | 栈和队列
                        TT-Kun
数据结构与算法数据结构栈队列C语言
                        文章目录栈和队列1.栈：后进先出（LIFO）的数据结构1.1概念与结构1.2栈的实现2.队列：先进先出（FIFO）的数据结构2.1概念与结构2.2队列的实现3.栈和队列算法题3.1有效的括号3.2用队列实现栈3.3用栈实现队列3.4设计循环队列结论栈和队列在计算机科学中，栈和队列是两种基本且重要的数据结构，它们在处理数据存储和访问顺序方面有着独特的规则和应用。本文将详细介绍栈和队列的概念、结构、实
                    
                    白骑士的Java教学基础篇 2.5 控制流语句
                        白骑士所长
Java教学java开发语言
                        欢迎继续学习Java编程的基础篇！在前面的章节中，我们了解了Java的变量、数据类型和运算符。接下来，我们将探讨Java中的控制流语句。控制流语句用于控制程序的执行顺序，使我们能够根据特定条件执行不同的代码块，或重复执行某段代码。这是编写复杂程序的基础。通过学习这一节内容，你将掌握如何使用条件语句和循环语句来编写更加灵活和高效的代码。条件语句条件语句用于根据条件的真假来执行不同的代码块。if语句‘
                    
                    python语法——三目运算符
                        HappyRocking
pythonpython三目运算符
                        在java中，有三目运算符，如：intc=(a>b)?a:b表示c取两者中的较大值。但是在python，不能直接这样使用，估计是因为冒号在python有分行的关键作用。那么在python中，如何实现类似功能呢？可以使用ifelse语句，也是一行可以完成，格式为：aifbelsec表示如果b为True，则表达式等于a，否则等于c。如：c=(aif(a>b)elseb)同样是完成了取最大值的功能。
                    
                                基本数据类型和引用类型的初始值
                                    3213213333332132
java基础
                                    package com.array;

/**
 * @Description 测试初始值
 * @author FuJianyong
 * 2015-1-22上午10:31:53
 */
public class ArrayTest {
    
	ArrayTest at;
	String str;
	byte bt;
	short s;
	int i;
	long
                                
                                摘抄笔记--《编写高质量代码：改善Java程序的151个建议》
                                    白糖_
高质量代码
                                            记得3年前刚到公司，同桌同事见我无事可做就借我看《编写高质量代码：改善Java程序的151个建议》这本书，当时看了几页没上心就没研究了。到上个月在公司偶然看到，于是乎又找来看看，我的天，真是非常多的干货，对于我这种静不下心的人真是帮助莫大呀。 
  
        看完整本书，也记了不少笔记
                                
                                【备忘】Django 常用命令及最佳实践
                                    dongwei_6688
django
                                    注意：本文基于 Django 1.8.2 版本 
  
生成数据库迁移脚本（python 脚本） 
python manage.py makemigrations polls 
 说明：polls 是你的应用名字，运行该命令时需要根据你的应用名字进行调整 
  
查看该次迁移需要执行的 SQL 语句（只查看语句，并不应用到数据库上）： 
python manage.p
                                
                                阶乘算法之一N! 末尾有多少个零
                                    周凡杨
java算法阶乘面试效率
                                                                     &n
                                
                                spring注入servlet
                                    g21121
Spring注入
                                    传统的配置方法是无法将bean或属性直接注入到servlet中的，配置代理servlet亦比较麻烦，这里其实有比较简单的方法，其实就是在servlet的init()方法中加入要注入的内容： 
ServletContext application = getServletContext();
WebApplicationContext wac = WebApplicationContextUtil
                                
                                Jenkins 命令行操作说明文档
                                    510888780
centos
                                     
假设Jenkins的URL为http://22.11.140.38:9080/jenkins/ 
 
 
 
基本的格式为 
 
java 
 
基本的格式为 
 
java -jar jenkins-cli.jar [-s JENKINS_URL] command [options][args] 
 
 
 
 
下面具体介绍各个命令的作用及基本使用方法 
 
 
 
1. &nb
                                
                                UnicodeBlock检测中文用法
                                    布衣凌宇
UnicodeBlock
                                    /**  * 判断输入的是汉字  */ public static boolean isChinese(char c) {        Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);    
                                
                                java下实现调用oracle的存储过程和函数
                                    aijuans
javaorale
                                      1.创建表：STOCK_PRICES 
   
  2.插入测试数据： 
   
  3.建立一个返回游标：  
PKG_PUB_UTILS 
   4.创建和存储过程：P_GET_PRICE 
  
   5.创建函数： 
   6.JAVA调用存储过程返回结果集 
JDBCoracle10G_INVO
                                
                                Velocity Toolbox
                                    antlove
模板toolboxvelocity
                                    velocity.VelocityUtil 
package velocity;

import org.apache.velocity.Template;
import org.apache.velocity.app.Velocity;
import org.apache.velocity.app.VelocityEngine;
import org.apache.velocity.c
                                
                                JAVA正则表达式匹配基础
                                    百合不是茶
java正则表达式的匹配
                                      
正则表达式;提高程序的性能,简化代码,提高代码的可读性,简化对字符串的操作 
  
正则表达式的用途; 
字符串的匹配

字符串的分割

字符串的查找

字符串的替换
 
  
  
  
正则表达式的验证语法 
    
  [a]    //[]表示这个字符只出现一次  ,[a] 表示a只出现一
                                
                                是否使用EL表达式的配置
                                    bijian1013
jspweb.xmlELEasyTemplate
                                            今天在开发过程中发现一个细节问题，由于前端采用EasyTemplate模板方法实现数据展示，但老是不能正常显示出来。后来发现竟是EL将我的EasyTemplate的${...}解释执行了，导致我的模板不能正常展示后台数据。 
        网
                                
                                精通Oracle10编程SQL(1-3)PLSQL基础
                                    bijian1013
oracle数据库plsql
                                    --只包含执行部分的PL/SQL块
--set serveroutput off
begin
  dbms_output.put_line('Hello,everyone!');
end;


select * from emp;

--包含定义部分和执行部分的PL/SQL块
declare
   v_ename varchar2(5);
begin
   select 
                                
                                【Nginx三】Nginx作为反向代理服务器
                                    bit1129
nginx
                                    Nginx一个常用的功能是作为代理服务器。代理服务器通常完成如下的功能： 
  
 
 接受客户端请求 
 将请求转发给被代理的服务器 
 从被代理的服务器获得响应结果 
 把响应结果返回给客户端 
 实例 
本文把Nginx配置成一个简单的代理服务器 
 
 对于静态的html和图片，直接从Nginx获取 
 对于动态的页面，例如JSP或者Servlet，Nginx则将请求转发给Res
                                
                                Plugin execution not covered by lifecycle configuration: org.apache.maven.plugin
                                    blackproof
maven报错
                                    转：http://stackoverflow.com/questions/6352208/how-to-solve-plugin-execution-not-covered-by-lifecycle-configuration-for-sprin 
  
maven报错： 
Plugin execution not covered by lifecycle configuration: 
                                
                                发布docker程序到marathon
                                    ronin47
docker 发布应用
                                    1 发布docker程序到marathon 1.1 搭建私有docker registry 1.1.1 安装docker regisry 
docker pull docker-registry
docker run -t -p 5000:5000 docker-registry
 下载docker镜像并发布到私有registry 
docker pull consol/tomcat-8.0

                                
                                java-57-用两个栈实现队列&&用两个队列实现一个栈
                                    bylijinnan
java
                                    
import java.util.ArrayList;
import java.util.List;
import java.util.Stack;

	/*
	 * Q 57 用两个栈实现队列
	 */

public class QueueImplementByTwoStacks {

	private Stack<Integer> stack1;
	pr
                                
                                Nginx配置性能优化
                                    cfyme
nginx
                                    转载地址：http://blog.csdn.net/xifeijian/article/details/20956605 
  
大多数的Nginx安装指南告诉你如下基础知识——通过apt-get安装，修改这里或那里的几行配置，好了，你已经有了一个Web服务器了。而且，在大多数情况下，一个常规安装的nginx对你的网站来说已经能很好地工作了。然而，如果你真的想挤压出Nginx的性能，你必
                                
                                [JAVA图形图像]JAVA体系需要稳扎稳打,逐步推进图像图形处理技术
                                    comsci
java
                                     
 
     对图形图像进行精确处理，需要大量的数学工具，即使是从底层硬件模拟层开始设计，也离不开大量的数学工具包，因为我认为，JAVA语言体系在图形图像处理模块上面的研发工作，需要从开发一些基础的，类似实时数学函数构造器和解析器的软件包入手，而不是急于利用第三方代码工具来实现一个不严格的图形图像处理软件...... 
 
  &nb
                                
                                MonkeyRunner的使用
                                    dai_lm
androidMonkeyRunner
                                    要使用MonkeyRunner，就要学习使用Python，哎 
 
先抄一段官方doc里的代码 
作用是启动一个程序（应该是启动程序默认的Activity），然后按MENU键，并截屏 
 

# Imports the monkeyrunner modules used by this program
from com.android.monkeyrunner import MonkeyRun
                                
                                Hadoop-- 海量文件的分布式计算处理方案
                                    datamachine
mapreducehadoop分布式计算
                                    csdn的一个关于hadoop的分布式处理方案，存档。 
原帖：http://blog.csdn.net/calvinxiu/article/details/1506112。 
 
    Hadoop 是Google MapReduce的一个Java实现。MapReduce是一种简化的分布式编程模式，让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同ja
                                
                                以資料庫驗證登入
                                    dcj3sjt126com
yii
                                    以資料庫驗證登入 
由於 Yii 內定的原始框架程式, 採用綁定在UserIdentity.php 的 demo 與 admin 帳號密碼:    public function authenticate()    {        $users=array( &nbs
                                
                                github做webhooks：[2]php版本自动触发更新
                                    dcj3sjt126com
githubgitwebhooks
                                    上次已经说过了如何在github控制面板做查看url的返回信息了。这次就到了直接贴钩子代码的时候了。       
工具/原料  
 
   git   
   github   
     
方法/步骤  
 
       在github的setting里面的webhooks里把我们的url地址填进去。   
       钩子更新的代码如下： error_reportin
                                
                                Eos开发常用表达式
                                    蕃薯耀
Eos开发Eos入门Eos开发常用表达式
                                    Eos开发常用表达式 
>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 
蕃薯耀 2014年8月18日 15:03:35 星期一 
  
  
&
                                
                                SpringSecurity3.X--SpEL 表达式
                                    hanqunfeng
SpringSecurity
                                    使用 Spring 表达式语言配置访问控制，要实现这一功能的直接方式是在<http>配置元素上添加 use-expressions 属性： 
  
<http auto-config="true"  use-expressions="true"> 
这样就会在投票器中自动增加一个投票器：org.springframework
                                
                                Redis vs Memcache
                                    IXHONG
redis
                                    1. Redis中，并不是所有的数据都一直存储在内存中的，这是和Memcached相比一个最大的区别。 
2. Redis不仅仅支持简单的k/v类型的数据，同时还提供list，set，hash等数据结构的存储。 
3. Redis支持数据的备份，即master-slave模式的数据备份。 
4. Redis支持数据的持久化，可以将内存中的数据保持在磁盘中，重启的时候可以再次加载进行使用。 
Red
                                
                                Python - 装饰器使用过程中的误区解读
                                    kvhur
JavaScriptjqueryhtml5css
                                    大家都知道装饰器是一个很著名的设计模式，经常被用于AOP(面向切面编程)的场景，较为经典的有插入日志，性能测试，事务处理，Web权限校验， Cache等。 
原文链接：http://www.gbtags.com/gb/share/5563.htm 
Python语言本身提供了装饰器语法（@），典型的装饰器实现如下：     
 
 @function_wrapper 
  de
                                
                                架构师之mybatis-----update 带case when 针对多种情况更新
                                    nannan408
case when
                                    1.前言. 
   如题. 
2. 代码. 
  

	<update id="batchUpdate" parameterType="java.util.List">
			<foreach collection="list" item="list" index=&
                                
                                Algorithm算法视频教程
                                    栏目记者
Algorithm算法
                                    课程：Algorithm算法视频教程 
 
百度网盘下载地址： http://pan.baidu.com/s/1qWFjjQW 密码: 2mji 
 
 
程序写的好不好,还得看算法屌不屌！Algorithm算法博大精深。 
 一、课程内容： 
课时1、算法的基本概念 + Sequential search 
课时2、Binary search 
课时3、Hash table 
课时4、Algor
                                
                                C语言算法之冒泡排序
                                    qiufeihu
c算法
                                    任意输入10个数字由小到大进行排序。 
代码： 
#include <stdio.h>
int main()
{
	int i,j,t,a[11];        /*定义变量及数组为基本类型*/
	for(i = 1;i < 11;i++){
		scanf("%d",&a[i]);     /*从键盘中输入10个数*/
	}
	for
                                
                                JSP异常处理
                                    wyzuomumu
Webjsp
                                    1.在可能发生异常的网页中通过指令将HTTP请求转发给另一个专门处理异常的网页中: 
<%@ page errorPage="errors.jsp"%> 
  
2.在处理异常的网页中做如下声明： 
errors.jsp: 
<%@ page isErrorPage="true"%>，这样设置完后就可以在网页中直接访问exc
                                
                
            
        
    


    
        
            按字母分类：
            ABCDEFGHIJKLMNOPQRSTUVWXYZ其他
        
    


    
        
            首页 -
            关于我们 -
            站内搜索 -
            Sitemap -
            侵权投诉
        
        版权所有 IT知识库 CopyRight © 2000-2050 E-COM-NET.COM , All Rights Reserved.