Androidlushangderen

基于连通图的分裂聚类算法

参考文献：基于连通图动态分裂的聚类算法.作者：邓健爽郑启伦彭宏邓维维(华南理工大学计算机科学与工程学院，广东广州510640)

我的算法库：https://github.com/linyiqun/lyq-algorithms-lib

算法介绍

从文章的标题可以看出，今天我所介绍的算法又是一个聚类算法，不过他比较特殊，用到了图方面的知识，而且是一种动态的算法，与BIRCH算法一样，他也是一种层次聚类的算法，BIRCH算法是属于那种，一步步慢慢合并从而形成最终的聚类结果，而本文所描述的算法则恰巧相反，通过不断分裂直到最后不能在分裂下去为止，事实上，通过分裂实现的聚类的算法并不常见，平时说的比较多的这种算法就是chameleon算法，基于连通图的分裂聚类算法与此很类似，但又有少许的不同。首先声明这个算法的提出是出自于某篇学术论文，人家提出了这个思想，我去做了一下学习和实现，所以在这里分享一下。

算法的原理

算法的大的方向的阶段为2个阶段，第一个是根据坐标点的位置距离关系形成连通图。第二个阶段是将形成的多个连通图，进行逐一的分裂。图形化的表示过程如下，方便大家理解。

这么看来，和chameleon算法还是非常类似的。第一个步骤可以采用我的上一篇文章中用到的dbscan算法的思路，去深度优先搜索尽可能大的范围的点集，然后再用边将他们连接起来。这个如果不清楚的话，可以点击我的上一篇文章进行查阅。在这里会给定一个距离阈值l,这样就会生出基于距离l的连通图集。在上图中，就生成了2个连通图集，上面的一个和下面的一个。下面主要讲一下分裂的机理和过程，这也是整个算法的创新点和难点所在。

分裂的原理

分裂的原理采用了类似于扁担挑重物的形式，每一条边类似于一个扁担，坐标点在这里就是一个个的重物，如果扁担的2端的重物都非常重，那么扁担就容易断，于是就会分裂。举个例子如下：

但是我们要怎么去衡量一条边能不能够被分裂的标准呢，在这里定义了2个概念，承受系数t和分裂阈值landa。承受因为t就是要分裂的2部分中的较轻的一端的重量/连接2部分的边数，意思就是平均每条边所要承受的点的个数。公式如下：

t=min{W1,W2}/n，W1,W2为分割后的2部分的点的个数，n为2连接2部分的边的数量。

理解了这个，就很好分裂阈值了，分裂阈值就是当前针对全部的连通图，每条边的承受状况指数，你可以理解为就是总坐标点数/总边数。但是我们在这里采用更科学的方式进行计算，大意还是如上面描述的那样：

注意这里的x和y的关系，与上面的已经不一样了，至于这个公式为什么就不比刚刚的那个要好，就不是本文所论述的范畴了。截止到这里，我们就能得出一个比较条件了，就是当根据某条边进行分割的时候，如果此时计算出来的承受系数大于等于分裂阈值的时候，就表明此边是可以被分割掉的，也就是说，此时的连通图可以继续被拆分掉。算法的伪代码如下：

main()

{

Result r;

for-each每个连通图G

{

Graph[] graphs;

graphs = splitGraph(G)

r.add(graphs)

}

splitGraph(连通图G)

{

//默认不能被划分

int canDivied=0;

for(m从2到Pnum/2) //Pnum为连通图中的坐标点数

{

//将原图进行分割

Graph2 subGraph2 =G,removeM();

Graph1 subGraph1 = G;

//此函数会判断承受系数是否大于此时的分裂阈值

if(canDivide(subGraph1, subGraph2))

{

//改变标签

canDivied=1;

//继续递归的划分子图1，子图2

split(subGraph1);

split(subGraph2);

}

if(canDivided == 0)

{

//说明不能在分割了，为一个聚类，加入结果集中

addToResult()

}

上面的伪代码是自己想出来的，与论文原文所描述略有不同，我对其中加入了个人的思考和改进的地方，首先一点都是一样的，就是分裂一定是递归进行的，后一次的划分是建立在前一次划分的基础上进行的。以上就是第二阶段所做的事情，然后再次把目标转向问题本身，因为此问题是基于连通图的，所以在这里我用了边的数组表示，他其实是一个无向图，我还是用了id对id的形式来表示是否存在连接2点的边。下面也是算法的代码实现，也非常的重要哦(请仔细看里面的一些实现细节)。

算法的实现

首先是数据的点输入graphData.txt(格式：id 横坐标纵坐标)：

总共15个点。

坐标点类Point.java:

package DataMining_CABDDCC;



/**
 * 坐标点类
 * @author lyq
 *
 */
public class Point implements Comparable<Point>{
	//坐标点id号,id号唯一
	int id;
	//坐标横坐标
	Integer x;
	//坐标纵坐标
	Integer y;
	//坐标点是否已经被访问(处理)过，在生成连通子图的时候用到
	boolean isVisited;
	
	public Point(String id, String x, String y){
		this.id = Integer.parseInt(id);
		this.x = Integer.parseInt(x);
		this.y = Integer.parseInt(y);
	}
	
	/**
	 * 计算当前点与制定点之间的欧式距离
	 * 
	 * @param p
	 *            待计算聚类的p点
	 * @return
	 */
	public double ouDistance(Point p) {
		double distance = 0;

		distance = (this.x - p.x) * (this.x - p.x) + (this.y - p.y)
				* (this.y - p.y);
		distance = Math.sqrt(distance);

		return distance;
	}
	
	/**
	 * 判断2个坐标点是否为用个坐标点
	 * 
	 * @param p
	 *            待比较坐标点
	 * @return
	 */
	public boolean isTheSame(Point p) {
		boolean isSamed = false;

		if (this.x == p.x && this.y == p.y) {
			isSamed = true;
		}

		return isSamed;
	}

	@Override
	public int compareTo(Point p) {
		if(this.x.compareTo(p.x) != 0){
			return this.x.compareTo(p.x);
		}else{
			//如果在x坐标相等的情况下比较y坐标
			return this.y.compareTo(p.y);
		}
	}
}

连通图类Graph.java:

package DataMining_CABDDCC;

import java.util.ArrayList;
import java.util.Collections;

/**
 * 连通图类
 * 
 * @author lyq
 * 
 */
public class Graph {
	// 坐标点之间的连接属性，括号内为坐标id号
	int[][] edges;
	// 连通图内的坐标点数
	ArrayList<Point> points;
	// 此图下分割后的聚类子图
	ArrayList<ArrayList<Point>> clusters;

	public Graph(int[][] edges) {
		this.edges = edges;
		this.points = getPointByEdges(edges);
	}

	public Graph(int[][] edges, ArrayList<Point> points) {
		this.edges = edges;
		this.points = points;
	}

	public int[][] getEdges() {
		return edges;
	}

	public void setEdges(int[][] edges) {
		this.edges = edges;
	}

	public ArrayList<Point> getPoints() {
		return points;
	}

	public void setPoints(ArrayList<Point> points) {
		this.points = points;
	}

	/**
	 * 根据距离阈值做连通图的划分,构成连通图集
	 * 
	 * @param length
	 *            距离阈值
	 * @return
	 */
	public ArrayList<Graph> splitGraphByLength(int length) {
		int[][] edges;
		Graph tempGraph;
		ArrayList<Graph> graphs = new ArrayList<>();

		for (Point p : points) {
			if (!p.isVisited) {
				// 括号中的下标为id号
				edges = new int[points.size()][points.size()];
				dfsExpand(p, length, edges);

				tempGraph = new Graph(edges);
				graphs.add(tempGraph);
			} else {
				continue;
			}
		}

		return graphs;
	}

	/**
	 * 深度优先方式扩展连通图
	 * 
	 * @param points
	 *            需要继续深搜的坐标点
	 * @param length
	 *            距离阈值
	 * @param edges
	 *            边数组
	 */
	private void dfsExpand(Point point, int length, int edges[][]) {
		int id1 = 0;
		int id2 = 0;
		double distance = 0;
		ArrayList<Point> tempPoints;

		// 如果处理过了，则跳过
		if (point.isVisited) {
			return;
		}

		id1 = point.id;
		point.isVisited = true;
		tempPoints = new ArrayList<>();
		for (Point p2 : points) {
			id2 = p2.id;

			if (id1 == id2) {
				continue;
			} else {
				distance = point.ouDistance(p2);
				if (distance <= length) {
					edges[id1][id2] = 1;
					edges[id2][id1] = 1;

					tempPoints.add(p2);
				}
			}
		}

		// 继续递归
		for (Point p : tempPoints) {
			dfsExpand(p, length, edges);
		}
	}

	/**
	 * 判断连通图是否还需要再被划分
	 * 
	 * @param pointList1
	 *            坐标点集合1
	 * @param pointList2
	 *            坐标点集合2
	 * @return
	 */
	private boolean needDivided(ArrayList<Point> pointList1,
			ArrayList<Point> pointList2) {
		boolean needDivided = false;
		// 承受系数t=轻的集合的坐标点数/2部分连接的边数
		double t = 0;
		// 分裂阈值，即平均每边所要承受的重量
		double landa = 0;
		int pointNum1 = pointList1.size();
		int pointNum2 = pointList2.size();
		// 总边数
		int totalEdgeNum = 0;
		// 连接2部分的边数量
		int connectedEdgeNum = 0;
		ArrayList<Point> totalPoints = new ArrayList<>();

		totalPoints.addAll(pointList1);
		totalPoints.addAll(pointList2);
		int id1 = 0;
		int id2 = 0;
		for (Point p1 : totalPoints) {
			id1 = p1.id;
			for (Point p2 : totalPoints) {
				id2 = p2.id;

				if (edges[id1][id2] == 1 && id1 < id2) {
					if ((pointList1.contains(p1) && pointList2.contains(p2))
							|| (pointList1.contains(p2) && pointList2
									.contains(p1))) {
						connectedEdgeNum++;
					}
					totalEdgeNum++;
				}
			}
		}

		if (pointNum1 < pointNum2) {
			// 承受系数t=轻的集合的坐标点数/连接2部分的边数
			t = 1.0 * pointNum1 / connectedEdgeNum;
		} else {
			t = 1.0 * pointNum2 / connectedEdgeNum;
		}

		// 计算分裂阈值,括号内为总边数/总点数，就是平均每边所承受的点数量
		landa = 0.5 * Math.exp((1.0 * totalEdgeNum / (pointNum1 + pointNum2)));

		// 如果承受系数不小于分裂阈值，则代表需要分裂
		if (t >= landa) {
			needDivided = true;
		}

		return needDivided;
	}

	/**
	 * 递归的划分连通图
	 * 
	 * @param pointList
	 *            待划分的连通图的所有坐标点
	 */
	public void divideGraph(ArrayList<Point> pointList) {
		// 判断此坐标点集合是否能够被分割
		boolean canDivide = false;
		ArrayList<ArrayList<Point>> pointGroup;
		ArrayList<Point> pointList1 = new ArrayList<>();
		ArrayList<Point> pointList2 = new ArrayList<>();

		for (int m = 2; m <= pointList.size() / 2; m++) {
			// 进行坐标点的分割
			pointGroup = removePoint(pointList, m);
			pointList1 = pointGroup.get(0);
			pointList2 = pointGroup.get(1);

			// 判断是否满足分裂条件
			if (needDivided(pointList1, pointList2)) {
				canDivide = true;
				divideGraph(pointList1);
				divideGraph(pointList2);
			}
		}

		// 如果所有的分割组合都无法分割，则说明此已经是一个聚类
		if (!canDivide) {
			clusters.add(pointList);
		}
	}

	/**
	 * 获取分裂得到的聚类结果
	 * 
	 * @return
	 */
	public ArrayList<ArrayList<Point>> getClusterByDivding() {
		clusters = new ArrayList<>();
		
		divideGraph(points);

		return clusters;
	}

	/**
	 * 将当前坐标点集合移除removeNum个点，构成2个子坐标点集合
	 * 
	 * @param pointList
	 *            原集合点
	 * @param removeNum
	 *            移除的数量
	 */
	private ArrayList<ArrayList<Point>> removePoint(ArrayList<Point> pointList,
			int removeNum) {
		//浅拷贝一份原坐标点数据
		ArrayList<Point> copyPointList = (ArrayList<Point>) pointList.clone();
		ArrayList<ArrayList<Point>> pointGroup = new ArrayList<>();
		ArrayList<Point> pointList2 = new ArrayList<>();
		// 进行按照坐标轴大小排序
		Collections.sort(copyPointList);

		for (int i = 0; i < removeNum; i++) {
			pointList2.add(copyPointList.get(i));
		}
		copyPointList.removeAll(pointList2);

		pointGroup.add(copyPointList);
		pointGroup.add(pointList2);

		return pointGroup;
	}

	/**
	 * 根据边的情况获取其中的点
	 * 
	 * @param edges
	 *            当前的已知的边的情况
	 * @return
	 */
	private ArrayList<Point> getPointByEdges(int[][] edges) {
		Point p1;
		Point p2;
		ArrayList<Point> pointList = new ArrayList<>();

		for (int i = 0; i < edges.length; i++) {
			for (int j = 0; j < edges[0].length; j++) {
				if (edges[i][j] == 1) {
					p1 = CABDDCCTool.totalPoints.get(i);
					p2 = CABDDCCTool.totalPoints.get(j);

					if (!pointList.contains(p1)) {
						pointList.add(p1);
					}

					if (!pointList.contains(p2)) {
						pointList.add(p2);
					}
				}
			}
		}

		return pointList;
	}
}

算法工具类：

package DataMining_CABDDCC;

import java.io.BufferedReader;
import java.io.File;
import java.io.FileReader;
import java.io.IOException;
import java.text.MessageFormat;
import java.util.ArrayList;

/**
 * 基于连通图的分裂聚类算法
 * 
 * @author lyq
 * 
 */
public class CABDDCCTool {
	// 测试数据点数据
	private String filePath;
	// 连通图距离阈值l
	private int length;
	// 原始坐标点
	public static ArrayList<Point> totalPoints;
	// 聚类结果坐标点集合
	private ArrayList<ArrayList<Point>> resultClusters;
	// 连通图
	private Graph graph;

	public CABDDCCTool(String filePath, int length) {
		this.filePath = filePath;
		this.length = length;

		readDataFile();
	}

	/**
	 * 从文件中读取数据
	 */
	public void readDataFile() {
		File file = new File(filePath);
		ArrayList<String[]> dataArray = new ArrayList<String[]>();

		try {
			BufferedReader in = new BufferedReader(new FileReader(file));
			String str;
			String[] tempArray;
			while ((str = in.readLine()) != null) {
				tempArray = str.split(" ");
				dataArray.add(tempArray);
			}
			in.close();
		} catch (IOException e) {
			e.getStackTrace();
		}

		Point p;
		totalPoints = new ArrayList<>();
		for (String[] array : dataArray) {
			p = new Point(array[0], array[1], array[2]);
			totalPoints.add(p);
		}

		// 用边和点构造图
		graph = new Graph(null, totalPoints);
	}

	/**
	 * 分裂连通图得到聚类
	 */
	public void splitCluster() {
		// 获取形成连通子图
		ArrayList<Graph> subGraphs;
		ArrayList<ArrayList<Point>> pointList;
		resultClusters = new ArrayList<>();

		subGraphs = graph.splitGraphByLength(length);

		for (Graph g : subGraphs) {
			// 获取每个连通子图分裂后的聚类结果
			pointList = g.getClusterByDivding();
			resultClusters.addAll(pointList);
		}
		
		printResultCluster();
	}

	/**
	 * 输出结果聚簇
	 */
	private void printResultCluster() {
		int i = 1;
		for (ArrayList<Point> cluster : resultClusters) {
			System.out.print("聚簇" + i + ":");
			for (Point p : cluster){
				System.out.print(MessageFormat.format("({0}, {1}) ", p.x, p.y));
			}
			System.out.println();
			i++;
		}
		
	}

}

算法调用类Client.java:

package DataMining_CABDDCC;

/**
 * 基于连通图的分裂聚类算法
 * @author lyq
 *
 */
public class Client {
	public static void main(String[] agrs){
		String filePath = "C:\\Users\\lyq\\Desktop\\icon\\graphData.txt";
		//连通距离阈值
		int length = 3;
		
		CABDDCCTool tool = new CABDDCCTool(filePath, length);
		tool.splitCluster();
	}
}

算法的输出：

聚簇1:(6, 9) (8, 10) (9, 11) (10, 9) (11, 12) 
聚簇2:(1, 12) (3, 9) (3, 12) (4, 10) 
聚簇3:(4, 4) (4, 1) (6, 3) (6, 1) (8, 3) (9, 2)

图形化的展示结果如下，一张是连通图的有效边(就是e[i][j]=1)的情况，后张图是分裂的聚类结果：

图片有点大，就没有处理了，大家将就着看吧.....

算法的遗漏点和优点

其实这个算法我在实现的时候，其实少考虑了很多东西，首先一个是构造连通图的时候，可以从示例的图线中看出，最后的图应该是一个闭环图，而我通过类似于DBSCAN算法会导致最边界的点会暴露在外面，形成不了闭环，与题目所要求的会有点不符。还有1点是划分部分坐标点的时候，我默认是从左往右，从下往上的优先级的顺序进行划分，但是我觉得更加合理的方式应该是怎样的。还有1个算法的缺点是总是在不停的比较中，时间开销比较大。算法非常的新颖，用了图的思想去做聚类的实现，而且用了类似于扁担挑重物的原理运用到数据挖掘中，不愧是一篇好论文。像我目前就只能是站在巨人的肩膀上，做点小东西罢了....

《CPython Internals》阅读笔记：p336-p352 codists 读书笔记 python
《CPythonInternals》学习第17天，p336-p352总结，总计17页。一、技术总结1.GDBGDB是GNUDbugger的缩写。(1)安装sudoaptinstallgdb(2)创建.gdbinit文件touch~/.gdbinitvim~/.gdbinit(3)配置.gdbinit文件add-auto-load-safe-path/project/cpython注：1./proj
快速入门Volc Engine的MaaS LLM模型 azzxcvhj python
在这篇文章中，我将为你详细介绍如何使用VolcEngine的MaaSLLM模型。我们将从安装库开始，然后深入到具体的代码实现，最后分析其应用场景及实践建议。技术背景介绍VolcEngine（火山引擎）提供了一个强大的MaaS（ModelasaService）平台，支持多种语言模型。这个平台旨在让开发者更容易地集成和使用先进的自然语言处理能力。通过VolcEngine，开发者可以轻松实现文本生成、文
如何使用Langchain加载Blackboard文档 PPIG564 langchain 前端 python
在当今数字化和网络化的学习环境中，Blackboard已成为许多教育机构的关键工具。为了有效地集成和利用Blackboard中的数据，开发人员可以使用特定的工具来加载和处理这些数据。Langchain是一个强大的Python库，能够帮助我们轻松地处理Blackboard中的文档数据。在本文中，我们将深入了解如何使用Langchain来加载Blackboard文档。技术背景介绍BlackboardL
虚拟与现实的桥梁：Facebook AI 如何变革社交互动模式 LokiSan Facebook facebook 智能合约人工智能隐私保护
在过去的十年里，社交平台的发展经历了巨大的变化，而其中最为引人注目的便是人工智能（AI）技术的引入。作为全球最大的社交平台之一，Facebook在人工智能的应用上不断创新，通过AI变革了社交互动的方式，为用户带来了更加智能和个性化的社交体验。人工智能如何融入社交平台人工智能并非突然出现在Facebook的社交模式中，而是通过不断的发展和技术积累，逐步渗透到平台的各个方面。首先，AI被应用于内容推荐
常见3D打印技术原理及比较 HuAo_3D 3D打印其他
3D打印作为一项新兴技术，对于制造行业来说具有革命性的意义，该技术能够有效缩减产品的开发、设计周期，大大提高工作效率，有效节约企业的运营成本，可以帮助企业在风云变化的市场竞争中站稳脚跟。尤其近年来，随着科学技术的飞速发展，3D打印技术也蓬勃发展，并得到社会各界的广泛关注，各类3D打印技术更是如雨后春笋般涌现，下面大家一起来看看各类比较常见的3D打印技术有何不同以及它们的工作原理又是怎样的。1、FD
从虚拟现实到元宇宙：Facebook如何塑造未来的社交体验？ ClonBrowser Facebook vr facebook 元宇宙虚拟现实社交媒体数据保护
近年来，虚拟现实（VR）和元宇宙成为科技领域的热门话题。Facebook（现Meta）作为全球最大的社交平台之一，正积极推动从虚拟现实到元宇宙的转型，以重塑未来的社交体验。随着技术的进步，Facebook如何通过创新构建全新的社交生态，成为行业瞩目的焦点。虚拟现实：开启沉浸式社交体验虚拟现实技术提供了一种全新的沉浸式体验，将人们从传统的平面屏幕中解放出来。用户通过佩戴VR设备，可以进入一个完全数字
如何优化 Nginx 处理流媒体的性能？糖葫芦.T 前端框架 nginx vue.js 服务器运维网络
关注博主️带你畅游技术世界，不错过每一次成长机会！文章目录如何优化Nginx处理流媒体的性能？一、理解Nginx与流媒体的“舞蹈”二、Nginx处理流媒体的挑战（一）带宽压力山大（二）高并发的考验（三）延迟和卡顿的噩梦三、优化策略之“软硬兼施”（一）硬件升级——给Nginx换上“强劲引擎”（二）软件优化——为Nginx打造“智能导航”四、具体配置与实践案例（一）缓存配置示例（二）负载均衡配置示例五
元宇宙如何改变社交平台的交互模式？Facebook的未来展望 Roc_z7 Facebook facebook 隐私保护社交媒体元宇宙
随着科技的进步，"元宇宙"这个概念逐渐从科幻走进现实，并开始改变我们对社交平台的认知。元宇宙是一个虚拟的沉浸式三维世界，结合了虚拟现实（VR）、增强现实（AR）和人工智能（AI）等技术。Facebook（现Meta）作为全球最大的社交平台之一，早已着手布局元宇宙，力求在未来的社交世界中占据一席之地。那么，元宇宙将如何改变社交平台的交互模式？Facebook如何借此机会发展？本文将一一探讨。什么是元
华为OD机试E卷 --最大社交距离--24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 华为od java javascript c语言 python
文章目录题目描述输入描述输出描述用例题目解析JS算法源码Java算法源码python算法源码c算法源码c++算法源码题目描述疫情期间需要大家保证一定的社交距离，公司组织开交流会议。座位一排共N个座位，编号分别为[0,N-1]。要求员工一个接着一个进入会议室，并且可以在任何时候离开会议室。满足：•每当一个员工进入时，需要坐到最大社交距离（最大化自己和其他人的距离的座位）；•如果有多个这样的座位，则坐
Nginx 性能优化技巧与实践（二）计算机毕设定制辅导-无忧学长 #Nginx nginx 性能优化运维
五、性能优化之负载均衡篇5.1负载均衡算法介绍Nginx作为一款强大的Web服务器和反向代理服务器，其负载均衡功能是提升Web服务性能和可靠性的关键。Nginx支持多种负载均衡算法，每种算法都有其独特的原理和特点，适用于不同的业务场景。轮询（RoundRobin）是Nginx的默认负载均衡算法，它就像一个有条不紊的调度员，按照顺序将请求依次分发到后端服务器。比如，假设有三个后端服务器A、B、C，当
SSM 架构中 JAVA 网络直播带货查询系统设计与 JSP 有效实现方法 2401_85439108 架构 java 开发语言
摘要随着科学技术的飞速发展，各行各业都在努力与现代先进技术接轨，通过科技手段提高自身的优势；对于网络直播带货网站当然也不能排除在外，随着网络技术的不断成熟，带动了网络直播带货网站，它彻底改变了过去传统的管理方式，不仅使服务管理难度变低了，还提升了管理的灵活性。这种个性化的平台特别注重交互协调与管理的相互配合，激发了管理人员的创造性与主动性，对网络直播带货网站而言非常有利。本系统采用的数据库是Mys
Facebook 元宇宙与全球文化交流的新趋势 Roc_z7 Facebook facebook 人工智能智能合约
随着科技的快速发展，虚拟现实与增强现实技术逐渐成为全球社交平台的重要组成部分。Facebook（现改名为Meta）率先将目光投向了元宇宙这一新兴领域，致力于打造一个超越传统社交媒体的虚拟空间，成为全球文化交流的新平台。Facebook元宇宙不仅仅是一个技术概念，它还将推动全球文化的相互理解与互动，为未来社交和文化传播开辟了全新的可能性。元宇宙：虚拟世界的新时代元宇宙（Metaverse）是一个由虚
数据治理组织架构产品经理自我修养大数据
企业数据治理体系除了在技术方面的实施架构，还需要管理方面的组织架构支撑。一般在数据治理建设初期，集团会先成立数据治理管理委员会。从上至下由决策层、管理层、执行层构成。决策层决策、管理层制定方案、执行层实施。层级管理、统一协调。4.2.1组织架构1）决策层提供数据标准管理的决策职能，通俗理解即拍板定方案。2）管理层审议数据标准管理相关制度对跨部门难的数据标准管理争议事项进行讨论并决策管理重大数据标准
软考信安19~操作系统安全保护 jnprlxc 软考~信息安全工程师安全网络学习方法笔记运维
1、操作系统安全概述1.1、操作系统安全概念操作系统的安全是指满足安全策略要求，具有相应的安全机制及安全功能，符合特定的安全标准，在一定约束条件下，能够抵御常见的网络安全威胁，保障自身的安全运行及资源安全。《信息安全技术操作系统安全技术要求(GB/T20272—2019)》将操作系统分成五个安全等级，即用户自主保护级、系统审计保护级、安全标记保护级、结构化保护级、访间验证保护级。操作系统的安全可控
软考信安12~网络安全审计技术原理与应用 jnprlxc 软考~信息安全工程师安全网络安全学习方法
1、网络安全审计概述1.1、网络安全审计概念网络安全审计是指对网络信息系统的安全相关活动信息进行获取、记录、存储、分析和利用的工作。网络安全审计的作用在于建立“事后“安全保障措施，保存网络安全事件及行为信息，为网络安全事件分析提供线索及证据，以便于发现潜在的网络安全威胁行为，开展网络安全风险分析及管理。常见的安全审计功能是安全事件采集、存储和查询。对于重要的信息系统，则部署独立的网络安全审计系统。
基于数据可视化+SpringBoot+Vue的医院综合管理平台设计和实现(源码+论文+部署讲解等) java李杨勇 Java精品毕设实战案例 Java毕业设计实战案例信息可视化 spring boot vue.js 医院综合管理平台 Java毕业设计
博主介绍：✌全网粉丝50W+,csdn特邀作者、博客专家、CSDN新星计划导师、Java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流✌技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、安卓app、大数据、物联网、机器学习等
人工智能和云计算带来的技术变革：人工智能实现自动化营销的方式 AI天才研究院 AI实战 AI大模型企业级应用开发实战大数据人工智能语言模型 AI LLM Java Python 架构设计 Agent RPA
1.背景介绍随着人工智能（AI）和云计算技术的不断发展，我们正面临着一场技术革命。这场革命正在改变我们的生活方式、工作方式和商业模式。在这篇文章中，我们将探讨人工智能如何实现自动化营销的方式，并深入了解其背后的核心概念、算法原理、代码实例等。1.1人工智能简介人工智能是一种计算机科学的分支，旨在让计算机具有人类智能的能力，如学习、推理、感知、语言理解等。人工智能的目标是让计算机能够理解自然语言、解
【数据治理】数据治理框架概述野老杂谈数据治理数据治理框架 DAMA-DMBOK COBIT 企业数据治理数据管理
欢迎来到我的博客，很高兴能够在这里和您见面！欢迎订阅相关专栏：⭐️全网最全IT互联网公司面试宝典：收集整理全网各大IT互联网公司技术、项目、HR面试真题.⭐️AIGC时代的创新与未来：详细讲解AIGC的概念、核心技术、应用领域等内容。⭐️大数据平台建设指南：全面讲解从数据采集到数据可视化的整个过程，掌握构建现代化数据平台的核心技术和方法。⭐️《遇见Python：初识、了解与热恋》：涵盖了Pytho
RELLM: 利用正则表达式进行结构化生成的LLM库 safHTEAHE 正则表达式 python
在人工智能生成文本的应用中，确保输出符合特定格式是非常重要的。RELLM是一个库，它通过包装本地HuggingFace管道模型实现了结构化的生成。其核心功能在于逐步生成每一个词元，并在每一步中屏蔽不符合提供的部分正则表达式的词元。这使得输出能够严格遵循指定的格式。技术背景介绍人工智能语言模型（LLM）如GPT等，在生成文本时通常不限制输出格式。然而，在某些应用场景下，遵循特定的输出格式（如JSON
使用Google Cloud Vertex AI进行文本和多模态生成 sagvWSRJHMNEB 人工智能计算机视觉 python
技术背景介绍GoogleCloudVertexAI是一个强大的框架，提供了多种AI模型的开放访问和动态部署，包括文本、代码和多模态生成模型。通过VertexAI，用户可以利用不同的基础模型，如Gemini、Palm、和Llama，来实现复杂的AI应用。VertexAI不仅限于文本生成，还支持多模态输入，如图像和音频，极大地扩展了AI应用的潜力。核心原理解析VertexAI提供了一种简化的方式来使用
浅析5G通信技术在铁路中的应用慎独⊥修己 5G 信息与通信网络
引言铁路作为我国最早应用无线通信技术的行业之一，经过几十年的应用发展和技术积累，已形成适应铁路体制的铁路专用通信技术体系。21世纪，为满足我国高速铁路的发展需要，原铁道部正式确定了铁路专用数字移动通信系统(GSM—R)的技术方向。历经10多年发展，我国已建成全球最大的GSM—R网络。但伴随着智能铁路等新的建设要求提出，GSM—R作为窄带无线通信的技术局限性越发突出，无法满足铁路行车应用和运营维护业
基于微信小程序的任务打卡管理系统小程序设计与实现(源码+lw+部署+讲解) 计算机YiDian 计算机毕设实战案例微信小程序毕设实战案例微信小程序小程序
文章目录1.前言2.详细视频演示3具体实现截图3.1小程序端部分效果3.2后台管理端部分效果4.技术可行性分析5.技术简介5.1后端框架SpringBoot5.2微信小程序5.3系统开发平台6.业务流程分析7.代码参考8.数据库参考9.为什么选择我们10.源码及文档获取1.前言博主介绍：✌CSDN特邀作者、全栈领域优质创作者、10年IT从业经验、码云/掘金/知乎/B站/华为云/阿里云等平台优质作者
大数据治理：概念、框架与实践一ge科研小菜鸡大数据 Python 大数据
个人主页：一ge科研小菜鸡-CSDN博客期待您的关注引言随着数据量的爆炸性增长，大数据治理（BigDataGovernance）成为数据管理领域的重要议题。大数据治理旨在对海量数据进行有效管理，确保数据的质量、可用性、安全性和合规性，同时为企业决策提供有力支持。本文系统介绍大数据治理的概念、核心框架、实施步骤及典型应用案例，结合实际场景提供技术支持和代码示例。一、大数据治理的定义与重要性1.什么是
以太网链路健康状况测试 network_tester 以太网测试网络服务器 linux
以太网链路健康状况测试是确保网络稳定性和性能的重要环节。以下是对以太网链路健康状况测试的详细解析：一、测试目的以太网链路健康状况测试的主要目的是评估链路的稳定性、可靠性和性能，确保网络数据能够高效、准确地传输。二、测试标准在进行以太网链路健康状况测试时，通常会遵循以下标准：GB/T21671-2018：基于以太网技术的局域网（LAN）系统验收测试方法。该标准详细规定了以太网链路的测试方法、测试参数
自动驾驶中的虚实迁移学习:降低对真实世界数据的依赖 AI架构设计之禅计算机软件编程原理与应用实践 java python javascript kotlin golang 架构人工智能
自动驾驶,迁移学习,虚实环境,数据效率,深度学习,强化学习1.背景介绍自动驾驶技术作为人工智能领域的重要应用之一，其发展离不开海量真实世界驾驶数据。然而，收集和标注真实世界驾驶数据成本高昂，且存在安全隐患。因此，如何降低对真实世界数据的依赖，提高自动驾驶系统的训练效率和安全性，成为一个亟待解决的关键问题。虚实迁移学习(Virtual-to-RealTransferLearning)作为一种新兴的机
鸿蒙操作系统的安全架构荔枝寄 harmonyos 安全架构华为
在当今数字化时代，数据安全与隐私保护成为人们日益关注的焦点。随着智能设备的普及和互联网技术的发展，个人数据泄露的风险也在不断增加。作为中国自主研发的操作系统，鸿蒙（HarmonyOS）从设计之初就将数据安全与隐私保护置于核心地位。鸿蒙操作系统不仅为用户提供了一个高效、流畅的用户体验，还通过一系列的安全机制来确保用户的数据安全与隐私。鸿蒙操作系统的安全架构鸿蒙操作系统采用了分层式安全架构，其安全模型
【探索前端技术之 React Three.js—— 简单的人脸动捕与 3D 模型表情同步应用】智界工具库 react.js javascript 前端
大家好，我是智界工具库，致力于分享好用实用且智能的软件以及在JAVA语言开发中遇到的问题，如果本篇文章对你有所帮助请帮我点个小赞小收藏吧，谢谢喲！简介：React是一个用于构建用户界面的JavaScript框架，以其组件化的设计和高效的更新机制而闻名。Three.js则是一个基于JavaScript的3D图形库，能够轻松创建和渲染复杂的3D场景。当React与Three.js相遇，ReactThr
基于Kinetica的实时数据库AI应用实战 dagGAIYD 人工智能数据库大数据 python
在现代数据密集型应用中，实时数据库的选择对于处理分析和生成式AI任务至关重要。Kinetica作为一个实时数据库，专为时间序列和空间数据的分析而设计，其强大的功能可以极大地简化数据获取和分析流程。在这篇文章中，我们将深入探索如何通过Kinetica的ChatModel、VectorStore、DocumentLoader及Retriever来实现这些功能。技术背景介绍Kinetica是一款实时数据
SQLDatabase Toolkit: 搭建基于SQL数据库的智能问答系统 azzxcvhj 数据库 sql jvm python
技术背景介绍SQLDatabaseToolkit是一个非常有用的工具集，旨在与SQL数据库进行交互。它的常见应用场景是通过数据库数据构建问答系统，特别是在需要迭代处理和错误恢复的情况下。此工具包在LangChain社区包中提供，支持多种大型语言模型(LLM)或聊天模型的集成。核心原理解析SQLDatabaseToolkit的核心功能包括查询执行、模式查找以及查询检查等。借助这些工具，可以构建一个智
如何贡献开源项目LangChain：完整指南 azzxcvhj 开源 langchain python
LangChain是一个快速发展的开源项目，旨在构建强大的AI应用程序框架。作为一名开发者或技术爱好者，你或许希望为这个项目贡献力量，无论是开发新功能、修复bug、改进文档，还是参与讨论和设计。这篇文章将详细介绍如何高效地加入LangChain的开发与贡献，帮助你事半功倍。1.技术背景介绍LangChain是一个专注于构建多模态AI应用的框架，通过模块化的方式集成各种工具和服务。随着其生态的不断扩
linux系统服务器下jsp传参数乱码 3213213333332132 java jsp linux windows xml
在一次解决乱码问题中，发现jsp在windows下用js原生的方法进行编码没有问题，但是到了linux下就有问题， escape,encodeURI,encodeURIComponent等都解决不了问题但是我想了下既然原生的方法不行，我用el标签的方式对中文参数进行加密解密总该可以吧。于是用了java的java.net.URLDecoder,结果还是乱码，最后在绝望之际，用了下面的方法解决了
Spring 注解区别以及应用 BlueSkator spring
1. @Autowired @Autowired是根据类型进行自动装配的。如果当Spring上下文中存在不止一个UserDao类型的bean，或者不存在UserDao类型的bean，会抛出 BeanCreationException异常，这时可以通过在该属性上再加一个@Qualifier注解来声明唯一的id解决问题。 2. @Qualifier 当spring中存在至少一个匹
printf和sprintf的应用 dcj3sjt126com PHP sprintf printf
<?php printf('b: %b c: %c d: %d <bf>f: %f', 80,80, 80, 80); echo ' '; printf('%0.2f %+d %0.2f ', 8, 8, 1235.456); printf('th
config.getInitParameter 171815164 parameter
web.xml <servlet> <servlet-name>servlet1</servlet-name> <jsp-file>/index.jsp</jsp-file> <init-param> <param-name>str</param-name>
Ant标签详解--基础操作 g21121 ant
Ant的一些核心概念： build.xml：构建文件是以XML 文件来描述的，默认构建文件名为build.xml。 project：每个构建文
[简单]代码片段_数据合并 53873039oycg 代码
合并规则:删除家长phone为空的记录,若一个家长对应多个孩子,保留一条家长记录,家长id修改为phone,对应关系也要修改。代码如下:
java 通信技术云端月影 Java 远程通信技术
在分布式服务框架中，一个最基础的问题就是远程服务是怎么通讯的，在Java领域中有很多可实现远程通讯的技术，例如：RMI、MINA、ESB、Burlap、Hessian、SOAP、EJB和JMS等，这些名词之间到底是些什么关系呢，它们背后到底是基于什么原理实现的呢，了解这些是实现分布式服务框架的基础知识，而如果在性能上有高的要求的话，那深入了解这些技术背后的机制就是必须的了，在这篇blog中我们将来
string与StringBuilder 性能差距到底有多大 aijuans
之前也看过一些对string与StringBuilder的性能分析，总感觉这个应该对整体性能不会产生多大的影响，所以就一直没有关注这块！由于学程序初期最先接触的string拼接，所以就一直没改变过自己的习惯！
今天碰到 java.util.ConcurrentModificationException 异常 antonyup_2006 java 多线程工作 IBM
今天改bug，其中有个实现是要对map进行循环，然后有删除操作，代码如下： Iterator<ListItem> iter = ItemMap.keySet.iterator(); while(iter.hasNext()){ ListItem it = iter.next(); //...一些逻辑操作 ItemMap.remove(it); } 结果运行报Con
PL/SQL的类型和JDBC操作数据库百合不是茶 PL/SQL表标量类型游标 PL/SQL记录
PL/SQL的标量类型: 字符,数字,时间,布尔,%type五中类型的 --标量：数据库中预定义类型的变量 --定义一个变长字符串 v_ename varchar2(10); --定义一个小数,范围 -9999.99~9999.99 v_sal number(6,2); --定义一个小数并给一个初始值为5.4 :=是pl/sql的赋值号
Mockito：一个强大的用于 Java 开发的模拟测试框架实例 bijian1013 mockito 单元测试
Mockito框架： Mockito是一个基于MIT协议的开源java测试框架。 Mockito区别于其他模拟框架的地方主要是允许开发者在没有建立“预期”时验证被测系统的行为。对于mock对象的一个评价是测试系统的测
精通Oracle10编程SQL(10)处理例外 bijian1013 oracle 数据库 plsql
/* *处理例外 */ --例外简介 --处理例外-传递例外 declare v_ename emp.ename%TYPE; begin SELECT ename INTO v_ename FROM emp where empno=&no; dbms_output.put_line('雇员名：'||v_ename); exceptio
【Java】Java执行远程机器上Linux命令 bit1129 linux命令
Java使用ethz通过ssh2执行远程机器Linux上命令，封装定义Linux机器的环境信息 package com.tom; import java.io.File; public class Env { private String hostaddr; //Linux机器的IP地址 private Integer po
java通信之Socket通信基础白糖_ java socket 网络协议
正处于网络环境下的两个程序，它们之间通过一个交互的连接来实现数据通信。每一个连接的通信端叫做一个Socket。一个完整的Socket通信程序应该包含以下几个步骤： ①创建Socket； ②打开连接到Socket的输入输出流； ④按照一定的协议对Socket进行读写操作； ④关闭Socket。 Socket通信分两部分：服务器端和客户端。服务器端必须优先启动，然后等待soc
angular.bind boyitech AngularJS angular.bind AngularJS API bind
angular.bind 描述：上下文，函数以及参数动态绑定，返回值为绑定之后的函数. 其中args是可选的动态参数，self在fn中使用this调用。使用方法： angular.bind(se
java-13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 bylijinnan java
import java.util.ArrayList; import java.util.List; public class KickOutBadGuys { /** * 题目：13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 * Maybe you can find out
Redis.conf配置文件及相关项说明（自查备用） Kai_Ge redis
Redis.conf配置文件及相关项说明 # Redis configuration file example # Note on units: when memory size is needed, it is possible to specifiy # it in the usual form of 1k 5GB 4M and so forth: #
[强人工智能]实现大规模拓扑分析是实现强人工智能的前奏 comsci 人工智能
真不好意思,各位朋友...博客再次更新... 节点数量太少,网络的分析和处理能力肯定不足,在面对机器人控制的需求方面,显得力不从心.... 但是,节点数太多,对拓扑数据处理的要求又很高,设计目标也很高,实现起来难度颇大...
记录一些常用的函数 dai_lm java
public static String convertInputStreamToString(InputStream is) { StringBuilder result = new StringBuilder(); if (is != null) try { InputStreamReader inputReader = new InputStreamRead
Hadoop中小规模集群的并行计算缺陷 datamachine mapreduce hadoop 并行计算
注：写这篇文章的初衷是因为Hadoop炒得有点太热，很多用户现有数据规模并不适用于Hadoop，但迫于扩容压力和去IOE（Hadoop的廉价扩展的确非常有吸引力）而尝试。尝试永远是件正确的事儿，但有时候不用太突进，可以调优或调需求，发挥现有系统的最大效用为上策。 -----------------------------------------------------------------
小学4年级英语单词背诵第二课 dcj3sjt126com english word
egg 蛋 twenty 二十 any 任何 well 健康的，好 twelve 十二 farm 农场 every 每一个 back 向后，回 fast 快速的 whose 谁的 much 许多 flower 花 watch 手表 very 非常，很 sport 运动 Chinese 中国的
自己实践了github的webhooks, linux上面的权限需要注意 dcj3sjt126com github webhook
环境, 阿里云服务器 1. 本地创建项目, push到github服务器上面 2. 生成www用户的密钥 sudo -u www ssh-keygen -t rsa -C "[email protected]" 3. 将密钥添加到github帐号的SSH_KEYS里面 3. 用www用户执行克隆, 源使
Java冒泡排序蕃薯耀冒泡排序 Java冒泡排序 Java排序
冒泡排序 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 10:40:14 星期二 http://fanshuyao.iteye.com/
Excle读取数据转换为实体List【基于apache-poi】 hanqunfeng apache
1.依赖apache-poi 2.支持xls和xlsx 3.支持按属性名称绑定数据值 4.支持从指定行、列开始读取 5.支持同时读取多个sheet 6.具体使用方式参见org.cpframework.utils.excelreader.CP_ExcelReaderUtilTest.java 比如： Str
3个处于草稿阶段的Javascript API介绍 jackyrong JavaScript
原文： http://www.sitepoint.com/3-new-javascript-apis-may-want-follow/?utm_source=html5weekly&utm_medium=email 本文中，介绍3个仍然处于草稿阶段，但应该值得关注的Javascript API. 1) Web Alarm API &
6个创建Web应用程序的高效PHP框架 lampcy Web 框架 PHP
以下是创建Web应用程序的PHP框架，有coder bay网站整理推荐： 1. CakePHP CakePHP是一个PHP快速开发框架，它提供了一个用于开发、维护和部署应用程序的可扩展体系。CakePHP使用了众所周知的设计模式，如MVC和ORM，降低了开发成本，并减少了开发人员写代码的工作量。 2. CodeIgniter CodeIgniter是一个非常小且功能强大的PHP框架，适合需
评"救市后中国股市新乱象泛起"谣言 nannan408
首先来看百度百家一位易姓作者的新闻：三个多星期来股市持续暴跌，跌得投资者及上市公司都处于极度的恐慌和焦虑中，都要寻找自保及规避风险的方式。面对股市之危机，政府突然进入市场救市，希望以此来重建市场信心，以此来扭转股市持续暴跌的预期。而政府进入市场后，由于市场运作方式发生了巨大变化，投资者及上市公司为了自保及为了应对这种变化，中国股市新的乱象也自然产生。首先，中国股市这两天
页面全屏遮罩的实现方式 Rainbow702 html css 遮罩 mask
之前做了一个页面，在点击了某个按钮之后，要求页面出现一个全屏遮罩，一开始使用了position:absolute来实现的。当时因为画面大小是固定的，不可以resize的，所以，没有发现问题。最近用了同样的做法做了一个遮罩，但是画面是可以进行resize的，所以就发现了一个问题，当画面被reisze到浏览器出现了滚动条的时候，就发现，用absolute 的做法是有问题的。后来改成fixed定位就
关于angularjs的点滴 tntxia AngularJS
angular是一个新兴的JS框架，和以往的框架不同的事，Angularjs更注重于js的建模，管理，同时也提供大量的组件帮助用户组建商业化程序，是一种值得研究的JS框架。 Angularjs使我们可以使用MVC的模式来写JS。Angularjs现在由谷歌来维护。这里我们来简单的探讨一下它的应用。首先使用Angularjs我
Nutz--->>反复新建ioc容器的后果 xiaoxiao1992428 DAO mvc IOC nutz
问题： public class DaoZ { public static Dao dao() { // 每当需要使用dao的时候就取一次 Ioc ioc = new NutIoc(new JsonLoader("dao.js")); return ioc.get(