Android路上的人

RoughSets属性约简算法

参考资料：http://baike.baidu.com/link?url=vlCBGoGR0_97l9SQ-WNeRv7oWb-3j7c6oUnyMzQAU3PTo0fx0O5MVXxckgqUlP871xR2Le-puGfFcrA4-zIntq

更多挖掘算法：https://github.com/linyiqun/DataMiningAlgorithm

介绍

RoughSets算法是一种比较新颖的算法，粗糙集理论对于数据的挖掘方面提供了一个新的概念和研究方法。本篇文章我不会去介绍令人厌烦的学术概念，就是简单的聊聊RoughSets算法的作用，直观上做一个了解。此算法的应用场景是，面对一个庞大的数据库系统，如何从里面分析出有效的信息，如果一database中有几十个字段，有我们好受的了，但是一般的在某些情况下有些信息在某些情况下是无用的或者说是无效的，这时候我们假设在不影响最终决策分类结果的情况下，对此属性进行约简。这就是RoughSets所干的事情了。

算法原理

算法的原理其实很简单，所有属性分为2种属性1类为条件属性，1类为决策属性，我们姑且把决策属性设置在数据列的最后一列，算法的步骤依次判断条件属性是否能被约简，如果能被约简，此输出约简属性后的规则，规则的形式大体类似于IF---THEN的规则。下面举1个例子，此例子来自于百度百科上的粗糙集理论。

给定8条记录：

元素颜色形状大小稳定性

x1 红三角大稳定

x2 红三角大稳定

x3 黄圆小不稳定

x4 黄圆小不稳定

x5 蓝方块大稳定

x6 红圆中不稳定

x7 蓝圆小不稳定

x8 蓝方块中不稳定

在这里还是得介绍几个最基本的一些概念，这里的所有的记录的集合叫做论域，那么这个论域能表达出一些什么知识或者信息呢，比如说蓝色的或者中的积木={X5，X7，X8}U{X6,X8}={X5,X6,X7,X8}，同理，通过论域集合内的记录进行交并运算能够表达出不同的信息。在这里总共有3个属性，就可以分成3x3=9个小属性分类，如下：

A/R1={X1,X2,X3}={{x1,x2,x6},{x3,x4},{x5,x7,x8}} （颜色分类）

A/R2={Y1,Y2,Y3}={{x1,x2},{x5,x8},{x3,x4,x6,x7}} （形状分类）

A/R3={Z1,Z2,Z3}={{x1,x2,x5},{x6,x8},{x3,x4,x7}} （大小分类）

我们定义一个知识系统A/R=R1∩R2∩R3，就是3x3x3总共27种可能，每行各取1个做计算组后的结果为

A/R={{x1,x2},{x3,x4},{x5},{x6},{x7},{x8}}，所以这个知识系统所决定的知识就是A/R中所有的集合以此这些集合的并集。给定一个集合如何用知识系统中的集合进行表示呢，这就用到了又一对概念，上近似和下近似。比如说给定集合X={X2,X5X7}，在知识库中就是下近似{X2.X5}，上近似{X1,X2,X5,X7}，上下近似的完整定义是下近似集是在那些所有的包含于X的知识库中的集合中求交得到的，而上近似则是将那些包含X的知识库中的集合求并得到的。在后面的例子中我也是以一个集合的上下近似集是否是等于他自身来对知识系统是否是允许的做一个判断。(这只是我自己的判断原则，并不是标准的)

下面是属性约简的过程，从颜色开始，这时知识系统变为了那么知识系统变成A/(R-R1)={{x1,x2},{x3,x4,x7},,,}以及这些子集的并集，此时稳定的集合{X1,X2,X5}的集合上下近似集还是他本身，所有没有改变，说明此属性是可以约简的，然后再此基础上在约简，直到上下近似集的改变。依次3种属性进行遍历。最后得到规则，我们以约简颜色属性为例，我们可以得出的规则是大三角的稳定，圆小的不稳定等等。大体原理就是如此，也许从某些方面来说还有欠妥的地方。

算法的代码实现

同样以上面的数据未例子，不过我把他转成了英文的形式，避免中文的编码问题：

Element Color Shape Size Stability
x1 Red Triangle Large Stable
x2 Red Triangle Large Stable
x3 Yellow Circle Small UnStable
x4 Yellow Circle Small UnStable
x5 Blue Rectangle Large Stable
x6 Red Circle Middle UnStable
x7 Blue Circle Small UnStable
x8 Blue Rectangle Middle UnStable

程序写的会有些复杂，里面很多都是集合的交并运算，之所以不采用直接的数组的运算，是为了更加突出集合的概念。
Record.java:

package DataMining_RoughSets;

import java.text.MessageFormat;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.Map;

/**
 * 数据记录，包含这条记录所有属性
 * 
 * @author lyq
 * 
 */
public class Record {
	// 记录名称
	private String name;
	// 记录属性键值对
	private HashMap attrValues;

	public Record(String name, HashMap attrValues) {
		this.name = name;
		this.attrValues = attrValues;
	}

	public String getName() {
		return this.name;
	}

	/**
	 * 此数据是否包含此属性值
	 * 
	 * @param attr
	 *            待判断属性值
	 * @return
	 */
	public boolean isContainedAttr(String attr) {
		boolean isContained = false;

		if (attrValues.containsValue(attr)) {
			isContained = true;
		}

		return isContained;
	}

	/**
	 * 判断数据记录是否是同一条记录，根据数据名称来判断
	 * 
	 * @param record
	 *            目标比较对象
	 * @return
	 */
	public boolean isRecordSame(Record record) {
		boolean isSame = false;

		if (this.name.equals(record.name)) {
			isSame = true;
		}

		return isSame;
	}

	/**
	 * 数据的决策属性分类
	 * 
	 * @return
	 */
	public String getRecordDecisionClass() {
		String value = null;

		value = attrValues.get(RoughSetsTool.DECISION_ATTR_NAME);

		return value;
	}

	/**
	 * 根据约简属性输出决策规则
	 * 
	 * @param reductAttr
	 *            约简属性集合
	 */
	public String getDecisionRule(ArrayList reductAttr) {
		String ruleStr = "";
		String attrName = null;
		String value = null;
		String decisionValue;

		decisionValue = attrValues.get(RoughSetsTool.DECISION_ATTR_NAME);
		ruleStr += "属性";
		for (Map.Entry entry : this.attrValues.entrySet()) {
			attrName = (String) entry.getKey();
			value = (String) entry.getValue();

			if (attrName.equals(RoughSetsTool.DECISION_ATTR_NAME)
					|| reductAttr.contains(attrName) || value.equals(name)) {
				continue;
			}

			ruleStr += MessageFormat.format("{0}={1},", attrName, value);
		}
		ruleStr += "他的分类为" + decisionValue;
		
		return ruleStr;
	}
}

RecordCollection.java:

package DataMining_RoughSets;

import java.util.ArrayList;
import java.util.HashMap;
import java.util.Map;

/**
 * 数据记录集合，包含一些共同的属性
 * 
 * @author lyq
 * 
 */
public class RecordCollection {
	// 集合包含的属性
	private HashMap attrValues;
	// 数据记录列表
	private ArrayList recordList;

	public RecordCollection() {
		this.attrValues = new HashMap<>();
		this.recordList = new ArrayList<>();
	}

	public RecordCollection(HashMap attrValues,
			ArrayList recordList) {
		this.attrValues = attrValues;
		this.recordList = recordList;
	}

	public ArrayList getRecord() {
		return this.recordList;
	}

	/**
	 * 返回集合的字符名称数组
	 * 
	 * @return
	 */
	public ArrayList getRecordNames() {
		ArrayList names = new ArrayList<>();

		for (int i = 0; i < recordList.size(); i++) {
			names.add(recordList.get(i).getName());
		}

		return names;
	}

	/**
	 * 判断集合是否包含此属性名称对应的属性值
	 * 
	 * @param attrName
	 *            属性名
	 * @return
	 */
	public boolean isContainedAttrName(String attrName) {
		boolean isContained = false;

		if (this.attrValues.containsKey(attrName)) {
			isContained = true;
		}

		return isContained;
	}

	/**
	 * 判断2个集合是否相等，比较包含的数据记录是否完全一致
	 * 
	 * @param rc
	 *            待比较集合
	 * @return
	 */
	public boolean isCollectionSame(RecordCollection rc) {
		boolean isSame = false;

		for (Record r : recordList) {
			isSame = false;

			for (Record r2 : rc.recordList) {
				if (r.isRecordSame(r2)) {
					isSame = true;
					break;
				}
			}

			// 如果有1个记录不包含，就算集合不相等
			if (!isSame) {
				break;
			}
		}

		return isSame;
	}

	/**
	 * 集合之间的交运算
	 * 
	 * @param rc
	 *            交运算的参与运算的另外一集合
	 * @return
	 */
	public RecordCollection overlapCalculate(RecordCollection rc) {
		String key;
		String value;
		RecordCollection resultCollection = null;
		HashMap resultAttrValues = new HashMap<>();
		ArrayList resultRecords = new ArrayList<>();

		// 进行集合的交运算，有相同的记录的则进行添加
		for (Record record : this.recordList) {
			for (Record record2 : rc.recordList) {
				if (record.isRecordSame(record2)) {
					resultRecords.add(record);
					break;
				}
			}
		}

		// 如果没有交集，则直接返回
		if (resultRecords.size() == 0) {
			return null;
		}

		// 将2个集合的属性进行合并
		for (Map.Entry entry : this.attrValues.entrySet()) {
			key = (String) entry.getKey();
			value = (String) entry.getValue();

			resultAttrValues.put(key, value);
		}

		for (Map.Entry entry : rc.attrValues.entrySet()) {
			key = (String) entry.getKey();
			value = (String) entry.getValue();

			resultAttrValues.put(key, value);
		}

		resultCollection = new RecordCollection(resultAttrValues, resultRecords);
		return resultCollection;
	}

	/**
	 * 求集合的并集，各自保留各自的属性
	 * 
	 * @param rc
	 *            待合并的集合
	 * @return
	 */
	public RecordCollection unionCal(RecordCollection rc) {
		RecordCollection resultRc = null;
		ArrayList records = new ArrayList<>();

		for (Record r1 : this.recordList) {
			records.add(r1);
		}

		for (Record r2 : rc.recordList) {
			records.add(r2);
		}

		resultRc = new RecordCollection(null, records);
		return resultRc;
	}
	
	/**
	 * 输出集合中包含的元素
	 */
	public void printRc(){
		System.out.print("{");
		for (Record r : this.getRecord()) {
			System.out.print(r.getName() + ", ");
		}
		System.out.println("}");
	}
}

KnowledgeSystem.java:

package DataMining_RoughSets;

import java.util.ArrayList;
import java.util.HashMap;

/**
 * 知识系统
 * 
 * @author lyq
 * 
 */
public class KnowledgeSystem {
	// 知识系统内的集合
	ArrayList ksCollections;

	public KnowledgeSystem(ArrayList ksCollections) {
		this.ksCollections = ksCollections;
	}

	/**
	 * 获取集合的上近似集合
	 * 
	 * @param rc
	 *            原始集合
	 * @return
	 */
	public RecordCollection getUpSimilarRC(RecordCollection rc) {
		RecordCollection resultRc = null;
		ArrayList nameArray;
		ArrayList targetArray;
		ArrayList copyRcs = new ArrayList<>();
		ArrayList deleteRcs = new ArrayList<>();
		targetArray = rc.getRecordNames();

		// 做一个集合拷贝
		for (RecordCollection recordCollection : ksCollections) {
			copyRcs.add(recordCollection);
		}

		for (RecordCollection recordCollection : copyRcs) {
			nameArray = recordCollection.getRecordNames();

			if (strIsContained(targetArray, nameArray)) {
				removeOverLaped(targetArray, nameArray);
				deleteRcs.add(recordCollection);

				if (resultRc == null) {
					resultRc = recordCollection;
				} else {
					// 进行并运算
					resultRc = resultRc.unionCal(recordCollection);
				}

				if (targetArray.size() == 0) {
					break;
				}
			}
		}
		//去除已经添加过的集合
		copyRcs.removeAll(deleteRcs);

		if (targetArray.size() > 0) {
			// 说明已经完全还未找全上近似的集合
			for (RecordCollection recordCollection : copyRcs) {
				nameArray = recordCollection.getRecordNames();

				if (strHasOverlap(targetArray, nameArray)) {
					removeOverLaped(targetArray, nameArray);

					if (resultRc == null) {
						resultRc = recordCollection;
					} else {
						// 进行并运算
						resultRc = resultRc.unionCal(recordCollection);
					}

					if (targetArray.size() == 0) {
						break;
					}
				}
			}
		}

		return resultRc;
	}

	/**
	 * 获取集合的下近似集合
	 * 
	 * @param rc
	 *            原始集合
	 * @return
	 */
	public RecordCollection getDownSimilarRC(RecordCollection rc) {
		RecordCollection resultRc = null;
		ArrayList nameArray;
		ArrayList targetArray;
		targetArray = rc.getRecordNames();

		for (RecordCollection recordCollection : ksCollections) {
			nameArray = recordCollection.getRecordNames();

			if (strIsContained(targetArray, nameArray)) {
				removeOverLaped(targetArray, nameArray);

				if (resultRc == null) {
					resultRc = recordCollection;
				} else {
					// 进行并运算
					resultRc = resultRc.unionCal(recordCollection);
				}

				if (targetArray.size() == 0) {
					break;
				}
			}
		}

		return resultRc;
	}

	/**
	 * 判断2个字符数组之间是否有交集
	 * 
	 * @param str1
	 *            字符列表1
	 * @param str2
	 *            字符列表2
	 * @return
	 */
	public boolean strHasOverlap(ArrayList str1, ArrayList str2) {
		boolean hasOverlap = false;

		for (String s1 : str1) {
			for (String s2 : str2) {
				if (s1.equals(s2)) {
					hasOverlap = true;
					break;
				}
			}

			if (hasOverlap) {
				break;
			}
		}

		return hasOverlap;
	}

	/**
	 * 判断字符集str2是否完全包含于str1中
	 * 
	 * @param str1
	 * @param str2
	 * @return
	 */
	public boolean strIsContained(ArrayList str1, ArrayList str2) {
		boolean isContained = false;
		int count = 0;

		for (String s : str2) {
			if (str1.contains(s)) {
				count++;
			}
		}

		if (count == str2.size()) {
			isContained = true;
		}

		return isContained;
	}

	/**
	 * 字符列表移除公共元素
	 * 
	 * @param str1
	 * @param str2
	 */
	public void removeOverLaped(ArrayList str1, ArrayList str2) {
		ArrayList deleteStrs = new ArrayList<>();

		for (String s1 : str1) {
			for (String s2 : str2) {
				if (s1.equals(s2)) {
					deleteStrs.add(s1);
					break;
				}
			}
		}

		// 进行公共元素的移除
		str1.removeAll(deleteStrs);
	}
}

RoughSetsTool.java：

package DataMining_RoughSets;

import java.io.BufferedReader;
import java.io.File;
import java.io.FileReader;
import java.io.IOException;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.Map;

/**
 * 粗糙集属性约简算法工具类
 * 
 * @author lyq
 * 
 */
public class RoughSetsTool {
	// 决策属性名称
	public static String DECISION_ATTR_NAME;

	// 测试数据文件地址
	private String filePath;
	// 数据属性列名称
	private String[] attrNames;
	// 所有的数据
	private ArrayList totalDatas;
	// 所有的数据记录,与上面的区别是记录的属性是可约简的，原始数据是不能变的
	private ArrayList totalRecords;
	// 条件属性图
	private HashMap> conditionAttr;
	// 属性记录集合
	private ArrayList collectionList;

	public RoughSetsTool(String filePath) {
		this.filePath = filePath;
		readDataFile();
	}

	/**
	 * 从文件中读取数据
	 */
	private void readDataFile() {
		File file = new File(filePath);
		ArrayList dataArray = new ArrayList();

		try {
			BufferedReader in = new BufferedReader(new FileReader(file));
			String str;
			String[] tempArray;
			while ((str = in.readLine()) != null) {
				tempArray = str.split(" ");
				dataArray.add(tempArray);
			}
			in.close();
		} catch (IOException e) {
			e.getStackTrace();
		}

		String[] array;
		Record tempRecord;
		HashMap attrMap;
		ArrayList attrList;
		totalDatas = new ArrayList<>();
		totalRecords = new ArrayList<>();
		conditionAttr = new HashMap<>();
		// 赋值属性名称行
		attrNames = dataArray.get(0);
		DECISION_ATTR_NAME = attrNames[attrNames.length - 1];
		for (int j = 0; j < dataArray.size(); j++) {
			array = dataArray.get(j);
			totalDatas.add(array);
			if (j == 0) {
				// 过滤掉第一行列名称数据
				continue;
			}

			attrMap = new HashMap<>();
			for (int i = 0; i < attrNames.length; i++) {
				attrMap.put(attrNames[i], array[i]);

				// 寻找条件属性
				if (i > 0 && i < attrNames.length - 1) {
					if (conditionAttr.containsKey(attrNames[i])) {
						attrList = conditionAttr.get(attrNames[i]);
						if (!attrList.contains(array[i])) {
							attrList.add(array[i]);
						}
					} else {
						attrList = new ArrayList<>();
						attrList.add(array[i]);
					}
					conditionAttr.put(attrNames[i], attrList);
				}
			}
			tempRecord = new Record(array[0], attrMap);
			totalRecords.add(tempRecord);
		}
	}

	/**
	 * 将数据记录根据属性分割到集合中
	 */
	private void recordSpiltToCollection() {
		String attrName;
		ArrayList attrList;
		ArrayList recordList;
		HashMap collectionAttrValues;
		RecordCollection collection;
		collectionList = new ArrayList<>();

		for (Map.Entry entry : conditionAttr.entrySet()) {
			attrName = (String) entry.getKey();
			attrList = (ArrayList) entry.getValue();

			for (String s : attrList) {
				recordList = new ArrayList<>();
				// 寻找属性为s的数据记录分入到集合中
				for (Record record : totalRecords) {
					if (record.isContainedAttr(s)) {
						recordList.add(record);
					}
				}
				collectionAttrValues = new HashMap<>();
				collectionAttrValues.put(attrName, s);
				collection = new RecordCollection(collectionAttrValues,
						recordList);

				collectionList.add(collection);
			}
		}
	}

	/**
	 * 构造属性集合图
	 * 
	 * @param reductAttr
	 *            需要约简的属性
	 * @return
	 */
	private HashMap> constructCollectionMap(
			ArrayList reductAttr) {
		String currentAtttrName;
		ArrayList cList;
		// 集合属性对应图
		HashMap> collectionMap = new HashMap<>();

		// 截取出条件属性部分
		for (int i = 1; i < attrNames.length - 1; i++) {
			currentAtttrName = attrNames[i];

			// 判断此属性列是否需要约简
			if (reductAttr != null && reductAttr.contains(currentAtttrName)) {
				continue;
			}

			cList = new ArrayList<>();

			for (RecordCollection c : collectionList) {
				if (c.isContainedAttrName(currentAtttrName)) {
					cList.add(c);
				}
			}

			collectionMap.put(currentAtttrName, cList);
		}

		return collectionMap;
	}

	/**
	 * 根据已有的分裂集合计算知识系统
	 */
	private ArrayList computeKnowledgeSystem(
			HashMap> collectionMap) {
		String attrName = null;
		ArrayList cList = null;
		// 知识系统
		ArrayList ksCollections;

		ksCollections = new ArrayList<>();

		// 取出1项
		for (Map.Entry entry : collectionMap.entrySet()) {
			attrName = (String) entry.getKey();
			cList = (ArrayList) entry.getValue();
			break;
		}
		collectionMap.remove(attrName);

		for (RecordCollection rc : cList) {
			recurrenceComputeKS(ksCollections, collectionMap, rc);
		}

		return ksCollections;
	}

	/**
	 * 递归计算所有的知识系统，通过计算所有集合的交集
	 * 
	 * @param ksCollection
	 *            已经求得知识系统的集合
	 * @param map
	 *            还未曾进行过交运算的集合
	 * @param preCollection
	 *            前个步骤中已经通过交运算计算出的集合
	 */
	private void recurrenceComputeKS(ArrayList ksCollections,
			HashMap> map,
			RecordCollection preCollection) {
		String attrName = null;
		RecordCollection tempCollection;
		ArrayList cList = null;
		HashMap> mapCopy = new HashMap<>();
		
		//如果已经没有数据了，则直接添加
		if(map.size() == 0){
			ksCollections.add(preCollection);
			return;
		}

		for (Map.Entry entry : map.entrySet()) {
			cList = (ArrayList) entry.getValue();
			mapCopy.put((String) entry.getKey(), cList);
		}

		// 取出1项
		for (Map.Entry entry : map.entrySet()) {
			attrName = (String) entry.getKey();
			cList = (ArrayList) entry.getValue();
			break;
		}

		mapCopy.remove(attrName);
		for (RecordCollection rc : cList) {
			// 挑选此属性的一个集合进行交运算，然后再次递归
			tempCollection = preCollection.overlapCalculate(rc);

			if (tempCollection == null) {
				continue;
			}

			// 如果map中已经没有数据了,说明递归到头了
			if (mapCopy.size() == 0) {
				ksCollections.add(tempCollection);
			} else {
				recurrenceComputeKS(ksCollections, mapCopy, tempCollection);
			}
		}
	}

	/**
	 * 进行粗糙集属性约简算法
	 */
	public void findingReduct() {
		RecordCollection[] sameClassRcs;
		KnowledgeSystem ks;
		ArrayList ksCollections;
		// 待约简的属性
		ArrayList reductAttr = null;
		ArrayList attrNameList;
		// 最终可约简的属性组
		ArrayList> canReductAttrs;
		HashMap> collectionMap;

		sameClassRcs = selectTheSameClassRC();
		// 这里讲数据按照各个分类的小属性划分了9个集合
		recordSpiltToCollection();

		collectionMap = constructCollectionMap(reductAttr);
		ksCollections = computeKnowledgeSystem(collectionMap);
		ks = new KnowledgeSystem(ksCollections);
		System.out.println("原始集合分类的上下近似集合");
		ks.getDownSimilarRC(sameClassRcs[0]).printRc();
		ks.getUpSimilarRC(sameClassRcs[0]).printRc();
		ks.getDownSimilarRC(sameClassRcs[1]).printRc();
		ks.getUpSimilarRC(sameClassRcs[1]).printRc();

		attrNameList = new ArrayList<>();
		for (int i = 1; i < attrNames.length - 1; i++) {
			attrNameList.add(attrNames[i]);
		}

		ArrayList remainAttr;
		canReductAttrs = new ArrayList<>();
		reductAttr = new ArrayList<>();
		// 进行条件属性的递归约简
		for (String s : attrNameList) {
			remainAttr = (ArrayList) attrNameList.clone();
			remainAttr.remove(s);
			reductAttr = new ArrayList<>();
			reductAttr.add(s);
			recurrenceFindingReduct(canReductAttrs, reductAttr, remainAttr,
					sameClassRcs);
		}
		
		printRules(canReductAttrs);
	}

	/**
	 * 递归进行属性约简
	 * 
	 * @param resultAttr
	 *            已经计算出的约简属性组
	 * @param reductAttr
	 *            将要约简的属性组
	 * @param remainAttr
	 *            剩余的属性
	 * @param sameClassRc
	 *            待计算上下近似集合的同类集合
	 */
	private void recurrenceFindingReduct(
			ArrayList> resultAttr,
			ArrayList reductAttr, ArrayList remainAttr,
			RecordCollection[] sameClassRc) {
		KnowledgeSystem ks;
		ArrayList ksCollections;
		ArrayList copyRemainAttr;
		ArrayList copyReductAttr;
		HashMap> collectionMap;
		RecordCollection upRc1;
		RecordCollection downRc1;
		RecordCollection upRc2;
		RecordCollection downRc2;

		collectionMap = constructCollectionMap(reductAttr);
		ksCollections = computeKnowledgeSystem(collectionMap);
		ks = new KnowledgeSystem(ksCollections);
		
		downRc1 = ks.getDownSimilarRC(sameClassRc[0]);
		upRc1 = ks.getUpSimilarRC(sameClassRc[0]);
		downRc2 = ks.getDownSimilarRC(sameClassRc[1]);
		upRc2 = ks.getUpSimilarRC(sameClassRc[1]);

		// 如果上下近似没有完全拟合原集合则认为属性不能被约简
		if (!upRc1.isCollectionSame(sameClassRc[0])
				|| !downRc1.isCollectionSame(sameClassRc[0])) {
			return;
		}
		//正类和负类都需比较
		if (!upRc2.isCollectionSame(sameClassRc[1])
				|| !downRc2.isCollectionSame(sameClassRc[1])) {
			return;
		}

		// 加入到结果集中
		resultAttr.add(reductAttr);
		//只剩下1个属性不能再约简
		if (remainAttr.size() == 1) {
			return;
		}

		for (String s : remainAttr) {
			copyRemainAttr = (ArrayList) remainAttr.clone();
			copyReductAttr = (ArrayList) reductAttr.clone();
			copyRemainAttr.remove(s);
			copyReductAttr.add(s);
			recurrenceFindingReduct(resultAttr, copyReductAttr, copyRemainAttr,
					sameClassRc);
		}
	}

	/**
	 * 选出决策属性一致的集合
	 * 
	 * @return
	 */
	private RecordCollection[] selectTheSameClassRC() {
		RecordCollection[] resultRc = new RecordCollection[2];
		resultRc[0] = new RecordCollection();
		resultRc[1] = new RecordCollection();
		String attrValue;

		// 找出第一个记录的决策属性作为一个分类
		attrValue = totalRecords.get(0).getRecordDecisionClass();
		for (Record r : totalRecords) {
			if (attrValue.equals(r.getRecordDecisionClass())) {
				resultRc[0].getRecord().add(r);
			}else{
				resultRc[1].getRecord().add(r);
			}
		}

		return resultRc;
	}
	
	/**
	 * 输出决策规则
	 * @param reductAttrArray
	 * 约简属性组
	 */
	public void printRules(ArrayList> reductAttrArray){
		//用来保存已经描述过的规则，避免重复输出
		ArrayList rulesArray;
		String rule;
		
		for(ArrayList ra: reductAttrArray){
			rulesArray = new ArrayList<>();
			System.out.print("约简的属性：");
			for(String s: ra){
				System.out.print(s + ",");
			}
			System.out.println();
			
			for(Record r: totalRecords){
				rule = r.getDecisionRule(ra);
				if(!rulesArray.contains(rule)){
					rulesArray.add(rule);
					System.out.println(rule);
				}
			}
			System.out.println();
		} 
	}

	/**
	 * 输出记录集合
	 * 
	 * @param rcList
	 *            待输出记录集合
	 */
	public void printRecordCollectionList(ArrayList rcList) {
		for (RecordCollection rc : rcList) {
			System.out.print("{");
			for (Record r : rc.getRecord()) {
				System.out.print(r.getName() + ", ");
			}
			System.out.println("}");
		}
	}
}

调用类Client.java:

package DataMining_RoughSets;

/**
 * 粗糙集约简算法
 * @author lyq
 *
 */
public class Client {
	public static void main(String[] args){
		String filePath = "C:\\Users\\lyq\\Desktop\\icon\\input.txt";
		
		RoughSetsTool tool = new RoughSetsTool(filePath);
		tool.findingReduct();
	}
}

结果输出：

原始集合分类的上下近似集合
{x1, x2, x5, }
{x1, x2, x5, }
{x3, x4, x7, x6, x8, }
{x3, x4, x7, x6, x8, }
约简的属性：Color,
属性Shape=Triangle,Size=Large,他的分类为Stable
属性Shape=Circle,Size=Small,他的分类为UnStable
属性Shape=Rectangle,Size=Large,他的分类为Stable
属性Shape=Circle,Size=Middle,他的分类为UnStable
属性Shape=Rectangle,Size=Middle,他的分类为UnStable

约简的属性：Color,Shape,
属性Size=Large,他的分类为Stable
属性Size=Small,他的分类为UnStable
属性Size=Middle,他的分类为UnStable

约简的属性：Shape,
属性Size=Large,Color=Red,他的分类为Stable
属性Size=Small,Color=Yellow,他的分类为UnStable
属性Size=Large,Color=Blue,他的分类为Stable
属性Size=Middle,Color=Red,他的分类为UnStable
属性Size=Small,Color=Blue,他的分类为UnStable
属性Size=Middle,Color=Blue,他的分类为UnStable

约简的属性：Shape,Color,
属性Size=Large,他的分类为Stable
属性Size=Small,他的分类为UnStable
属性Size=Middle,他的分类为UnStable

算法的小问题

我在算法实现时很大的问题到不是碰到很多，就是对于上下近似集的计算上自己做了一个修改，下近似集就是知识系统中的集合完全包括在目标集合的目标，而上近似则是在下近似集的基础上添加目标集合中还没有被包含进集合的元素的所属集合，跟题目原先设想的还是有一点点的不一样，但是算法整体思想还是呈现出来了。

我对算法的思考

粗糙集属性约简算法重在约简，至于用什么原则作为约简的标准，其实本身不止一种，当然你可以根本不需要用上下近似集的概念，这样确实使得验证变得非常的繁琐，你可以直接一条条的记录去约简属性，看会不会对分类的最终结果造成影响，然后做出判断，通过对决策影响的判断也仅仅是一种属性约简的情况。

算法的适用情况

RoughSets算法在属性集比较少的情况下能得到一个不错的分类的，也可以降低存储开销，但是属性集比较多的时候，可能准确率无法保证。

C++11堆操作深度解析：std::is_heap与std::is_heap_until原理解析与实践
文章目录堆结构基础与函数接口堆的核心性质函数签名与核心接口std::is_heapstd::is_heap_until实现原理深度剖析std::is_heap的验证逻辑std::is_heap_until的定位策略算法优化细节代码实践与案例分析基础用法演示自定义比较器实现最小堆检查边缘情况处理性能分析与实际应用时间复杂度对比典型应用场景与手动实现的对比注意事项与最佳实践迭代器要求比较器设计C++标
为什么会出现“与此站点的连接不安全”警告？
当浏览器弹出“与此站点的连接不安全”的红色警告时，不仅会让访客感到不安，还可能直接导致用户流失、品牌信誉受损，甚至引发数据泄露风险。作为网站运营者，如何快速解决这一问题？一、为什么会出现“与此站点的连接不安全”警告？浏览器提示“不安全连接”，本质上是检测到当前网站与用户之间的数据传输未经过加密保护。以下是触发警告的常见原因：1.未安装SSL证书SSL（SecureSocketsLayer）证书是网
JSON 与 AJAX Auscy json ajax 前端
一、JSON（JavaScriptObjectNotation）1.数据类型与语法细节支持的数据类型：基本类型：字符串（需用双引号）、数字、布尔值（true/false）、null。复杂类型：数组（[]）、对象（{}）。严格语法规范：键名必须用双引号包裹（如"name":"张三"）。数组元素用逗号分隔，最后一个元素后不能有多余逗号。数字不能以0开头（如012会被解析为12），不支持八进制/十六进制
Guava LoadingCache sqyaa. java并发编程 Java知识 jvm 缓存 guava
LoadingCache是GoogleGuava库提供的一个高级缓存实现，它通过自动加载机制简化了缓存使用模式。核心特性自动加载机制当缓存未命中时，自动调用指定的CacheLoader加载数据线程安全：并发请求下，相同key只会加载一次灵活的过期策略支持基于写入时间(expireAfterWrite)和访问时间(expireAfterAccess)的过期可设置最大缓存大小，基于LRU策略淘汰丰富的
JavaScript 树形菜单总结 Auscy microsoft
树形菜单是前端开发中常见的交互组件，用于展示具有层级关系的数据（如文件目录、分类列表、组织架构等）。以下从核心概念、实现方式、常见功能及优化方向等方面进行总结。一、核心概念层级结构：数据以父子嵌套形式存在，如{id:1,children:[{id:2}]}。节点：树形结构的基本单元，包含自身信息及子节点（若有）。展开/折叠：子节点的显示与隐藏切换，是树形菜单的核心交互。递归渲染：因数据层级不固定，
冒泡、选择、插入排序：三大基础排序算法深度解析（C语言实现） xienda 算法排序算法数据结构
在算法学习道路上，排序算法是每位程序员必须掌握的基石。本文将深入解析冒泡排序、选择排序和插入排序这三种基础排序算法，通过C语言代码实现和对比分析，帮助读者彻底理解它们的差异与应用场景。算法原理与代码实现1.冒泡排序（BubbleSort）工作原理：通过重复比较相邻元素，将较大元素逐步"冒泡"到数组末尾。voidbubbleSort(intarr[],intn){ for(inti=0;iarr[
Leetcode 148. 排序链表
文章目录前引题目代码（首刷看题解）代码（8.9二刷部分看解析）代码（9.15三刷部分看解析）前引综合性比较强的一道题，要求时间复杂度必须O(logn)才能通过，最适合链表的排序算法就是归并。这里采用自顶向下的方法步骤：找到链表中点（双指针）对两个子链表排序(递归，直到只有一个结点，记得将子链表最后指向nullptr）归并（引入dummy结点）题目Leetcode148.排序链表代码（首刷看题解）c
全面触摸屏输入法设计与实现长野君
本文还有配套的精品资源，点击获取简介：触摸屏输入法是针对触摸设备优化的文字输入方案，包括虚拟键盘、手写、语音识别和手势等多种输入方式。本方案通过提供主程序文件、用户手册、界面截图、示例图、说明文本和音效文件，旨在为用户提供一个完整的、多样的文字输入体验。开发者通过持续优化算法和用户界面，使用户在无物理键盘环境下也能高效准确地进行文字输入。1.触摸屏输入法概述简介在现代信息技术飞速发展的今天，触摸屏
高效批量单词翻译工具的设计与应用
本文还有配套的精品资源，点击获取简介：在信息技术飞速发展的今天，批量单词翻译工具通过计算机的数据处理能力，大大提高了语言学习和文字处理的效率。用户通过简单输入单词列表到一个文本文件，并运行翻译程序，即可获得翻译结果并保存至指定文件。该工具集成了内置或外部翻译引擎，利用自然语言处理技术实现快速准确的翻译，并可能提供词性识别等附加功能。尽管机器翻译无法完全取代人工校对，但它为用户提供了一种高效的翻译解
Android 开源组件和第三方库汇总 gyyzzr Android Android 开源框架
转载1、github排名https://github.com/trending,github搜索：https://github.com/search2、https://github.com/wasabeef/awesome-android-ui目录UIUI卫星菜单节选器下拉刷新模糊效果HUD与Toast进度条UI其它动画网络相关响应式编程地图数据库图像浏览及处理视频音频处理测试及调试动态更新热更新
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）阿牛的药铺算法移植部署 fpga开发 verilog
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）引言：为什么这个FPGA入门路线能帮你快速上岗？本文设计了一条**"Verilog语法→工具链操作→光学项目实战→岗位技能对标"的阶梯式学习路径。不同于泛泛而谈的FPGA教程，我们聚焦光学类产品开发**核心能力（时序接口设计、图像处理算法移植、高速接口应用），通过3个递进式项目（从LED闪烁到图像边缘检测），
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
Android ViewBinding 使用与封装教程积跬步DEV Android 开发实战大全 android
AndroidViewBinding使用与封装教程：一、ViewBinding是什么？核心功能：为每个XML布局文件自动生成一个绑定类（如ActivityMainBinding），直接暴露所有带ID的视图引用。优点：避免繁琐的findViewById()，类型安全且编译时检查。对比DataBinding：ViewBinding仅处理视图引用，无数据绑定功能。DataBinding支持双向数据绑定，
基于链家网的二手房数据采集清洗与可视化分析 Mint_Datazzh 项目 selenium 网络爬虫
个人学习内容笔记，仅供参考。项目链接：https://gitee.com/rongwu651/lianjia原文链接：基于链家网的二手房数据采集清洗与可视化分析–笔墨云烟研究内容该课题的主要目的是通过将二手房网站上的存量与已销售房源，构建一个二手房市场行情情况与房源特点的可视化平台。该平台通过HTML架构和Echarts完成可视化的搭建。因此，该课题的主要研究内容就是如何利用相关技术设计并实现这样
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
分布式学习笔记_04_复制模型 NzuCRAS 分布式学习笔记架构后端
常见复制模型使用复制的目的在分布式系统中，数据通常需要被分布在多台机器上，主要为了达到：拓展性：数据量因读写负载巨大，一台机器无法承载，数据分散在多台机器上仍然可以有效地进行负载均衡，达到灵活的横向拓展高容错&高可用：在分布式系统中单机故障是常态，在单机故障的情况下希望整体系统仍然能够正常工作，这时候就需要数据在多台机器上做冗余，在遇到单机故障时能够让其他机器接管统一的用户体验：如果系统客户端分布
算法学习笔记：15.二分查找 ——从原理到实战，涵盖 LeetCode 与考研 408 例题呆呆企鹅仔算法学习算法学习笔记考研二分查找
在计算机科学的查找算法中，二分查找以其高效性占据着重要地位。它利用数据的有序性，通过不断缩小查找范围，将原本需要线性时间的查找过程优化为对数时间，成为处理大规模有序数据查找问题的首选算法。二分查找的基本概念二分查找（BinarySearch），又称折半查找，是一种在有序数据集合中查找特定元素的高效算法。其核心原理是：通过不断将查找范围减半，快速定位目标元素。与线性查找逐个遍历元素不同，二分查找依赖
Python 脚本最佳实践2025版
前文可以直接把这篇文章喂给AI,可以放到AI角色设定里,也可以直接作为提示词.这样,你只管提需求,写脚本就让AI来.概述追求简洁和清晰：脚本应简单明了。使用函数(functions)、常量(constants)和适当的导入(import)实践来有逻辑地组织你的Python脚本。使用枚举(enumerations)和数据类(dataclasses)等数据结构高效管理脚本状态。通过命令行参数增强交互性
《分片终章的哈希裂痕：藏在数据拼接里的隐形逻辑》前端
在大文件分片传输里，有一个令人费解的现象：当所有分片的校验都显示正常，拼接后的整体文件却与源文件的哈希值不符，而问题往往精准地指向最后一片。这并非偶然的技术故障，而是数据传输链条中多重隐形逻辑交织的必然结果，如同钟表的齿轮在最后一圈突然出现难以察觉的错位。文件被切割成固定大小的分片时，最后一片往往是规则的例外。它如同拼图中形状特异的收尾piece，尺寸可能小于其他分片，却承担着衔接整体的关键作用。
（Python基础篇）循环结构 EternityArt 基础篇 python
一、什么是Python循环结构？循环结构是编程中重复执行代码块的机制。在Python中，循环允许你：1.迭代处理数据：遍历列表、字典、文件内容等。2.自动化重复任务：如批量处理数据、生成序列等。3.控制执行流程：根据条件决定是否继续或终止循环。二、为什么需要循环结构？假设你需要打印1到100的所有偶数：没有循环：需手动编写100行print()语句。print(0)print(2)print(4)
（Python基础篇）字典的操作 EternityArt 基础篇 python 开发语言
一、引言在Python编程中，字典（Dictionary）是一种极具灵活性的数据结构，它通过“键-值对”（key-valuepair）的形式存储数据，如同现实生活中的字典——通过“词语（键）”快速查找“释义（值）”。相较于列表和元组的有序索引访问，字典的优势在于基于键的快速查找，这使得它在处理需要频繁通过唯一标识获取数据的场景中极为高效。掌握字典的操作，能让我们更高效地组织和管理复杂数据，是Pyt
LeetCode算法题：电话号码的字母组合吱屋猪_ 算法 leetcode java
题目描述：给定一个仅包含数字2-9的字符串，返回所有它能表示的字母组合。答案可以按任意顺序返回。给出数字到字母的映射如下（与电话按键相同）。注意1不对应任何字母。2->"abc"3->"def"4->"ghi"5->"jkl"6->"mno"7->"pqrs"8->"tuv"9->"wxyz"例如，给定digits="23"，返回["ad","ae","af","bd","be","bf","cd
Cesium加载各类数据总结 zhu_zhu_xia cesium JavaScript javascript
接触到的加载数据类型：源地图、shp、Geojson、png、wms、地形底图一.Cesium加载各类底图#此类加载的本质在于newCesium.ImageryProvider()Apidefination：“Providesimagerytobedisplayedonthesurfaceofanellipsoid.Thistypedescribesaninterfaceandisnotinten
vue keep-alive标签的运用
keep-alive，想必大家都不会很陌生，在一些选项卡中会使用到。其实，它的作用大概就是把组件的数据给缓存起来。比如果我有一个选项卡，标签一，标签二，标签三。现在，我需要实现，当我在标签一的表单中输入内容后，点击标签二，再回到标签一，表单的内容依然存在。如果按以往的做法，不使用keep-alive，那是不能实现的。然而，我们只需要在选项卡的内容最外层包一个keep-alive标签即可。但这儿有一
Redis Sentinel（哨兵）和 Redis Cluster（集群） G丶AEOM 八股普通学习区 Redis redis 数据库缓存
哨兵机制和集群有什么区别Redis集群主要有两种，一种是RedisSentinel哨兵集群，一种是RedisCluster。主从集群，包括一个Master和多个Slave节点，Master负责数据的读写，Slave负责数据的读取，Master上收到的数据变更会同步到Slave节点上实现数据同步，但不提供容错和恢复，在Master宕机时不会选出新的Master，导致后续客户端所有写请求直接失败。所以
CentOS7环境卸载MySQL5.7 Hadoop_Liang mysql 数据库 mysql
备份重要数据切记，卸载之前先备份mysql重要的数据。备份一个数据库例如：备份名为mydatabase的数据库到backup.sql的文件中mysqldump-uroot-ppassword123mydatabase>backup.sql备份所有数据库mysqldump-uroot-ppassword123--all-databases>all_databases_backup.sql注意：-p后
php SPOF 贵哥的编程之路(热爱分享为后来者) PHP语言经典程序100题 php 开发语言
1.什么是单点故障（SPOF）？单点故障指的是系统中某个组件一旦失效，整个系统或服务就会不可用。常见的单点有：数据库、缓存、Web服务器、负载均衡、网络设备等。2.常见单点故障场景只有一台数据库服务器，宕机后所有业务不可用只有一台Redis缓存，挂掉后缓存全部失效只有一台Web服务器，挂掉后网站无法访问只有一个负载均衡节点，挂掉后流量无法分发只有一条网络链路，断开后所有服务失联3.消除单点故障的主
霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
centos7安装 mysql5.7(安装包) heiPony linux mysql mariadb centos mysql
一.卸载centos7自带数据库查看系统自带的Mariadbrpm-qa|grepmariadbmariadb-libs-5.5.44-2.el7.centos.x86_64卸载rpm-e--nodepsmariadb-libs-5.5.44-2.el7.centos.x86_64删除etc目录下的my.cnfrm/etc/my.cnf二.检查mysql是否存在(有就卸载,删除相关文件)rpm-q
MySQL Explain 详解：从入门到精通，让你的 SQL 飞起来
引言：为什么Explain是SQL优化的“照妖镜”？在Java开发中，我们常常会遇到数据库性能瓶颈的问题。一条看似简单的SQL语句，在数据量增长到一定规模后，可能会从毫秒级响应变成秒级甚至分钟级响应，直接拖慢整个应用的性能。此时，你是否曾困惑于：为什么这条SQL突然变慢了？索引明明建了，为什么没生效？到底是哪里出了问题？答案就藏在MySQL的EXPLAIN命令里。EXPLAIN就像一面“照妖镜”，
iOS http封装 374016526 ios 服务器交互 http 网络请求
程序开发避免不了与服务器的交互，这里打包了一个自己写的http交互库。希望可以帮到大家。内置一个basehttp，当我们创建自己的service可以继承实现。 KuroAppBaseHttp *baseHttp = [[KuroAppBaseHttp alloc] init]; [baseHttp setDelegate:self]; [baseHttp
lolcat ：一个在 Linux 终端中输出彩虹特效的命令行工具 brotherlamp linux linux教程 linux视频 linux自学 linux资料
那些相信 Linux 命令行是单调无聊且没有任何乐趣的人们，你们错了，这里有一些有关 Linux 的文章，它们展示着 Linux 是如何的有趣和“淘气” 。在本文中，我将讨论一个名为“lolcat”的小工具 – 它可以在终端中生成彩虹般的颜色。何为 lolcat ? Lolcat 是一个针对 Linux，BSD 和 OSX 平台的工具，它类似于 cat 命令，并为 cat
MongoDB索引管理（1）——[九] eksliang mongodb MongoDB管理索引
转载请出自出处：http://eksliang.iteye.com/blog/2178427 一、概述数据库的索引与书籍的索引类似，有了索引就不需要翻转整本书。数据库的索引跟这个原理一样，首先在索引中找，在索引中找到条目以后，就可以直接跳转到目标文档的位置，从而使查询速度提高几个数据量级。不使用索引的查询称
Informatica参数及变量 18289753290 Informatica 参数变量
下面是本人通俗的理解，如有不对之处，希望指正 info参数的设置：在info中用到的参数都在server的专门的配置文件中（最好以parma）结尾下面的GLOBAl就是全局的，$开头的是系统级变量，$$开头的变量是自定义变量。如果是在session中或者mapping中用到的变量就是局部变量，那就把global换成对应的session或者mapping名字。 [GLOBAL] $Par
python 解析unicode字符串为utf8编码字符串酷的飞上天空 unicode
php返回的json字符串如果包含中文，则会被转换成\uxx格式的unicode编码字符串返回。在浏览器中能正常识别这种编码，但是后台程序却不能识别，直接输出显示的是\uxx的字符，并未进行转码。转换方式如下 >>> import json >>> q = '{"text":"\u4
Hibernate的总结永夜-极光 Hibernate
1.hibernate的作用,简化对数据库的编码,使开发人员不必再与复杂的sql语句打交道做项目大部分都需要用JAVA来链接数据库，比如你要做一个会员注册的页面，那么获取到用户填写的基本信后，你要把这些基本信息存入数据库对应的表中，不用hibernate还有mybatis之类的框架，都不用的话就得用JDBC，也就是JAVA自己的，用这个东西你要写很多的代码，比如保存注册信
SyntaxError: Non-UTF-8 code starting with '\xc4' 随便小屋 python
刚开始看一下Python语言，传说听强大的，但我感觉还是没Java强吧！写Hello World的时候就遇到一个问题，在Eclipse中写的，代码如下 ''' Created on 2014年10月27日 @author: Logic ''' print("Hello World!"); 运行结果 SyntaxError: Non-UTF-8
学会敬酒礼仪不做酒席菜鸟 aijuans 菜鸟
俗话说，酒是越喝越厚，但在酒桌上也有很多学问讲究，以下总结了一些酒桌上的你不得不注意的小细节。细节一：领导相互喝完才轮到自己敬酒。敬酒一定要站起来，双手举杯。细节二：可以多人敬一人，决不可一人敬多人，除非你是领导。细节三：自己敬别人，如果不碰杯，自己喝多少可视乎情况而定，比如对方酒量，对方喝酒态度，切不可比对方喝得少，要知道是自己敬人。细节四：自己敬别人，如果碰杯，一
《创新者的基因》读书笔记 aoyouzi 读书笔记《创新者的基因》
创新者的基因创新者的“基因”，即最具创意的企业家具备的五种“发现技能”：联想，观察，实验，发问，建立人脉。第一部分破坏性创新，从你开始第一章破坏性创新者的基因如何获得启示：发现以下的因素起到了催化剂的作用：(1) -个挑战现状的问题；(2)对某项技术、某个公司或顾客的观察；(3) -次尝试新鲜事物的经验或实验；(4)与某人进行了一次交谈，为他点醒
表单验证技术百合不是茶 JavaScript DOM对象 String对象事件
js最主要的功能就是验证表单,下面是我对表单验证的一些理解,贴出来与大家交流交流 ,数显我们要知道表单验证需要的技术点, String对象,事件,函数一:String对象;通常是对字符串的操作; 1,String的属性; 字符串.length;表示该字符串的长度; var str= "java"
web.xml配置详解之context-param bijian1013 java servlet web.xml context-param
一.格式定义： <context-param> <param-name>contextConfigLocation</param-name> <param-value>contextConfigLocationValue></param-value> </context-param> 作用：该元
Web系统常见编码漏洞（开发工程师知晓） Bill_chen sql PHP Web fckeditor 脚本
1.头号大敌：SQL Injection 原因：程序中对用户输入检查不严格，用户可以提交一段数据库查询代码，根据程序返回的结果，获得某些他想得知的数据，这就是所谓的SQL Injection，即SQL注入。本质: 对于输入检查不充分，导致SQL语句将用户提交的非法数据当作语句的一部分来执行。示例： String query = "SELECT id FROM users
【MongoDB学习笔记六】MongoDB修改器 bit1129 mongodb
本文首先介绍下MongoDB的基本的增删改查操作，然后，详细介绍MongoDB提供的修改器，以完成各种各样的文档更新操作 MongoDB的主要操作 show dbs 显示当前用户能看到哪些数据库 use foobar 将数据库切换到foobar show collections 显示当前数据库有哪些集合 db.people.update，update不带参数，可
提高职业素养，做好人生规划白糖_ 人生
培训讲师是成都著名的企业培训讲师，他在讲课中提出的一些观点很新颖，在此我收录了一些分享一下。注：讲师的观点不代表本人的观点，这些东西大家自己揣摩。 1、什么是职业规划：职业规划并不完全代表你到什么阶段要当什么官要拿多少钱，这些都只是梦想。职业规划是清楚的认识自己现在缺什么，这个阶段该学习什么，下个阶段缺什么，又应该怎么去规划学习，这样才算是规划。
国外的网站你都到哪边看？ bozch 技术网站国外
学习软件开发技术，如果没有什么英文基础，最好还是看国内的一些技术网站，例如：开源OSchina，csdn，iteye,51cto等等。个人感觉如果英语基础能力不错的话，可以浏览国外的网站来进行软件技术基础的学习，例如java开发中常用的到的网站有apache.org 里面有apache的很多Projects,springframework.org是spring相关的项目网站,还有几个感觉不错的
编程之美-光影切割问题 bylijinnan 编程之美
package a; public class DisorderCount { /**《编程之美》“光影切割问题” * 主要是两个问题： * 1.数学公式（设定没有三条以上的直线交于同一点）： * 两条直线最多一个交点，将平面分成了4个区域； * 三条直线最多三个交点，将平面分成了7个区域； * 可以推出：N条直线 M个交点，区域数为N+M+1。
关于Web跨站执行脚本概念 chenbowen00 Web 安全跨站执行脚本
跨站脚本攻击(XSS)是web应用程序中最危险和最常见的安全漏洞之一。安全研究人员发现这个漏洞在最受欢迎的网站,包括谷歌、Facebook、亚马逊、PayPal,和许多其他网站。如果你看看bug赏金计划,大多数报告的问题属于 XSS。为了防止跨站脚本攻击,浏览器也有自己的过滤器,但安全研究人员总是想方设法绕过这些过滤器。这个漏洞是通常用于执行cookie窃取、恶意软件传播,会话劫持,恶意重定向。在
[开源项目与投资]投资开源项目之前需要统计该项目已有的用户数 comsci 开源项目
现在国内和国外,特别是美国那边,突然出现很多开源项目,但是这些项目的用户有多少,有多少忠诚的粉丝,对于投资者来讲,完全是一个未知数,那么要投资开源项目,我们投资者必须准确无误的知道该项目的全部情况,包括项目发起人的情况,项目的维持时间..项目的技术水平,项目的参与者的势力,项目投入产出的效益.....
oracle alert log file（告警日志文件） daizj oracle 告警日志文件 alert log file
The alert log is a chronological log of messages and errors, and includes the following items: All internal errors (ORA-00600), block corruption errors (ORA-01578), and deadlock errors (ORA-00060)
关于 CAS SSO 文章声明 denger SSO
由于几年前写了几篇 CAS 系列的文章，之后陆续有人参照文章去实现，可都遇到了各种问题，同时经常或多或少的收到不少人的求助。现在这时特此说明几点： 1. 那些文章发表于好几年前了，CAS 已经更新几个很多版本了，由于近年已经没有做该领域方面的事情，所有文章也没有持续更新。 2. 文章只是提供思路，尽管 CAS 版本已经发生变化，但原理和流程仍然一致。最重要的是明白原理，然后
初二上学期难记单词 dcj3sjt126com english word
lesson 课 traffic 交通 matter 要紧；事物 happy 快乐的，幸福的 second 第二的 idea 主意；想法；意见 mean 意味着 important 重要的，重大的 never 从来，决不 afraid 害怕的 fifth 第五的 hometown 故乡，家乡 discuss 讨论；议论 east 东方的 agree 同意；赞成 bo
uicollectionview 纯代码布局, 添加头部视图 dcj3sjt126com Collection
#import <UIKit/UIKit.h> @interface myHeadView : UICollectionReusableView { UILabel *TitleLable; } -(void)setTextTitle; @end #import "myHeadView.h" @implementation m
N 位随机数字串的 JAVA 生成实现 FX夜归人 java Math 随机数 Random
/** * 功能描述随机数工具类<br /> * @author FengXueYeGuiRen * 创建时间 2014-7-25<br /> */ public class RandomUtil { // 随机数生成器 private static java.util.Random random = new java.util.R
Ehcache（09）——缓存Web页面 234390216 ehcache 页面缓存
页面缓存目录 1 SimplePageCachingFilter 1.1 calculateKey 1.2 可配置的初始化参数 1.2.1 cach
spring中少用的注解@primary解析 jackyrong primary
这次看下spring中少见的注解@primary注解，例子 @Component public class MetalSinger implements Singer{ @Override public String sing(String lyrics) { return "I am singing with DIO voice
Java几款性能分析工具的对比 lbwahoo java
Java几款性能分析工具的对比摘自：http://my.oschina.net/liux/blog/51800 在给客户的应用程序维护的过程中，我注意到在高负载下的一些性能问题。理论上，增加对应用程序的负载会使性能等比率的下降。然而，我认为性能下降的比率远远高于负载的增加。我也发现，性能可以通过改变应用程序的逻辑来提升，甚至达到极限。为了更详细的了解这一点，我们需要做一些性能
JVM参数配置大全 nickys jvm 应用服务器
JVM参数配置大全 /usr/local/jdk/bin/java -Dresin.home=/usr/local/resin -server -Xms1800M -Xmx1800M -Xmn300M -Xss512K -XX:PermSize=300M -XX:MaxPermSize=300M -XX:SurvivorRatio=8 -XX:MaxTenuringThreshold=5 -
搭建 CentOS 6 服务器(14) - squid、Varnish rensanning varnish
（一）squid 安装 # yum install httpd-tools -y # htpasswd -c -b /etc/squid/passwords squiduser 123456 # yum install squid -y 设置 # cp /etc/squid/squid.conf /etc/squid/squid.conf.bak # vi /etc/
Spring缓存注解@Cache使用 tom_seed spring
参考资料 http://www.ibm.com/developerworks/cn/opensource/os-cn-spring-cache/ http://swiftlet.net/archives/774 缓存注解有以下三个： @Cacheable @CacheEvict @CachePut
dom4j解析XML时出现"java.lang.noclassdeffounderror: org/jaxen/jaxenexception"错误 xp9802
java.lang.NoClassDefFoundError: org/jaxen/JaxenExc 关键字: java.lang.noclassdeffounderror: org/jaxen/jaxenexception 使用dom4j解析XML时，要快速获取某个节点的数据，使用XPath是个不错的方法，dom4j的快速手册里也建议使用这种方式执行时却抛出以下异常： Exceptio