tumblerman

粗糙集

　粗糙集理论及其应用

　　摘要在很多实际系统中均不同程度地存在着不确定性因素, 采集到的数据常常包含着噪声,不精确甚至不完整. 粗糙集理论是继概率论,模糊集,证据理论之后的又一个处理不确定性的数学工具. 作为一种较新的软计算方法, 粗糙集近年来越来越受到重视, 其有效性已在许多科学与工程领域的成功应用中得到证实, 是当前国际上人工智能理论及其应用领域中的研究热点之一.
　　本文介绍了粗糙集理论的基本概念,特点及有关应用.
　　关键词粗糙集, 不确定性, 数据分析, 软计算
　　1 引言
　　在自然科学,社会科学和工程技术的很多领域中, 都不同程度地涉及到对不确定因素和对不完备( imperfect) 信息的处理. 从实际系统中采集到的数据常常包含着噪声, 不够精确甚至不完整. 采用纯数学上的假设来消除或回避这种不确定性, 效果往往不理想, 反之, 如果正视它,对这些信息进行合适地处理, 常常有助于相关实际系统问题的解决. 多年来, 研究人员一直在努力寻找科学地处理不完整性和不确定性的有效途径. 模糊集和基于概率方法的证据理论是处理不确定信息的两种方法, 已应用于一些实际领域. 但这些方法有时需要一些数据的附加信息或先验知识, 如模糊隶属函数,基本概率指派函数和有关统计概率分布等, 而这些信息有时并不容易得到. 1982 年, 波兰学者Z. Paw lak 提出了粗糙集理论, 它是一种刻划不完整性和不确定性的数学工具, 能有效地分析不精确,不一致( incon sisten t),不完整( incomp lete) 等各种不完备的信息, 还可以对数据进行分析和推理, 从中发现隐含的知识, 揭示潜在的规律. 粗糙集理论是建立在分类机制的基础上的, 它将分类理解为在特定空间上的等价关系, 而等价关系构成了对该空间的划分.粗糙集理论将知识理解为对数据的划分, 每一被划分的集合称为概念.粗糙集理论的主要思想是利用已知的知识库, 将不精确或不确定的知识用已知的知识库中的知识来(近似) 刻画.该理论与其他处理不确定和不精确问题理论的最显著的区别是它无需提供问题所需处理的数据集合之外的任何先验信息, 所以对问题的不确定性的描述或处理可以说是比较客观的, 由于这个理论未能包含处理不精确或不确定原始数据的机制, 所以这个理论与概率论, 模糊数学和证据理论等其他处理不确定或不精确问题的理论有很强的互补性.本文简要介绍了粗糙集理论的基本概念和实际应用.
　　2 粗糙集的理论
　　2. 1 粗糙集理论的产生和发展
　　在本世纪70 年代, 波兰学者Z. Paw lak 和一些波兰科学院,波兰华沙大学的逻辑学家们,一起从事关于信息系统逻辑特性的研究. 粗糙集理论就是在这些研究的基础上产生的. 1982年, Z. Paw lak 发表了经典论文Rough Set s , 宣告了粗糙集理论的诞生. 此后, 粗糙集理论引起了许多数学家,逻辑学家和计算机研究人员的兴趣, 他们在粗糙集的理论和应用方面作了大量的研究工作.1991 年Z. Paw lak 的专著和1992 年应用专集的出版, 对这一段时期理论和实践工作的成果作了较好的总结, 同时促进了粗糙集在各个领域的应用. 此后召开的与粗糙集有关的国际会议进一步推动了粗糙集的发展. 越来越多的科技人员开始了解并准备从事该领域的研究. 目前, 粗糙集已成为人工智能领域中一个较新的学术热点, 在机器学习,知识获取,决策分析,过程控制等许多领域得到了广泛的应用.
　　2. 2 粗糙集理论所处理的问题
　　粗糙集能有效地处理下列问题:
　　·不确定或不精确知识的表达;
　　·经验学习并从经验中获取知识;
　　·不一致信息的分析;
　　·根据不确定,不完整的知识进行推理;
　　·在保留信息的前提下进行数据化简;
　　·近似模式分类;
　　·识别并评估数据之间的依赖关系
　　2. 3 粗糙集理论的一些基本概念
　　2. 3. 1 知识的含义
　　"知识"这个概念在不同的范畴内有多种不同的含义. 在粗糙集理论中,"知识"被认为是一种分类能力. 人们的行为是基于分辨现实的或抽象的对象的能力, 如在远古时代, 人们为了生存必须能分辨出什么可以食用, 什么不可以食用; 医生给病人诊断, 必须辨别出患者得的是哪一种病. 这些根据事物的特征差别将其分门别类的能力均可以看作是某种"知识".
　　2. 3. 2 不可分辨关系与基本集
　　分类过程中, 相差不大的个体被归于同一类, 它们的关系就是不可分辨关系( indiscernability relation). 假定只用两种黑白颜色把空间中的物体分割两类, {黑色物体},{白色物体},那么同为黑色的两个物体就是不可分辨的, 因为描述它们特征属性的信息相同, 都是黑色. 如果再引入方,圆的属性, 又可以将物体进一步分割为四类: {黑色方物体},{黑色圆物体},{白色方物体},{白色圆物体}. 这时, 如果两个同为黑色方物体, 则它们还是不可分辨的. 不可分辨关系也称为一个等效关系(equivalence relationship ) , 两个白色圆物体间的不可分辨关系可以理解为它们在白,圆两种属性下存在等效关系.
　　基本集(elementary set) 定义为由论域中相互间不可分辨的对象组成的集合, 是组成论域知识的颗粒. 不可分辨关系这一概念在粗糙集理论中十分重要, 它深刻地揭示出知识的颗粒状结构 , 是定义其它概念的基础. 知识可认为是一族等效关系, 它将论域分割成一系列的等效类.
　　2. 3. 3 集合的下逼近,上逼近及边界区
　　粗糙集理论延拓了经典的集合论, 把用于分类的知识嵌入集合内, 作为集合组成的一部分. 一个对象a 是否属于集合X 需根据现有的知识来判断, 可分为三种情况: (1) 对象a 肯定属于集合X ; (2) 对象a 肯定不属于集X ; (3) 对象a 可能属于也可能不属于集合X . 集合的划分密切依赖于我们所掌握的关于论域的知识, 是相对的而不是绝对的.给定一个有限的非空集合U 称为论域, I 为U 中的一族等效关系, 即关于U 的知识, 则二元对 K = (U , I ) 称为一个近似空间(approximation space). 设x 为U 中的一个对象, X为U 的一个子集, I (x ) 表示所有与x 不可分辨的对象所组成的集合, 换句话说, 是由x 决定的
　　等效类, 即I (x ) 中的每个对象都与x 有相同的特征属性(attribute).
　　集合X 关于I 的下逼近(Lower approximation) 定义为:
　　I* (X ) = {x ∈U : I (x ) I *(X ) 实际上由那些根据现有知识判断肯定属于X 的对象所组成的最大的集合, 有时也称
　　为X 的正区(po sit ive region) , 记作PO S (X ). 类似地, 由根据现有知识判断肯定不属于X 的
　　对象组成的集合称为X 的负区(negat ive region) , 记作N EG (X ).
　　集合X 关于I 的上逼近(U pper app rox im at ion) 定义为
　　I3 (X ) = {x ∈U : I (x ) ∩ X ≠ 5 } (2)
　　I3 (X ) 是由所有与X 相交非空的等效类I (x ) 的并集, 是那些可能属于X 的对象组成的最小
　　集合. 显然, I3 (X ) + N EG (X ) = 论域U.
　　集合X 的边界区(Boundary region) 定义为
　　BND (X ) = I
　　3 (X ) - I 3 (X ) (3)
　　BND (X ) 为集合X 的上逼近与下逼近之差. 如果BND (X ) 是空集, 则称X 关于I 是清晰的
　　(crisp ) ; 反之如果BND (X ) 不是空集, 则称集合X 为关于I 的粗糙集( rough set).
　　下逼近,上逼近及边界区等概念称为可分辨区(discern ib ility region s) , 刻划了一个边界含
　　糊(vague) 集合的逼近特性. 粗糙程度可按按下式的计算
　　A1
　　=
　　I 3 (X )
　　I
　　3 (X ) , (4)
　　式中 # 表示集合# 的基数或势(cardinality) , 对有限集合表示集合中所包含的元素的个数.
　　显然0≤A
　　1 (X ) ≤1, 如果A
　　1 (X ) = 1, 则称集合X 相对于I 是清晰(crisp ) 的, 如果A
　　1 (X ) 0} (7)
　　BND (X ) = {x ∈U : 0 < LIX
　　(x ) < 1} (8)
　　从上面的定义中, 可以看出粗糙集理论中"含糊"(vague) 和"不确定"(uncertain ty) 这两个
　　概念之间的关系:"含糊"用来描述集合, 指集合的边界不清楚; 而"不确定"描述的是集合中的
　　元素, 指某个元素是否属于某集合是不确定的.
　　2. 4 实例
　　下面用一个具体的实例说明粗糙集的概念. 在粗糙集中使用信息表( info rm at ion tab le) 描
　　述论域中的数据集合. 根据学科领域的不同, 它们可能代表医疗,金融,军事,过程控制等方面
　　的数据. 信息表的形式和大家所熟悉的关系数据库中的关系数据模型很相似, 是一张二维表
　　1 期韩祯祥等: 粗糙集理论及其应用39
　　1995-2005 Tsinghua Tongfang Optical Disc Co., Ltd. All rights reserved.
　　格, 如表一所示. 表格的数据描述了一些人的教育程度以及是否找到了较好工作, 旨在说明两
　　者之间的关系. 其中王治,马丽, 赵凯等称为对象(ob ject s) , 一行描述一个对象. 表中的列描
　　述对象的属性. 粗糙集理论中有两种属性: 条件属性(condit ion at t ribu te) 和决策属性(decision
　　at t ribu te). 本例中"教育程度"为条件属性;"是否找到了好工作"为决策属性.
　　表1 教育程度与是否找到好工作的关系
　　姓名教育程度是否找到了好工作
　　王治高中否
　　马丽高中是
　　李得小学否
　　刘保大学是
　　赵凯博士是
　　设O 表示找到了好工作的人的集合, 则
　　O = {马丽, 刘保, 赵凯}, 设I 表示属性"教育
　　程度"所构成的一个等效关系, 根据教育程度
　　的不同, 该论域被分割为四个等效类: {王治,
　　马丽},{李得},{刘保},{赵凯}. 王治和马丽在
　　同一个等效类中, 他们都为高中文化程度, 是
　　不可分辨的. 则:
　　集合O 的下逼近(即正区) 为 I 3 (O ) = PO S (O ) = {刘保,赵凯}
　　集合O 的负区为 N EG (O ) = {李得}
　　集合O 的边界区为 BND (O ) = {王治, 马丽}
　　集合O 的上逼近为 I 3 (O ) = PO S (O ) + BND (O ) = {刘保,赵凯,王治,马
　　丽}
　　根据表1, 可以归纳出下面几条规则, 揭示了教育程度与是否能找到好工作之间的关系.
　　RUL E 1: IF (教育程度= 大学) OR (教育程度= 博士) THEN (可以找到好工作)
　　RUL E 2: IF (教育程度= 小学) THEN (找不到好工作)
　　RUL E 3: IF (教育程度= 高中) THEN (可能找到好工作)
　　从这个简单的例子中, 我们还可以体会到粗糙集理论在数据分析,寻找规律方面的作用.
　　3 粗糙集理论的特点
　　3. 1 粗糙集是一种软计算方法
　　软计算(sof t compu t ing) 的概念是由模糊集创始人Zadeh[ 9 ]提出的. 软计算中的主要工具
　　包括粗糙集,模糊逻辑(FL ),神经网络(NN ),概率推理(PR ),信度网络(Belief N etwo rk s),遗
　　传算法(GA ) 与其它进化优化算法,混沌(Chao s) 理论等.
　　传统的计算方法即所谓的硬计算(hard compu t ing) , 使用精确,固定和不变的算法来表达
　　和解决问题. 而软计算的指导原则是利用所允许的不精确性,不确定性和部分真实性以得到易
　　于处理,鲁棒性强和成本较低的解决方案, 以便更好地与现实系统相协调.
　　3. 2 粗糙集理论的特点
　　粗糙集方法的简单实用性是令人惊奇的, 它能在创立后的不长时间内得到迅速应用是因
　　为具有以下特点[ 6～ 8 ]:
　　(1) 它能处理各种数据, 包括不完整( incomp lete) 的数据以及拥有众多变量的数据;
　　(3) 它能处理数据的不精确性和模棱两可(am b igu ity) , 包括确定性和非确定性的情况;
　　(4) 它能求得知识的最小表达( reduct) 和知识的各种不同颗粒(granu larity) 层次;
　　(5) 它能从数据中揭示出概念简单, 易于操作的模式(pat tern) ;
　　(6) 它能产生精确而又易于检查和证实的规则, 特别适于智能控制中规则的自动生成.
　　40 信息与控制27 卷
　　1995-2005 Tsinghua Tongfang Optical Disc Co., Ltd. All rights reserved.
　　4 粗糙集理论的应用
　　粗糙集理论是一门实用性很强的学科, 从诞生到现在虽然只有十几年的时间, 但已经在不
　　少领域取得了丰硕的成果, 如近似推理,数字逻辑分析和化简,建立预测模型,决策支持,控制
　　算法获取,机器学习算法和模式识别等等. 下面介绍一下粗糙集应用的几个主要领域.
　　4. 1 人工神经网络训练样本集化简
　　人工神经网络具有并行处理,高度容错和泛化能力强的特点, 适合应用在预测,复杂对象
　　建模和控制等场合. 但是当神经网络规模较大,样本较多时, 训练时间过于漫长, 这个固有缺点
　　是制约神经网络进一步实用化的一个主要因素. 虽然各种提高训练速度的算法不断出现, 问题
　　远未彻底解决. 化简训练样本集, 消除冗余数据是另一条提高训练速度的途径.
　　文[ 10 ]正是沿着这条思路, 应用粗糙集化简神经网络训练样本数据集, 在保留重要信息的
　　前提下消除了多余(superf luou s) 的数据. 仿真实验表明训练速度提高了4. 77 倍, 获得了较好
　　的效果.
　　4. 2 控制算法获取
　　实际系统中有很多复杂对象难于建立严格的数学模型, 这样传统的基于数学模型的控制
　　方法就难以奏效. 模糊控制模拟人的模糊推理和决策过程, 将操作人员的控制经验总结为一系
　　列语言控制规则, 具有鲁棒性和简单性的特点, 在工业控制等领域发展较快. 但是有些复杂对
　　象的控制规则难以人工提取, 这样就在一定程度上限制了模糊控制的应用.
　　粗糙集能够自动抽取控制规则的特点为解决这一难题提供了新的手段. 一种新的控制策
　　略—模糊- 粗糙控制(fuzzy2rough con t ro l) 正悄然兴起, 成为一个有吸引力的发展方向. 应用
　　这种控制方法, 文[11 ]研究了"小车—倒立摆系统"这一经典控制问题, 文[12 ]研究了过程控制
　　(水泥窑炉) , 均取得了较好的控制效果. 应用粗糙集进行控制的基本思路是: 把控制过程的一
　　些有代表性的状态以及操作人员在这些状态下所采取的控制策略都记录下来, 然后利用粗糙
　　集理论处理这些数据, 分析操作人员在何种条件下采取何种控制策略, 总结出一系列控制规
　　则:
　　规则1 IF Condit ion 1 满足 THEN 采取decision 1
　　规则2 IF Condit ion 2 满足 THEN 采取decision 2
　　规则3 IF Condit ion 3 满足 THEN 采取decision 3
　　这种根据观测数据获得控制策略的方法通常被称为从范例中学习( learn ing f rom exam2
　　p les). 粗糙控制( rough con t ro l) 与模糊控制都是基于知识,基于规则的控制, 但粗糙控制更加
　　简单迅速,实现容易(因为粗糙控制有时可省却模糊化及去模糊化步骤) ; 另一个优点在于控制
　　算法可以完全来自数据本身, 所以从软件工程的角度看, 其决策和推理过程与模糊(或神经网
　　络) 控制相比可以很容易被检验和证实(validate). 文[ 11 ]还指出在特别要求控制器结构与算
　　法简单的场合, 更适合采取粗糙控制.
　　美国电力科学研究院(EPR I) 对粗糙集的应用研究的潜力对十分重视, 将其作为战略性
　　研究开发(St rategy R&D) 项目, 在1996 年拨款 196, 600 资助San Jo se 州立大学进行电力系
　　统模糊- 粗糙控制器的研究.
　　1 期韩祯祥等: 粗糙集理论及其应用41
　　1995-2005 Tsinghua Tongfang Optical Disc Co., Ltd. All rights reserved.
　　4. 3 决策支持系统
　　面对大量的信息以及各种不确定因素, 要作出科学,合理的决策是非常困难的. 决策支持
　　系统是一组协助制定决策的工具, 其重要特征就是能够执行IF THEN 规则进行判断分
　　析. 粗糙集理论可以在分析以往大量经验数据的基础上找到这些规则, 基于粗糙集的决策支持
　　系统在这方面弥补了常规决策方法的不足, 允许决策对象中存在一些不太明确,不太完整的属
　　性, 并经过推理得出基本上肯定的结论.
　　下面举一个例子, 说明粗糙集理论可以根据以往的病例归纳出诊断规则, 帮助医生作出判
　　断. 表二描述了八个病人的症状. 从表二中可以归纳出以下几条确定的规则:
　　表2 症状与感冒的关系
　　病人编号
　　病理症状诊断结果
　　是否头痛体温是否感冒
　　病人1 是正常否
　　病人2 是高是
　　病人3 是很高是
　　病人4 否正常否
　　病人5 否高否
　　病人6 否很高是
　　病人7 否高是
　　病人8 否很高否
　　1. IF (体温正常) THEN (没感冒)
　　2. IF (头痛) AND (体温高) THEN
　　(感冒)
　　3. IF (头痛) AND (体温很高) THEN
　　(感冒)
　　还有几条可能的规则:
　　4. IF (头不痛) THEN (可能没感冒)
　　5. IF (体温高) THEN (可能感冒了)
　　6. IF (体温很高) THEN (可能感冒了)
　　病人5 和病人7, 病人6 和病人8, 症状
　　相同, 但是一个感冒另一个却没感冒, 这种情
　　况称为不一致( incon sisten t). 粗糙集就是靠这种IF THEN 规则的形式表示数据中蕴含的
　　知识.
　　希腊工业发展银行ETEVA 用粗糙集理论协助制订信贷政策, 从大量实例中抽取出的规
　　则条理清晰, 得到了金融专家的好评[ 13 ].
　　4. 4 从数据库中知识发现
　　现代社会中, 随着信息产业的迅速发展, 大量来自金融,医疗,科研等不同领域的信息被存
　　储在数据库中. 这些浩如烟海的数据间隐含着许多有价值的但鲜为人知的相关性, 例如股票的
　　价格和一些经济指数有什么关系; 手术前病人的病理指标可能与手术是否成功存在某种联系;
　　满足何种条件的夜空会出现彗星等天文现象等等.
　　由于数据库的庞大, 人工处理这些数据几乎是不可能的, 于是出现了一个新的研究方向—
　　数据库中的知识发现(Know ledge D iscovery in Databases, KDD) , 也叫做数据库(信息) 发掘
　　(M in ing) , 它是目前国际上人工智能领域中研究较为活跃的分支. 粗糙集是其中的一种重要
　　的研究方法, 它采用的信息表与关系数据库中的关系数据模型很相似, 这样就便于将基于粗糙
　　集的算法嵌入数据库管理系统中.
　　粗糙集引入核(co re),化简( reduct) 等有力的概念与方法, 从数据中导出用IF THEN
　　规则形式描述的知识, 这些精练的知识更便于存储和使用. 美国医学工作者应用粗糙集理论对
　　大量的病历进行分析, 发现黑人妇女患乳腺癌后的死亡率比白人妇女高. 到目前为止, 早产的
　　预测在医学上还是比较困难的. 现有的人工预测方法准确率只有17à - 58à , 而应用粗糙集
　　理论则可将准确率提高到68à - 90à [ 8 ].
　　42 信息与控制27 卷
　　1995-2005 Tsinghua Tongfang Optical Disc Co., Ltd. All rights reserved.
　　5 粗糙集与模糊集,证据理论及其它一些情况
　　5. 1 粗糙集与模糊集,证据理论
　　粗糙集与模糊集都能处理不完备( imperfect) 数据, 但方法不同, 模糊集注重描述信息的含
　　糊(vagueness) 程度, 粗糙集则强调数据的不可辨别( indiscern ib ility) , 不精确( imp recision) 和
　　模棱两可(am b igu ity). 使用图像处理中的语言来作比喻, 当论述图像的清晰程度时, 粗糙集强
　　调组成图像象素的大小, 而模糊集则强调象素存在不同的灰度. 粗糙集研究的是不同类中的对
　　象组成的集合之间的关系, 重在分类; 模糊集研究的是属于同一类的不同对象的隶属的关系,
　　重在隶属的程度. 因此粗糙集和模糊集是两种不同的理论, 但又不是相互对立的, 它们在处理
　　不完善数据方面可以互为补充.
　　粗糙集理论与证据理论虽有一些相互交叠的地方, 但本质不同, 粗糙集使用集合的上,下
　　逼近而证据理论使用信任函数(belief funct ion) 作为主要工具. 粗糙集对给定数据的计算是客
　　观的, 无须知道关于数据的任何先验知识(如概率分布等) , 而证据理论则需要假定的似然值
　　(p lau sib ility).
　　5. 2 近年来召开的与粗糙集有关的国际会议
　　相继召开的以粗糙集理论为主题的国际会议, 促进了粗糙集理论的推广. 这些会议发表了
　　大量的具有一定学术和应用价值的论文, 方便了学术交流, 推动了粗糙集在各个科学领域的拓
　　展和应用. 下面列出了近年召开的一些会议:
　　· 1992 年第一届国际研讨会(Rough Set s: State of the A rt and Perspect ives) 在波兰
　　K iek rz 召开;
　　·1993 年第二届国际研讨会(The Second In ternat ionalWo rk shop on Rough Set s and
　　Know ledge D iscovery, RSKD'93) 在加拿大Banff 召开;
　　·1994 年第三届国际研讨会(The Th ird In ternat ionalWo rk shop on Rough Set s and Sof t
　　Compu t ing, RSSC'94) 在美国San Jo se 召开;
　　·1995 年在美国No rth Caro lina 召开了题为"Rough Set Theo ry, RST'95"的国际会议;
　　·1996 年第四届国际研讨会(The Fou rth In ternat ionalWo rk shop on Rough Set s, Fuzzy
　　Set s, andM ach ine D iscovery, RSFD'96) 在日本东京召开;
　　·1997 年3 月在美国No rth Caro lina 召开了第五届国际研讨会(The F if th In ternat ional
　　Wo rk shop on Rough Set s and Sof t Compu t ing, RSSC'97)
　　5. 3 国际上一些有关粗糙集的软件
　　目前, 国际上研究粗糙集的机构和个人开发了一些应用粗糙集的实用化软件, 也出现了商
　　业化的软件. 加拿大Reduct System Inc. 公司开发的用于数据库知识发现的软件DataLogic
　　R [ 14 ]是用C 语言开发的, 可安装在个人计算机上, 为科研领域和工业界服务.
　　美国肯萨斯大学开发了一套基于粗糙集的经验学习系统[ 15 ] , 名为L ERS (L earn ing f rom
　　Examp les based on Rough Set s) , 它能从大量经验数据中抽取出规则. L ERS 已被美国国家航
　　空航天管理局(NA SA ) 的约翰逊(John son) 空间中心采用, 作为专家系统开发工具, 为"自由
　　号"(F reedom ) 空间站上的医疗决策服务. 美国环境保护署(U S Environm en tal P ro tect ion A 2
　　gency) 资助的一个项目中也采用了L ERS.
　　波兰波兹南工业大学(Poznan U n iversity of Techno logy) 开发的软件RoughDA S 和
　　1 期韩祯祥等: 粗糙集理论及其应用43
　　1995-2005 Tsinghua Tongfang Optical Disc Co., Ltd. All rights reserved.
　　RoughClass, 也在不少实际领域中得到应用[ 5 ].
　　加拿大Regina 大学开发的KDD- R 是用C 编写的, 在UN IX 环境下运行, KDD2R 基于
　　变精度粗糙集模型[ 16 ] (V ariab le P recision Rough Set, V PRS) , 通过改变粗糙程度而使数据中
　　隐含的模式更清楚的显示出来.
　　6 结束语
　　粗糙集是一种较有前途的处理不确定性的方法, 相信今后将会在更多的领域中得到应用.
　　但是, 粗糙集理论还处在继续发展之中, 正如粗糙集理论的创立人Z. Paw lak 所指出的那
　　样[ 8 ] , 尚有一些理论上的问题需要解决, 诸如用于不精确推理的粗糙逻辑(Rough logic) 方法,
　　粗糙集理论与非标准分析(Non standard analysis) 和非参数化统计(Nonparam et ric stat ist ics)
　　等之间的关系等等.
　　将粗糙集与其它软计算方法(如模糊集,人工神经网络,遗传算法等) 相综合, 发挥出各自
　　的优点, 可望设计出具有较高的机器智商(M IQ ) 的混合智能系统(Hyb rid In telligen t
　　System ) , 这是一个值得努力的方向.

粗糙集理论介绍
　　面对日益增长的数据库，人们将如何从这些浩瀚的数据中找出有用的知识？我们如何将所学到的知识去粗取精？什么是对事物的粗线条描述什么是细线条描述？
　　粗糙集合论回答了上面的这些问题。要想了解粗糙集合论的思想，我们先要了解一下什么叫做知识？假设有8个积木构成了一个集合A，我们记：A={x1,x2,x3,x4,x5,x6,x7,x8}，每个积木块都有颜色属性，按照颜色的不同，我们能够把这堆积木分成R1={红，黄，兰}三个大类，那么所有红颜色的积木构成集合X1={x1,x2,x6}，黄颜色的积木构成集合X2={x3,x4}，蓝颜色的积木是：X3={x5,x7,x8}。按照颜色这个属性我们就把积木集合A进行了一个划分(所谓A的划分就是指对于A中的任意一个元素必然属于且仅属于一个分类），那么我们就说颜色属性就是一种知识。在这个例子中我们不难看到，一种对集合A的划分就对应着关于A中元素的一个知识，假如还有其他的属性，比如还有形状R2={三角,方块,圆形}，大小R3={大,中,小}，这样加上R1属性对A构成的划分分别为：
　　A/R1={X1,X2,X3}={{x1,x2,x6},{x3,x4},{x5,x7,x8}} （颜色分类）
　　A/R2={Y1,Y2,Y3}={{x1,x2},{x5,x8},{x3,x4,x6,x7}} （形状分类）
　　A/R3={Z1,Z2,Z3}={{x1,x2,x5},{x6,x8},{x3,x4,x7}} （大小分类）
　　上面这些所有的分类合在一起就形成了一个基本的知识库。那么这个基本知识库能表示什么概念呢？除了红的{x1,x2,x6}、大的{x1,x2,x5}、三角形的{x1,x2}这样的概念以外还可以表达例如大的且是三角形的{x1,x2,x5}∩{x1,x2}={x1,x2}，大三角{x1,x2,x5}∩{x1,x2}={x1,x2}，蓝色的小的圆形({x5,x7,x8}∩{x3,x4,x7}∩{x3,x4,x6,x7}=，蓝色的或者中的积木{x5,x7,x8}∪{x6,x8}={x5,x6,x7,x8}。而类似这样的概念可以通过求交运算得到，比如X1与Y1的交就表示红色的三角。所有的这些能够用交、并表示的概念以及加上上面的三个基本知识(A/R1,A/R2.A/R3)一起就构成了一个知识系统记为R=R1∩R2∩R3，它所决定的所有知识是A/R={{x1,x2},,,,,,}以及A/R中集合的并。
　　下面考虑近似这个概念。假设给定了一个A上的子集合X={x2,x5,x7}，那么用我们的知识库中的知识应该怎样描述它呢？红色的三角？****的大圆？都不是，无论是单属性知识还是由几个知识进行交、并运算合成的知识，都不能得到这个新的集合X，于是我们只好用我们已有的知识去近似它。也就是在所有的现有知识里面找出跟他最像的两个一个作为下近似，一个作为上近似。于是我们选择了“蓝色的大方块或者蓝色的小圆形”这个概念：{x5,x7}作为X的下近似。选择“三角形或者蓝色的”{x1,x2,x5,x7,x8}作为它的上近似，值得注意的是，下近似集是在那些所有的包含于X的知识库中的集合中求并得到的，而上近似则是将那些包含X的知识库中的集合求并得到的。一般的，我们可以用下面的图来表示上、下近似的概念。
　　这其中曲线围的区域是X的区域，蓝色的内部方框是内部参考消息，是下近似，绿的是边界加上蓝色的部分就是上近似集。其中各个小方块可以被看成是论域上的知识系统所构成的所有划分。
　　整个粗集理论的核心就是上面说的有关知识、集合的划分、近似集合等等概念。下面我们讨论一下关于粗糙集在数据库中数据挖掘的应用问题。考虑一个数据库中的二维表如下：
　　元素颜色形状大小稳定性
　　x1 红三角大稳定
　　x2 红三角大稳定
　　x3 黄圆小不稳定
　　x4 黄圆小不稳定
　　x5 蓝方块大稳定
　　x6 红圆中不稳定
　　x7 蓝圆小不稳定
　　x8 蓝方块中不稳定
　　可以看出，这个表就是上面的那个例子的二维表格体现，而最后一列是我们的决策属性，也就是说评价什么样的积木稳定。这个表中的每一行表示了类似这样的信息：红色的大三角积木稳定，****的小圆形不稳定等等。我们可以把所有的记录看成是论域A={x1,x2,x3,x4,x5,x6,x7,x8}，任意一个列表示一个属性构成了对论域的元素上的一个划分，在划分的每一个类中都具有相同的属性。而属性可以分成两大类，一类叫做条件属性：颜色、形状、大小都是，另一类叫做决策属性：最后一列的是否稳定？下面我们考虑，对于决策属性来说是否所有的条件属性都是有用的呢？考虑所有决策属性是“稳定”的集合{x1,x2,x5}，它在知识系统A/R中的上下近似都是{x1,x2,x5}本身，“不稳定”的集合{x3,x4,x6,x7,x8}，在知识系统A/R中的上下近似也都是{x3,x4,x6,x7,x8}它本身。说明该知识库能够对这个概念进行很好的描述。下面考虑是否所有的基本知识：颜色、形状、大小都是必要的？如果我们把这个集合在知识系统中去掉颜色这个基本知识，那么知识系统变成A/(R-R1)={{x1,x2},{x3,x4,x7},,,}以及这些子集的并集。如果用这个新的知识系统表达“稳定”概念得到上下近似仍旧都是：{x1,x2,x5}，“不稳定”概念的上下近似也还是{x3,x4,x6,x7,x8}，由此看出去掉颜色属性我们表达稳定性的知识不会有变化，所以说颜色属性是多余的可以删除。如果再考虑是否能去掉大小属性呢？这个时候知识系统就变为：
　　A/(R-R1-R3)=A/R2={{x1,x2},{x5,x8},{x3,x4,x6,x7}}。同样考虑“稳定”在知识系统A/R2中的上下近似分别为：{x1,x2}和{x1,x2,x5,x8}，已经和原来知识系统中的上下近似不一样了，同样考虑“不稳定”的近似表示也变化了，所以删除属性“大小”是对知识表示有影响的故而不能去掉。同样的讨论对于“形状”属性也一样，它是不能去掉的。最后我们得到化简后的知识库R2,R3，从而能得到下面的决策规则：大三角-稳定，大方块-稳定，小圆-不稳定，中圆-不稳定，中方块-不稳定，利用粗集的理论还可以对这些规则进一步化简得到：大-稳定，圆-不稳定，中方块-不稳定。这就是上面这个数据表所包含的真正有用的知识，而这些知识都是从数据库有粗糙集方法自动学习得到的。因此，粗糙集是数据库中数据挖掘的有效方法。
　　从上面这个例子中我们不难看出，实际上我们只要把这个数据库输入进粗糙集运算系统，而不用提供任何先验的知识，粗糙集算法就能自动学习出知识来，这正是它能够广泛应用的根源所在。而在模糊集、可拓集等集合论中我们还要事先给定隶属函数。

你可能感兴趣的:(工作,数据库,算法,网络,数据挖掘,教育)

CANopen学习笔记卡钦斯基通信协议网络
1.CANopen的预定义报文ID分类CANopen在设计时，对其定义为小网络、控制信号的实时通讯：报文传输采用CAN标准帧格式。即11bit的ID域，以尽量减小传输时间。网络控制报均采用数据最小字节数。比如心跳报文，只有1个字节数据。实时更新的过程数据无需接收方报文应答。即采用生产消费模型，降低总线负载。需要接收方确认的配置参数一般都时采用快速单字传输。即1个报文最多传达1个32bit的参数变量
Windchill开发-移除工作区模型这城有海 Windchill二开 java
移除工作区模型一、应用场景二、相关代码2.1查询模型2.1.1方法一2.1.2方法二2.1.3区别2.2查询模型所在工作区2.3移除工作区的模型一、应用场景Windchill系统中，系统的模型数据和工作区中的模型数据并非是同一个数据，工作区在线时会自动把系统的数据与工作区做同步，也可以通过工作区的更新按钮，保持工作区数据与系统数据的一致性。但是在实际业务中，工作区缓存、数据存在于多工作区等情况都会
桂云网络：桂花流程引擎(Osmanthus)与Camunda、Zeebe、Flowable、Activiti流程引擎选择对比桂云网络OSG 桂花流程引擎流程图经验分享 java 后端中间件
在当今企业数字化转型的过程中，流程引擎作为实现业务自动化、提升工作效率和增强决策能力的重要技术工具，已成为企业流程管理不可或缺的一部分。市场上有多种流程引擎解决方案，每种方案具有不同的功能特点、技术架构和使用场景。在选择合适的流程引擎时，企业需要根据业务需求、技术栈、开发能力以及未来扩展性等多个方面进行全面考量。本文将对桂云网络公司的"桂花流程引擎(Osmanthus)"与几款主流的流程引擎技术进
《Prometheus+Grafana 实践派》专栏介绍阿提说说实践派 prometheus grafana 云原生监控
专栏名称Prometheus+Grafana实践派专栏介绍本专栏根据本公司统一监控落地实践编写。在该专栏您将学到企业级监控的选型Prometheus的基础知识Grafana的基础知识快速搭建Prometheus+Grafana监控各类指标的收集和可视化企业级统一监控实现博主介绍一年太久，只争朝夕，这是博主的座右铭，预示时间宝贵，博主拥有10年以上工作经验，阿里云专家博主，华为云享专家，Spring
c语言通讯录二分查找,C语言程序设计通讯录程序.doc weixin_39674028 c语言通讯录二分查找
《C语言程序设计通讯录程序.doc》由会员分享，可在线阅读，更多相关《C语言程序设计通讯录程序.doc(28页珍藏版)》请在人人文库网上搜索。1、目录：课程设计任务书2目录：3一、目的4二、基本情况5三、时间安排5四、设计和调试过程规范化要求5五、设计内容和设计要求6六、考核方式7一通讯录的主要功能:8一、问题描述:8二、功能要求:8三、算法提示:8四、测试数据:9二、课题的主要功能模块划分：9三
使用神经网络做二分类预测 weixin_33816300 人工智能 python matlab
不想整理代码了。先给个结果图：train0loss:1838.0616train100loss:1441.5283train200loss:1299.4546train300loss:934.36536train400loss:506.06702train500loss:322.9782train600loss:271.5825train700loss:360.091train800loss:23
android opengl纹理,Android OpenGL透明纹理绘制黑色丛子涵 android opengl纹理
我试图在我的应用程序中绘制透明纹理(文本).奇怪的是,它适用于最新的Nexus7和我的第二代MotoX,但在原来的Nexus7上,纹理只是黑色.我已经启用了混合,纹理是512×512,所以它不是两个问题.我也只是使用GL10,应该支持一切,对吧？任何原因纹理不会在这个设备上工作？gl.glEnable(GL10.GL_BLEND);gl.glBlendFunc(GL10.GL_SRC_ALPHA,
oracle开源审计,Oracle审计功能如水蜜 oracle开源审计
设置审计的实例：对试图尝试口令的访问的审计本节讨论的是一个审计的实例，用于记录尝试通过野蛮尝试法破译ORACLE帐号口令的例子：1.修改审计相关参数(参照上一节介绍的方法)2.重启数据库3.设置审计信息SQL>AUDITALLBYACCESSWHENEVERNOTSUCCESSFUL4.查询AUD$SQL>selectreturncode,action#,userid,userhost,termi
Amazon Redshift实用命令语句 weixin_30777913 云计算数据仓库
1.数据库管理相关命令创建数据库CREATEDATABASEmydatabase;AmazonRedshift创建数据库命令除了基本形式外，还有以下几种带不同参数的形式：带OWNER参数可以指定数据库的所有者，通常是一个数据库用户或角色。CREATEDATABASEmydatabaseOWNERmyuser;带ENCODING参数用于指定数据库使用的字符编码。CREATEDATABASEmydat
如何使用 Emmet 快捷方式提高开发效率木觞清 javascript html5 css3
前端开发是一个高度依赖效率的领域，开发者们常常需要处理大量的HTML和CSS代码。为了解决重复工作和提高开发效率，Emmet快捷方式应运而生。Emmet作为一款强大的前端工具，能够通过简化的快捷命令快速生成HTML和CSS结构，极大地提升了开发者的编码速度。本文将介绍如何在日常开发中使用Emmet，帮助你节省宝贵的时间。什么是Emmet快捷方式？Emmet是一款广泛应用于前端开发的插件，它通过一系
360智算中心万卡GPU集群架构分析科技互联人生科技数码人工智能硬件架构系统架构人工智能
360智算中心：万卡GPU集群落地实践 360智算中心是一个融合了人工智能、异构计算、大数据、高性能网络、AI平台等多种技术的综合计算设施，旨在为各类复杂的AI计算任务提供高效、智能化的算力支持。360智算中心不仅具备强大的计算和数据处理能力，还结合了AI开发平台，使得计算资源的使用更加高效和智能化。360内部对于智算中心的核心诉求是性能和稳定性，本文将深入探讨3
freebsd12 安装gnome3图形界面 sayang_shao FreeBSD FreeBSD12 gnome3 freebsd12
1、准备工作注：由于我是在实体机上做的所以没有提供截图。也可以访问官方文档进行安装：https://www.freebsd.org/doc/en_US.ISO8859-1/books/handbook/x11-wm.html已经安装完Freebsd12系统可以联网2、开始安装pkg更新#pkgupdate安装显卡驱动（本机为intel）#pkginstallxf86-video-intel开启li
python LTP 安装 failed building wheel for pyltp Waldenz NLP Python LTP python ltp wheel failed building wheel
LTP（LanguageTechnologyPlatform）语言技术平台。LTP提供了一系列中文自然语言处理工具，用户可以使用这些工具对于中文文本进行分词、词性标注、句法分析等等工作。主页GitHubpyltpwin10pip直接安装pyltp时的各种报错，Faildbuildingwheelforpyltp或者Runningsetup.pybdist_wheelforpyltp...error
数据不出境的SSL证书有吗？ Gworg ssl 网络协议网络
在中国没有数据不出境的SSL证书，原因是世界上所有可信的SSL证书必须经过Webtrust认证和CA/B组织，没有经过认证和参加组织的CA属于不可信SSL证书或自签名SSL证书。相比能看到这篇文章的肯定被人忽悠得不轻或者就是政策解读错了，国产SSL证书再次说一下除了CFCA就没有了，所以数据不出境的SSL证书除了CFCA，目前还没有一家机构可以做到，除非你选择的是国密算法SSL证书，但国密算法SS
简单步骤获取IP地址SSL 证书 Gworg 安全 php web安全
在网络安全中，SSL证书在保护用户浏览器和Web服务器之间交换的敏感信息方面发挥着至关重要的作用。但是，如果您不仅想保护域名，还想保护特定的IP地址，该怎么办？您可以为IP地址获取SSL证书吗？简短的回答是肯定的，但有一些重要的细节需要考虑。在这篇博文中，我们将探讨有关IP地址SSL证书的所有信息，包括如何获取证书、有哪些不同类型的证书以及它们提供的好处。IP地址和SSL证书：了解连接在深入研究I
P1089 [NOIP2004 提高组] 津津的储蓄计划沉睡的雄虱算法 c++
目录题目描述输入格式输出格式输入输出样例思路分析：代码实现：总结题目描述P1089[NOIP2004提高组]津津的储蓄计划-洛谷|计算机科学教育新生态津津的零花钱一直都是自己管理。每个月的月初妈妈给津津300300元钱，津津会预算这个月的花销，并且总能做到实际花销和预算的相同。为了让津津学习如何储蓄，妈妈提出，津津可以随时把整百的钱存在她那里，到了年末她会加上20%20%还给津津。因此津津制定了一
centos7.9安装mysql8.4详细步骤【亲测有效】张3蜂 linux 软件安装部署数据库 adb
目录1.选择合适的mysql版本2.解压mysql压缩包至/usr/local/目录下3.新建数据目录、用户名和用户组4.修改环境变量并重启环境变量5.配置初始化使用命令6.初始化Mysql数据库7.启动Mysql服务8.关闭Mysql服务(安装时不要做这一步)9.跳过密码验证并修改密码新密码登录本地mysql服务10.查看端口是否会被占用11.mysql8开机自启12.卸载mysql【我没有测试
数据库的三级模式结构与两级映像凭君语未可数据库数据库 oracle
三级模式结构与两级映像什么是数据库的三级模式结构？1.模式（ConceptualSchema，概念模式）定义特点作用示例2.外模式（ExternalSchema，外部模式）定义特点作用举例3.内模式（InternalSchema，内部模式）定义特点作用举例三级模式结构的关系和映射1.外模式与模式的映射外模式与模式的关系映射机制举例电商系统中的用户视图与模式权限控制：映射的意义2.模式与内模式的映射
【数据挖掘实战】房价预测机器学习司猫白数据挖掘人工智能 python 机器学习
本次对kaggle中的入门级数据集，房价回归数据集进行数据挖掘，预测房屋价格。本人主页：机器学习司猫白机器学习专栏：机器学习实战PyTorch入门专栏：PyTorch入门深度学习实战：深度学习ok，话不多说，我们进入正题吧概述本次竞赛有79个解释变量（几乎）描述了爱荷华州艾姆斯住宅的各个方面，需要预测每套住宅的最终价格。数据集描述本次数据集已经上传，大家可以自行下载尝试文件说明train.csv-
kaggle入门级竞赛Spaceship Titanic LIghtgbm+Optuna调参机器学习司猫白机器学习实战机器学习 python 集成学习 scikit-learn
kaggle入门级竞赛SpaceshipTitanic简介数据介绍数据集描述数据字段描述train.csv-约三分之二（~8700）乘客的个人记录，用作培训数据。test.csv-剩余三分之一（~4300）乘客的个人记录，用作测试数据。您的任务是预测Transported该集合中乘客的价值。Sample_submission.csv-格式正确的提交文件。代码分类变量optuna算法简介简介欢迎来到
Linux 时间同步服务不想起昵称929 linux
时间同步:多主机协作工作时，各个主机的时间同步很重要，时间不一致会造成很多重要应用的故障，如:加密协议，日志，集群等，利用NTP(NetworkTimeProtocol)协议使网络中的各个计算机时间达到同步。目前NTP协议属于运维基础架构中必备的基本服务之一时间同步实现:ntp，chrony//关闭系统同步时间服务timedatectlstopchronyd.servicentp:将系统时钟和世界
Neural Architecture Search (NAS) 原理和应用 weixin_58349913 python
NeuralArchitectureSearch(NAS)原理和应用NeuralArchitectureSearch(NAS)是一种自动化设计神经网络架构的技术。它通过搜索空间中的不同架构配置来找到最优或接近最优的神经网络结构，从而减少人工设计网络结构的工作量。NAS的目标是通过自动化的方式获得比手工设计更高效、准确的模型架构，特别适用于对网络架构要求较高的任务。1.NAS的基本原理NAS的核心思
用GANs生成艺术作品的创新探索：人工智能与艺术的奇妙碰撞 Echo_Wish 前沿技术人工智能人工智能 gan python
用GANs生成艺术作品的创新探索：人工智能与艺术的奇妙碰撞随着人工智能技术的飞速发展，生成对抗网络（GenerativeAdversarialNetworks，GANs）在图像生成、视频生成、音频合成等领域展现出了惊人的创造力。特别是在艺术创作方面，GANs以其独特的生成能力，为艺术家和创作者提供了新的灵感和工具。本文将探讨GANs在艺术作品生成中的应用与创新，并通过具体代码示例展示其实现过程。一
局域网IP扫描工具：原理、应用与实战邹晓航0号
本文还有配套的精品资源，点击获取简介：局域网IP扫描工具是网络管理的重要工具，可以帮助用户扫描并列出同一网络段内的所有活动设备的IP地址。本文将深入探讨该工具的工作原理、功能特点以及应用场景，包括快速准确地识别网络设备、故障排查、系统安全检查以及网络优化。此外，本文还将介绍一款开源的免费IP扫描工具——FreeIPScan，并总结如何通过正确使用这些工具来提高网络安全性、优化网络资源并及时发现和解
企业级网络架构哦吼吼吼tian
目录三层交换机三层交换机使用过程:连接外网动态路由ospf协议,开放最短路径优先协议ospf区域区域ID骨干区域0ospf配置:传输层传输层的作用传输层两个重要的协议TCP的应用UDP应用ACL访问控制列表ACL的主要类型ACL规则三层交换机使用三层交换技术实现VLAN间通信三层交换=二层交换+三层转发三层交换机使用过程:1.添加VLAN(vlanbatch23)2.对应的接口添加相应的VLAN(
【AI日志分析】基于机器学习的异常检测：告别传统规则的智能进阶网罗开发 AI 大模型人工智能机器学习
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
【Redis】golang操作Redis基础入门 m0_74825360 面试学习路线阿里巴巴 redis golang 数据库
【Redis】golang操作Redis基础入门大家好我是寸铁??总结了一篇【Redis】golang操作Redis基础入门sparkles:喜欢的小伙伴可以点点关注??Redis的作用Redis（RemoteDictionaryServer）是一个开源的内存数据库，它主要用于存储键值对，并提供多种数据结构的支持。Redis的主要作用包括：1.缓存:Redis可以作为缓存系统，将常用的数据缓存在内
软件测试工具——Junit单元测试衣衣困 junit 单元测试
什么是单元测试定义：单元测试是对软件中的最小可测试单元（通常是一个函数或方法）进行的验证性测试，旨在确保其按预期工作。目的：通过测试单元代码来发现并修复错误，提高代码的可靠性和维护性。“单元”的大小或范围，并没有一个明确的标准，“单元”可以是一个函数、方法、类、功能模块或者子系统。单元测试一般是有开发人员或测试人员来做。单元测试通常和白盒测试联系到一起，如果单从概念上来讲两者是有区别的，不过我们通
Copilot 概述计算机萍萍学姐 copilot copilot 人工智能机器学习
Copilot是什么？它有什么用途？Copilot是由人工智能公司和GitHub合作开发的一个基于人工智能的代码提示工具，它可以利用机器学习技术和大量训练数据生成高质量的代码。Copilot的目标是在保持代码质量和可读性的前提下，提高开发者的编码效率，使得编码工作更为高效和便捷。Copilot的出现是解决编程过程中可能遇到的一些难点和瓶颈问题，特别是在快速迭代的敏捷开发场景中，提高编码效率和减少编
读后感：《The Missing README: A Guide for the New Software Engineer》 rongqing2019 读后感软件工程
最近在读一本书，中文版的书名叫《程序员的README》，我觉得非常有收获，但是觉得标题翻译的不好，原名就见名知意，这本书是在阿里云开发者公众号上看到了一篇读书笔记让我觉得这本书的内容真好（读书笔记｜程序员的README），自己正在实习，这个“README文档”帮助我慢慢解开了一直以来的疑惑，完整的介绍了现代软件工程的细节，边工作边看，具象了许多。先简单介绍一下作者ChrisRiccomini（详细
tomcat基础与部署发布暗黑小菠萝 Tomcat java web
从51cto搬家了，以后会更新在这里方便自己查看。做项目一直用tomcat，都是配置到eclipse中使用，这几天有时间整理一下使用心得，有一些自己配置遇到的细节问题。 Tomcat：一个Servlets和JSP页面的容器，以提供网站服务。一、Tomcat安装安装方式：①运行.exe安装包 &n
网站架构发展的过程 ayaoxinchao 数据库应用服务器网站架构
1.初始阶段网站架构：应用程序、数据库、文件等资源在同一个服务器上 2.应用服务和数据服务分离：应用服务器、数据库服务器、文件服务器 3.使用缓存改善网站性能：为应用服务器提供本地缓存，但受限于应用服务器的内存容量，可以使用专门的缓存服务器，提供分布式缓存服务器架构 4.使用应用服务器集群改善网站的并发处理能力：使用负载均衡调度服务器，将来自客户端浏览器的访问请求分发到应用服务器集群中的任何
[信息与安全]数据库的备份问题 comsci 数据库
如果你们建设的信息系统是采用中心-分支的模式,那么这里有一个问题如果你的数据来自中心数据库,那么中心数据库如果出现故障,你的分支机构的数据如何保证安全呢? 是否应该在这种信息系统结构的基础上进行改造,容许分支机构的信息系统也备份一个中心数据库的文件呢? &n
使用maven tomcat plugin插件debug关联源代码商人shang maven debug 查看源码 tomcat-plugin
*首先需要配置好'''maven-tomcat7-plugin'''，参见[[Maven开发Web项目]]的'''Tomcat'''部分。 *配置好后，在[[Eclipse]]中打开'''Debug Configurations'''界面，在'''Maven Build'''项下新建当前工程的调试。在'''Main'''选项卡中点击'''Browse Workspace...'''选择需要开发的
大访问量高并发 oloz 大访问量高并发
大访问量高并发的网站主要压力还是在于数据库的操作上，尽量避免频繁的请求数据库。下面简要列出几点解决方案： 01、优化你的代码和查询语句，合理使用索引 02、使用缓存技术例如memcache、ecache将不经常变化的数据放入缓存之中 03、采用服务器集群、负载均衡分担大访问量高并发压力 04、数据读写分离 05、合理选用框架，合理架构(推荐分布式架构)。
cache 服务器小猪猪08 cache
Cache 即高速缓存.那么cache是怎么样提高系统性能与运行速度呢？是不是在任何情况下用cache都能提高性能？是不是cache用的越多就越好呢？我在近期开发的项目中有所体会，写下来当作总结也希望能跟大家一起探讨探讨，有错误的地方希望大家批评指正。　　1.Cache 是怎么样工作的? 　　Cache 是分配在服务器上
mysql存储过程香水浓 mysql
Description:插入大量测试数据 use xmpl; drop procedure if exists mockup_test_data_sp; create procedure mockup_test_data_sp( in number_of_records int ) begin declare cnt int; declare name varch
CSS的class、id、css文件名的常用命名规则 agevs JavaScript UI 框架 Ajax css
CSS的class、id、css文件名的常用命名规则 (一)常用的CSS命名规则　　头：header 　　内容：content/container 　　尾：footer 　　导航：nav 　　侧栏：sidebar 　　栏目：column 　　页面外围控制整体布局宽度：wrapper 　　左右中：left right
全局数据源 AILIKES java tomcat mysql jdbc JNDI
实验目的：为了研究两个项目同时访问一个全局数据源的时候是创建了一个数据源对象，还是创建了两个数据源对象。 1：将diuid和mysql驱动包（druid-1.0.2.jar和mysql-connector-java-5.1.15.jar）copy至%TOMCAT_HOME%/lib下；2：配置数据源，将JNDI在%TOMCAT_HOME%/conf/context.xml中配置好,格式如下：&l
MYSQL的随机查询的实现方法 baalwolf mysql
MYSQL的随机抽取实现方法。举个例子，要从tablename表中随机提取一条记录，大家一般的写法就是：SELECT * FROM tablename ORDER BY RAND() LIMIT 1。但是，后来我查了一下MYSQL的官方手册，里面针对RAND()的提示大概意思就是，在ORDER BY从句里面不能使用RAND()函数，因为这样会导致数据列被多次扫描。但是在MYSQL 3.23版本中，
JAVA的getBytes()方法 bijian1013 java eclipse unix OS
在Java中，String的getBytes()方法是得到一个操作系统默认的编码格式的字节数组。这个表示在不同OS下，返回的东西不一样！ String.getBytes(String decode)方法会根据指定的decode编码返回某字符串在该编码下的byte数组表示，如： byte[] b_gbk = "
AngularJS中操作Cookies bijian1013 JavaScript AngularJS Cookies
如果你的应用足够大、足够复杂，那么你很快就会遇到这样一咱种情况：你需要在客户端存储一些状态信息，这些状态信息是跨session(会话)的。你可能还记得利用document.cookie接口直接操作纯文本cookie的痛苦经历。幸运的是，这种方式已经一去不复返了，在所有现代浏览器中几乎
[Maven学习笔记五]Maven聚合和继承特性 bit1129 maven
Maven聚合在实际的项目中，一个项目通常会划分为多个模块，为了说明问题，以用户登陆这个小web应用为例。通常一个web应用分为三个模块： 1. 模型和数据持久化层user-core, 2. 业务逻辑层user-service以 3. web展现层user-web， user-service依赖于user-core user-web依赖于user-core和use
【JVM七】JVM知识点总结 bit1129 jvm
1. JVM运行模式 1.1 JVM运行时分为-server和-client两种模式，在32位机器上只有client模式的JVM。通常，64位的JVM默认都是使用server模式，因为server模式的JVM虽然启动慢点，但是，在运行过程，JVM会尽可能的进行优化 1.2 JVM分为三种字节码解释执行方式：mixed mode, interpret mode以及compiler
linux下查看nginx、apache、mysql、php的编译参数 ronin47
在linux平台下的应用，最流行的莫过于nginx、apache、mysql、php几个。而这几个常用的应用，在手工编译完以后，在其他一些情况下（如：新增模块），往往想要查看当初都使用了那些参数进行的编译。这时候就可以利用以下方法查看。 1、nginx [root@361way ~]# /App/nginx/sbin/nginx -V nginx: nginx version: nginx/
unity中运用Resources.Load的方法？ brotherlamp unity视频 unity资料 unity自学 unity unity教程
问：unity中运用Resources.Load的方法？答：Resources.Load是unity本地动态加载资本所用的方法,也即是你想动态加载的时分才用到它,比方枪弹,特效,某些实时替换的图像什么的,主张此文件夹不要放太多东西,在打包的时分,它会独自把里边的一切东西都会集打包到一同,不论里边有没有你用的东西,所以大多数资本应该是自个建文件放置 1、unity实时替换的物体即是依据环境条件
线段树-入门 bylijinnan java 算法线段树
/** * 线段树入门 * 问题：已知线段[2,5] [4,6] [0,7]；求点2,4,7分别出现了多少次 * 以下代码建立的线段树用链表来保存，且树的叶子结点类似[i,i] * * 参考链接：http://hi.baidu.com/semluhiigubbqvq/item/be736a33a8864789f4e4ad18 * @author lijinna
全选与反选 chicony 全选
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html> <head> <title>全选与反选</title>
vim一些简单记录 chenchao051 vim
mac在/usr/share/vim/vimrc linux在/etc/vimrc 1、问：后退键不能删除数据，不能往后退怎么办？答：在vimrc中加入set backspace=2 2、问：如何控制tab键的缩进？答：在vimrc中加入set tabstop=4 (任何
Sublime Text 快捷键 daizj 快捷键 sublime
[size=large][/size]Sublime Text快捷键：Ctrl+Shift+P：打开命令面板Ctrl+P：搜索项目中的文件Ctrl+G：跳转到第几行Ctrl+W：关闭当前打开文件Ctrl+Shift+W：关闭所有打开文件Ctrl+Shift+V：粘贴并格式化Ctrl+D：选择单词，重复可增加选择下一个相同的单词Ctrl+L：选择行，重复可依次增加选择下一行Ctrl+Shift+L：
php 引用(&)详解 dcj3sjt126com PHP
在PHP 中引用的意思是：不同的名字访问同一个变量内容. 与Ｃ语言中的指针是有差别的．Ｃ语言中的指针里面存储的是变量的内容在内存中存放的地址变量的引用 PHP 的引用允许你用两个变量来指向同一个内容复制代码代码如下: <? $a="ABC"; $b =&$a; echo
SVN中trunk,branches,tags用法详解 dcj3sjt126com SVN
Subversion有一个很标准的目录结构，是这样的。比如项目是proj，svn地址为svn://proj/，那么标准的svn布局是svn://proj/|+-trunk+-branches+-tags这是一个标准的布局，trunk为主开发目录，branches为分支开发目录，tags为tag存档目录（不允许修改）。但是具体这几个目录应该如何使用，svn并没有明确的规范，更多的还是用户自己的习惯。
对软件设计的思考 e200702084 设计模式数据结构算法 ssh 活动
软件设计的宏观与微观软件开发是一种高智商的开发活动。一个优秀的软件设计人员不仅要从宏观上把握软件之间的开发，也要从微观上把握软件之间的开发。宏观上，可以应用面向对象设计，采用流行的SSH架构，采用web层，业务逻辑层，持久层分层架构。采用设计模式提供系统的健壮性和可维护性。微观上，对于一个类，甚至方法的调用，从计算机的角度模拟程序的运行情况。了解内存分配，参数传
同步、异步、阻塞、非阻塞 geeksun 非阻塞
同步、异步、阻塞、非阻塞这几个概念有时有点混淆，在此文试图解释一下。同步：发出方法调用后，当没有返回结果，当前线程会一直在等待（阻塞）状态。场景：打电话，营业厅窗口办业务、B/S架构的http请求-响应模式。异步：方法调用后不立即返回结果，调用结果通过状态、通知或回调通知方法调用者或接收者。异步方法调用后，当前线程不会阻塞，会继续执行其他任务。实现：
Reverse SSH Tunnel 反向打洞實錄 hongtoushizi ssh
實際的操作步驟： # 首先，在客戶那理的機器下指令連回我們自己的 Server，並設定自己 Server 上的 12345 port 會對應到幾器上的 SSH port ssh -NfR 12345:localhost:22 [email protected] # 然後在 myhost 的機器上連自己的 12345 port，就可以連回在客戶那的機器 ssh localhost -p 1
Hibernate中的缓存 Josh_Persistence 一级缓存 Hiberante缓存查询缓存二级缓存
Hibernate中的缓存一、Hiberante中常见的三大缓存：一级缓存，二级缓存和查询缓存。 Hibernate中提供了两级Cache，第一级别的缓存是Session级别的缓存，它是属于事务范围的缓存。这一级别的缓存是由hibernate管理的，一般情况下无需进行干预；第二级别的缓存是SessionFactory级别的缓存，它是属于进程范围或群集范围的缓存。这一级别的缓存
对象关系行为模式之延迟加载 home198979 PHP 架构延迟加载
形象化设计模式实战 HELLO!架构一、概念 Lazy Load：一个对象，它虽然不包含所需要的所有数据，但是知道怎么获取这些数据。延迟加载貌似很简单，就是在数据需要时再从数据库获取，减少数据库的消耗。但这其中还是有不少技巧的。二、实现延迟加载实现Lazy Load主要有四种方法：延迟初始化、虚
xml 验证 pengfeicao521 xml xml解析
有些字符，xml不能识别，用jdom或者dom4j解析的时候就报错 public static void testPattern() { // 含有非法字符的串 String str = "Jamey친Ñ&#1282
div设置半透明效果 spjich css 半透明
为div设置如下样式： div{filter:alpha(Opacity=80);-moz-opacity:0.5;opacity: 0.5;} 说明： 1、filter：对win IE设置半透明滤镜效果，filter:alpha(Opacity=80)代表该对象80%半透明，火狐浏览器不认2、-moz-opaci
你真的了解单例模式么？ w574240966 java 单例设计模式 jvm
单例模式，很多初学者认为单例模式很简单，并且认为自己已经掌握了这种设计模式。但事实上，你真的了解单例模式了么。一，单例模式的5中写法。（回字的四种写法，哈哈。） 1，懒汉式（1）线程不安全的懒汉式 public cla