JasonDing1354

【聚类分析】聚类算法初阶引入

1 聚类分析基本概念

聚类分析将数据划分成有意义或有用的簇。如果目标是划分成有意义的组，则簇应当捕获数据的自然结构。
聚类分析是一种分类的多元统计分析方法。按照个体或样品的特征将它们分类，使同一类别内的个体具有尽可能高的同质性(homogeneity)，而类别之间则应具有尽可能高的异质性(heterogeneity)。
聚类是研究数据间逻辑上或物理上的相互关系的技术，其分析结果不仅可以揭示数据间的内在联系与区别，还可以为进一步的数据分析与知识发现提供重要依据。它是数据挖掘技术中的重要组成部分。作为统计学的重要研究内容之一，聚类分析具有坚实的理论基础，并形成了系统的方法学体系

2 聚类分析的应用

聚类分析是洞察数据分布的独立工具，也可以作为其他算法预处理或者中间处理环节的方法。
一般而言，可分为以下几个方面：
（1）其他数据挖掘任务的关键中间环节：用于构建数据概要，用于分类、模式识别、假设生成和测试；用于异常检测，检测远离群簇的点。
（2）数据摘要、数据压缩、数据降维：例如图像处理中的矢量量化技术。创建一个包含所有簇原型的表，即每个原型赋予一个整数值，作为它在表中的索引。每个对象用与它所在簇相关联的原型的索引表示。
（3）协同过滤：用于推荐系统和用户细分。
（4）动态趋势检测：对流数据进行聚类，检测动态趋势和模式。
（5）用于多媒体数据、生物数据、社交网络数据的应用。

举例来说，在商务上，聚类能帮助市场分析人员从客户基本库中发现不同的客户群，并且用不同的购买模式来刻画不同的消费群体的特征。在生物学上，聚类能用于帮助推导植物和动物的种类，基因和蛋白质的分类，获得对种群中固定结构的认识。聚类在地球观测数据中相似地区的确定，根据房屋的类型、价值和位置对一个城市中房屋的分类发挥作用。聚类也能用来对web上的文档进行分类，以发现有用的信息。聚类分析能作为一种独立的工具来获得数据分布的情况，观察每个簇的特点，并对某些特定的节点进一步分析。

3 聚类算法的分类

聚类分析的算法可以分为划分法（Partitioning Methods）、层次法（Hierarchical Methods）、基于密度的方法（density-based methods）、基于网格的方法（grid-based methods）、基于模型的方法（Model-Based Methods）。

3.1 基于距离的方法

划分算法和层次算法可以看做是基于距离的聚类算法。
划分算法(partitioning method)是简单地将数据对象划分成不重叠的子集（簇），使得每个数据对象恰在一个子集中。
给定一个有N个元组或者纪录的数据集，分裂法将构造K个分组，每一个分组就代表一个聚类，K

3.2 基于密度的方法

绝大多数划分方法基于对象之间的距离进行聚类，这样的方法只能发现球状的类，而在发现任意形状的类上有困难。因此，出现了基于密度的聚类方法，其主要思想是：只要邻近区域的密度（对象或数据点的数目）超过某个阈值，就继续聚类。也就是说，对给定类中的每个数据点，在一个给定范围的区域内必须至少包含某个数目的点。这样的方法可以过滤“噪声”数据，发现任意形状的类。但算法计算复杂度高，一般为O(n^2)，对于密度分布不均的数据集，往往得不到满意的聚类结果。
其代表算法有DBSCAN、OPTICS和DENCLUE等。

3.3 基于网格的方法

基于网格的方法把对象空间量化为有限数目的单元，形成一个网格结构。所有的聚类操作都在这个网格结构（即量化空间）上进行。这种方法的主要优点是它的处理速度很快，其处理速度独立于数据对象的数目，只与量化空间中每一维的单元数目有关。但这种算法效率的提高是以聚类结果的精确性为代价的。
它的代表算法有STING、CLIQUE、WAVE-CLUSTER等。

3.4 基于概率和生成模型的方法

基于模型的聚类算法为每簇假定了一个模型，寻找数据对给定模型的最佳拟合。一个基于模型的算法可能通过构建反应数据点空间分布的密度函数来定位聚类。它也基于标准的统计数字自动决定聚类的数目，过滤噪声数据或孤立点，从而产生健壮的聚类方法。基于模型的聚类试图优化给定的数据和某些数据模型之间的适应性。这样的方法经常是基于这样的假设：数据是根据潜在的概率分布生成的。
基于模型的方法主要有两类：统计学方法和网络神经方法。其中，统计学方法有COBWEB算法，网络神经方法有SOM算法。

4 对聚类分析的要求

4.1 聚类质量

处理不同类型属性的能力：许多算法被设计用来聚类数值类型的数据。但是，应用可能要求聚类其他类型的数据，如二元类型(binary)，分类/标称类型（categorical/nominal），序数型（ordinal）数据，或者这些数据类型的混合。

发现任意形态的群簇：许多聚类算法基于欧几里得或者曼哈顿距离度量来决定聚类。基于这样的距离度量的算法趋向于发现具有相近尺度和密度的球状簇。但是，一个簇可能是任意形状的。提出能发现任意形状簇的算法是很重要的。

处理噪声的能力：绝大多数现实中的数据库都包含了孤立点，缺失，或者错误的数据。一些聚类算法对于这样的数据敏感，可能导致低质量的聚类结果。

4.2 可伸缩性

许多聚类算法在小于200个数据对象的小数据集合上工作得很好；但是，一个大规模数据库可能包含几百万个对象，在这样的大数据集合样本上进行聚类可能会导致有偏的结果。我们需要具有高度可伸缩性的聚类算法
可伸缩性的聚类算法要求算法对所有数据进行聚类，能够处理好高维数据，可以对流数据进行聚类，算法对数据输入顺序不敏感。

4.3 可解释性和可用性

用户希望聚类结果是可解释的，可理解的，和可用的。也就是说，聚类可能需要和特定的语义解释和应用相联系。

转载请注明作者Jason Ding及其出处
Github博客主页(http://jasonding1354.github.io/)
GitCafe博客主页(http://jasonding1354.gitcafe.io/)
CSDN博客(http://blog.csdn.net/jasonding1354)
简书主页(http://www.jianshu.com/users/2bd9b48f6ea8/latest_articles)
Google搜索jasonding1354进入我的博客主页

你可能感兴趣的:(聚类)

python读取sas数据集_SASpy模块，利用Python操作SAS
SASpy模块打通了Python与SAS之间的连接。有了SASpy模块，我们就能够在Python中操控SAS。本文将首先介绍SASpy模块的一些基本方法，最后通过一个聚类分析的例子，来展示如何在Python中调用SAS的机器学习过程，以及对聚类结果的可视化。SASpy模块特点1、需要Python3.X及以上，SAS9.4及以上，需要Java环境；2、无论是本地SAS还是远程服务器上的SAS，都可以
《聚类算法》入门--大白话篇：像整理房间一样给数据分类
一、什么是聚类算法？想象一下你的衣柜里堆满了衣服，但你不想一件件整理。聚类算法就像一个聪明的助手，它能自动帮你把衣服分成几堆：T恤放一堆、裤子放一堆、外套放一堆。它通过观察衣服的颜色、大小、款式这些特征，把相似的放在一起，不相似的分开。在计算机世界里，聚类算法就是帮我们把杂乱的数据分成有意义的组。它不需要提前知道答案（这就是"无监督学习"），而是像侦探一样，从数据中发现隐藏的规律。二、最常见的三种
高斯混合模型（Gaussian Mixture Model, GMM）不想秃头的程序神经网络语音识别人工智能深度学习网络
高斯混合模型（GaussianMixtureModel,GMM）是一种概率模型，用于表示数据点由多个高斯分布（GaussianDistribution）混合生成的过程。它广泛应用于聚类分析、密度估计、图像分割、语音识别等领域，尤其适合处理非球形簇或多模态数据。以下是GMM的详细介绍：一、核心思想GMM假设数据是由多个高斯分布混合生成的，每个高斯分布代表一个簇（Cluster），并引入隐变量（Lat
Python 数据挖掘实战：关联规则与聚类分析，解锁数据价值的钥匙清水白石008 python Python题库 python 数据挖掘动画
Python数据挖掘实战：关联规则与聚类分析，解锁数据价值的钥匙引言在数字化浪潮席卷全球的今天，数据已成为企业和组织最重要的战略资产。海量数据蕴藏着巨大的价值，等待我们去挖掘和发现。数据挖掘(DataMining)，作为从海量数据中提取有价值知识和模式的关键技术，正日益受到各行各业的重视。它如同探矿者的火眼金睛，能够穿透数据的迷雾，发现隐藏在背后的规律和趋势，为商业决策、科学研究和社会发展提供强有
高斯混合模型GMM&K均值（十三-1）——K均值是高斯混合模型的特例 phoenix@Capricornus 模式识别与机器学习均值算法机器学习算法
EM算法与K均值算法的关系K均值可以看成是高斯混合模型的特例。对K均值算法与EM算法进行比较后，可以发现它们之间有很大的相似性。K均值算法将数据点硬（hard）分配到聚类中，每个数据点唯一地与一个聚类相关联，而EM算法基于后验概率进行软（soft）分配。事实上，可以从EM算法推导出K均值算法。考虑一个高斯混合模型，其中混合分量的协方差矩阵由σ2I{\sigma^2}Iσ2I给出，其中σ2{\sig
《Python数据分析与挖掘实战》Chapter8中医证型关联规则挖掘笔记茫茫大地真干净机器学习 Python 数据挖掘
最近在学习《Python数据分析与挖掘实战》中的案例，写写自己的心得。代码分为两大部分：1.读取数据并进行聚类分析2.应用Apriori关联规则挖掘规律1.聚类部分函数分析：defprogrammer_1():datafile="C:/Users/longming/Desktop/chapter8/data/data.xls"processedfile="C:/Users/longming/Des
顺序内聚是指模块内的处理元素密切相关，并且必须按照特定的顺序执行，前一个处理元素的输出是下一个处理元素的输入 Bol5261 JVM(Java Virtual Machine)JMM(Java Memory Model)JMS(Java Message Service)服务器
该模块的内聚类型为顺序内聚。顺序内聚是指模块内的处理元素密切相关，并且必须按照特定的顺序执行，前一个处理元素的输出是下一个处理元素的输入。这种内聚类型比功能内聚稍弱，但仍然具有较高的内聚性。根据模块内聚的分类标准，当模块中各个处理元素密切相关于同一功能，且必须顺序执行，前一处理元素的输出直接作为下一处理元素的输入时，这种内聚类型属于顺序内聚（SequentialCohesion）。模块内聚类型对比
Prompt Engineering终极手册：构建高效AI提示词库的完整技术路线 LCG元大模型 prompt 人工智能
目录一、提示词库构建核心架构二、关键技术实现步骤1.数据采集与清洗2.提示词向量化编码3.聚类分析与分类存储三、API服务化部署四、性能优化方案五、监控与持续优化六、应用效果展示本文将深入探讨构建企业级AI提示词库的完整技术方案，含数据处理、模型训练、部署监控全流程代码实现在AI应用爆炸式增长的今天，提示词质量直接决定模型输出效果。本文将手把手教你构建企业级提示词库，涵盖以下核心技术环节：一、提示
【PyCharm 使用技巧】PyCharm 基本功能详解 || 【Jupyter Notebook】如何进入其它盘，如D盘？H盘？|| 【机器学习】聚类算法详解及其应用 || 道路交通流量模拟预测追光者♂ Python从入门到人工智能工具技巧解决办法百题千解计划(项目实战案例）PyCharm使用技巧 Jupyter如何进入其它盘聚类算法练习 PyCharm详解时空交通流预测模拟
作者主页：追光者♂个人简介：在读计算机专业硕士研究生、CSDN-人工智能领域新星创作者、2022年CSDN博客之星人工智能领域TOP4、阿里云社区专家博主【无限进步，一起追光！】欢迎点赞收藏⭐留言本篇的目录一，是请看目录四——PyCharm基础设置回顾的续篇，继续记录讲解PyCharm的基本功能。目录二回顾了在使用Jupyter时的问题。目录三练习了机器学习算法中的聚类算法。目录一、再次了解PyC
k近邻算法(kNearest Neighbors) 原理与代码实例讲解 AI大模型应用实战 java python javascript kotlin golang 架构人工智能
k-近邻算法,聚类,分类,分离散数据,决策边界,邻域,机器学习,监督学习k-近邻算法(k-NearestNeighbors)-原理与代码实例讲解k-近邻算法（k-NearestNeighbors，简称kNN）是一种简单的监督学习方法，它在机器学习领域有着广泛的应用。kNN算法的核心思想是：在特征空间中，如果一个样本附近的k个最近邻样本的大多数属于某个类别，则该样本也属于这个类别。这种基于局部决策的
算法思想之广度优先搜索（BFS）及示例（亲子游戏）墨鸦_Cormorant 算法算法宽度优先游戏
广度优先搜索广度优先算法，又称广度优先搜索算法，是最简便的图的算法之一，其特点是：在扫描数据空间时，每个点以最短路径生成广度优先生成树。广度优先搜索这种算法遍历整个图的所有节点并记录，直至找到所需结果为止，是一种盲目算法，但它还有一个非常重要的特性一最佳解，即当所有的边长相等，它就是最佳解，若在距离聚类算法中，应用广度优先搜索此特性去搜寻数据对象的同类，则可以有效地提高聚类速度。此外，可以把网格单
DAY 17 常见聚类算法 yizhimie37 python训练营打卡笔记机器学习
@浙大疏锦行https://blog.csdn.net/weixin_45655710day17笔记全流程（可点开下载）#导入必要的库importpandasaspdimportnumpyasnpimportmatplotlib.pyplotaspltimportseabornassnsimportwarnings#忽略警告信息，使输出更整洁warnings.filterwarnings("ign
【人工智能-练习】三个案例搞明白机器学习中的三大任务：分类、回归、聚类若北辰人工智能分类回归
文章目录一、分类任务结果代码解释导入必要的库配置字体生成模拟数据集拆分数据集数据标准化逻辑回归分类器预测并计算准确率绘制分类效果定义决策边界绘制函数绘制训练集和测试集的分类效果二、回归结果代码解释1.导入库2.设置Matplotlib的字体3.生成模拟数据集4.将数据集划分为训练集和测试集5.数据标准化6.定义线性回归模型7.预测8.计算均方误差(MSE)9.绘制回归预测效果图训练集上的预测效果测
从0开始学习R语言--Day27--空间自相关 Chef_Chen 学习
有的时候，我们在数据进行分组时，会发现用正常的聚类分析的方法和思维，分组的情况不是很理想。其实这是因为我们常常会忽略一个问题：假设我们正在分析的数据是真实的，那么它也肯定在一定程度上符合客观规律。而如果我们正在分析的数据中，有真实的客观空间数据时，可以考虑用空间自相关的方法去分析。例如我们在分析城市犯罪率的时候，用聚类分析的思维，我们可能会思考不同城市的犯罪特征是什么，是否有相似点，亦或是试图把城
Task01. 时序数据与 PyPOTS 介绍三分梦~ python 机器学习时序数据库数据挖掘
Task01.时序数据与PyPOTS介绍Task01.时序数据与PyPOTS介绍1.时间序列数据介绍️举例：与i.i.d数据的区别示例：1.1时间序列数据的类型1.2常见时间序列数据示例1.3时间序列研究与应用方向主要任务：1.预测（Forecasting）2.分类（Classification）3.聚类（Clustering）4.异常检测（AnomalyDetection）5.时间序列生成（Ge
python scipy简介凤枭香 Python 图像处理 python scipy 开发语言图像处理
scipyscipy是一个python开源的数学计算库，可以应用于数学、科学以及工程领域，它是基于numpy的科学计算库。主要包含了统计学、最优化、线性代数、积分、傅里叶变换、信号处理和图像处理以及常微分方程的求解以及其他科学工程中所用到的计算。scipy模块介绍scipy主要通过下面这些包来实现数学算法和科学计算，后面对于scipy的讲解主要也是基于这些包来实现的cluster：包含聚类算法co
【无标题】书桐先生 python 前端开发语言
✅什么是KMeans聚类？为什么要用它？通俗解释：KMeans聚类就像“自动分类器”，它根据像素的灰度值，把整张图分成亮度不同的几类区域。比如，把黑色背景、亮一点的重影、最亮的主影区分开。为什么用它：图像中的亮度差异很明显：背景暗（低灰度）重影比背景亮但比主影暗主影最亮KMeans可以自动分组像素，不需要手动设阈值，适应性强，适用于批量图像处理。✅什么是“形态学去噪”？用来干什么？通俗解释：形态学
【数据挖掘】期末复习模拟题（暨考试题） chaser&upper 数据分析随笔小记数据挖掘 python 聚类
数据挖掘-期末复习试题挑战全网最全题库单选题多选题判断题填空题程序填空sigmoid曼哈顿距离泰坦尼克号披萨价格预测鸢尾花DBSCN密度聚类决策树购物表单-关联规则火龙果-关联分析数据非线性映射高斯朴素贝叶斯分类器手写数字识别k1-10聚类平均偏差程序分析PM2.5线性回归Titanic数据清洗KNN鸢尾花Kmeans聚类KNN电影分类频繁k项集混淆矩阵OverlookMOOC总结挑战全网最全题库
Datawhale组队学习 - 202505 - PyPOTS - Task01时序数据与PyPOTS 来两个炸鸡腿学习 python 人工智能
系列文章目录Task01-时序数据与PyPOTS文章目录系列文章目录前言1时间序列数据1.1时间序列数据的类型1.2时间序列数据示例1.3时间序列的研究与应用方向1.3.1预测Forecasting1.3.2分类Classification1.3.3聚类Clustering1.3.4异常监测AnomalyDetection1.3.5时间序列生成Generation1.3.6插补Imputation
python中Scikit-learn模块介绍不会仰游的河马君 python python scikit-learn 开发语言
Scikit-learn是Python中一个开源的机器学习库，它提供了简单高效的工具，用于数据挖掘和数据分析。该库包含了各种分类、回归、聚类算法，以及数据预处理、模型选择、模型评估等功能。Scikit-learn的特点是接口统一、使用简单、运行高效，并且有一个活跃的社区不断维护和更新。它广泛应用于数据科学、机器学习、人工智能等领域。应用和发展趋势Scikit-learn在机器学习和数据科学领域的应
数据挖掘与机器学习期末复习整理无敌摸鱼高手数据挖掘与机器学习数据挖掘机器学习人工智能期末复习知识总结
1.分类：–有类别标记信息,因此是一种监督学习–根据训练样本获得分类器，然后把每个数据归结到某个已知的类，进而也可以预测未来数据的归类。2.聚类：–无类别标记,因此是一种无监督学习–无类别标记样本，根据信息相似度原则进行聚类，通过聚类，人们能够识别密集的和稀疏的区域，因而发现全局的分布模式，以及数据属性之间的关系3.聚类方法：划分方法-（分割类型）K-均值K-Means顺序领导者方法基于模型的方法
BIRCH、K-Means、KNN聚类算法实战：二维坐标空间聚类分析闲书郎
本文还有配套的精品资源，点击获取简介：本项目深入探讨BIRCH、K-Means、K-Means++和K-NearestNeighbors（KNN）四种聚类算法在二维坐标空间中的应用与分析。通过Python代码实现，项目着重介绍算法的运行机制，以及它们在聚类任务中的效果和优缺点。测试集包含二维坐标数据，通过比较不同算法处理效果，学习者将加深对算法的理解，并为未来的数据分析工作打下基础。1.聚类算法在
机器学习算法_聚类KMeans算法 TY-2025 机器学习机器学习算法聚类
一、聚类算法分析1.概念概念：根据样本之间的相似性，将样本划分到不同的类别中；不同的相似度的计算方法，会得到不同的聚类结果，常见的相似度计算方法有欧氏距离法（无监督算法）聚类算法的目的是在没有先验知识的情况下，自动发现数据集中的内在结构和模式2.聚类算法分类（1）根据聚类颗粒度分类个数比较多的，细聚类；个数比较多的，粗聚类（2）根据实现方法分类K-means：按照质心分类层次聚类：对数据进行逐层划
二分K-means：让聚类更高效、更精准！ AI妈妈手把手 kmeans 聚类支持向量机二分K-means Python实现机器学习聚类算法
大家好！！欢迎再次来到我的技术分享博客~在前期文章中，我们系统剖析了K-means的随机初始化缺陷、Canopy+K-means的粗粒度预处理以及K-means++的概率化质心选择。今天，我们解锁另一种高效优化方案——二分K-means（BisectingK-Means），它用层次分裂策略彻底规避初始点敏感性问题，并与前三篇内容形成完美闭环！K-means算法详解Canopy+K-means优化方
K均值聚类例题 phoenix@Capricornus 均值算法聚类机器学习
给定5个样本的样本矩阵X⊤=[0015520002]{\bmX}^\top=\begin{bmatrix}0&0&1&5&5\\2&0&0&0&2\end{bmatrix}X⊤=[0200105052]使用KKK均值聚类算法将样本聚到两个类中。选择两个样本点x1=(0,2)⊤{\bmx}_1=(0,2)^\topx1=(0,2)⊤，x2=(0,0)⊤{\bmx}_2=(0,0)^\topx2=(0
【Python】机器学习：Scikit-learn、Statsmodels
机器学习：Scikit-learn、Statsmodels文章目录机器学习：Scikit-learn、Statsmodels1.**Scikit-learn****主要功能****核心模块****常用功能及代码示例**1.**数据预处理**2.**分类算法**3.**回归算法**4.**聚类算法**5.**模型选择**6.**Pipeline**2.**Statsmodels****主要功能***
文本聚类分析：基于相似性的文档分组 Morpheon R R TextClustering
大家周一快乐！最近世界局势动荡，中东冲突不断。这种混乱可能会影响我们对世界的认知。就像法国人说的“C’estlavie”（这就是生活）。但无论未来如何，请记住瑞士人常说的“Lavieestbelle”（生活是美好的）。文本聚类分析通过内容相似性将文档分组，实现在R语言中自动对大型文本集合进行分类。什么是文本聚类分析？聚类分析将文档分组，使得同一组内的文档彼此之间的相似度高于与其他组中文档的相似度。
R情感分析：解码文本中的情感 Morpheon R r语言开发语言
基于之前关于文本聚类和文本模型的博客，我们现在可以深入探讨一个经典主题-情感分析。情感分析通过计算方式识别和分类文本中的情感，帮助理解公众意见或消费者反馈。什么是情感分析？情感分析确定文本背后的情感基调，将其分类为积极、消极或中性。它被广泛用于社交媒体监控和理解消费者需求。为什么使用情感分析？公众意见：评估对话题或品牌的情绪。消费者洞察：快速识别客户反应（例如，Expedia加拿大的商业案例）。挑
YOLO进化史：从v1到v12的注意力革命 —— 实时检测的“快”与“准”如何兼得？摘取一颗天上星️ YOLO
⚙️一、初代奠基：打破两阶段检测的垄断（2016-2018）YOLOv1（2016）：首次提出“单次检测”范式，将目标检测转化为回归问题。7×7网格+30维向量输出，实现45FPS实时检测，但小目标漏检严重。YOLOv2（2017）：引入锚框（AnchorBoxes），通过k-means聚类确定先验框尺寸新增高分辨率微调（448×448输入）使用Darknet-19主干，速度达67FPSYOLOv
机器学习15-2（Mini Batch Kmeans） Roy_Allen MachineL 机器学习 batch kmeans
文章目录简介MiniBatchK-MeansDBSCAN基本原理具体实现简介除了K-Means快速聚类意外，还有两种常用的聚类算法能够进一步提升快速聚类的速度的MiniBatchK-Means算法能够和K-Means快速聚类形成性能上互补的算法DBSCAN密度聚类MiniBatchK-Means非常抱歉，需要先来一段理论基础做铺垫，速览即可！在K-Means的基础上增加了一个MiniBatch的抽
[星球大战]阿纳金的背叛 comsci
本来杰迪圣殿的长老是不同意让阿纳金接受训练的......... 但是由于政治原因,长老会妥协了...这给邪恶的力量带来了机会所以......现代的地球联邦接受了这个教训...绝对不让某些年轻人进入学院
看懂它，你就可以任性的玩耍了！ aijuans JavaScript
javascript作为前端开发的标配技能，如果不掌握好它的三大特点：1.原型 2.作用域 3. 闭包 ,又怎么可以说你学好了这门语言呢？如果标配的技能都没有撑握好，怎么可以任性的玩耍呢？怎么验证自己学好了以上三个基本点呢，我找到一段不错的代码，稍加改动，如果能够读懂它，那么你就可以任性了。 function jClass(b
Java常用工具包 Jodd Kai_Ge java jodd
Jodd 是一个开源的 Java 工具集，包含一些实用的工具类和小型框架。简单，却很强大！写道 Jodd = Tools + IoC + MVC + DB + AOP + TX + JSON + HTML < 1.5 Mb Jodd 被分成众多模块，按需选择，其中工具类模块有： jodd-core &nb
SpringMvc下载 120153216 springMVC
@RequestMapping(value = WebUrlConstant.DOWNLOAD) public void download(HttpServletRequest request,HttpServletResponse response,String fileName) { OutputStream os = null; InputStream is = null;
Python 标准异常总结 2002wmj python
Python标准异常总结 AssertionError 断言语句（assert）失败 AttributeError 尝试访问未知的对象属性 EOFError 用户输入文件末尾标志EOF（Ctrl+d） FloatingPointError 浮点计算错误 GeneratorExit generator.close()方法被调用的时候 ImportError 导入模块失
SQL函数返回临时表结构的数据用于查询 357029540 SQL Server
这两天在做一个查询的SQL，这个SQL的一个条件是通过游标实现另外两张表查询出一个多条数据，这些数据都是INT类型，然后用IN条件进行查询，并且查询这两张表需要通过外部传入参数才能查询出所需数据，于是想到了用SQL函数返回值，并且也这样做了，由于是返回多条数据，所以把查询出来的INT类型值都拼接为了字符串，这时就遇到问题了，在查询SQL中因为条件是INT值，SQL函数的CAST和CONVERST都
java 时间格式化 | 比较大小| 时区个人笔记 7454103 java eclipse tomcat c MyEclipse
个人总结！不当之处多多包含！引用 1.0 如何设置 tomcat 的时区：位置：(catalina.bat---JAVA_OPTS 下面加上) set JAVA_OPT
时间获取Clander的用法 adminjun Clander 时间
/** * 得到几天前的时间 * @param d * @param day * @return */ public static Date getDateBefore(Date d,int day){ Calend
JVM初探与设置 aijuans java
JVM是Java Virtual Machine（Java虚拟机）的缩写，JVM是一种用于计算设备的规范，它是一个虚构出来的计算机，是通过在实际的计算机上仿真模拟各种计算机功能来实现的。Java虚拟机包括一套字节码指令集、一组寄存器、一个栈、一个垃圾回收堆和一个存储方法域。 JVM屏蔽了与具体操作系统平台相关的信息，使Java程序只需生成在Java虚拟机上运行的目标代码（字节码）,就可以在多种平台
SQL中ON和WHERE的区别 avords
SQL中ON和WHERE的区别数据库在通过连接两张或多张表来返回记录时，都会生成一张中间的临时表，然后再将这张临时表返回给用户。 www.2cto.com 在使用left jion时，on和where条件的区别如下： 1、 on条件是在生成临时表时使用的条件，它不管on中的条件是否为真，都会返回左边表中的记录。
说说自信 houxinyou 工作生活
自信的来源分为两种,一种是源于实力,一种源于头脑.实力是一个综合的评定,有自身的能力,能利用的资源等.比如我想去月亮上,要身体素质过硬,还要有飞船等等一系列的东西.这些都属于实力的一部分.而头脑不同,只要你头脑够简单就可以了!同样要上月亮上,你想,我一跳,1米,我多跳几下,跳个几年,应该就到了!什么?你说我会往下掉?你笨呀你!找个东西踩一下不就行了吗? 无论工作还
WEBLOGIC事务超时设置 bijian1013 weblogic jta 事务超时
系统中统计数据，由于调用统计过程，执行时间超过了weblogic设置的时间，提示如下错误：统计数据出错! 原因：The transaction is no longer active - status: 'Rolling Back. [Reason=weblogic.transaction.internal
两年已过去，再看该如何快速融入新团队 bingyingao java 互联网融入架构新团队
偶得的空闲，翻到了两年前的帖子该如何快速融入一个新团队，有所感触，就记下来，为下一个两年后的今天做参考。时隔两年半之后的今天，再来看当初的这个博客，别有一番滋味。而我已经于今年三月份离开了当初所在的团队，加入另外的一个项目组，2011年的这篇博客之后的时光，我很好的融入了那个团队，而直到现在和同事们关系都特别好。大家在短短一年半的时间离一起经历了一
【Spark七十七】Spark分析Nginx和Apache的access.log bit1129 apache
Spark分析Nginx和Apache的access.log，第一个问题是要对Nginx和Apache的access.log文件进行按行解析，按行解析就的方法是正则表达式： Nginx的access.log解析正则表达式 val PATTERN = """([^ ]*) ([^ ]*) ([^ ]*) (\\[.*\\]) (\&q
Erlang patch bookjovi erlang
Totally five patchs committed to erlang otp, just small patchs. IMO, erlang really is a interesting programming language, I really like its concurrency feature. but the functional programming style
log4j日志路径中加入日期 bro_feng java log4j
要用log4j使用记录日志，日志路径有每日的日期，文件大小5M新增文件。实现方式 log4j: <appender name="serviceLog" class="org.apache.log4j.RollingFileAppender"> <param name="Encoding" v
读《研磨设计模式》-代码笔记-桥接模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 个人觉得关于桥接模式的例子，蜡笔和毛笔这个例子是最贴切的：http://www.cnblogs.com/zhenyulu/articles/67016.html * 笔和颜色是可分离的，蜡笔把两者耦合在一起了：一支蜡笔只有一种
windows7下SVN和Eclipse插件安装 chenyu19891124 eclipse插件
今天花了一天时间弄SVN和Eclipse插件的安装，今天弄好了。svn插件和Eclipse整合有两种方式，一种是直接下载插件包，二种是通过Eclipse在线更新。由于之前Eclipse版本和svn插件版本有差别，始终是没装上。最后在网上找到了适合的版本。所用的环境系统：windows7JDK：1.7svn插件包版本：1.8.16Eclipse：3.7.2工具下载地址：Eclipse下在地址：htt
[转帖]工作流引擎设计思路 comsci 设计模式工作应用服务器 workflow 企业应用
作为国内的同行，我非常希望在流程设计方面和大家交流，刚发现篇好文(那么好的文章，现在才发现，可惜)，关于流程设计的一些原理，个人觉得本文站得高，看得远，比俺的文章有深度，转载如下 ================================================================================= 自开博以来不断有朋友来探讨工作流引擎该如何
Linux 查看内存，CPU及硬盘大小的方法 daizj linux cpu 内存硬盘大小
一、查看CPU信息的命令 [root@R4 ~]# cat /proc/cpuinfo |grep "model name" && cat /proc/cpuinfo |grep "physical id" model name : Intel(R) Xeon(R) CPU X5450 @ 3.00GHz model name :
linux 踢出在线用户 dongwei_6688 linux
两个步骤： 1.用w命令找到要踢出的用户，比如下面： [root@localhost ~]# w 18:16:55 up 39 days, 8:27, 3 users, load average: 0.03, 0.03, 0.00 USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT
放手吧,就像不曾拥有过一样 dcj3sjt126com
内容提要：静悠悠编著的《放手吧就像不曾拥有过一样》集结“全球华语世界最舒缓心灵”的精华故事，触碰生命最深层次的感动，献给全世界亿万读者。《放手吧就像不曾拥有过一样》的作者衷心地祝愿每一位读者都给自己一个重新出发的理由，将那些令你痛苦的、扛起的、背负的，一并都放下吧！把憔悴的面容换做一种清淡的微笑，把沉重的步伐调节成春天五线谱上的音符，让自己踏着轻快的节奏，在人生的海面上悠然漂荡，享受宁静与
php二进制安全的含义 dcj3sjt126com PHP
PHP里，有string的概念。 string里，每个字符的大小为byte（与PHP相比，Java的每个字符为Character，是UTF8字符，C语言的每个字符可以在编译时选择）。 byte里，有ASCII代码的字符，例如ABC，123，abc，也有一些特殊字符，例如回车，退格之类的。特殊字符很多是不能显示的。或者说，他们的显示方式没有标准，例如编码65到哪儿都是字母A，编码97到哪儿都是字符
Linux下禁用T440s，X240的一体化触摸板(touchpad) gashero linux ThinkPad 触摸板
自打1月买了Thinkpad T440s就一直很火大，其中最让人恼火的莫过于触摸板。 Thinkpad的经典就包括用了小红点(TrackPoint)。但是小红点只能定位，还是需要鼠标的左右键的。但是自打T440s等开始启用了一体化触摸板，不再有实体的按键了。问题是要是好用也行。实际使用中，触摸板一堆问题，比如定位有抖动，以及按键时会有飘逸。这就导致了单击经常就
graph_dfs hcx2013 Graph
package edu.xidian.graph; class MyStack { private final int SIZE = 20; private int[] st; private int top; public MyStack() { st = new int[SIZE]; top = -1; } public void push(i
Spring4.1新特性——Spring核心部分及其他 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
配置HiveServer2的安全策略之自定义用户名密码验证 liyonghui160com
具体从网上看 http://doc.mapr.com/display/MapR/Using+HiveServer2#UsingHiveServer2-ConfiguringCustomAuthentication LDAP Authentication using OpenLDAP Setting
一位30多的程序员生涯经验总结 pda158 编程工作生活咨询
1.客户在接触到产品之后，才会真正明白自己的需求。　　这是我在我的第一份工作上面学来的。只有当我们给客户展示产品的时候，他们才会意识到哪些是必须的。给出一个功能性原型设计远远比一张长长的文字表格要好。 2.只要有充足的时间，所有安全防御系统都将失败。　　安全防御现如今是全世界都在关注的大课题、大挑战。我们必须时时刻刻积极完善它，因为黑客只要有一次成功，就可以彻底打败你。 3.
分布式web服务架构的演变自由的奴隶 linux Web 应用服务器互联网
最开始，由于某些想法，于是在互联网上搭建了一个网站，这个时候甚至有可能主机都是租借的，但由于这篇文章我们只关注架构的演变历程，因此就假设这个时候已经是托管了一台主机，并且有一定的带宽了，这个时候由于网站具备了一定的特色，吸引了部分人访问，逐渐你发现系统的压力越来越高，响应速度越来越慢，而这个时候比较明显的是数据库和应用互相影响，应用出问题了，数据库也很容易出现问题，而数据库出问题的时候，应用也容易
初探Druid连接池之二——慢SQL日志记录 xingsan_zhang 日志连接池 druid 慢SQL
由于工作原因，这里先不说连接数据库部分的配置，后面会补上，直接进入慢SQL日志记录。 1.applicationContext.xml中增加如下配置： <bean abstract="true" id="mysql_database" class="com.alibaba.druid.pool.DruidDataSourc

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他