方格田

【学习笔记】K-Means聚类算法

目录

所属知识体系
思想
相关概念
算法流程
代码实现
k值的选取
初始中心点的选取
K-Means缺点
参考文章
参考文献

所属知识体系

K-Means聚类算法∈无监督学习算法∈机器学习

思想

将相似的对象归到同一个簇中，根据样本之间的距离或者说是相似性（亲疏性），把越相似、差异越小的样本聚成一类（簇），最后形成多个簇，使同一个簇内部的样本相似度高，不同簇之间差异性高。

相关概念

K值——要得到的簇的个数

质心——每个簇的均值向量，即向量各维取平均即可

距离量度——常用欧几里得距离和余弦相似度（先标准化）

算法流程

1、首先确定一个k值，即我们希望将数据集经过聚类得到k个集合。
2、从数据集中随机选择k个数据点作为质心。
3、对数据集中每一个点，计算其与每一个质心的距离（如欧式距离），离哪个质心近，就划分到那个质心所属的集合。
4、把所有数据归好集合后，一共有k个集合。然后重新计算每个集合的质心。
5、如果新计算出来的质心和原来的质心之间的距离小于某一个设置的阈值（表示重新计算的质心的位置变化不大，趋于稳定，或者说收敛），我们可以认为聚类已经达到期望的结果，算法终止。
6、如果新质心和原质心距离变化很大，需要迭代3~5步骤。

代码实现

运行结果见参考文章：
数据挖掘十大算法（二）：K-means聚类算法原理与实现

# K-means Algorithm is a clustering algorithm
import numpy as np
import matplotlib.pyplot as plt
import random


def get_distance(p1, p2):
    diff = [x - y for x, y in zip(p1, p2)]
    distance = np.sqrt(sum(map(lambda x: x ** 2, diff)))
    return distance


# 计算多个点的中心
# cluster = [[1,2,3], [-2,1,2], [9, 0 ,4], [2,10,4]]
def calc_center_point(cluster):
    N = len(cluster)
    m = np.matrix(cluster).transpose().tolist()
    center_point = [sum(x) / N for x in m]
    return center_point


# 检查两个点是否有差别
def check_center_diff(center, new_center):
    n = len(center)
    for c, nc in zip(center, new_center):
        if c != nc:
            return False
    return True


# K-means算法的实现
def K_means(points, center_points):
    N = len(points)  # 样本个数
    n = len(points[0])  # 单个样本的维度
    k = len(center_points)  # k值大小

    tot = 0
    while True:  # 迭代
        temp_center_points = []  # 记录中心点

        clusters = []  # 记录聚类的结果
        for c in range(0, k):
            clusters.append([])  # 初始化

        # 针对每个点，寻找距离其最近的中心点（寻找组织）
        for i, data in enumerate(points):
            distances = []
            for center_point in center_points:
                distances.append(get_distance(data, center_point))
            index = distances.index(min(distances))  # 找到最小的距离的那个中心点的索引，

            clusters[index].append(data)  # 那么这个中心点代表的簇，里面增加一个样本

        tot += 1
        print(tot, '次迭代   ', clusters)
        k = len(clusters)
        colors = ['r.', 'g.', 'b.', 'k.', 'y.']  # 颜色和点的样式
        for i, cluster in enumerate(clusters):
            data = np.array(cluster)
            data_x = [x[0] for x in data]
            data_y = [x[1] for x in data]
            plt.subplot(2, 3, tot)
            plt.plot(data_x, data_y, colors[i])
            plt.axis([0, 1000, 0, 1000])

        # 重新计算中心点（该步骤可以与下面判断中心点是否发生变化这个步骤，调换顺序）
        for cluster in clusters:
            temp_center_points.append(calc_center_point(cluster))

        # 在计算中心点的时候，需要将原来的中心点算进去
        for j in range(0, k):
            if len(clusters[j]) == 0:
                temp_center_points[j] = center_points[j]

        # 判断中心点是否发生变化：即，判断聚类前后样本的类别是否发生变化
        for c, nc in zip(center_points, temp_center_points):
            if not check_center_diff(c, nc):
                center_points = temp_center_points[:]  # 复制一份
                break
        else:  # 如果没有变化，那么退出迭代，聚类结束
            break

    plt.show()
    return clusters  # 返回聚类的结果


# 随机获取一个样本集，用于测试K-means算法
def get_test_data():
    N = 1000

    # 产生点的区域
    area_1 = [0, N / 4, N / 4, N / 2]
    area_2 = [N / 2, 3 * N / 4, 0, N / 4]
    area_3 = [N / 4, N / 2, N / 2, 3 * N / 4]
    area_4 = [3 * N / 4, N, 3 * N / 4, N]
    area_5 = [3 * N / 4, N, N / 4, N / 2]

    areas = [area_1, area_2, area_3, area_4, area_5]
    k = len(areas)

    # 在各个区域内，随机产生一些点
    points = []
    for area in areas:
        rnd_num_of_points = random.randint(50, 200)
        for r in range(0, rnd_num_of_points):
            rnd_add = random.randint(0, 100)
            rnd_x = random.randint(area[0] + rnd_add, area[1] - rnd_add)
            rnd_y = random.randint(area[2], area[3] - rnd_add)
            points.append([rnd_x, rnd_y])

    # 自定义中心点，目标聚类个数为5，因此选定5个中心点
    center_points = [[0, 250], [500, 500], [500, 250], [500, 250], [500, 750]]

    return points, center_points


if __name__ == '__main__':

    points, center_points = get_test_data()
    clusters = K_means(points, center_points)
    print('#######最终结果##########')
    for i, cluster in enumerate(clusters):
        print('cluster ', i, ' ', cluster)

k值的选取

在面对实际的数据时，我们并不知道数据应该聚成几类（实际中我们是不太可能看得到高维数据有很明显的分割的）。

在论文[1]中，就用一个最简单的指标——sum of squared error (SSE)组内平方误差和来确定最佳聚类数目。

计算公式如下：

根据上图，p表示簇中的点，m表示该簇的中心点，求出所有簇的组内误差平方和之后再求和即可得到SSE，又叫做WSS方法。

一般k不会很大，大概在2~10之间，因此可以作出这个范围内的SSE-k的曲线，再选择一个拐点，作为合适的k值。怎么才算合适呢？

论文[1]中给出了一个曲线：

“从图1 看出，当K 值大于5 时，随着K 值的增大，类中总的平方值对聚类数量的曲线趋于平缓，表明进一步增大聚类数聚类效果也并不能增强，因此确定最佳聚类数为5.”

初始中心点的选取

一般来说，初始中心点的选取是随机的，但是不同初始中心点，会导致聚类的效果不同。一个原则是：初始中心点之间的间距应该较大。因此，可以采取的策略是：

step1：计算所有样本点之间的距离，选择距离最大的一个点对（两个样本C1, C2）作为2个初始中心点，从样本点集中去掉这两个点。
step2：如果初始中心点个数达到k个，则终止。如果没有，在剩余的样本点中，选一个点C3，这个点优化的目标是：max { min { |C3-C1| ，|C3-C2| } }

即选择距离前两个点的最近距离最大的点作为第三个初始类簇的中心点，以此类推，直至选出K个初始类簇中心点。

K-Means缺点

1、需要确定K的值。K的取值需要事先确定，然而在无监督聚类任务上，由于并不知道数据集究竟有多少类别，所以很难确定K的取值。

2、对异常点敏感。K-Means很容易受到异常点（outliers）的影响，由于K-Means在更新时取的是簇内样本均值，那么就会很容易受到异常点的影响，比如某个簇内样本在某个维度上的值特别大，这就使得聚簇中心偏向于异常点，从而导致不太好的聚类效果。

3、凸形聚类。K-Means由于采用欧氏距离来衡量样本之间相似度，所以得到的聚簇都是凸的，就不能解决“S型”数据分布的聚类，这就使得K-Means的应用范围受限，难以发现数据集中一些非凸的性质。

4、聚簇中心初始化，收敛到局部最优，未考虑密度分布等等。

参考文章

K-Means聚类算法：
https://www.jianshu.com/p/4f032dccdcef

无监督学习K-means聚类算法笔记-Python：
https://www.jianshu.com/p/bbfafb4454be

机器学习中 K近邻法(knn)与k-means的区别：
https://www.cnblogs.com/PiPifamily/p/8520405.html

数据挖掘十大算法（二）：K-means聚类算法原理与实现：
https://blog.csdn.net/ten_sory/article/details/81016748

四种常用聚类及代码（一）：K-Means：
https://blog.csdn.net/weixin_43526820/article/details/89493751

简单粗暴理解与实现机器学习之聚类算法（四）：
https://blog.csdn.net/qq_35456045/article/details/104645015

参考文献

[1] 唐慧祥,常啸,宋来敏.基于数据挖掘的淘宝精准营销策略研究[J].哈尔滨师范大学自然科学学报,2020,36(03):19-24.

你可能感兴趣的:(毕业设计,聚类,算法,数据挖掘,python,机器学习)

python md5加密解密_python md5加密解密 weixin_39589394 python md5加密解密
md5加密以后的字符串长度我下了一段用JAVA实现MD5加密的算法，不管输入字符串多长，加密后的字符加密后为128位（bit），按照16进制（4位一个16进制数）编码后，就成了32个字符。MD5并不是加密算法zhidao，而是摘要算法。加密算法是可逆的，摘要算法是理专论上不可逆的，详细步骤：md5算法主要应用在密码领域,为了防止明文传输密码的危险Python怎么对用户密码进行MD5加密，或者是单向
pg使用python编写存储过程_postgresql存储过程代码编写 weixin_39562185
背景公司最近有个项目数据库里表需要使用到另外一个数据库里表的某两个字段，而且并不是直接查询就能插入到新表里旧表idsncustomer1xxxxTest新表idsncustomer_id1xxxx1idcustomer1Test我开始考虑的是使用python脚本去查数据库，然后逻辑判断，这种方式也是可以实现的。进行插入但表里的数据有几百万条记录，使用python脚本迁移，有网络的开销，执行的速度会
基于FPGA的简易RLC测量仪设计与实现耄先森吖
本文还有配套的精品资源，点击获取简介：RLC测量仪用于检测电路中电阻、电感和电容参数，对于电子工程和电路设计至关重要。本文将详细探讨简易RLC测量仪的设计与实现，特别关注其自动换档测量技术和采用的FPGA技术。FPGA提供并行处理能力和高速运算，能够快速响应测量信号并调整测量范围。本文还提供了测量仪的硬件逻辑设计、测量算法和软件实现，以及技术文档说明，对于理解RLC测量仪的实现细节和使用方法具有重
pg使用python编写存储过程_Python操作PostgreSql数据库的方法(基本的增删改查) 何明科
Python操作PostgreSql数据库(基本的增删改查)操作数据库最快的方式当然是直接用使用SQL语言直接对数据库进行操作，但是偶尔我们也会碰到在代码中操作数据库的情况，我们可能用ORM类的库对数控库进行操作，但是当需要操作大量的数据时，ORM的数据显的太慢了。在python中，遇到这样的情况，我推荐使用psycopg2操作postgresql数据库psycopg2官方文档传送门：http:/
AI 对程序员的冲击剖析程序员WANG 工具人工智能机器学习语言模型
摘要随着人工智能（AI）技术的飞速发展，其影响力已逐渐渗透到各个行业，程序员群体也面临着前所未有的冲击。本文深入探讨AI对程序员在编程工作模式、技能需求以及职业发展路径等方面带来的冲击，并分析程序员应对这些冲击的策略与方向，旨在为程序员在AI时代的职业发展提供参考。一、引言AI技术近年来取得了突破性进展，其在自然语言处理、机器学习、深度学习等领域的应用日益广泛。在软件开发领域，AI不再仅仅是辅助工
【头歌-Python】Python第一章作业（初级）谛凌 Python 头歌-Educoder python 开发语言头歌
禁止转载，原文：https://blog.csdn.net/qq_45801887/article/details/137069102参考教程：B站视频讲解——https://space.bilibili.com/3546616042621301如果代码存在问题，麻烦大家指正~~有帮助麻烦点个赞~~Python第一章作业（初级）第1关：浮点数四则运算与格式化输出第2关：计算矩形面积第3关：简单数学
VMD（变分模态分解）详解 DuHz 波的分析方法现代谱分析方法音频处理数据挖掘信号处理人工智能信息与通信数学建模
VMD（变分模态分解）详解目录前言背景及发展VMD原理与数学基础问题的提出变分框架与能量最小化中心频率与带宽定义目标函数及约束拉格朗日乘子法频域迭代更新公式VMD与EMD/EEMD/CEEMDAN等方法比较VMD算法流程主要参数的选择与影响优点与不足实际应用中需要注意的问题示例代码代码简要解读参考资料前言在信号处理、时频分析、故障诊断等诸多领域，如何将一个复杂信号进行多分量分解，进而提取到其中所包
python MD5加密 lvyou88 python python md5 加密解密
安装依赖第三方库pipinstallhashlib代码一#string这是要加密的字符串defmark_md5(string)string=str(string).encode("utf8")str_md5=hashlib.md5(string).hexdigest()returnstr(str_md5)代码二#string这是要加密的字符串#secret这里是秘钥defmark_md5_2(st
【Postgres_Python】使用python脚本批量导出PG数据库萌小丹Fighting Postgres_Python 数据库
示例代码说明：有多个数据库需要导出为.sql格式，数据库名与sql文件名一致,读取的数据库名需要根据文件名进行拼接importpsycopg2importsubprocessimportosfolder_path='D:/HQ/chongqing_20241112'#获取文件夹下所有文件和文件夹的名称filenames=[fforfinos.listdir(folder_path)ifos.pat
python 核心编程正则表达式部分答案 kirrin python
正则表达式章节15-16到15-29答案15-16修改脚本gendata.py的代码，使数据直接写入文件redata.txt中，而不是输出到屏幕上。.运行命令：pythongenedata.py>redata.txt运行genedata.py，生成测试数据，并存储到redata.txt文件中附上genedata.py代码：#创建测试数据redata.txt#generaterandomdatafr
WebRover：专为训练大型语言模型和 AI 应用程序而设计的 Python 库数据集
2024-11-30，由Area-25团队开发的一个专门用于生成高质量网络内容数据集的Python库。该数据集旨在为大型语言模型（LLM）和人工智能应用的训练提供丰富的数据资源。数据集地址：WebRoverDataset|自然语言处理数据集|AI模型训练数据集一、让我们一起来看一下WebRoverWebRover通过智能网络爬虫技术，自动从网络中提取与特定主题相关的内容，并支持多种输入格式，如JS
蓝桥杯试题算法训练最小距离 ( C++ ) ghost_him 蓝桥杯练习算法蓝桥杯 c++
最小距离最小距离算法题目算法代码算法的核心思路最小距离算法题目资源限制时间限制：1.0s内存限制：256.0MB最小距离问题描述数轴上有n个数字，求最近的两个数，即min(abs(x-y))输入格式第一行包含一个整数n。接下来一行，表示n整数。输出格式一个整数表示最小距离样例输入673411917样例输出1样例说明取3和4数据规模和约定n#includeusingnamespacestd;cons
别再手动下载！用pip直接安装GitHub上的Python第三方库 python
引言平时安装Python库我们一般是直接使用pip或者其他的工具包管理工具安装，因为库都发布到了pypi上面，可以直接安装。但是有的时候会有一些Python软件包没有发布到pypi上面，这种情况下我们要安装的话要将它clone下来，然后进入到文件夹中安装，本篇文章分享一种新的方式，可以直接安装。pip+git先看官方文档：python-mpipinstall[options][package-in
Python系列教程--python初级第三章 _AndyLau 手把手学python python
Python初级文章目录Python初级函数自定义函数lambda函数模块文件I/O输出到屏幕print输入raw_input函数(python3弃用)input函数打开文件异常面向对象面向对象技术简介简单类的创建内置属性类的继承基础重栽方法类的私有属性类的方法类的私有方法函数自定义函数函数定义采用def关键字进行定义，只需要声明输入参数，返回结果根据函数体内的return语句来定义#函数定义#无
使用python将Excal表格数据批量导入PostgreSQL数据库大橙子zz python 数据库 postgresql
使用Python中的psycopg2库来操作PostgreSQL数据库是一个常见的任务。以下是一个完整的示例，包括安装必要的包、建立和关闭连接、执行增删改查操作以及处理可能的异常。1.环境准备安装必要的包：pandas：用于读取Excel文件并处理数据。openpyxl或者xlrd：pandas读取Excel文件所需的库。psycopg2：Python访问PostgreSQL数据库的适配器。pip
从 PyQt5 窗口闪退问题看 Python 垃圾回收与消息机制 python
前言此篇文章源于知乎上的一个问题，使用PyQt5编写GUI程序时，新创建的界面会闪退，本篇文章仅作记录以防以后忘记。问题代码importsysfromPyQt5.QtWidgetsimportQApplication,QMainWindow,QPushButtonclassMain(QMainWindow):def__init__(self):super(Main,self).__init__()
Md5sum与aide的使用入眼皆含月 linux 运维安全知识图谱
一、Md5sum1、概述md5sum是一个用于计算和校验文件MD5哈希值的工具。MD5（Message-DigestAlgorithm5）是一种广泛使用的哈希算法，它可以产生一个128位（16字节）的哈希值，通常用32位的十六进制字符串表示。md5sum命令可以生成文件的MD5校验和，并与原始校验和进行比较，以判断文件是否被篡改。2、Md5sum的用途（1）验证文件完整性：在文件传输或备份后，使用
JSON数据与Python的字典或者列表嵌套字典的转化 2301_80749359 json python 开发语言
JSON数据与Python的字典或者列表嵌套字典的转化Python中的字典或者列表嵌套字典转JSON数据格式importjson#json在python有两种表现形式：字典；列表嵌套字典#列表嵌套字典#定义一个列表嵌套字典namw1=[{"name":"张三","age":21},{"name":"王五","age":23},{"name":"赵二","age":26}]#通过json中的dump
SVC函数介绍浊酒南街 #机器学习算法人工智能
目录前言函数介绍示例前言SVC（SupportVectorClassification）是支持向量机（SVM）的一种实现，主要用于分类问题。支持向量机是一种监督学习算法，其基本原理是找到一个最优的超平面来将不同类别的数据分开。SVC在小样本和高维空间中表现良好，且能够处理非线性分类问题。函数介绍SVC(C=1.0,kernel=‘rbf’,degree=3,gamma=‘auto’,coef0=0
4. 马科维茨资产组合模型+Fama-French五因子优化方案（理论+Python实战）金融OG 金融资产组合模型进化论 python java 前端金融数据库机器学习大数据
目录0.承前1.Fama-French五因子优化的现代投资组合理论1.1WhatisFama-French五因子优化的现代投资组合理论1.2WhyisFama-French五因子优化的现代投资组合理论1.3HowtoFama-French五因子优化的现代投资组合理论2.数据要素&计算流程2.1参数集设置2.2数据获取&预处理2.3收益率计算2.4因子构建与预期收益率计算2.5协方差矩阵计算2.6投
2. 马科维茨资产组合模型+CAMP优化方案（理论+Python实战）金融OG 金融资产组合模型进化论人工智能大数据金融 python 数据库机器学习
目录0.承前1.资本资产定价模型(CAPM)优化的现代投资组合理论1.1WhatisCAPM优化的现代投资组合理论1.2WhyisCAPM优化的现代投资组合理论1.3HowtoCAPM优化的现代投资组合理论2.数据要素&计算流程2.1参数集设置2.2数据获取&预处理2.3收益率计算2.4CAPM预期收益率计算2.5协方差矩阵计算2.6投资组合表现计算2.7夏普比率优化2.8持仓筛选3.汇总代码4.
【AI量金术师：简易代码领悟高深金融术语】02.马科维茨资产组合模型Python实战金融OG 高深金融术语私厨人工智能金融 python
目录1.马科维茨资产组合模型简介1.1模型的起源与发展1.2核心概念2.模型的基本假设2.1投资者行为假设2.2市场环境假设3.模型的应用与局限性3.1实际应用3.2局限性探讨4.Python代码案例：实现马科维茨资产组合模型4.1环境准备与数据获取4.2数据收集4.3计算收益率与协方差矩阵4.4随机生成投资组合4.5绘制有效前沿4.6优化求解最优投资组合5.结论与展望1.马科维茨资产组合模型简介
svm python 模型绘图_1SVM处理数据并绘图张炜大师傅 svm python 模型绘图
爬虫Python基础、数据分析扩展包Numpy、pandas、matplotlib，Python读取MySQL数据，Python爬虫及Scrapy框架，无监督机器学习算法聚类分析等，以及案例：互联网金融行业客户价值分析等。机器学习机器学习是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有
服务器ibmc无法加载js文件,华为服务器IBMC批量巡检代码 1ce0ear 服务器ibmc无法加载js文件
selenium需要下载Chrome驱动webdriver，具体下载的版本根据自己的谷歌浏览器版本进行下载，然后将下载好的驱动webdriver放到自己python解释器同级目录中即可，下载地址http://npm.taobao.org/mirrors/chromedriver/此代码可用于华为服务器批量巡检，前提要在脚本存放的同级目录下建立一个ipList.txt文件存储服务器管理IP地址格式为
AI产品经理还不会数据挖掘❓看完这篇就够了脱泥不tony 人工智能产品经理数据挖掘 python tensorflow 开发语言 llama
前言在数字化时代的浪潮中，AI产品经理正成为推动科技与商业融合的重要力量。然而，面对海量的数据，如何从中挖掘出有价值的信息，为AI产品的开发提供有力支持？这已成为AI产品经理必须面对的挑战。今天，我们就来探讨一下数据挖掘在AI产品经理工作中的重要性，以及如何通过掌握数据挖掘方法论，打造卓越的AI产品。一、数据挖掘：AI产品经理的必备技能在AI产品的世界中，大数据是构建一切的基础。无论是算法组件、知
python数据分析与可视化盆蒂 python 开发语言
一、Python数据分析概述Python是一种解释型、交互式的编程语言，其设计理念强调代码的可读性和简洁性。Python的语法结构简单，支持面向对象、过程式和函数式三种编程范式，使得Python成为一种强大而灵活的编程语言。Python数据分析主要包括数据清洗、数据探索和数据可视化三个部分。数据清洗是数据分析的重要环节，主要是对数据进行预处理，包括缺失值处理、异常值处理、数据类型转换等。数据探索则
HTTPS keytool工具使用(高频) 笑锝没心没肺 Linux #网络安全 https 网络协议 http
keytool是Java平台的一个密钥和证书管理工具，它用于管理JavaKeystore(JKS)文件，这些文件用于存储密钥和证书。以下是keytool命令的一些常用选项及其详解：基本语法keytool[options]选项列表生成密钥库-genkeypair:生成密钥对。-alias:密钥库条目的别名。-keyalg:密钥算法，例如RSA或EC。-keysize:密钥大小（位数）。-validi
顺序表、链式表、顺序栈、链式栈以及顺序队列、链式队列 ¿134 数据结构算法 c语言
一、什么是数据结构1、数据结构的起源1968，美国高德纳教授，《计算机程序设计艺术》第一卷《基本算法》，开创了数据结构和算法的先河数据结构是研究数据之间关系和操作的学科，而非计算方法数据结构+算法=程序美国沃斯提出这句话揭示了程序的本质2、数据结构相关概念结构：所以能够输入到计算机中，能够被程序处理的描述客观事物的符号数据项：有独立含义的数据的最小单位，也称为域数据元素：组成数据的有一定含义的基本
Python操作MongoDB看这一篇就够了 Python3.7 Python进阶 python
MongoDB是由C++语言编写的非关系型数据库，是一个基于分布式文件存储的开源数据库系统，其内容存储形式类似JSON对象，它的字段值可以包含其他文档、数组及文档数组，非常灵活。在这一节中，我们就来看看Python3下MongoDB的存储操作。1.准备工作在开始之前，请确保已经安装好了MongoDB并启动了其服务，并且安装好了Python的PyMongo库。2.连接MongoDB连接MongoDB
python加密解密算法_Python-AES加密算法接口测试 weixin_39602737 python加密解密算法
前言先前已经学过了Python-SHA256加密算法接口测试，今天我跟大家讲解一下AES加密算法的接口如何写python脚本进行测试。一：安装pycryptodome模块pipinstallpycryptodome二：定义AES加密的方法，本次使用ECB模式加密importbase64fromCrypto.CipherimportAESfromCrypto.Util.Paddingimportpa
[星球大战]阿纳金的背叛 comsci
本来杰迪圣殿的长老是不同意让阿纳金接受训练的......... 但是由于政治原因,长老会妥协了...这给邪恶的力量带来了机会所以......现代的地球联邦接受了这个教训...绝对不让某些年轻人进入学院
看懂它，你就可以任性的玩耍了！ aijuans JavaScript
javascript作为前端开发的标配技能，如果不掌握好它的三大特点：1.原型 2.作用域 3. 闭包 ,又怎么可以说你学好了这门语言呢？如果标配的技能都没有撑握好，怎么可以任性的玩耍呢？怎么验证自己学好了以上三个基本点呢，我找到一段不错的代码，稍加改动，如果能够读懂它，那么你就可以任性了。 function jClass(b
Java常用工具包 Jodd Kai_Ge java jodd
Jodd 是一个开源的 Java 工具集，包含一些实用的工具类和小型框架。简单，却很强大！写道 Jodd = Tools + IoC + MVC + DB + AOP + TX + JSON + HTML < 1.5 Mb Jodd 被分成众多模块，按需选择，其中工具类模块有： jodd-core &nb
SpringMvc下载 120153216 springMVC
@RequestMapping(value = WebUrlConstant.DOWNLOAD) public void download(HttpServletRequest request,HttpServletResponse response,String fileName) { OutputStream os = null; InputStream is = null;
Python 标准异常总结 2002wmj python
Python标准异常总结 AssertionError 断言语句（assert）失败 AttributeError 尝试访问未知的对象属性 EOFError 用户输入文件末尾标志EOF（Ctrl+d） FloatingPointError 浮点计算错误 GeneratorExit generator.close()方法被调用的时候 ImportError 导入模块失
SQL函数返回临时表结构的数据用于查询 357029540 SQL Server
这两天在做一个查询的SQL，这个SQL的一个条件是通过游标实现另外两张表查询出一个多条数据，这些数据都是INT类型，然后用IN条件进行查询，并且查询这两张表需要通过外部传入参数才能查询出所需数据，于是想到了用SQL函数返回值，并且也这样做了，由于是返回多条数据，所以把查询出来的INT类型值都拼接为了字符串，这时就遇到问题了，在查询SQL中因为条件是INT值，SQL函数的CAST和CONVERST都
java 时间格式化 | 比较大小| 时区个人笔记 7454103 java eclipse tomcat c MyEclipse
个人总结！不当之处多多包含！引用 1.0 如何设置 tomcat 的时区：位置：(catalina.bat---JAVA_OPTS 下面加上) set JAVA_OPT
时间获取Clander的用法 adminjun Clander 时间
/** * 得到几天前的时间 * @param d * @param day * @return */ public static Date getDateBefore(Date d,int day){ Calend
JVM初探与设置 aijuans java
JVM是Java Virtual Machine（Java虚拟机）的缩写，JVM是一种用于计算设备的规范，它是一个虚构出来的计算机，是通过在实际的计算机上仿真模拟各种计算机功能来实现的。Java虚拟机包括一套字节码指令集、一组寄存器、一个栈、一个垃圾回收堆和一个存储方法域。 JVM屏蔽了与具体操作系统平台相关的信息，使Java程序只需生成在Java虚拟机上运行的目标代码（字节码）,就可以在多种平台
SQL中ON和WHERE的区别 avords
SQL中ON和WHERE的区别数据库在通过连接两张或多张表来返回记录时，都会生成一张中间的临时表，然后再将这张临时表返回给用户。 www.2cto.com 在使用left jion时，on和where条件的区别如下： 1、 on条件是在生成临时表时使用的条件，它不管on中的条件是否为真，都会返回左边表中的记录。
说说自信 houxinyou 工作生活
自信的来源分为两种,一种是源于实力,一种源于头脑.实力是一个综合的评定,有自身的能力,能利用的资源等.比如我想去月亮上,要身体素质过硬,还要有飞船等等一系列的东西.这些都属于实力的一部分.而头脑不同,只要你头脑够简单就可以了!同样要上月亮上,你想,我一跳,1米,我多跳几下,跳个几年,应该就到了!什么?你说我会往下掉?你笨呀你!找个东西踩一下不就行了吗? 无论工作还
WEBLOGIC事务超时设置 bijian1013 weblogic jta 事务超时
系统中统计数据，由于调用统计过程，执行时间超过了weblogic设置的时间，提示如下错误：统计数据出错! 原因：The transaction is no longer active - status: 'Rolling Back. [Reason=weblogic.transaction.internal
两年已过去，再看该如何快速融入新团队 bingyingao java 互联网融入架构新团队
偶得的空闲，翻到了两年前的帖子该如何快速融入一个新团队，有所感触，就记下来，为下一个两年后的今天做参考。时隔两年半之后的今天，再来看当初的这个博客，别有一番滋味。而我已经于今年三月份离开了当初所在的团队，加入另外的一个项目组，2011年的这篇博客之后的时光，我很好的融入了那个团队，而直到现在和同事们关系都特别好。大家在短短一年半的时间离一起经历了一
【Spark七十七】Spark分析Nginx和Apache的access.log bit1129 apache
Spark分析Nginx和Apache的access.log，第一个问题是要对Nginx和Apache的access.log文件进行按行解析，按行解析就的方法是正则表达式： Nginx的access.log解析正则表达式 val PATTERN = """([^ ]*) ([^ ]*) ([^ ]*) (\\[.*\\]) (\&q
Erlang patch bookjovi erlang
Totally five patchs committed to erlang otp, just small patchs. IMO, erlang really is a interesting programming language, I really like its concurrency feature. but the functional programming style
log4j日志路径中加入日期 bro_feng java log4j
要用log4j使用记录日志，日志路径有每日的日期，文件大小5M新增文件。实现方式 log4j: <appender name="serviceLog" class="org.apache.log4j.RollingFileAppender"> <param name="Encoding" v
读《研磨设计模式》-代码笔记-桥接模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 个人觉得关于桥接模式的例子，蜡笔和毛笔这个例子是最贴切的：http://www.cnblogs.com/zhenyulu/articles/67016.html * 笔和颜色是可分离的，蜡笔把两者耦合在一起了：一支蜡笔只有一种
windows7下SVN和Eclipse插件安装 chenyu19891124 eclipse插件
今天花了一天时间弄SVN和Eclipse插件的安装，今天弄好了。svn插件和Eclipse整合有两种方式，一种是直接下载插件包，二种是通过Eclipse在线更新。由于之前Eclipse版本和svn插件版本有差别，始终是没装上。最后在网上找到了适合的版本。所用的环境系统：windows7JDK：1.7svn插件包版本：1.8.16Eclipse：3.7.2工具下载地址：Eclipse下在地址：htt
[转帖]工作流引擎设计思路 comsci 设计模式工作应用服务器 workflow 企业应用
作为国内的同行，我非常希望在流程设计方面和大家交流，刚发现篇好文(那么好的文章，现在才发现，可惜)，关于流程设计的一些原理，个人觉得本文站得高，看得远，比俺的文章有深度，转载如下 ================================================================================= 自开博以来不断有朋友来探讨工作流引擎该如何
Linux 查看内存，CPU及硬盘大小的方法 daizj linux cpu 内存硬盘大小
一、查看CPU信息的命令 [root@R4 ~]# cat /proc/cpuinfo |grep "model name" && cat /proc/cpuinfo |grep "physical id" model name : Intel(R) Xeon(R) CPU X5450 @ 3.00GHz model name :
linux 踢出在线用户 dongwei_6688 linux
两个步骤： 1.用w命令找到要踢出的用户，比如下面： [root@localhost ~]# w 18:16:55 up 39 days, 8:27, 3 users, load average: 0.03, 0.03, 0.00 USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT
放手吧,就像不曾拥有过一样 dcj3sjt126com
内容提要：静悠悠编著的《放手吧就像不曾拥有过一样》集结“全球华语世界最舒缓心灵”的精华故事，触碰生命最深层次的感动，献给全世界亿万读者。《放手吧就像不曾拥有过一样》的作者衷心地祝愿每一位读者都给自己一个重新出发的理由，将那些令你痛苦的、扛起的、背负的，一并都放下吧！把憔悴的面容换做一种清淡的微笑，把沉重的步伐调节成春天五线谱上的音符，让自己踏着轻快的节奏，在人生的海面上悠然漂荡，享受宁静与
php二进制安全的含义 dcj3sjt126com PHP
PHP里，有string的概念。 string里，每个字符的大小为byte（与PHP相比，Java的每个字符为Character，是UTF8字符，C语言的每个字符可以在编译时选择）。 byte里，有ASCII代码的字符，例如ABC，123，abc，也有一些特殊字符，例如回车，退格之类的。特殊字符很多是不能显示的。或者说，他们的显示方式没有标准，例如编码65到哪儿都是字母A，编码97到哪儿都是字符
Linux下禁用T440s，X240的一体化触摸板(touchpad) gashero linux ThinkPad 触摸板
自打1月买了Thinkpad T440s就一直很火大，其中最让人恼火的莫过于触摸板。 Thinkpad的经典就包括用了小红点(TrackPoint)。但是小红点只能定位，还是需要鼠标的左右键的。但是自打T440s等开始启用了一体化触摸板，不再有实体的按键了。问题是要是好用也行。实际使用中，触摸板一堆问题，比如定位有抖动，以及按键时会有飘逸。这就导致了单击经常就
graph_dfs hcx2013 Graph
package edu.xidian.graph; class MyStack { private final int SIZE = 20; private int[] st; private int top; public MyStack() { st = new int[SIZE]; top = -1; } public void push(i
Spring4.1新特性——Spring核心部分及其他 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
配置HiveServer2的安全策略之自定义用户名密码验证 liyonghui160com
具体从网上看 http://doc.mapr.com/display/MapR/Using+HiveServer2#UsingHiveServer2-ConfiguringCustomAuthentication LDAP Authentication using OpenLDAP Setting
一位30多的程序员生涯经验总结 pda158 编程工作生活咨询
1.客户在接触到产品之后，才会真正明白自己的需求。　　这是我在我的第一份工作上面学来的。只有当我们给客户展示产品的时候，他们才会意识到哪些是必须的。给出一个功能性原型设计远远比一张长长的文字表格要好。 2.只要有充足的时间，所有安全防御系统都将失败。　　安全防御现如今是全世界都在关注的大课题、大挑战。我们必须时时刻刻积极完善它，因为黑客只要有一次成功，就可以彻底打败你。 3.
分布式web服务架构的演变自由的奴隶 linux Web 应用服务器互联网
最开始，由于某些想法，于是在互联网上搭建了一个网站，这个时候甚至有可能主机都是租借的，但由于这篇文章我们只关注架构的演变历程，因此就假设这个时候已经是托管了一台主机，并且有一定的带宽了，这个时候由于网站具备了一定的特色，吸引了部分人访问，逐渐你发现系统的压力越来越高，响应速度越来越慢，而这个时候比较明显的是数据库和应用互相影响，应用出问题了，数据库也很容易出现问题，而数据库出问题的时候，应用也容易
初探Druid连接池之二——慢SQL日志记录 xingsan_zhang 日志连接池 druid 慢SQL
由于工作原因，这里先不说连接数据库部分的配置，后面会补上，直接进入慢SQL日志记录。 1.applicationContext.xml中增加如下配置： <bean abstract="true" id="mysql_database" class="com.alibaba.druid.pool.DruidDataSourc

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他