Doris_H_n_q

K-means[np.argwhere/图片压缩/kmeans.cluster_centers_]

K均值算法（K-means）聚类

【关键词】K个种子，均值

一、K-means算法原理

聚类的概念：一种无监督的学习，事先不知道类别，自动将相似的对象归到同一个簇中。

K-Means算法是一种聚类分析（cluster analysis）的算法，其主要是来计算数据聚集的算法，主要通过不断地取离种子点最近均值的算法。

K-Means算法主要解决的问题如下图所示。我们可以看到，在图的左边有一些点，我们用肉眼可以看出来有四个点群，但是我们怎么通过计算机程序找出这几个点群来呢？于是就出现了我们的K-Means算法

这个算法其实很简单，如下图所示：

从上图中，我们可以看到，A，B，C，D，E是五个在图中点。而灰色的点是我们的种子点，也就是我们用来找点群的点。有两个种子点，所以K=2。

然后，K-Means的算法如下：

随机在图中取K（这里K=2）个种子点。
然后对图中的所有点求到这K个种子点的距离，假如点Pi离种子点Si最近，那么Pi属于Si点群。（上图中，我们可以看到A，B属于上面的种子点，C，D，E属于下面中部的种子点）
接下来，我们要移动种子点到属于他的“点群”的中心。（见图上的第三步）
然后重复第2）和第3）步，直到，种子点没有移动（我们可以看到图中的第四步上面的种子点聚合了A，B，C，下面的种子点聚合了D，E）。

这个算法很简单，重点说一下“求点群中心的算法”：欧氏距离（Euclidean Distance）：差的平方和的平方根

K-Means主要最重大的缺陷——都和初始值有关：

K是事先给定的，这个K值的选定是非常难以估计的。很多时候，事先并不知道给定的数据集应该分成多少个类别才最合适。（ISODATA算法通过类的自动合并和分裂，得到较为合理的类型数目K）

K-Means算法需要用初始随机种子点来搞，这个随机种子点太重要，不同的随机种子点会有得到完全不同的结果。（K-Means++算法可以用来解决这个问题，其可以有效地选择初始点）

总结：K-Means算法步骤：

从数据中选择k个对象作为初始聚类中心;
计算每个聚类对象到聚类中心的距离来划分；
再次计算每个聚类中心
计算标准测度函数，直到达到最大迭代次数，则停止，否则，继续操作。
确定最优的聚类中心

K-Means算法应用

看到这里，你会说，K-Means算法看来很简单，而且好像就是在玩坐标点，没什么真实用处。而且，这个算法缺陷很多，还不如人工呢。是的，前面的例子只是玩二维坐标点，的确没什么意思。但是你想一下下面的几个问题：

1）如果不是二维的，是多维的，如5维的，那么，就只能用计算机来计算了。

2）二维坐标点的X，Y 坐标，其实是一种向量，是一种数学抽象。现实世界中很多属性是可以抽象成向量的，比如，我们的年龄，我们的喜好，我们的商品，等等，能抽象成向量的目的就是可以让计算机知道某两个属性间的距离。如：我们认为，18岁的人离24岁的人的距离要比离12岁的距离要近，鞋子这个商品离衣服这个商品的距离要比电脑要近，等等。

二、实战

重要参数：

n_clusters：聚类的个数

重要属性：

clustercenters : [n_clusters, n_features]的数组，表示聚类中心点的坐标
labels_ : 每个样本点的标签

1、聚类实例

导包，使用make_blobs生成随机点cluster_std

from sklearn.cluster import KMeans

import numpy as np

import sklearn.datasets as datasets

import matplotlib.pyplot as plt
%matplotlib inline

数据集

X,y = datasets.make_blobs()
display(X.shape,y.shape)
Out:
(100, 2)
(100,)
plt.scatter(X[:,0],X[:,1],c = y)

建立模型,训练数据，并进行数据预测，使用相同数据：

KMeans的原理较为简单：以某种相似性度量为标准，确定样本的结构，即样本属于哪一个簇取决于该样本与哪一个簇的中心点最相似。

K-Means类主要参数 ：

1) n_clusters: 即k值，一般需要多试一些值以获得较好的聚类效果。k值好坏的评估标准在下面会讲。
2）max_iter：最大的迭代次数，一般如果是凸数据集的话可以不管这个值，如果数据集不是凸的，可能很难收敛，此时可以指定最大的迭代次数让算法可以及时退出循环。
3）n_init：用不同的初始化质心运行算法的次数。由于K-Means是结果受初始值影响的局部最优的迭代算法，因此需要多跑几次以选择一个较好的聚类效果，默认是10，一般不需要改。如果你的k值较大，则可以适当增大这个值。
4）init：即初始值选择的方式，可以为完全随机选择’random’,优化过的’k-means++’或者自己指定初始化的k个质心。一般建议使用默认的’k-means++’。
5）algorithm：有“auto”, “full” or “elkan”三种选择。”full”就是我们传统的K-Means算法， “elkan”是（机器学习(25)之K-Means聚类算法详解）原理篇讲的elkan K-Means算法。默认的”auto”则会根据数据值是否是稀疏的，来决定如何选择”full”和“elkan”。一般数据是稠密的，那么就是 “elkan”，否则就是”full”。一般来说建议直接用默认的”auto”

'''KMeans(n_clusters=8, init='k-means++', n_init=10, max_iter=300, tol=0.0001, 
precompute_distances='auto', verbose=0, random_state=None, copy_x=True, n_jobs=1, 
algorithm='auto') '''
kmeans = KMeans(n_clusters=3)

# 无监督学习
kmeans.fit(X)
Out：
KMeans(algorithm='auto', copy_x=True, init='k-means++', max_iter=300,
    n_clusters=3, n_init=10, n_jobs=1, precompute_distances='auto',
    random_state=None, tol=0.0001, verbose=0)

y_ = kmeans.predict(X)
y_
Out:
array([2, 1, 1, 2, 0, 2, 0, 2, 2, 1, 1, 0, 2, 1, 1, 0, 0, 2, 0, 2, 0, 0,
       0, 1, 2, 0, 0, 2, 2, 0, 1, 0, 0, 0, 1, 2, 0, 0, 2, 2, 1, 1, 0, 1,
       2, 0, 1, 1, 1, 1, 0, 0, 2, 1, 2, 2, 0, 1, 0, 2, 1, 2, 1, 0, 0, 1,
       2, 1, 2, 1, 1, 2, 0, 1, 0, 0, 2, 1, 0, 0, 2, 0, 1, 1, 2, 2, 1, 1,
       1, 2, 2, 2, 1, 2, 0, 0, 2, 1, 0, 2])

无监督的情况下进行计算，预测现在机器学习没有目标

绘制图形，显示聚类结果kmeans.cluster_centers

2、实战，三问中国足球几多愁？

导包

import pandas as pd

数据集

X = pd.read_csv('../data/AsiaZoo.txt',header=None)
X

导包，3D图像需导包：from mpl_toolkits.mplot3d import Axes3D
读取数据

列名修改为："国家","2006世界杯","2010世界杯","2007亚洲杯"

X.columns = ["国家","2006世界杯","2010世界杯","2007亚洲杯"]
X

使用K-Means进行数据处理，对亚洲球队进行分组，分三组

kmeans = KMeans(3)

kmeans.fit(X.iloc[:,1:])
Out：
KMeans(algorithm='auto', copy_x=True, init='k-means++', max_iter=300,
    n_clusters=3, n_init=10, n_jobs=1, precompute_distances='auto',
    random_state=None, tol=0.0001, verbose=0)

y_ = kmeans.predict(X.iloc[:,1:])
y_
Out：
array([0, 1, 1, 2, 2, 0, 0, 0, 2, 0, 0, 0, 2, 2, 0])

X['国家']
Out：
0         中国
1         日本
2         韩国
3         伊朗
4         沙特
5        伊拉克
6        卡塔尔
7        阿联酋
8     乌兹别克斯坦
9         泰国
10        越南
11        阿曼
12        巴林
13        朝鲜
14        印尼
Name: 国家, dtype: object

for循环打印输出分组后的球队，argwhere()

np.argwhere(y_ == 1)
Out：
array([[1],
       [2]], dtype=int64)


for i in range(3):
    index = np.argwhere(y_ == i).reshape(-1)
    
    print(X['国家'][index].values)
    print('---------------------------------------------')
['中国' '伊拉克' '卡塔尔' '阿联酋' '泰国' '越南' '阿曼' '印尼']
---------------------------------------------
['日本' '韩国']
---------------------------------------------
['伊朗' '沙特' '乌兹别克斯坦' '巴林' '朝鲜']
---------------------------------------------

绘制三维立体图形,ax = plt.subplot(projection = '3d')
ax.scatter3D()

略……

3、聚类实践与常见错误

第一种错误：k值不合适，make_blobs默认中心点三个

第二种错误：数据偏差
trans = [[0.6,-0.6],[-0.4,0.8]]
X2 = np.dot(X,trans)

trans = [[0.6,-0.6],[-0.4,0.8]]
X2 = np.dot(X,trans)
X2.shape
Out：(100, 2)

# y.shape=(100,)
plt.scatter(X2[:,0],X2[:,1],c = y)

kmeans = KMeans(3)
kmeans.fit(X2)
y_ = kmeans.predict(X2)
plt.scatter(X2[:,0],X2[:,1],c = y_)

X2 = X点乘trans
X2点乘trans逆矩阵

X3 = np.dot(X2,np.linalg.inv(trans))

plt.scatter(X3[:,0],X3[:,1],c = y)

第三个错误:标准偏差不相同cluster_std

X,y = datasets.make_blobs(cluster_std=[1.0,1.0,8])
plt.scatter(X[:,0],X[:,1],c = y)

kmeans = KMeans(3)
kmeans.fit(X)
y_ = kmeans.predict(X)
plt.scatter(X[:,0],X[:,1],c = y_)

第四个错误：样本数量不同

X,y = datasets.make_blobs(n_samples=300,cluster_std=3)
plt.scatter(X[:,0],X[:,1],c = y)

index_0 = np.argwhere(y == 0).reshape(-1)
index_0
Out：
array([  4,   5,   9,  11,  12,  13,  16,  18,  20,  22,  23,  24,  25,
        29,  33,  34,  40,  41,  44,  48,  52,  55,  58,  63,  65,  67,
        68,  72,  73,  74,  75,  79,  80,  85,  87,  88,  94, 102, 105,
       113, 118, 130, 134, 136, 138, 140, 143, 150, 151, 152, 154, 166,
       171, 173, 175, 176, 178, 179, 180, 185, 192, 201, 203, 206, 207,
       208, 212, 213, 215, 219, 222, 225, 226, 230, 231, 233, 234, 236,
       237, 244, 248, 250, 251, 254, 257, 261, 262, 264, 265, 270, 277,
       279, 280, 283, 286, 287, 289, 297, 298, 299], dtype=int64)

index_1 = np.argwhere(y == 1).reshape(-1)[:20]
index_1
Out：
array([ 0,  1,  7, 10, 15, 27, 28, 36, 38, 42, 45, 47, 54, 61, 62, 78, 82,
       83, 86, 89], dtype=int64)

index_2 = np.argwhere(y ==2).reshape(-1)[:10]
index_2
Out：
array([ 2,  3,  6,  8, 14, 17, 19, 21, 26, 30], dtype=int64)

index = np.concatenate([index_0,index_1,index_2])

X = X[index]
y = y[index]

plt.scatter(X[:,0],X[:,1],c = y)

kmeans = KMeans(3)
kmeans.fit(X)
y_ = kmeans.predict(X)
plt.scatter(X[:,0],X[:,1],c = y_)

4、K-Means图片颜色点分类

导包from sklearn.metrics import pairwise_distances_argmin

from scipy import ndimage

压缩：ndimage.zoom

# ndimage.zoom(input, zoom, output=None, order=3, mode='constant', cval=0.0, prefilter=True)
china_new2 = ndimage.zoom(china_new,zoom = [427/1500,640/1500,1])
plt.imshow(china_new2)

2、图片压缩

使用聚类压缩图片

img = plt.imread('../data/bird_small.png') img_shape = img.shape img_shape

bird = plt.imread('../data/bird_small.png')
bird.shape
Out：(128,128,3)
'''128*128=16384'''

bird.reshape(-1,3) 
Out：
array([[0.85882354, 0.7058824 , 0.40392157],
       [0.9019608 , 0.7254902 , 0.45490196],
       [0.8862745 , 0.7294118 , 0.43137255],
       ...,
       [0.25490198, 0.16862746, 0.15294118],
       [0.22745098, 0.14509805, 0.14901961],
       [0.20392157, 0.15294118, 0.13333334]], dtype=float32)

plt.imshow(bird)

from pandas import Series,DataFrame

df = DataFrame(bird.reshape(-1,3))
df
'''df[0].shape =(16384,) '''


df.drop_duplicates().shape
Out :
(13930, 3)
'''16384个像素值，包含13930个不同的颜色'''

kmeans

kmeans = KMeans(n_clusters=4)

# 16384颜色
kmeans.fit(bird.reshape(-1,3))
Out:
KMeans(algorithm='auto', copy_x=True, init='k-means++', max_iter=300,
    n_clusters=4, n_init=10, n_jobs=1, precompute_distances='auto',
    random_state=None, tol=0.0001, verbose=0)

预测

y_ = kmeans.predict(bird.reshape(-1,3))
y_
Out：
array([0, 0, 0, ..., 1, 1, 1])

y_.shape
Out：(16384,)

y_.max()
Out： 3

聚类中心点代表着颜色

# 聚类中心点代表着颜色
cluster_centers_ = kmeans.cluster_centers_
cluster_centers_
Out：
array([[0.7932539 , 0.63968104, 0.42075178],
       [0.12838763, 0.13014919, 0.12066123],
       [0.48904994, 0.40076178, 0.3222613 ],
       [0.9130492 , 0.86011744, 0.74095654]], dtype=float32)

cluster_centers_[0]
Out：array([0.7932539 , 0.63968104, 0.42075178], dtype=float32)

cluster_centers_[[0,1,2,1,0]]
Out：
array([[0.7932539 , 0.63968104, 0.42075178],
       [0.12838763, 0.13014919, 0.12066123],
       [0.48904994, 0.40076178, 0.3222613 ],
       [0.12838763, 0.13014919, 0.12066123],
       [0.7932539 , 0.63968104, 0.42075178]], dtype=float32)

Series(y_).unique()
Out :
array([3, 0, 2, 1], dtype=int64)

bird_new = cluster_centers_[y_]
bird_new.shape
Out:
(16384, 3)

plt.imshow(bird_new.reshape(128,128,3))

梯度下降法小丹丹的梦想后花园
梯度下降法，最通俗易懂的解释。数据分析挖掘与算法1月7日作者：六尺帐篷链接：https://www.jianshu.com/p/c7e642877b0e本文从一个下山场景开始，提出梯度下降算法的基本思想，接着从数学上解释梯度下降算法原理，最后实现一个简单的梯度下降算法实例！梯度下降的场景假设梯度下降法的基本思想可以类比为一个下山的过程。假设这样一个场景：一个人被困在山上，需要从山上下来(i.e.找
退火模拟算法c语言程序,模拟退火算法实例（c++ 与 c# 实现） weixin_39799825 退火模拟算法c语言程序
此片文章主要参考CSDN博主里头的一篇文章，将自己的理解写下来，以方便后期的查阅。一、C++实现1.已知平面上若干点坐标(xi,yi),求平面上一点p(x,y),到这些点的总距离最小。思路：取所有点的均值为目标点。计算全部点与目标点求差值的和，将目标点以一定系数朝着总和的方向移动，得到新的目标点。//求最小距离//限制条件：10.02)//0.02为温度的下限，若温度为temp达到下限，则停止搜索
贪心算法之找零钱奋进的大脑袋贪心算法算法
贪心算法是一种在每一步选择中都采取在当前状态下最优的选择，从而希望能够得到全局最优解的算法策略。下面是一个经典的贪心算法实例：找零钱问题。找零钱问题假设你是一个收银员，需要找零给客户。你有以下面额的硬币：1元、5元、10元、25元。现在需要找零n元钱，问如何用最少的硬币数量找零？#include#includestd::vectormakeChange(intamount){std::vector
分治算法之归并排序奋进的大脑袋算法排序算法数据结构
分治算法是一种将问题分解成更小子问题，然后合并子问题的解以获得原问题解的算法策略。分治算法通常包括三个步骤：分解、解决、合并。下面是一个经典的分治算法实例：归并排序。归并排序归并排序是一种经典的分治排序算法，它将一个数组分成两个子数组，分别对这两个子数组进行排序，然后合并这两个有序子数组，从而得到整个数组的有序序列。#include#includevoidmerge(std::vector&arr
Python3算法实例 1.1：动态规划之上台阶 AiFany
step.jpg问题：50级台阶的楼梯，从下往上走，每跨一步只能向上1级或者2级台阶，共有多少种走法。动态规划思想解析：假设T(50)表示所有走法的种数。当在50级台阶的时候，要么是从49级台阶一步走了1阶上来的，要么是从48级台阶一步走了2阶上来的。因此T(50)=T(49)+T(48)。同理可得 T(49)=T(48)+T(47) T(49)=T(48)+T(47) …… T(3)=T
位运算的算法实例 2bd02fb60c5b
问题：10亿个数，有两个数只出现了1次，其他的数有出现了两次，请找出这两个数分析：10亿个数，每个int数据占4个byte，10亿个数需要4G的内存，代码示例：下面的示例，使用了Integer，这将会占用更大的空间！！Listlist=Arrays.asList(1,1,3,3,4,4,7,9);intresult=list.stream().reduce(0,(o1,o2)->o1^o2);Sy
[笔记]机器学习之机器学习理论及案例分析《二》聚类二进制怪兽人工智障聚类机器学习算法
#21天学习挑战赛—机器学习#活动地址：CSDN21天学习挑战赛文章目录前言聚类聚类定义什么是簇聚类分类离群点聚类算法实例K-Means算法(k-均值算法)寻找质心最佳位置关于均值关于距离函数维度灾难定义产生的问题解决办法总结前言聚类聚类是在无标记样本的条件下将数据进行分组，从而发现天然的结构。聚类是无监督学习的主要任务，分类是监督学习的主要任务。聚类主要应用在：发现数据的潜在结构对数据进行自然分
【JS逆向学习】国家加密系列-SM算法实例诗雅颂 javascript 逆向 node npm sm 国家加密加密
SM系列1、国家加密算法介绍事实上从2010年开始，我国国家密码管理局就已经开始陆续发布了一系列国产加密算法，其中SM1、SM4、SM7、祖冲之密码（ZUC）是对称算法；SM2、SM9是非对称算法；SM3是哈希算法。目前，这些算法已广泛应用于各个领域中。其中SM2、SM3、SM4三种加密算法是比较常见的2、算法分类算法名称算法类别应用领域特点SM1对称（分组）加密算法芯片分组长度、密钥长度均为12
凝聚层次聚类及DBscan算法详解与Python实例 OverlordDuke 聚类算法 python 算法聚类
凝聚层次聚类及DBscan算法详解与Python实例凝聚层次聚类DBscan算法实例演示在本篇博客中，我们将深入探讨凝聚层次聚类（AgglomerativeHierarchicalClustering）和DBscan算法，并通过Python实例演示它们的应用。这两种算法都属于聚类算法的范畴，用于将数据点划分为不同的簇。凝聚层次聚类凝聚层次聚类是一种层次化的聚类方法，其主要思想是将每个数据点视为一个
银行家算法c++ ly@눈_눈 算法 c++开发语言
银行家算法1.银行家算法1.1银行算法家的目的1.2银行算法家的作用2.设计原理2.1银行家算法的数据结构2.2银行家算法介绍2.3安全性算法3.实验要求4.银行家算法实例5.完整代码和运行测试5.1测试结果5.2完整代码1.银行家算法1.1银行算法家的目的银行家算法是避免死锁的一种重要方法，能够有效的在资源分配的过程中，对系统的安全性进行检测。通过银行家算法设计与实现，可以加深对死锁的理解，掌握
php n个猴子围坐成,PHP_php实现猴子选大王问题算法实例，本文实例讲述了php实现猴子选 - phpStudy... CelioHsu php n个猴子围坐成
php实现猴子选大王问题算法实例本文实例讲述了php实现猴子选大王问题算法。分享给大家供大家参考。具体分析如下：一、问题：n只猴子围坐成一个圈，按顺时针方向从1到n编号。然后从1号猴子开始沿顺时针方向从1开始报数，报到m的猴子出局，再从刚出局猴子的下一个位置重新开始报数，如此重复，直至剩下一个猴子，它就是大王。设计并编写程序，实现如下功能：(1)要求由用户输入开始时的猴子数$n、报数的最后一个数$
聚类分析实例 llovew. 机器学习算法机器学习人工智能聚类 python 数据挖掘
目录层次聚类概述自底向上的合并算法相似度计算实例分别计算欧式距离值（矩阵）两个组合数据点间的距离层次聚类实例K-MEANS算法基本概念工作流程K-Means算法实例K值对结果的影响DBSCAN算法算法步骤基本步骤工作流程参数选择层次聚类概述层次聚类（HierarchicalClustering）是一种无监督学习的聚类分析方法，用于将数据集中的样本或观测值划分为不同的群集或簇。它通过计算样本之间的相
HTTP接口签名校验月犹依依 Java后端技术栈 Spring http java
文章目录为什么要签名校验常用签名校验算法实例为什么要签名校验一般对外的http接口加签的目的是防止数据被篡改。举个例子，A正在某银行网站给B转账，转入卡号和金额输入完成后生成请求报文，然后加密报文传送给银行后台。银行收到请求后，解密得到明文，然后解析得到B的卡号和转账金额等信息，继续走后续转账流程。如果传输使用对称加密算法（最常用的），客户端和服务端都是用同一个对称密钥，那么这个对称密钥就存在泄露
python进化算法工具箱_基于DEAP库的Python进化算法从入门到入土—(二)简单遗传算法实现... weixin_39738380 python进化算法工具箱
前言在上一篇中，我们已经介绍了如何在DEAP中实现进化算法的基本操作，在这一篇中我们试图将各个操作组装起来，用进化算法解决一个简单的一元函数寻优问题。进化算法实例-一元函数寻优问题描述与分析给定一个函数，求解该函数的最大值。该函数图像如下：function_visuallization该函数的最大值应该出现在处，值为。可以看到该函数有很多局部极值作为干扰项，如果进化算法过早收敛，很容易陷入某个局部
神经网络参数优化算法,神经网络算法实例说明快乐的小蓝猫算法神经网络机器学习
lms算法是什么？LMS（Leastmeansquare）算法，即最小均方误差算法。lms算法由美国斯坦福大学的BWidrow和MEHoff于1960年在研究自适应理论时提出，由于其容易实现而很快得到了广泛应用，成为自适应滤波的标准算法。在滤波器优化设计中，采用某种最小代价函数或者某个性能指标来衡量滤波器的好坏，而最常用的指标就是均方误差，也把这种衡量滤波器好坏的方法叫做均方误差准则。lms算法的
智能优化算法——模拟退火算法学不明白属于是智能优化算法算法模拟退火算法 python matlab
目录算法简介模拟退火算法的思想模拟退火算法的流程说点“人话”算法实例求解一元函数求解二元函数求解TSP问题模拟退火求TSP时，产生新解的方法参考资料本文内容均以求最小化问题为背景进行阐述（代码实例除外）算法简介模拟退火算法是一种通用的全局优化算法，为具有NP复杂性的问题提供有效的近似解，其克服了其他优化过程容易陷入局部最小的缺陷和对初值的依赖，目前被广泛的应用于生产调度、控制工程、机器学习、神经网
RSA算法基础云楼主算法密码学
算法笔记：RSA算法基础RSA算法基础简介算法基础算法详解大整数表示素数产生Euclid算法模幂算法Montgomery算法RSA算法实例RSA-CRTRSA算法基础简介RSA算法由RonRivest、AdiShamir和LeonardAdleman于1977年提出，算法名字由三人名字开头字母组成。该算法是当前公钥密码体系中的算法基础。RSA算法的安全性依赖于“大整数因字分解问题是NP-hard的
EM算法实例 Zero or One MATLAB matlab 算法数据挖掘
EM算法详解NatureBiotech在他的一篇EMtutorial文章《Do,C.B.,&Batzoglou,S.(2008).Whatistheexpectationmaximizationalgorithm?.Naturebiotechnology,26(8),897.》中，用了一个投硬币的例子来讲EM算法的思想。比如两枚硬币A和B，如果知道每次抛的是A还是B，那可以直接估计（见下图a）。如
em算法python代码_Python实现EM算法实例代码 weixin_39572316 em算法python代码
EM算法实例通过实例可以快速了解EM算法的基本思想，具体推导请点文末链接。图a是让我们预热的，图b是EM算法的实例。这是一个抛硬币的例子，H表示正面向上，T表示反面向上，参数θ表示正面朝上的概率。硬币有两个，A和B，硬币是有偏的。本次实验总共做了5组，每组随机选一个硬币，连续抛10次。如果知道每次抛的是哪个硬币，那么计算参数θ就非常简单了，如下图所示：如果不知道每次抛的是哪个硬币呢？那么，我们就需
【数据结构】算法的时间复杂度和空间复杂度宁清_ 数据结构算法数据结构排序算法 c语言深度优先遍历
Abstract一、时间复杂度1.1时间复杂度的定义1.2大O渐进法1.3最坏情况时间复杂度二、空间复杂度2.1空间复杂度的定义三、常见复杂度类型及其实例3.1经典实例3.2排序算法实例快速排序归并排序插入排序直接插入排序使用二分法优化的入排序希尔排序堆排序四、经典例题（待补充）五、重新审视学习数据结构和算法的旅程引言在算法的代码运行前，衡量一个算法的好坏，一般从时间和空间两个维度衡量，即时间复杂
KNN算法实例——鸢尾花种类预测学徒SJA 算法 python
线性回归的scikit-learn实现scikit-learn中提供了一个KNeighborClassifier类来实现k近邻法分类模型方法：fit(X,y)：训练模型predict：使用模型来预测，返回待预测样本的标记。score(X,y)：返回在（X，y）上预测的准确率。predict_proba(X)：返回样本为每种标记的概率。kneighbors([X,n_neighbors,return
神经网络模型的实际案例,神经网络模型应用实例快乐的小荣荣神经网络算法机器学习
神经网络算法实例说明有哪些？在网络模型与算法研究的基础上，利用人工神经网络组成实际的应用系统，例如，完成某种信号处理或模式识别的功能、构作专家系统、制成机器人、复杂系统控制等等。纵观当代新兴科学技术的发展历史，人类在征服宇宙空间、基本粒子，生命起源等科学技术领域的进程中历经了崎岖不平的道路。我们也会看到，探索人脑功能和神经网络的研究将伴随着重重困难的克服而日新月异。谷歌人工智能写作项目：爱发猫神经
贝叶斯分类算法实例 --根据姓名推测男女大数据_zzzzMing
一.从贝叶斯公式开始贝叶斯分类其实是利用用贝叶斯公式，算出每种情况下发生的概率，再取概率较大的一个分类作为结果。我们先来看看贝叶斯公式：P(A|B)=P(B|A)P(A)/P(B)其中P(A|B)是指在事件B发生的情况下事件A发生的概率。在贝叶斯定理中，每个名词都有约定俗成的名称：P(A|B)是已知B发生后A的条件概率，也由于得自B的取值而被称作A的后验概率。P(A)是A的先验概率（或边缘概率）。
用java语言写一个AES算法，使用AES(CBC模式)对数据进行加密或解密。加解密用到的密钥(Key)和密钥偏移量(IV)，代码实例类编写。 gb4215287 springboot java java
以下是一个使用Java编写的AES算法实例，使用AES（CBC模式）对数据进行加密和解密。代码中包括了生成随机密钥和密钥偏移量的方法。javaCopycodeimportjavax.crypto.*;importjavax.crypto.spec.IvParameterSpec;importjavax.crypto.spec.SecretKeySpec;importjava.security.In
2.算法-Python模拟退火算法实例南宫遐迩算法模拟退火算法算法机器学习 python 后端数据结构推荐算法
题记下面是python编写的模拟退火算法实例，包括全过程和解析。编写main.py文件main.py文件如下：importmathimportrandom#初始解：算法从问题的解空间中随机选择一个初始解作为当前解。#目标函数：算法需要优化的目标函数定义了解的质量。算法的目标是最小化或最大化这个函数。#温度：模拟退火算法引入了一个控制搜索过程的温度参数。温度高时，算法更容易接受比当前解质量差的解；温
1.算法-Python遗传算法实例南宫遐迩算法 python 算法开发语言数据结构推荐算法青少年编程后端
题记以下是一个python遗传算法实例，包括全过程和解析。编辑main.py文件main.py文件如下：#导入生成伪随机数的模块importrandom#随机生成初始种群#1.初始化种群，在搜索空间内随机生成一组个体，称为种群#定义函数，参数为种群数量，基因数量或者长度，随机生成的是基因defgenerate_population(size,num_genes):return[[random.ra
php java aes加密解密算法_PHP实现的简单AES加密解密算法实例 kotlit php java aes加密解密算法
本文实例讲述了PHP简单AES加密解密算法。分享给大家供大家参考，具体如下：/**实现AES加密*$str:要加密的字符串*$keys:加密密钥*$iv:加密向量*$cipher_alg:加密方式*/functionecryptdString($str,$keys="6461772803150152",$iv="8105547186756005",$cipher_alg=MCRYPT_RIJNDA
LeetCode28 KMP算法实例 WeiHoly LeetCode
题目描述：实现strStr()函数。给定一个haystack字符串和一个needle字符串，在haystack字符串中找出needle字符串出现的第一个位置(从0开始)。如果不存在，则返回-1。示例1:输入:haystack="hello",needle="ll"输出:2示例2:输入:haystack="aaaaa",needle="bba"输出:-1这道题我在自己做的时候，使用了“自以为是”的“
【期末知识点整理】算法设计与分析 samarua UtilityRoom 算法期末复习
文章目录第一部分——算法绪论算法是什么算法的目标算法的基本特征时间复杂度渐进记号第二部分——算法概述分治法蛮力法回溯法分支限界法贪心法动态规划法第三部分——算法比较动态规划VS贪心动态规划VS分治回溯VS分支限界分治VS递归第四部分——算法实例快速排序归并排序折半查找最大连续子序列和幂（子）集全排列子集树/排列树算法框架图的单源最短路径（BFS分别使用队列和优先队列）哈夫曼编码最短路径算法（Dij
贪心算法实例汇总（分糖果、加油站、面试调度）等待的疲倦数据结构算法贪心算法动态规划数据结构
大多数算法都是基于四种算法：（1）贪心算法；（2）分而治之算法（递归思想）；（3）动态规划（4）暴力法（穷举思想）贪心算法核心思想：局部最优——>整体最优对于一个复杂问题，如果暂时找不到全局最优解，就可以先把原问题拆成几个小问题（分而治之），分别求每个小问题的最优解，再把“局部最优解”叠加起来，就当做整个问题的整体最优解。【分糖果问题】老师想给孩子们分发糖果，有N个孩子站成了一条直线，老师会根据每
面向对象面向过程 3213213333332132 java
面向对象：把要完成的一件事，通过对象间的协作实现。面向过程：把要完成的一件事，通过循序依次调用各个模块实现。我把大象装进冰箱这件事为例，用面向对象和面向过程实现，都是用java代码完成。 1、面向对象 package bigDemo.ObjectOriented; /** * 大象类 * * @Description * @author FuJian
Java Hotspot: Remove the Permanent Generation bookjovi HotSpot
openjdk上关于hotspot将移除永久带的描述非常详细，http://openjdk.java.net/jeps/122 JEP 122: Remove the Permanent Generation Author Jon Masamitsu Organization Oracle Created 2010/8/15 Updated 2011/
正则表达式向前查找向后查找,环绕或零宽断言 dcj3sjt126com 正则表达式
向前查找和向后查找 1. 向前查找：根据要匹配的字符序列后面存在一个特定的字符序列(肯定式向前查找)或不存在一个特定的序列(否定式向前查找)来决定是否匹配。.NET将向前查找称之为零宽度向前查找断言。对于向前查找，出现在指定项之后的字符序列不会被正则表达式引擎返回。 2. 向后查找：一个要匹配的字符序列前面有或者没有指定的
BaseDao 171815164 seda
import java.sql.Connection; import java.sql.DriverManager; import java.sql.SQLException; import java.sql.PreparedStatement; import java.sql.ResultSet; public class BaseDao { public Conn
Ant标签详解--Java命令 g21121 Java命令
这一篇主要介绍与java相关标签的使用终于开始重头戏了，Java部分是我们关注的重点也是项目中用处最多的部分。 1
[简单]代码片段_电梯数字排列 53873039oycg 代码
今天看电梯数字排列是9 18 26这样呈倒N排列的,写了个类似的打印例子，如下: import java.util.Arrays; public class 电梯数字排列_S3_Test { public static void main(S
Hessian原理云端月影 hessian原理
Hessian 原理分析一．远程通讯协议的基本原理网络通信需要做的就是将流从一台计算机传输到另外一台计算机，基于传输协议和网络 IO 来实现，其中传输协议比较出名的有 http 、 tcp 、 udp 等等， http 、 tcp 、 udp 都是在基于 Socket 概念上为某类应用场景而扩展出的传输协
区分Activity的四种加载模式----以及Intent的setFlags aijuans android
在多Activity开发中，有可能是自己应用之间的Activity跳转，或者夹带其他应用的可复用Activity。可能会希望跳转到原来某个Activity实例，而不是产生大量重复的Activity。这需要为Activity配置特定的加载模式，而不是使用默认的加载模式。加载模式分类及在哪里配置 Activity有四种加载模式： standard singleTop
hibernate几个核心API及其查询分析 antonyup_2006 html .net Hibernate xml 配置管理
(一) org.hibernate.cfg.Configuration类读取配置文件并创建唯一的SessionFactory对象.(一般,程序初始化hibernate时创建.) Configuration co
PL/SQL的流程控制百合不是茶 oracle PL/SQL编程循环控制
PL/SQL也是一门高级语言,所以流程控制是必须要有的,oracle数据库的pl/sql比sqlserver数据库要难,很多pl/sql中有的sqlserver里面没有流程控制; 分支语句 if 条件 then 结果 else 结果 end if ; 条件语句 case when 条件 then 结果; 循环语句 loop
强大的Mockito测试框架 bijian1013 mockito 单元测试
一.自动生成Mock类在需要Mock的属性上标记@Mock注解，然后@RunWith中配置Mockito的TestRunner或者在setUp()方法中显示调用MockitoAnnotations.initMocks(this);生成Mock类即可。二.自动注入Mock类到被测试类 &nbs
精通Oracle10编程SQL(11)开发子程序 bijian1013 oracle 数据库 plsql
/* *开发子程序 */ --子程序目是指被命名的PL/SQL块，这种块可以带有参数，可以在不同应用程序中多次调用 --PL/SQL有两种类型的子程序：过程和函数 --开发过程 --建立过程：不带任何参数 CREATE OR REPLACE PROCEDURE out_time IS BEGIN DBMS_OUTPUT.put_line(systimestamp); E
【EhCache一】EhCache版Hello World bit1129 Hello world
本篇是EhCache系列的第一篇，总体介绍使用EhCache缓存进行CRUD的API的基本使用，更细节的内容包括EhCache源代码和设计、实现原理在接下来的文章中进行介绍环境准备 1.新建Maven项目 2.添加EhCache的Maven依赖 <dependency> <groupId>ne
学习EJB3基础知识笔记白糖_ bean Hibernate jboss webservice ejb
最近项目进入系统测试阶段，全赖袁大虾领导有力，保持一周零bug记录，这也让自己腾出不少时间补充知识。花了两天时间把“传智播客EJB3.0”看完了，EJB基本的知识也有些了解，在这记录下EJB的部分知识，以供自己以后复习使用。 EJB是sun的服务器端组件模型，最大的用处是部署分布式应用程序。EJB (Enterprise JavaBean)是J2EE的一部分，定义了一个用于开发基
angular.bootstrap boyitech AngularJS AngularJS API angular中文api
angular.bootstrap 描述：手动初始化angular。这个函数会自动检测创建的module有没有被加载多次，如果有则会在浏览器的控制台打出警告日志，并且不会再次加载。这样可以避免在程序运行过程中许多奇怪的问题发生。使用方法： angular .
java-谷歌面试题-给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数 bylijinnan java
public class SearchInShiftedArray { /** * 题目：给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数。 * 请在这个特殊数组中找出给定的整数。 * 解答： * 其实就是“旋转数组”。旋转数组的最小元素见http://bylijinnan.iteye.com/bl
天使还是魔鬼？都是我们制造 ducklsl 生活教育情感
----------------------------剧透请原谅，有兴趣的朋友可以自己看看电影，互相讨论哦！！！从厦门回来的动车上，无意中瞟到了书中推荐的几部关于儿童的电影。当然，这几部电影可能会另大家失望，并不是类似小鬼当家的电影，而是关于“坏小孩”的电影！自己挑了两部先看了看，但是发现看完之后，心里久久不能平
[机器智能与生物]研究生物智能的问题 comsci 生物
我想,人的神经网络和苍蝇的神经网络,并没有本质的区别...就是大规模拓扑系统和中小规模拓扑分析的区别.... 但是,如果去研究活体人类的神经网络和脑系统,可能会受到一些法律和道德方面的限制,而且研究结果也不一定可靠,那么希望从事生物神经网络研究的朋友,不如把
获取Android Device的信息 dai_lm android
String phoneInfo = "PRODUCT: " + android.os.Build.PRODUCT; phoneInfo += ", CPU_ABI: " + android.os.Build.CPU_ABI; phoneInfo += ", TAGS: " + android.os.Build.TAGS; ph
最佳字符串匹配算法（Damerau-Levenshtein距离算法）的Java实现 datamachine java 算法字符串匹配
原文：http://www.javacodegeeks.com/2013/11/java-implementation-of-optimal-string-alignment.html------------------------------------------------------------------------------------------------------------
小学5年级英语单词背诵第一课 dcj3sjt126com english word
long 长的 show 给...看，出示 mouth 口，嘴 write 写 use 用，使用 take 拿，带来 hand 手 clever 聪明的 often 经常 wash 洗 slow 慢的 house 房子 water 水 clean 清洁的 supper 晚餐 out 在外 face 脸，
macvim的使用实战 dcj3sjt126com mac vim
macvim用的是mac里面的vim, 只不过是一个GUI的APP, 相当于一个壳 1. 下载macvim https://code.google.com/p/macvim/ 2. 了解macvim :h vim的使用帮助信息 :h macvim
java二分法查找蕃薯耀 java二分法查找二分法 java二分法
java二分法查找 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 11:40:03 星期二 http:/
Spring Cache注解+Memcached hanqunfeng spring memcached
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>com.google.code.simple-spring-memcached</groupId> <artifactId>simple-s
apache commons io包快速入门 jackyrong apache commons
原文参考 http://www.javacodegeeks.com/2014/10/apache-commons-io-tutorial.html Apache Commons IO 包绝对是好东西，地址在http://commons.apache.org/proper/commons-io/，下面用例子分别介绍： 1）工具类 2
如何学习编程 lampcy java 编程 C++c
首先,我想说一下学习思想.学编程其实跟网络游戏有着类似的效果.开始的时候,你会对那些代码,函数等产生很大的兴趣,尤其是刚接触编程的人,刚学习第一种语言的人.可是,当你一步步深入的时候,你会发现你没有了以前那种斗志.就好象你在玩韩国泡菜网游似的,玩到一定程度,每天就是练级练级,完全是一个想冲到高级别的意志力在支持着你.而学编程就更难了,学了两个月后,总是觉得你好象全都学会了,却又什么都做不了,又没有
架构师之spring-----spring3.0新特性的bean加载控制@DependsOn和@Lazy nannan408 Spring3
1.前言。如题。 2.描述。 @DependsOn用于强制初始化其他Bean。可以修饰Bean类或方法，使用该Annotation时可以指定一个字符串数组作为参数，每个数组元素对应于一个强制初始化的Bean。 @DependsOn({"steelAxe","abc"}) @Comp
Spring4+quartz2的配置和代码方式调度 Everyday都不同代码配置 spring4 quartz2.x 定时任务
前言：这些天简直被quartz虐哭。。因为quartz 2.x版本相比quartz1.x版本的API改动太多，所以，只好自己去查阅底层API…… quartz定时任务必须搞清楚几个概念： JobDetail——处理类 Trigger——触发器，指定触发时间，必须要有JobDetail属性，即触发对象 Scheduler——调度器，组织处理类和触发器，配置方式一般只需指定触发
Hibernate入门 tntxia Hibernate
前言使用面向对象的语言和关系型的数据库，开发起来很繁琐，费时。由于现在流行的数据库都不面向对象。Hibernate 是一个Java的ORM（Object/Relational Mapping）解决方案。 Hibernte不仅关心把Java对象对应到数据库的表中，而且提供了请求和检索的方法。简化了手工进行JDBC操作的流程。如
Math类 xiaoxing598 Math
一、Java中的数字（Math）类是final类，不可继承。 1、常数 PI：double圆周率 E：double自然对数 2、截取（注意方法的返回类型） double ceil(double d) 返回不小于d的最小整数 double floor(double d) 返回不大于d的整最大数 int round(float f) 返回四舍五入后的整数 long round