llovew.

聚类分析实例

目录

层次聚类概述

自底向上的合并算法

相似度计算

实例

分别计算欧式距离值（矩阵）

两个组合数据点间的距离

层次聚类实例

K-MEANS 算法

基本概念

工作流程

K-Means算法实例

K值对结果的影响

DBSCAN 算法

算法步骤

基本步骤

工作流程

参数选择

层次聚类概述

层次聚类（Hierarchical Clustering）是一种无监督学习的聚类分析方法，用于将数据集中的样本或观测值划分为不同的群集或簇。它通过计算样本之间的相似性或距离来进行聚类，并且可以根据相似性的程度来构建层次结构。

通过计算不同类别数据点间的相似度来创建一棵有层次的嵌套聚类树。在聚类树中，不同类别的原始数据点是树的最低层，树的顶层是一个聚类的根节点。创建聚类树有自下而上合并和自上而下分裂两种方法。

论数据集应该聚类成多少个簇，通常是在讨论我们在什么尺度上关注这个数据集。层次聚类算法相比划分聚类算法的优点之一是可以在不同的尺度上（层次）展示数据集的聚类情况。

层次聚类有两种主要的方法：凝聚聚类和分裂聚类。

凝聚聚类（Agglomerative Clustering）是一种自底向上的聚类方法，它从单个样本开始，逐渐合并相似的样本或簇，直到形成最终的聚类结果。凝聚聚类的步骤如下：
- 计算样本之间的相似性或距离。
- 将每个样本作为一个单独的簇。
- 不断合并最相似的簇，直到达到预设的停止条件（如设定簇的数量或某个相似性阈值）。
凝聚聚类的结果是一棵二叉树，称为聚类树或树状图，其中每个节点表示一个样本或簇，较低层次的节点表示较小的簇，较高层次的节点表示更大的簇。
分裂聚类（Divisive Clustering）是一种自顶向下的聚类方法，它从整个样本集开始，逐渐划分为更小的簇，直到每个簇只包含一个样本。分裂聚类的步骤如下：
- 计算样本之间的相似性或距离。
- 将整个样本集视为一个簇。
- 选择一个合适的划分方法，将当前簇划分为较小的子簇。
- 对每个子簇递归地应用划分方法，直到每个簇只包含一个样本或达到预设的停止条件。

自底向上的合并算法

层次聚类的合并算法通过计算两类数据点间的相似性，对所有数据点中最为相似的两个数据点进行组合，并反复迭代这一过程。简单的说层次聚类的合并算法是通过计算每一个类别的数据点与所有数据点之间的距离来确定它们之间的相似性，距离越小，相似度越高。并将距离最近的两个数据点或类别进行组合，生成聚类树。

相似度计算

层次聚类使用欧式距离来计算不同类别数据点间的距离（相似度）。

实例

分别计算欧式距离值（矩阵）

将数据点B与数据点C进行组合后，重新计算各类别数据点间的距离矩阵。数据点间的距离计算方式与之前的方法一样。这里需要说明的是组合数据点(B,C)与其他数据点间的计算方法。当我们计算(B,C)到A的距离时，需要分别计算B到A和C到A的距离均值。

经过计算数据点D到数据点E的距离在所有的距离值中最小，为1.20。这表示在当前的所有数据点中（包含组合数据点），D和E的相似度最高。因此我们将数据点D和数据点E进行组合。并再次计算其他数据点间的距离。

后面的工作就是不断的重复计算数据点与数据点，数据点与组合数据点间的距离。这个步骤应该由程序来完成。这里由于数据量较小，我们手工计算并列出每一步的距离计算和数据点组合的结果。

两个组合数据点间的距离

计算两个组合数据点间距离的方法有三种，分别为Single Linkage，Complete Linkage和Average Linkage。在开始计算之前，我们先来介绍下这三种计算方法以及各自的优缺点。

Single Linkage：方法是将两个组合数据点中距离最近的两个数据点间的距离作为这两个组合数据点的距离。这种方法容易受到极端值的影响。两个很相似的组合数据点可能由于其中的某个极端的数据点距离较近而组合在一起。
Complete Linkage：Complete Linkage的计算方法与Single Linkage相反，将两个组合数据点中距离最远的两个数据点间的距离作为这两个组合数据点的距离。Complete Linkage的问题也与Single Linkage相反，两个不相似的组合数据点可能由于其中的极端值距离较远而无法组合在一起。
Average Linkage：Average Linkage的计算方法是计算两个组合数据点中的每个数据点与其他所有数据点的距离。将所有距离的均值作为两个组合数据点间的距离。这种方法计算量比较大，但结果比前两种方法更合理。

我们使用Average Linkage计算组合数据点间的距离。下面是计算组合数据点(A,F)到(B,C)的距离，这里分别计算了(A,F)和(B,C)两两间距离的均值。

层次聚类实例

import pandas as pd

seeds_df = pd.read_csv('./datasets/seeds-less-rows.csv')
seeds_df.head()

seeds_df.grain_variety.value_counts()  

varieties = list(seeds_df.pop('grain_variety'))

samples = seeds_df.values

#距离计算的 还有树状图
from scipy.cluster.hierarchy import linkage, dendrogram
import matplotlib.pyplot as plt

#进行层次聚类
mergings = linkage(samples, method='complete')

#树状图结果
fig = plt.figure(figsize=(10,6))
dendrogram(mergings,
           labels=varieties,
           leaf_rotation=90,
           leaf_font_size=6,
)
plt.show()

#得到标签结果
#maximum height自己指定
from scipy.cluster.hierarchy import fcluster
labels = fcluster(mergings, 6, criterion='distance')

df = pd.DataFrame({'labels': labels, 'varieties': varieties})
ct = pd.crosstab(df['labels'], df['varieties'])


#不同距离的选择会产生不同的结果
import pandas as pd

scores_df = pd.read_csv('./datasets/eurovision-2016-televoting.csv', index_col=0)
country_names = list(scores_df.index)
scores_df.head()

#缺失值填充，没有的就先按满分算吧
scores_df = scores_df.fillna(12)

from sklearn.preprocessing import normalize
samples = normalize(scores_df.values)
samples

from scipy.cluster.hierarchy import linkage, dendrogram
import matplotlib.pyplot as plt

mergings = linkage(samples, method='single')
fig = plt.figure(figsize=(10,6))
dendrogram(mergings,
           labels=country_names,
           leaf_rotation=90,
           leaf_font_size=6,
)
plt.show()



mergings = linkage(samples, method='complete')
fig = plt.figure(figsize=(10,6))
dendrogram(mergings,
           labels=country_names,
           leaf_rotation=90,
           leaf_font_size=6,
)
plt.show()

K-MEANS 算法

K-Means算法是一种无监督学习算法，用于将数据集划分为K个互不重叠的簇(cluster)。

基本概念

1.要得到簇的个数，需指定K值

2.质心：均值，即向量各维度取平均

3.距离的度量：常用欧氏距离和余弦相似度（需先标准化）

4.优化目标

工作流程

优势：简单、快速、适合常规数据集

劣势：K值难确定、对初始值的稳定性效果极差需要多做几次实验求平均值、复杂度与样本呈线性关系、很难发现任意(比较奇怪)形状的簇。

K-Means算法的目标是最小化簇内数据点与各自簇中心的距离之和（也被称为“簇内平方和”或“SSE”）。它是一种迭代的过程，不保证找到全局最优解，因此初始聚类中心的选择会对结果产生影响。

K-Means算法实例

import pandas as pd

df = pd.read_csv('./datasets/ch1ex1.csv')
points = df.values
df.head()

#散点图观察
import matplotlib.pyplot as plt
xs = points[:,0]
ys = points[:,1]
plt.scatter(xs, ys)
plt.show()

#聚类操作
df = pd.read_csv('./datasets/ch1ex1.csv')
points = df.values

from sklearn.cluster import KMeans
model = KMeans(n_clusters=3)
model.fit(points)
labels = model.predict(points)
labels

#聚类中心
centroids = model.cluster_centers_
centroids_x = centroids[:,0]
centroids_y = centroids[:,1]

plt.scatter(xs, ys, c=labels)
plt.scatter(centroids_x, centroids_y, marker='X', s=200)
plt.show()

K值对结果的影响

import pandas as pd

seeds_df = pd.read_csv('./datasets/seeds.csv')

varieties = list(seeds_df['grain_variety'])

del seeds_df['grain_variety']

seeds_df.head()

samples = seeds_df.values

from sklearn.cluster import KMeans

ks = range(1, 6)
inertias = []

for k in ks:
    # Create a KMeans instance with k clusters: model
    model = KMeans(n_clusters=k)

    # Fit model to samples
    model.fit(samples)

    # Append the inertia to the list of inertias
    inertias.append(model.inertia_)

import matplotlib.pyplot as plt

# Plot ks vs inertias
plt.plot(ks, inertias, '-o')
plt.xlabel('number of clusters, k')
plt.ylabel('inertia')
plt.xticks(ks)
plt.show()

DBSCAN 算法

DBSCAN（Density-Based Spatial Clustering of Applications with Noise）是一种无监督学习算法（传销发展下线算法），用于将数据点划分为不同的密度相连的簇(cluster)，并且可以识别噪声数据点。

算法步骤

初始化：选择一个未访问的数据点。
密度可达（Density-Reachable）和密度相连（Density-Connected）：以该数据点为中心，以一个给定的半径(ε)来判断与其距离在半径范围内的数据点是否足够密集，如果密度足够大，那么这些数据点被认为是与该数据点密度可达。如果一个数据点与另一个密度可达的数据点相互之间密度可达，那么它们被认为是密度相连的。
核心点（Core Point）和边界点（Border Point）：如果一个数据点周围半径范围内的数据点数目大于等于一个给定的阈值(MinPts)，那么它被认为是一个核心点。否则，它可能是一个边界点。
扩展簇：从一个核心点出发，通过密度可达和密度相连的规则找到所有与之相关的数据点，并将它们分配到同一个簇中。重复该过程，直到无法再找到新的密度相连点。
单独点（Noise Points）：未归类到任何簇中的数据点被认为是噪声点。

DBSCAN算法的主要优点是可以自动识别任意形状和大小的簇，并且能够有效处理噪声数据。它不需要预先指定簇的数目，并且对初始参数的选择相对不敏感。然而，DBSCAN算法的性能在处理高维数据和不同密度的簇时可能会下降。

在使用DBSCAN时，需要调整两个关键参数：半径(ε)和邻域中的最小数据点数(MinPts)。适当选择这些参数对于获得良好的聚类结果至关重要，并且需要根据具体情况进行实验和调试。

基本步骤

工作流程

参数选择

半径ϵ：可以根据K距离来设定：找突变点
K距离：给定数据集P={p(i); i=0,1,…n}，计算点P(i)到集合D的子集S中所有点之间的距离，距离按照从小到大的顺序排序，d(k)就被称为k-距离。
MinPts： k-距离中k的值，一般取的小一些，多次尝试

优势：

不需要指定簇个数
可以发现任意形状的簇
擅长找到离群点（检测任务）
两个参数就够了

劣势：

高维数据有些困难（可以做降维）
参数难以选择（参数对结果的影响非常大）
Sklearn中效率很慢（数据削减策略）

可视化小工具：https://www.naftaliharris.com/blog/visualizing-dbscan

clustering/

你可能感兴趣的:(机器学习,算法,机器学习,人工智能,聚类,python,数据挖掘)

C++自研游戏引擎-碰撞检测组件-八叉树AABB检测算法实现千年奇葩三维引擎 c++人工智能算法八叉树
八叉树碰撞检测是一种在三维空间中高效处理物体碰撞检测的算法，其原理可以类比为一个管理三维空间物体的智能系统。这个示例包含两个部分：八叉树部分用于宏观检测，AABB用于微观检测。AABB可以更换为均值或节点检测来提高检测精度。八叉树的构建确定根节点范围首先要为整个碰撞检测系统确定一个初始范围，这就像是为所有参与碰撞检测的物体划定一个“活动区域”。这个范围是一个能够完全容纳所有待检测物体的三维立方体空
券商api有哪些用途？如何申请和使用券商api进行股票交易？股票程序化交易接口量化交易股票API接口 Python股票量化交易大数据券商api 股票交易申请使用股票量化接口股票API接口
Python股票接口实现查询账户，提交订单，自动交易（1）Python股票程序交易接口查账，提交订单，自动交易（2）股票量化，Python炒股，CSDN交流社区>>>自动化交易功能券商API允许投资者编写程序来实现自动化交易。在股票市场中，价格波动瞬息万变，人工交易可能会因为反应速度慢而错过最佳交易时机。通过自动化交易程序，利用券商API，可以根据预设的交易策略，如当股票价格达到某个设定值时自动买
python中session的使用白桃提拉米苏
使用场景：当接口之间有cookie数据之间的传递的情况下为了确保接口之间cookie数据传递，一定要使用同一个session对象接口返回的cookie数据，存储在session对象中#1.创建session对象session=requests.session()#2.使用session对象，实现之后所有的接口请求session.get()session.post()session.put()举例#
本地部署model scope魔搭大模型流程 CQller python 算法深度学习机器学习 jupyter pytorch
一、安装python二、安装Gradio三、添加镜像加速四、运行字符串倒叙五、运行绘图六、安装常用软件包和库七、我目前使用的软件包和库简介八、文字生成图片AI模型九、文字回复AI模型一、安装python可参考安装步骤：python学习笔记-python安装与环境变量配置_python环境变量-CSDN博客二、安装Gradio在cmd执行以下命令。Gradio封装了功能丰富的前端用户界面，一会儿用来
Python中的Session和Cookie详解闲人编程进阶算法案例 python 开发语言 cookie session 网络爬虫
目录Python中的Session和Cookie详解引言一、Cookie1.1Cookie的基本概念1.2Cookie的工作原理1.3Cookie的基本属性1.4Python中Cookie的实现1.4.1Cookie实现代码1.5使用案例二、Session2.1Session的基本概念2.2Session的工作原理2.3Session的优点2.4Python中Session的实现2.4.1Sess
DeepSeek 混合专家（MoE）架构技术原理剖析计算机学长通用大语言模型人工智能架构
DeepSeek混合专家（MoE）架构技术原理剖析在人工智能快速发展的当下，大规模语言模型不断突破创新，DeepSeek混合专家（MoE）架构脱颖而出，成为业内关注焦点。本文将深入剖析其技术原理，为大家揭开它的神秘面纱。一、MoE架构概述（一）基本概念混合专家（MixtureofExperts，MoE）架构，简单来说，就像是一个专家团队。在这个团队里，每个专家都是一个小型神经网络，各自擅长处理特定
应用行为检测工具【python源码】 PaceCN python
使用说明基于python编写的应用行为检测工具源码。1、选择你想检测的exe文件，点击启动检测，等待日志显示。2、工具会自动检测启动的进程并显示在左侧3、在启动检测软件如果有DLL加载、网络连接、文件修改、子程序创建、注册表操作会显示在日志窗口4、支持日志另存为，方便查询用(将日志直接丢给AI，然后问它是否存在行为风险)日志查询示例日志信息分析1.日志内容概述进程创建：日志记录了QQMusic.e
Python的那些事第二十三篇：Express（Node.js）与 Python：一场跨语言的浪漫邂逅暮雨哀尘 Python的那些事 linux python node.js express 服务器开发语言 web开发
摘要在当今的编程世界里，Node.js和Python像是两个性格迥异的超级英雄，一个以速度和灵活性著称，另一个则以强大和优雅闻名。本文将探讨如何通过Express框架将Node.js和Python结合起来，打造出一个高效、有趣的Web应用。我们将通过一系列幽默风趣的实例和表格，展示这种跨语言合作的无限可能。如果你厌倦了单调的技术论文，那么这篇论文绝对能让你眼前一亮！1.引言：当Node.js遇上P
【深度解析】ICLR：人工智能领域的顶级学术会议 | 顶会与SCI期刊的区别全攻略 X_taiyang18 人工智能
【深度解析】ICLR：人工智能领域的顶级学术会议|顶会与SCI期刊的区别全攻略简介在人工智能和机器学习领域，ICLR（InternationalConferenceonLearningRepresentations）被誉为“深度学习的顶级会议”。自2013年由深度学习三巨头中的YoshuaBengio和YannLeCun创办以来，ICLR迅速崛起，成为全球科研人员争相投稿的学术盛会。那么，ICLR
30.4:Python如何安装Pandas库？（课程共4100字）小兔子平安 Python完整学习全解答 python pandas 开发语言
课程概述（课程共4100字）①安装Pandas库打开命令提示符或终端窗口，输入以下命令来安装Pandas：当安装完成后，可以使用以下命令来验证Pandas是否已正确安装：②数据处理和分析读写数据数据清洗和预处理数据分组和聚合数据可视化③Python学习的深入讨论Python的应用领域Python的优点和缺点学习Python的建议学习Python的挑战课程总结课程概述Python是一种功能强大的编程
python画二维矩阵图_基于python 二维数组及画图的实例详解 weixin_39785400 python画二维矩阵图
1、二维数组取值注：不管是二维数组，还是一维数组，数组里的数据类型要一模一样，即若是数值型，全为数值型#二维数组importnumpyasnplist1=[[1.73,1.68,1.71,1.89,1.78],[54.4,59.2,63.6,88.4,68.7]]list3=[1.73,1.68,1.71,1.89,1.78]list4=[54.4,59.2,63.6,88.4,68.7]list
使用多模态大语言模型进行深度学习的图像、文本和语音数据增强数行天下人工智能语言模型深度学习人工智能自然语言处理
在过去的五年里，研究方向已从传统的机器学习（ML）和深度学习（DL）方法转向利用大语言模型（LLMs），包括多模态方法，用于数据增强，以提高泛化能力，并在训练深度卷积神经网络时防止过拟合。然而，现有的综述文章主要集中于机器学习和深度学习技术或有限的模态（如文本或图像），在涵盖LLM方法的最新进展和多模态应用方面仍存在空白。本文通过探索利用多模态LLMs进行图像、文本和语音数据增强的最新文献，填补了
《深入浅出LLM基础篇》（三）：大模型结构分类 GoAI 深入浅出LLM 深入浅出AI 自然语言处理NLP 大模型 LLM 人工智能 transformer chatgpt
AI学习星球推荐：GoAI的学习社区知识星球是一个致力于提供《机器学习|深度学习|CV|NLP|大模型|多模态|AIGC》各个最新AI方向综述、论文等成体系的学习资料，配有全面而有深度的专栏内容，包括不限于前沿论文解读、资料共享、行业最新动态以、实践教程、求职相关（简历撰写技巧、面经资料与心得）多方面综合学习平台，强烈推荐AI小白及AI爱好者学习，性价比非常高！加入星球➡️点击链接✨专栏介
本地部署 DeepSeek：环境准备 + 详细步骤 + 高级部署方案 + 可视化工具集成 + 故障排除手册 + 性能优化建议 Katie。人工智能技术发展 ai deepseek 人工智能人工智能大模型
前言随着人工智能技术的迅猛发展，大语言模型（LLM）在多个行业中的应用日益广泛，从自然语言处理、内容生成到智能客服、医疗诊断等领域，AI正在深刻改变传统的工作方式和业务流程。DeepSeek作为一家新兴的AI公司，凭借其高效的AI模型和开源的优势，迅速在竞争激烈的AI市场中脱颖而出。其模型不仅在性能上表现出色，还通过开源策略吸引了大量开发者和企业的关注，形成了一个活跃的社区生态。然而，随着AI技术
解决linux中pip速度过慢问题江城闲鹤 linux pip python
在Linux系统下，如果你发现使用pip下载Python库时速度非常慢，可以考虑以下几种方法来加速下载：使用pip的-i选项：如果你只想临时使用其他镜像，可以在安装时加上-i选项：pipinstallpackage_name-ihttps://mirrors.aliyun.com/pypi/simple/
【论文精读】MotionLM EEPI 自动驾驶深度学习论文阅读
【论文精读】MotionLM1背景2存在的问题3具体方案轨迹转运动序列模型轨迹去重和聚类loss1背景团队：Waymo时间：2023.9代码：简介：采用自回归的方式做轨迹生成，能够更好地建模交互，且避免模态坍缩，在数据集达到了SOTA。2存在的问题轨迹回归方面：原本xy预测认为空间过大，有的xy很大（t大速度快的时候），有的xy很小（t小速度慢的时候）。3具体方案Encoder采用了之前的论文Wa
数字内容体验未来趋势：五大平台横向对比与深度解析清风徐徐de来其他
内容概要当前，企业数字化转型的核心战场正逐步向数字内容体验的精细化运营转移。随着用户行为碎片化与需求多元化趋势加剧，AI驱动的智能推荐系统、基于数据决策的动态优化能力，以及跨渠道的品牌一致性维护，已成为衡量内容平台竞争力的三大核心维度。本文将围绕这三大支柱，通过横向对比主流平台的技术架构与落地实践，揭示未来数字内容体验的演进方向。首先，AI驱动不仅改变了内容分发的效率，更通过深度学习算法实现用户行
全面解析：AI大模型入门教程，让你的学习之路不再迷茫，这个大模型学习路线非常详细收藏这篇就够了！ AGI大模型老王人工智能学习大模型 AI大模型大模型学习大模型教程大模型入门
前言AI大模型，作为当前人工智能领域的热点，凭借其强大的处理复杂数据和任务的能力，受到广泛的关注和应用。无论你是技术小白还是有一定基础的开发者，本教程都将带你从入门到实践，逐步掌握AI大模型的核心技术。基础知识大模型概述定义：AI大模型是一种拥有海量参数和强大计算能力的神经网络模型，能够处理复杂的数据和任务。应用：广泛应用于自然语言处理、图像识别、生成等领域。学习大模型的意义提升技术能力：掌握大模
共享内存的数据结构 ——循环队列+信息量 ——互斥锁、多进程的消费者模型源码模型测试代码 C++ sevenysq 数据结构 c++centos linux
前言：简单来说，共享内存不能自动扩展，申请多少就是多少，而且只能用C++内置的数据类型。也不能用STL容器，例如vector会自动扩展，容易造成内存泄漏，越界等问题。移动语义也不能用。要想实现多进程的生产/消费者模型只能采用循环队列。循环队列类值得一提的是这里面头尾指针的移动算法：（指针+1）取最大长度的余数。其他都很简单。#include#include#include#include#incl
Linux常见的性能优化策略这多冒昧啊 linux 服务器运维
目录1.CPU性能优化：调整进程优先级2.内存优化：禁用透明大页3.磁盘I/O优化：切换I/O调度器4.网络优化：TCP缓冲区调优5.文件句柄优化：高并发API服务器策略总结：1.CPU性能优化：调整进程优先级场景描述：某跨境电商平台在“黑色星期五”大促期间，订单处理系统（Java服务）出现响应延迟。运维团队通过pidstat-u1发现名为log_aggregator的Python日志收集进程（P
众英达赏聘：人才与机会的完美交汇点 xjxijd 招聘
在信息化高速发展的今天，无论是企业还是求职者，都渴望能够在一个高效、便捷、精准的平台上找到彼此。众英达赏聘，正是这样一个致力于连接人才与机会的综合性招聘平台。众英达赏聘凭借其独特的算法和精准匹配技术，能够迅速分析用户的需求和特点，为企业和求职者提供个性化的推荐服务。无论是正在寻找优秀团队的企业，还是正在寻找理想工作岗位的求职者，都能在众英达赏聘上找到满意的选择。一个以企业招聘为主并融合本地生活出行
SaaS+AI工具推荐：最适合智能化转型的解决方案 saas
不论是传统软件还是SaaS，其核心目标始终如一——帮助企业解决问题、提升效率。然而，随着技术的飞速发展，SaaS正在超越传统模式，尤其是在与AI（人工智能）的深度融合中展现出了强大的潜力。这种“智能化”的转型不仅让企业获得了更具针对性和效率的服务，还让解决问题的方式更加灵活和高效。下面我们将从“更好的解决方案”和“智能化技术应用”两个层面，探讨SaaS在企业问题解决中的新路径。SaaS+AI：智能
第2节课：深度学习基础python代码 Lips611 李哥深度学习 python 深度学习神经网络
目录编译环境：代码：文件：ds_0.py小结：python声明不需要定义，整型和浮点型都是直接给予值，字符串的[-2]代表是列表倒数的某值;同一列表里面可以有各种类型的变量;哈希表的键值对在打印时是调用字典[key]，然后输出对应的value文件：judge_0.py小结：python相对于c语言，是将（）换成空格和“：”，与此同时判断语句if和else的缩进不同对应着不同层次的判定条件，约等于“
w214多媒体素材库的设计与实现栗豆包 java spring boot 后端 java spring maven
作者简介：多年一线开发工作经验，原创团队，分享技术代码帮助学生学习，独立完成自己的网站项目。代码可以查看文章末尾⬇️联系方式获取，记得注明来意哦~赠送计算机毕业设计600个选题excel文件，帮助大学选题。赠送开题报告模板，帮助书写开题报告。作者完整代码目录供你选择：《Springboot网站项目》400套《ssm网站项目》800套《小程序项目》300套《App项目》500套《Python网站项目
Pandas与Python数据类型对应表南希圆子 python pycharm pytorch
作为初学者，要注意pands与python数据类型是不一样的，如object数据类型对应的是Python的字符型
算法刷题--哈希表--字母异位词和两个数组的交集 Bruce Jue LeetCode刷题算法散列表哈希算法
哈希表概念哈希表是根据关键码的值而直接进行访问的数据结构。直白来讲数组就是一种哈希表。那么哈希表能解决什么问题呢，一般哈希表都是用来快速判断一个元素是否出现集合里。那么一般都是将一个集合里面的元素映射为哈希表的索引。那么设计哈希表的时候需要考虑以下原则：均匀性，尽可能让不同key均匀分布到哈希表中；高效性；覆盖性，确保所有key都能映射到哈希表范围内。当多个元素映射到同一个索引时，这种现象叫做哈希
用python写一个聊天室程序酷爱码 Python python 服务器网络
下面是一个简单的基于Socket的Python聊天室程序示例，包括服务器端和客户端：服务器端代码：importsocketimportthreadingdefhandle_client(client,address):print(f"Newconnectionfrom{address}")whileTrue:msg=client.recv(1024).decode()ifnotmsg:breakp
Py的Pandas：Python pandas库的详细介绍、安装和使用方法追逐程序梦想者 pandas python 数据分析
Py的Pandas：Pythonpandas库的详细介绍、安装和使用方法Pandas是一个Python的数据处理库，它提供了快速、灵活、易用且高效的数据结构来进行数据操作。在数据挖掘、数据分析等领域中，Pandas被广泛应用。本文主要介绍Pandas的安装、基本数据结构、数据读写、数据统计以及数据可视化等方面。安装在命令行中使用pip工具安装Pandas：pipinstallpandas基本数据结
Rasa：开源的机器学习框架 Indra_ran 开源机器学习人工智能 linux centos 运维
一、Rasa简介Rasa是一套用来构建基于上下文的AI小助手和聊天机器人框架。分为两个主要的模块：NLU：自然语言理解模块，实现意图识别以及槽值的提取，将用户的输入转化为结构性数据，在训练过程中，为了提高从用户信息的实体识别能力，采用了预先训练的实体提取器Pre-trainedEntityExtractors，正则表达式Regexes，同义词Synonyms等RasaCore：对话管理模块，也是一
Python图形界面 Tkinter入门13 mango大侠 Python python 开发语言 tkinter
13.1多输入框fromtkinterimport*root=Tk()root.title('主窗口')root.geometry('800x400')#遍历输入框内容到列表my_entries=[]my_entries=[]defsomething():entry_list=''forentriesinmy_entries:entry_list=entry_list+str(entries.ge
java的(PO,VO,TO,BO,DAO,POJO) Cb123456 VO TO BO POJO DAO
转: http://www.cnblogs.com/yxnchinahlj/archive/2012/02/24/2366110.html ------------------------------------------------------------------- O/R Mapping 是 Object Relational Mapping（对象关系映
spring ioc原理（看完后大家可以自己写一个spring） aijuans spring
最近，买了本Spring入门书：spring In Action 。大致浏览了下感觉还不错。就是入门了点。Manning的书还是不错的，我虽然不像哪些只看Manning书的人那样专注于Manning,但怀着崇敬的心情和激情通览了一遍。又一次接受了IOC 、DI、AOP等Spring核心概念。先就IOC和DI谈一点我的看法。IO
MyEclipse 2014中Customize Persperctive设置无效的解决方法 Kai_Ge MyEclipse2014
高高兴兴下载个MyEclipse2014，发现工具条上多了个手机开发的按钮，心生不爽就想弄掉他！结果发现Customize Persperctive失效！！有说更新下就好了，可是国内Myeclipse访问不了，何谈更新... so~这里提供了更新后的一下jar包，给大家使用！ 1、将9个jar复制到myeclipse安装目录\plugins中 2、删除和这9个jar同包名但是版本号较
SpringMvc上传 120153216 springMVC
@RequestMapping(value = WebUrlConstant.UPLOADFILE) @ResponseBody public Map<String, Object> uploadFile(HttpServletRequest request,HttpServletResponse httpresponse) { try { //
Javascript----HTML DOM 事件何必如此 JavaScript html Web
HTML DOM 事件允许Javascript在HTML文档元素中注册不同事件处理程序。事件通常与函数结合使用，函数不会在事件发生前被执行！注：DOM：指明使用的 DOM 属性级别。 1.鼠标事件属性
动态绑定和删除onclick事件 357029540 JavaScript jquery
因为对JQUERY和JS的动态绑定事件的不熟悉，今天花了好久的时间才把动态绑定和删除onclick事件搞定!现在分享下我的过程。在我的查询页面，我将我的onclick事件绑定到了tr标签上同时传入当前行(this值)参数，这样可以在点击行上的任意地方时可以选中checkbox，但是在我的某一列上也有一个onclick事件是用于下载附件的，当
HttpClient|HttpClient请求详解 7454103 apache 应用服务器网络协议网络应用 Security
HttpClient 是 Apache Jakarta Common 下的子项目，可以用来提供高效的、最新的、功能丰富的支持 HTTP 协议的客户端编程工具包，并且它支持 HTTP 协议最新的版本和建议。本文首先介绍 HTTPClient，然后根据作者实际工作经验给出了一些常见问题的解决方法。HTTP 协议可能是现在 Internet 上使用得最多、最重要的协议了，越来越多的 Java 应用程序需
递归逐层统计树形结构数据 darkranger 数据结构
将集合递归获取树形结构: /** * * 递归获取数据 * @param alist:所有分类 * @param subjname:对应统计的项目名称 * @param pk:对应项目主键 * @param reportList: 最后统计的结果集 * @param count:项目级别 */ public void getReportVO(Arr
访问WEB-INF下使用frameset标签页面出错的原因 aijuans struts2
<frameset rows="61,*,24" cols="*" framespacing="0" frameborder="no" border="0">
MAVEN常用命令 avords
Maven库： http://repo2.maven.org/maven2/ Maven依赖查询： http://mvnrepository.com/ Maven常用命令： 1. 创建Maven的普通java项目： mvn archetype:create -DgroupId=packageName
PHP如果自带一个小型的web服务器就好了 houxinyou apache 应用服务器 Web PHP 脚本
最近单位用PHP做网站，感觉PHP挺好的，不过有一些地方不太习惯，比如，环境搭建。PHP本身就是一个网站后台脚本，但用PHP做程序时还要下载apache，配置起来也不太很方便，虽然有好多配置好的apache+php+mysq的环境，但用起来总是心里不太舒服，因为我要的只是一个开发环境，如果是真实的运行环境，下个apahe也无所谓，但只是一个开发环境，总有一种杀鸡用牛刀的感觉。如果php自己的程序中
NoSQL数据库之Redis数据库管理(list类型) bijian1013 redis 数据库 NoSQL
3.list类型及操作 List是一个链表结构，主要功能是push、pop、获取一个范围的所有值等等，操作key理解为链表的名字。Redis的list类型其实就是一个每个子元素都是string类型的双向链表。我们可以通过push、pop操作从链表的头部或者尾部添加删除元素，这样list既可以作为栈，又可以作为队列。 &nbs
谁在用Hadoop？ bingyingao hadoop 数据挖掘公司应用场景
Hadoop技术的应用已经十分广泛了，而我是最近才开始对它有所了解，它在大数据领域的出色表现也让我产生了兴趣。浏览了他的官网，其中有一个页面专门介绍目前世界上有哪些公司在用Hadoop，这些公司涵盖各行各业，不乏一些大公司如alibaba,ebay,amazon,google,facebook,adobe等，主要用于日志分析、数据挖掘、机器学习、构建索引、业务报表等场景,这更加激发了学习它的热情。
【Spark七十六】Spark计算结果存到MySQL bit1129 mysql
package spark.examples.db import java.sql.{PreparedStatement, Connection, DriverManager} import com.mysql.jdbc.Driver import org.apache.spark.{SparkContext, SparkConf} object SparkMySQLInteg
Scala: JVM上的函数编程 bookjovi scala erlang haskell
说Scala是JVM上的函数编程一点也不为过，Scala把面向对象和函数型编程这两种主流编程范式结合了起来，对于熟悉各种编程范式的人而言Scala并没有带来太多革新的编程思想，scala主要的有点在于Java庞大的package优势，这样也就弥补了JVM平台上函数型编程的缺失，MS家.net上已经有了F#，JVM怎么能不跟上呢？对本人而言
jar打成exe bro_feng java jar exe
今天要把jar包打成exe，jsmooth和exe4j都用了。遇见几个问题。记录一下。两个软件都很好使，网上都有图片教程，都挺不错。首先肯定是要用自己的jre的，不然不能通用，其次别忘了把需要的lib放到classPath中。困扰我很久的一个问题是，我自己打包成功后，在一个同事的没有装jdk的电脑上运行，就是不行，报错jvm.dll为无效的windows映像，如截图最后发现
读《研磨设计模式》-代码笔记-策略模式-Strategy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 策略模式定义了一系列的算法，并将每一个算法封装起来，而且使它们还可以相互替换。策略模式让算法独立于使用它的客户而独立变化简单理解： 1、将不同的策略提炼出一个共同接口。这是容易的，因为不同的策略，只是算法不同，需要传递的参数
cmd命令值cvfM命令 chenyu19891124 cmd
cmd命令还真是强大啊。今天发现jar -cvfM aa.rar @aaalist 就这行命令可以根据aaalist取出相应的文件例如：在d：\workspace\prpall\test.java 有这样一个文件，现在想要将这个文件打成一个包。运行如下命令即可比如在d：\wor
OpenJWeb(1.8) Java Web应用快速开发平台 comsci java 框架 Web 项目管理企业应用
OpenJWeb(1.8) Java Web应用快速开发平台的作者是我们技术联盟的成员，他最近推出了新版本的快速应用开发平台 OpenJWeb(1.8)，我帮他做做宣传 OpenJWeb快速开发平台以快速开发为核心，整合先进的java 开源框架，本着自主开发+应用集成相结合的原则，旨在为政府、企事业单位、软件公司等平台用户提供一个架构透
Python 报错：IndentationError: unexpected indent daizj python tab 空格缩进
IndentationError: unexpected indent 是缩进的问题，也有可能是tab和空格混用啦 Python开发者有意让违反了缩进规则的程序不能通过编译，以此来强制程序员养成良好的编程习惯。并且在Python语言里，缩进而非花括号或者某种关键字，被用于表示语句块的开始和退出。增加缩进表示语句块的开
HttpClient 超时设置 dongwei_6688 httpclient
HttpClient中的超时设置包含两个部分： 1. 建立连接超时，是指在httpclient客户端和服务器端建立连接过程中允许的最大等待时间 2. 读取数据超时，是指在建立连接后，等待读取服务器端的响应数据时允许的最大等待时间在HttpClient 4.x中如下设置： HttpClient httpclient = new DefaultHttpC
小鱼与波浪 dcj3sjt126com
一条小鱼游出水面看蓝天，偶然间遇到了波浪。　　小鱼便与波浪在海面上游戏，随着波浪上下起伏、汹涌前进。　　小鱼在波浪里兴奋得大叫：“你每天都过着这么刺激的生活吗？简直太棒了。”　　波浪说：“岂只每天过这样的生活，几乎每一刻都这么刺激！还有更刺激的，要有潮汐变化，或者狂风暴雨，那才是兴奋得心脏都会跳出来。”　　小鱼说：“真希望我也能变成一个波浪，每天随着风雨、潮汐流动，不知道有多么好！”　　很快，小鱼
Error Code: 1175 You are using safe update mode and you tried to update a table dcj3sjt126com mysql
快速高效用：SET SQL_SAFE_UPDATES = 0；下面的就不要看了！今日用MySQL Workbench进行数据库的管理更新时，执行一个更新的语句碰到以下错误提示： Error Code: 1175 You are using safe update mode and you tried to update a table without a WHERE that
枚举类型详细介绍及方法定义 gaomysion enum javaee
转发 http://developer.51cto.com/art/201107/275031.htm 枚举其实就是一种类型，跟int, char 这种差不多，就是定义变量时限制输入的，你只能够赋enum里面规定的值。建议大家可以看看，这两篇文章，《java枚举类型入门》和《C++的中的结构体和枚举》，供大家参考。枚举类型是JDK5.0的新特征。Sun引进了一个全新的关键字enum
Merge Sorted Array hcx2013 array
Given two sorted integer arrays nums1 and nums2, merge nums2 into nums1 as one sorted array. Note:You may assume that nums1 has enough space (size that is
Expression Language 3.0新特性 jinnianshilongnian el 3.0
Expression Language 3.0表达式语言规范最终版从2013-4-29发布到现在已经非常久的时间了；目前如Tomcat 8、Jetty 9、GlasshFish 4已经支持EL 3.0。新特性包括：如字符串拼接操作符、赋值、分号操作符、对象方法调用、Lambda表达式、静态字段/方法调用、构造器调用、Java8集合操作。目前Glassfish 4/Jetty实现最好，对大多数新特性
超越算法来看待个性化推荐 liyonghui160com 超越算法来看待个性化推荐
一提到个性化推荐，大家一般会想到协同过滤、文本相似等推荐算法，或是更高阶的模型推荐算法，百度的张栋说过，推荐40%取决于UI、30%取决于数据、20%取决于背景知识，虽然本人不是很认同这种比例，但推荐系统中，推荐算法起的作用起的作用是非常有限的。就像任何
写给Javascript初学者的小小建议 pda158 JavaScript
　　一般初学JavaScript的时候最头痛的就是浏览器兼容问题。在Firefox下面好好的代码放到IE就不能显示了，又或者是在IE能正常显示的代码在firefox又报错了。　　如果你正初学JavaScript并有着一样的处境的话建议你：初学JavaScript的时候无视DOM和BOM的兼容性，将更多的时间花在了解语言本身（ECMAScript）。只在特定浏览器编写代码（Chrome/Fi
Java 枚举 ShihLei java enum 枚举
注：文章内容大量借鉴使用网上的资料，可惜没有记录参考地址，只能再传对作者说声抱歉并表示感谢！一基础 1）语法枚举类型只能有私有构造器（这样做可以保证客户代码没有办法新建一个enum的实例）枚举实例必须最先定义 2）特性 &nb
Java SE 6 HotSpot虚拟机的垃圾回收机制 uuhorse java HotSpot GC 垃圾回收 VM
官方资料，关于Java SE 6 HotSpot虚拟机的garbage Collection，非常全，英文。 http://www.oracle.com/technetwork/java/javase/gc-tuning-6-140523.html Java SE 6 HotSpot[tm] Virtual Machine Garbage Collection Tuning &

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他