小果一粒沙

R语言--数据挖掘5---探索性聚类分析

探索性聚类分析

本次实验报告的内容为：

介绍数据。首先介绍数据的状况，数据大体代表的意思。

数据分为两个部分，一个是R语言自带的鸢尾花的数据；以及航空公司客户信息的数据air_data.csv

介绍原理。主要介绍两种聚类分析的方法，k-means聚类和层次聚类法。

案例分析。根据原来来对数据进行实际分析，对得到结果给出合理性的解释。

本次的案例分析分为两个部分，一部分是对iris数据的分析；另一部分是航空公司客户信息进行聚类分析；

总结。对当前做的事情做一个总结，自我评价一下不足。

参考及代码。

数据介绍

鸢尾花数据介绍：

本鸢尾花数据有五列数据，分别是Sepal.Length, Sepal.Width, petal.Length, petal.Width, Species。主要分为原始特征和花的类别，其中前四列代表鸢尾花的特征，分为两块，一个是鸢尾花花瓣，以及萼片，分别有长度和宽度两个特征，总共有四个特征；最后一列代表每个观测所代表的花的种类，一共有150个观测数据。在本报告的分析中，我们主要是使用前面四列的特征来对鸢尾花的数据做聚类分析。

航空公司客户数据：

客户在某航空公司下的消费信息数据存储在air_data.csv，这些数据信息主要分为三块：客户基本信息、乘机信息和积分信息。本数据所包含的总特征有44个，总观测数有62988条记录。这些数据是根据末次飞行日期，选取宽度为两年的时间段作为分析观测窗口，从航空公司系统内抽取2012-04-01至2014-03-31内所有乘客的详细数据。在本次的分析报告中，我们首先对数据处理，从原始数据特征中抽取部分特征来进行聚类分析。

原理简介

关于聚类介绍的准备知识

数据标准化：分为中心标准化和最大最小值的标准化。在进行聚类之前，数据之间取值变量差异非常大，同时又存在单位不统一的情况，所以我们需要首先对原始数据进行标准化处理，再开始聚类。

我们主要是根据变量来对数据进行聚类，这里的变量分别有名义变量、定序变量、定距变量和定比变量。

名义变量的度量：名义变量取值是离散的，也就是说有有限个取值，这些取值中有些取值的所代表的重要性相差不大，有些相差就比较大。变量各个取值重要性相等的变量称为对称名义变量；重要性取值不等的成为非对称名义变量。

对于名义变量，他们之间的关系一般是用距离或者相似度来度量的。具体相似度度量参考课本114-115页。

**度量定序或定距变量：**对于定序变量的度量，一般是先转化为定距变量，再使用Minkoweski距离来度量的。当p=1时，是城市距离；当p=2时，是欧式距离；当 $\infty$ 时，是Chebyshev距离。

**度量定比变量：**1、使用定距变量的距离度量；2、使用另外三种对于非负定比的变量的，还有余弦相似度，以及相关系数的相似度来度量。其中余弦相似度一般用于文本挖掘中，对不同文本之间相似度的一个度量。

对于混合变量的度量：

一种方式：将名义变量转化为哑变量；定序变量转化为定距变量；再将所有的变量都转化为定距变量，使用度量定距变量的方法来度量。

另一种方式：遵从变量的原始类型，使用
$s(\textbf{x}, \textbf{y}) = \cfrac{\sum_{r=1}^{p} \delta_{\textbf{x},\textbf{y}}^{r} s_{\textbf{x},\textbf{y}}^{r}}{\sum_{r=1}^{p} \delta_{\textbf{x},\textbf{y}}^{r}}$
来度量。

其中
$\delta_{\textbf{x},\textbf{y}}^{r} = \left\{ \begin{array}{ll} 1 & \textrm{对称名义，定序，定距，定比}\\ & \textrm{非对称名义，$x_r, y_r$同等重要} \\ 0 & \textrm{非同等重要} \end{array} \right. \\ s_{\textbf{x},\textbf{y}}^{r} = \left\{ \begin{array}{ll} 1 & \textrm{名义，$x_r=y_r$}\\ 0 & \textrm{名义，$x_r \ne y_r$} \\ 1-\cfrac{|x_r-y_r|}{R_r} & \textrm{定序，定距，定比， $R_r$代表极差（全距）} \end{array} \right.$
相似性度量与距离度量的转换：一个事实：距离度量 $d (x, y)$ 总是能转化成相似性度量 $s (x, y)$ 。相似性度量在转化成正式的距离度量时，需要满足对称性，非负性以及当 $x = y$ 时， $d (x, y) = 0$ ，还有三角不等式性。且只有当相似度矩阵为非负定矩阵时，才能从相似度量中构造出满足上述四条性质的距离度量。

k-means聚类

k均值聚类步骤：

初始化K个聚类中心，可以随机选取。
固定中心，在每次循环中，将每个变量分到与其最近的中心。
$\min_{1 \le l \le K}d{(x_i, v_l)}, i=1, \cdots, N$
固定每个变量的类，重新计算类的中心，在一个类中，找到一个点，使得它距离每个点的距离都很小。
$v_l = arg \min_v \sum\limits_{i \in C_i}d(x_i, v), l=1, \cdots, K$
持续循环2和3，直到所有类别中心的改变很小，或者达到实现规定的循环次数。

确定类别的个数：

使用伪F统计量来寻找最优的类别个数，其中伪F统计量定义为：
$\begin{aligned} Pseudo \quad F &= \cfrac{(SST - SSW)/[(K-1)p]}{SSW/[(N-K)p]} \\ & = \cfrac{(SST - SSW)/(K-1)}{SSW/(N-K)} \end{aligned}$
其中SST代表总平方和，SSW代表组内平方和，SST-SSW代表组间平方和。伪F统计量的值越大，说明聚类结果的质量越高。

层次聚类法

画出聚类的坐标轴，横轴代表所聚的类，纵轴代表类别之间的距离。可以按照距离截断，就可以得到在截断距离画一条平行于X轴的水平线，就可以得到聚类的个数。

层次聚类的类型分为两种，合并式聚类法和分裂式层次聚类法。

其中，合并式聚类法：

（1）初始化时每个观测单独形成一个类别。

（2）迭代的将最相似（或距离最近）的两个类别合并。

（3）随着被合并的两个类别的相似度减小（或距离增加，因为相似度为1代表距离最小为0），最终所有观测都归于同一个类别。

分裂式层次聚类法：

（1）初始化所有观测都属同一个类别；

（2）迭代的将最不相似的两个子类别进行分裂。

（3）随着分裂成的两个子类别的相似度增加（或距离减小），最终每个观测单独形成一个类别。

对比两者：分列式层次聚类法的每一步都需要对比现有跟各个类别的各种分裂方式，算法复杂度高，因此一般使用合并式层次聚类法。

类别个数的确定：

这里是伪 $t^2$ 统计量：
$\begin{aligned} Pseudo\quad t^2 & = \cfrac{[SSW_M-(SSW_l + SSW_{l'})]/p}{(SSW_l + SSW_{l'})/[(N_l + N_{l'}-2)]p} \\ &= \cfrac{SSW_M-(SSW_l + SSW_{l'})}{(SSW_l + SSW_{l'})/(N_l + N_{l'}-2)} \end{aligned}$
其中： $SSW_l$ 代表类别 $l$ 内的平方和， $SSW_{l'}$ 代表类别 $l^{'}$ 的平方和， $SSW_M$ 代表类别 $M$ 的平方和。它的值越小，说明该合并步骤质量越高。

案例分析

iris聚类分析

k-means聚类分析

先使用k-means方法对原始数据进行分析：

分析的步骤：

首先取出数据的前四列，并且对数据进行标准化的预处理。这里的标准化是中心化标准化。
```
iris.4 = iris[, 1:4]
iris.4 = scale(iris.4, center=T, scale=T)
```
使用k均值聚类，这里我们默认使用的类别数是5。

分别得到每一类有：23 25 48 25 29个观测数据。
画图，关于花瓣和萼片。

图1 花瓣的长度与宽度图2 萼片的长度与宽度
再通过伪F值，找到最优的K

在标准化之后，我们得到最优的k是2，但是在未标准化时，我们得到的最优k是3。画图如下：

图1 标准化之后得到伪F值图2 标准化之前得到伪F值
标准化之后进行聚类得到的类别个数与原始数据中给出的类别个数不一，具体原因我猜想是这些不同变量之间的度量差异可能对他们的特征具有代表性，经过标准化之后会”泛化“这些”代表性“。
进行多维标度分析，将4维数据降为2维，画出类别的分布，这里是使用最优类别为3来画图的。

如图所示，数据之间还算分得开，其中左半部分代表第一类的数据分布，后半部分分别代表第三类和第二类的数据分布。
最后选择最优的类别个数为3.

层次聚类法分析

分析的步骤：

首先对数据进行标准化，同k-means聚类。
聚类，层次聚类

得到结果如上图所示，再通过对原始数据作类别数为4的截断，得到：

其中每一类分别有49 ,1, 97, 3 个.
对其在多维标度分析之后画图：

图1 类别数设置为2

图2 类别数设置为4

由图1所示，将类别数设置为4，各个类别的分布不太均匀，且分布离散，不太合适，结合层次聚类得到的图知，得到的类别只能为2、4、6等类，于是我们尝试将类别数仅设置为2，图像如图2所示.

使用NBclust，找到层次聚类分析法中的最优的类别个数：

这里使用控制方法分析，在使用NbClust分析的时候，method为average.

图1 索引值与类别个数图2 索引值的二阶差分与类别个数

由左图可知，Dindex values的值随着类别个数的增大而减小。在这里，我们进行聚类分析时使用的index是“all”，index最大值所对应的类别个数是最优的类别个数，所以最终我们使用层次聚类法得到的类别个数为2. 同时，使用nbcluster$Best.partition得到的最优类别个数也是2.

航空公司客户数据聚类分析

本次使用的对航空公司客户数据聚类分析使用的是LRFMC模型。

LRFMC模型变量解释：

模型	L	R	F	M	C
航空公司LRFMC模型	LOAD_TIME - FFP_DATE会员入会时间距观测窗口结束的月数	LAST_TO_END客户最近一次乘坐公司飞机距观测窗口结束的月数	FLIGHT_COUNT客户在观测窗口内乘坐公司飞机的次数	SEG_KM_SUM客户在观测窗口内累计的飞行里程	AVG_DISCOUNT客户在观测窗口内乘坐舱位所对应的折扣系数的平均值

步骤：

数据预处理，去除空值（得到62984条数据）、将所有数据都转换成数值型变量，变换得到下图
标准化，因为L代表的是天数，不能取负值，所有这里标准化选择最大最小标准化。
聚类，使用k-means聚类，聚为5类：

其中1-5类分别有10267, 21734, 12221, 4976, 13786 .
画图：

分别得到5类图的在L和R上的分布。

因为在本航空数据中，数据量过大，K-means法比较适用，层次聚类法不太适用，所以我们不考虑使用层次聚类法来进行聚类分析。

总结

本报告按照数据介绍、原理简介、案例分析（分为iris和air_data)，最后的总结来展开。

其中在案例分析中，对iris数据，因为其数据量比较小，所以我们使用了两种方法来对数据进行聚类分析，但是这里仅仅只是对数据进行了聚类，没有比较两者之间的效果，在以后的学习过程中，需要补齐。除了对iris数据进行聚类之外，还结合了上一张聚类分析的内容，尝试使用多标度分析法来降维，对数据画图，通过可视化，对比了数据聚类的效果。

对于air_data数据，因为数据量比较大，所以只采用了k-means聚类方法来分析，分析的过程比较简单，在以后的学习中还需回来完善。

在找最优刻度上，只针对iris数据找了一下，但是在后来的air_data数据中就没有找，因为我发现这个Pseudo F值随着类别的增大是在不断减小的，且越来越小，我不知道类别取哪个值是合适的，所以就取了一个默认的数5，不严谨。

参考

[1] In scan(file = file, what = what, sep = sep, quote = quote, dec = dec, : EOF within quoted string

[2] 基于R语言的聚类分析（k-means,层次聚类）

[3] 请问如何用r语言中的ggplot2画出多种渐变色的好看的图？

[4] R语言计算某一列中变量种类以及每一个种类中的变量个数

[5] 航空公司客户价值分析

[6] 航空客户价值分析特色LRFMC模型——RFM升级

代码

# -----------1、获取数据并标准化
iris.4 = iris[, 1:4]
iris.4 = scale(iris.4, center=T, scale=T)
# -----------2、对前四列数据做聚类
##k均值聚类
K <- 4
cluster.iris <- kmeans(iris.4,centers = K,iter.max = 99,nstart=25)
cluster.iris$size
# -----------3、画图
plot(iris.4, col=cluster.iris$cluster)
plot_data = function(data, k=4){
  # 找到前四列的数据
  # 我希望来画图
  # 将聚的类添加到最后一列
  cluster.data <- kmeans(data,centers = 5,iter.max = 99,nstart=25)
  print(length(cluster.data$cluster))
  sepal = data[, 1:2]
  petal = data[, 3:4]
  color = cluster.data$cluster
  plot(sepal, xlab=colnames(sepal)[1], ylab=colnames(sepal)[2], 
       main=paste("Scatter of " , colnames(sepal)[1], "and", colnames(sepal)[2]),
       col=color)
  plot(petal, xlab=colnames(petal)[1], ylab=colnames(petal)[2], 
       main=paste("Scatter of " , colnames(petal)[1] , "and", colnames(petal)[2]),
       col=color)
  return(data)
  
} 
plot_data(iris.4)

# -----------4、找到最优刻度
N <- dim(iris.4)[1]
pseudo_li = seq(2, 8, 1)
i = 1
for (k in 2:8){
  clustercars <- kmeans(iris.4,centers = k,iter.max = 99,nstart=25)
  pseudo = (clustercars$betweenss / (k - 1)) / (clustercars$tot.withinss / (N - k))
  pseudo_li[i] = pseudo
  print(paste(k, ": ", pseudo))
  i = i + 1
}

plot(seq(2, 8, 1), pseudo_li)



# -----------5、多维标度分析，清晰可视化
library(ggplot2)
# 1、对原始维度的变量进行k-means聚类
# 2、对聚类之后的数据，通过多维标度分析转化为2维
# 3、对2维数据画图，颜色为第几类变量
cluster.data <- kmeans(iris.4, centers = 3, iter.max = 99,nstart=25)
color = cluster.data$cluster
m.data = as.matrix(data[, 1:4])
dis.data = dist(m.data)
MD = cmdscale(dis.data, k=2)
p <- ggplot(data=as.data.frame(MD), mapping=aes(x=MD[, 1], y=MD[, 2]))
d <- p + geom_point(aes(colour=color)) + ggtitle(label="2-D points after Multidimensional scaling analysis") + scale_color_gradientn(colours =rainbow(4))
d

# ---------6、层次聚类法。
help("hclust")
tree <- hclust(dist(iris.4),method = "average")
# method="average"指定使用平均连接法。

# 画聚类树图。
plot(tree)

# 类别数为2时所得的聚类结果。
out <- cutree(tree,k = 2)
out
table(out)    # 查看多少类

# -----------7、多维标度分析，查看层次聚类之后的结果
library(ggplot2)
m.data = as.matrix(iris.4)
dis.data = dist(m.data)
MD = cmdscale(dis.data, k=2)
color = out
p <- ggplot(data=as.data.frame(MD), mapping=aes(x=MD[, 1], y=MD[, 2]))
d <- p + geom_point(aes(colour=color)) + ggtitle(label="2-D points after Multidimensional scaling analysis")+ scale_color_gradientn(colours =rainbow(4))
d

# -----------8、使用NbClust函数进行聚类，实际是找最优类别数K
library(NbClust)
#加载程序包NbClust，其中含有NbClust函数。
help(NbClust)
nbcluster <- NbClust(iris.4,method = "average")
# "average"，表示使用平均连接的层次聚类法），将数据进行聚类。
# 查看nbcluster包含的分析结果项
names(nbcluster)
# 查看综合各个指标所得的最佳类别数下，各个观测所属的类别
nbcluster$Best.partition
# =====================航空客户信息============================
# -----------读取数据
air_data = read.csv("D:/lagua/CODING/R-learn/R-code/Chap6_ClusterAnalysis/air_data.csv",
                    header=TRUE,quote = "",
                    sep=",",
                    encoding='UTF-8',
                    strip.white = TRUE
)
colnames(air_data)
col_need = c('LOAD_TIME', 'FFP_DATE','LAST_TO_END', 'FLIGHT_COUNT', 'SEG_KM_SUM', 'avg_discount')
air_data = subset(air_data, select=col_need)
air_data$LOAD_TIME = as.Date(air_data$LOAD_TIME)
air_data$FFP_DATE = as.Date(air_data$FFP_DATE)
str(air_data)


library(dplyr)
# -----------1、数据预处理
# 1 初始化数据
# 2 将数据转化成整数，转化为数值型
# 3 删除列
# 4 重新命名
# 5 对列重新排序
new_air = air_data
new_air = na.omit(new_air)
new_air$L = (new_air$LOAD_TIME - new_air$FFP_DATE) %>% as.numeric()
new_air$FLIGHT_COUNT = as.numeric(new_air$FLIGHT_COUNT)
new_air = new_air[,-which(names(new_air) %in% c('LOAD_TIME', 'FFP_DATE'))]
new_air = rename(new_air, c("R"='LAST_TO_END', "F"='FLIGHT_COUNT', "M"='SEG_KM_SUM', 'C'='avg_discount'))
new_air = new_air[, c(5, 1, 2, 3, 4)]
colnames(new_air)
head(new_air)
str(new_air)

# 最大最小标准化
normalize <- function(x) {
  return((x - min(x)) / (max(x) - min(x)))
}

std_air = apply(new_air, 2, normalize)
head(std_air)
# L = LOAD_DATE - FFP_DATE
# R = LAST_TO_END
# F = FLIGHT_COUNT
# M = SEG_KM_SUM
# C = AVG_DISCOUNT

# -----------2、k均值聚类
K <- 5
clusterair <- kmeans(std_air,centers = K,iter.max = 99,nstart=25)
table(col=clusterair$cluster)

# -----------3、画图
color = clusterair$cluster
L <- std_air[, 1]
R <- std_air[, 2]
p <- ggplot(data=as.data.frame(std_air), mapping=aes(x=L, y=R))
d <- p + geom_point(aes(colour=color)) + ggtitle(label="Air data after k-means cluster")+ scale_color_gradientn(colours =rainbow(4))
d
plot(std_air, col=clusterair$cluster)

用OpenCV标定相机内参应用示例（C++和Python）
下面是一个完整的使用OpenCV进行相机内参标定（CameraCalibration）的示例，包括C++和Python两个版本，基于棋盘格图案标定。一、目标：相机标定通过拍摄多张带有棋盘格图案的图像，估计相机的内参：相机矩阵（内参）K畸变系数distCoeffs可选外参（R,T）标定精度指标（如重投影误差）二、棋盘格参数设置（根据自己的棋盘格设置）：棋盘格角点数：9x6（内角点，9列×6行）；每个
Anaconda 详细下载与安装教程
Anaconda详细下载与安装教程1.简介Anaconda是一个用于科学计算的开源发行版，包含了Python和R的众多常用库。它还包括了conda包管理器，可以方便地安装、更新和管理各种软件包。2.下载Anaconda2.1访问官方网站首先，打开浏览器，访问Anaconda官方网站。2.2选择适合的版本在页面中，你会看到两个主要的下载选项：AnacondaIndividualEdition：适用于
基于Python的健身数据分析工具的搭建流程day1 weixin_45677320 python 开发语言数据挖掘爬虫
基于Python的健身数据分析工具的搭建流程分数据挖掘、数据存储和数据分析三个步骤。本文主要介绍利用Python实现健身数据分析工具的数据挖掘部分。第一步：加载库加载本文需要的库，如下代码所示。若库未安装，请按照python如何安装各种库（保姆级教程）_python安装库-CSDN博客https://blog.csdn.net/aobulaien001/article/details/133298
【证明】对极几何：本质矩阵内在性质 Powerful_QI slam 线性代数矩阵
--这是目录--1.本质矩阵内在性质表述2.预备知识2.1线性代数基础2.1.1奇异值与特征值的关系2.1.2矩阵加减单位阵后特征值的变化2.2引理：一个常用的矩阵变换3.证明1.本质矩阵内在性质表述本质矩阵(EssentialMatrix)EEE是一个3阶方阵，满足E=t∧RE=t^{\land}RE=t∧R其中RRR为旋转矩阵，ttt为平移量，t∧t^{\land}t∧运算定义如下（参考了
什么是RFM模型走过冬季学习笔记大数据数据分析
RFM模型是客户价值分析中一种经典且实用的量化模型，它通过三个关键维度评估用户价值，帮助企业识别最有价值的客户群体。名称RFM由三个核心指标的英文首字母组成：R（Recency）-最近一次消费时间定义：用户上一次发生交易行为距今的时间长度（如多少天前）。意义：衡量用户的活跃度和流失风险。R值越小（最近有消费），说明用户越活跃，流失风险越低；R值越大（很久没消费），用户流失风险越高。母婴场景示例：一
C++ 标准库＜numeric＞
以下对C++标准库中头文件所提供的数值算法与工具做一次系统、深入的梳理，包括算法功能、示例代码、复杂度分析及实践建议。一、概述中定义了一组对数值序列进行累加、内积、差分、扫描等操作的算法，以及部分辅助工具（如std::iota、std::gcd/std::lcm等）。所有算法均作用于迭代器区间，符合STL风格，可与任意容器或原始数组配合使用。从C++17、20起，又陆续加入了并行友好的std::r
Ubuntu 服务器虚拟主机,ubuntu云服务器虚拟机 Gamer42 Ubuntu 服务器虚拟主机
ubuntu云服务器虚拟机内容精选换一换通过云服务器或者外部镜像文件创建私有镜像时，如果云服务器或镜像文件所在虚拟机的网络配置是静态IP地址时，您需要修改网卡属性为DHCP，以使私有镜像发放的新云服务器可以动态获取IP地址。本节以WindowsServer2008R2操作系统为例。其他操作系统配置方法略有区别，请参考对应操作系统的相关资料进行操作，文档中不对此进行详细说明后端虚拟机绑定EIP。登录
深度学习图像分类数据集—桃子识别分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：桃子识别分类：['B1','M2','R0','S3']训练数据集总共有6637张图片，每个文件夹单独放一种数据各子文件夹图片统计:·B1:1601张图片·M2:1800张图片·R0:1601张图片·S3:
24GB GPU 中的 DeepSeek R1：Unsloth AI 针对 671B 参数模型进行动态量化知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 deepseek ollama
简介最初的DeepSeekR1是一个拥有6710亿个参数的语言模型，UnslothAI团队对其进行了动态量化，将模型大小减少了80%（从720GB减少到131GB），同时保持了强大的性能。当添加模型卸载功能时，该模型可以在24GBVRAM下以低令牌/秒的推理速度运行。推荐文章《本地构建AI智能分析助手之01快速安装，使用PandasAI和Ollama进行数据分析，用自然语言向你公司的数据提问为决策
在 Obsidian 中本地使用 DeepSeek — 无需互联网！知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 deepseek
简介您是否想在Obsidian内免费使用类似于ChatGPT的本地LLM？如果是，那么本指南适合您！我将引导您完成在Obsidian中安装和使用DeepSeek-R1模型的确切步骤，这样您就可以在笔记中拥有一个由AI驱动的第二大脑。推荐文章《24GBGPU中的DeepSeekR1：UnslothAI针对671B参数模型进行动态量化》权重1，DeepSeek类《在RaspberryPi上运行语音识别
使用 DeepSeek R1 和 Ollama 开发 RAG 系统使用 DeepSeek R1 和 Ollama 构建强大的 RAG 系统。了解开发智能 AI 解决方案的设置过程、最佳实践和技巧。知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 deepseek ollama
简介DeepSeekR1和Ollama提供了用于构建检索增强生成(RAG)系统的强大工具。本指南介绍了使用这些技术开发RAG应用程序的设置、实施和最佳实践。为什么RAG系统会改变游戏规则检索增强生成(RAG)系统结合了搜索和生成AI的优点，可实现精确且准确的情境感知响应。借助DeepSeekR1和Ollama等工具，创建RAG系统不再令人生畏。无论您是构建聊天机器人、知识助手还是AI驱动的搜索引擎
dpdk-testpmd 统计显示
背景最近在做测试的发现testpmdshowport统计的Tx-packets是个极大值，很不符合预期。硬件同学说，这个是软件统计，一定是软件问题。我大概知道它是个硬件统计，但是并不能确定，于是，做了一下代码的分析。testpmd>showportstats0########################NICstatisticsforport0########################R
php加密的是什么,看看下面这个php代码是使用什么加密的? xiao龟 php加密的是什么
加密的代码如下：!/usr/bin/php-qeNrtWWlTG1cW/SvY5Yqg4krevoSQuIUEiE0LYAwuijKbEGA2YbMk+TUOjEnyc976b+Y2pKZqpNcgz3gm46r5BpL69Ln3nnvved3PrrFyRhOJEAoySvT66ceoMFbS02BNEFE8XRsLRAmkHI7eKMxMHC7tnKOz+Ytuezt7SUrPS6TcOa0c6
php rad加密公钥过长,看看下面这个php代码是使用什么加密的? 范特嘻嘻 php rad加密公钥过长
加密的代码如下：!/usr/bin/php-qeNrtWWlTG1cW/SvY5Yqg4krevoSQuIUEiE0LYAwuijKbEGA2YbMk+TUOjEnyc976b+Y2pKZqpNcgz3gm46r5BpL69Ln3nnvved3PrrFyRhOJEAoySvT66ceoMFbS02BNEFE8XRsLRAmkHI7eKMxMHC7tnKOz+Ytuezt7SUrPS6TcOa0c6
访问远程共享文件时“连到系统上的设备没有发挥作用”错误解决方法 s_nshine 文件服务器
问题症状：在访问远程共享目录（比如Moabn）有时可能会遇到这个错误，提示“连到系统上的设备没有发挥作用”的错误。解决方法：1、按下Win+R组合键（Win是Alt旁边那个键），在“运行”里输入services.msc，点击确定。2、在打开的系统服务窗口中，检查下面三个系统服务项是否启动。如果没有启动，双击在属性里启动，另外“启动类型”也建议设置为自动。DHCPClientDNSClientRou
麒麟v10arm64自制nginx1.26.1的docker镜像包睡不醒的双眼皮 docker nginx
#基础镜像openeuler2203arm64#1.宿主机下载nginx对应版本编译./configure--prefix=/usr/local/nginx--conf-path=/etc/nginx/nginx.conf&&make&&makeinstall2.#创建构建镜像目录mkdir/opt/dockerfilecp-r/usr/local/nginx/opt/dockerfile/ngi
图神经网络：挖掘关系数据中的宝藏
图神经网络：挖掘关系数据中的宝藏在浩瀚的数据海洋中，蕴藏着一类特殊而强大的资源——关系数据。它们不是孤立的点，而是相互连接、彼此影响的复杂网络：社交平台上朋友的朋友、电商系统中商品与用户的互动、蛋白质分子内原子的结合、城市交通网中的道路连接……这些数据天然以图的形式存在，节点代表实体，边则承载着实体间千丝万缕的关系。传统的数据挖掘工具面对这些盘根错节的结构往往力不从心，而图神经网络（GNN）的崛起
显示遇到一些临时服务器问题,大师为你细说win10系统登录office提示“遇到一些临时服务器问题”的学习... Love Snape 显示遇到一些临时服务器问题
我们在操作win10系统电脑的时候,常常会遇到win10系统登录office提示“遇到一些临时服务器问题”的情况，想必大家都遇到过win10系统登录office提示“遇到一些临时服务器问题”的情况吧，那么应该怎么处理win10系统登录office提示“遇到一些临时服务器问题”呢？我们依照按下win+R组合键打开运行，在框中输入regedit，打开”注册表辑器“；在注册表左侧菜单一次展开：HKEY_
添加行号（python版）
添加行号#打开PyCharm，新建一个新的py文件，取名demo，生成demo.py文件lines_maxlenth=0#定义新的变量，储存最长的代码长度line_numbers=1#每次加一，代表当前正在添行号的位置code_in=open("demo.py","r").readlines()#打开demo.py文件，读取所有内容code_out=open("demo_new.py","w")#
Django Rest Framework 视图和路由 Matrix 工作室从源代码学Python
DRF的视图APIView我们django中写CBV的时候继承的是View，rest_framework继承的是APIView，那么他们两个有什么不同呢urlpatterns=[url(r'^book$',BookView.as_view()),url(r'^book/(?P\d+)$'
SQL注入与防御-第六章-3：利用操作系统--巩固访问
一、核心逻辑与价值“巩固访问”是SQL注入攻击的持久化控制阶段，通过篡改数据库权限、植入隐蔽后门（如“数据库rootkit”）、利用系统组件（如SQLServerSOAP端点），实现对数据库及关联服务器的长期控制，绕过常规防御检测，扩大攻击影响。二、技术实现与典型场景（一）数据库Rootkit植入（以Oracle为例）1.原理通过篡改数据库元数据、系统视图，隐藏恶意用户、权限或操作，类似操作系统R
Python桌面应用开发的未来——智能化工具与大模型赋能 IronwoodStag78
开发AI智能应用，就下载InsCodeAIIDE，一键接入DeepSeek-R1满血版大模型！标题：Python桌面应用开发的未来——智能化工具与大模型赋能随着人工智能技术的飞速发展，传统软件开发模式正在被重新定义。Python作为一门功能强大且灵活的语言，在桌面应用开发领域一直占据重要地位。然而，面对日益复杂的用户需求和快速变化的技术环境，如何提升开发效率、降低开发门槛，成为开发者亟需解决的问题
【Python】OpenAI API 宅男很神经 python 开发语言
【Python与OpenAIAPI深度探索：从基础到未来】第一章：OpenAIAPI概览与核心概念1.1OpenAIAPI是什么？能做什么？OpenAIAPI(ApplicationProgrammingInterface，应用程序编程接口)是一套允许开发者通过编程方式访问和使用OpenAI开发的各种先进人工智能模型的服务。这些模型经过海量数据的训练，能够在多种任务上达到甚至超越人类水平。通过AP
【数据分析】多数据集网络分析：探索健康与退休研究中的变量关系生信学习者1 数据分析 (2025版)数据分析 r语言数据挖掘数据可视化
禁止商业或二改转载，仅供自学使用，侵权必究，如需截取部分内容请后台联系作者!文章目录介绍加载R包数据下载导入数据数据预处理函数网络分析画图保存图片总结系统信息介绍在医学和社会科学研究中，理解多个变量之间的复杂关系对于揭示潜在的病理生理机制和社会行为模式至关重要。本文介绍了一种基于R语言的网络分析方法，用于探索HRS（健康与退休研究）及其类似研究（CHARLS、ELSA、MHAS、SHARE）中的变
Linux面试问题-软件测试
1、你在上一家公司常用的Linux命令有哪些？答：使用vim/vi编辑文件，使用cat，more,less，head查看文件，使用grep过滤日志中的error,使用ps查看进程，使用top查看实时进程，netstat查看端口，（df查看磁盘使用情况，du统计目录使用的大小，使用vmstat查看虚拟内存，使用free查看内存），还有一些其他比如使用scp拷贝文件，mv重命名，mkdir创建目录，r
进制转换原理与实现详解
一、进制系统基础概念1.1位权计数法原理十进制系统：采用10ⁿ位权体系，每个数字的位置代表不同的权重。例如数字"365"表示为：3×10²+6×10¹+5×10⁰=300+60+5=365通用r进制系统：遵循rⁿ位权表达方式。对于r进制数"dₙdₙ₋₁...d₁d₀"，其十进制值为：∑dᵢ×rⁱ(i=0到n)。例如：二进制1011=1×2³+0×2²+1×2¹+1×2⁰=11八进制745=7×8²
搜广推校招面经九十一
美团机器学习/数据挖掘算法工程师_二面一、介绍一下ESMM模型，是否有进行过函数推导传统的转化率建模方式：只用发生点击（click=1）的样本来训练CVR模型。CVR定义如下：CVR=P(y=1∣x,z=1)CVR=P(y=1|x,z=1)CVR=P(y=1∣x,z=1)y=1表示用户发生了转化（如购买）z=1表示用户点击了广告这样做的问题：样本选择偏差（SampleSelectionBias,S
突破传统：Dell R730服务器RAID 5配置与智能监控全解析芯作者 D2：ubuntu 服务器 linux ubuntu
在现代数据中心运维中，合理的存储配置是保障业务连续性的基石。今天，我们将深入探索DellPowerEdgeR730服务器的RAID5配置技巧，并结合热备盘策略、自动化监控脚本以及性能调优方案，为您呈现一份别开生面的技术指南。一、为什么RAID5+热备盘是企业级存储的黄金组合？RAID5通过分布式奇偶校验实现数据冗余，允许单块硬盘故障时不丢失数据。其存储效率公式为：Efficiency=\frac{
windows 设置定时锁屏
1.编写锁屏命令新建一个txt文件，重命名为：lockScreen（名字随意）–>打开该文件添加内容：rundll32.exeuser32.dll,LockWorkStation保存，将该文件后缀名（扩展名）txt改为bat2.指定该文件的存储位置WIN+R->输入:C:\Windows\System32->按回车键->将该文件lockScreen.bat拷贝到该目录System32下3.创建一个
去除 nuxt.js 框架下的 window.__NUXT__
问题描述：nuxt.js框架建设网站，在网站页面点击查看查看网页源代码，就会发现源代码里面有一串这样的代码window.__NUXT__=(function(a,b,c,d,e,f,g,h,i,j,k,l,m,n,o,p,q,r,s,t,u,v,w,x,y,z,A,B,C,D,E,F,G,H,I,J,K,L,M,N,O,P,Q,R,S,T,U,V,W,X,Y,Z,_,$,aa,.....后续代码太
关于旗正规则引擎下载页面需要弹窗保存到本地目录的问题何必如此 jsp 超链接文件下载窗口
生成下载页面是需要选择“录入提交页面”，生成之后默认的下载页面<a>标签超链接为：<a href="<%=root_stimage%>stimage/image.jsp?filename=<%=strfile234%>&attachname=<%=java.net.URLEncoder.encode(file234filesourc
【Spark九十八】Standalone Cluster Mode下的资源调度源代码分析 bit1129 cluster
在分析源代码之前，首先对Standalone Cluster Mode的资源调度有一个基本的认识：首先，运行一个Application需要Driver进程和一组Executor进程。在Standalone Cluster Mode下，Driver和Executor都是在Master的监护下给Worker发消息创建(Driver进程和Executor进程都需要分配内存和CPU，这就需要Maste
linux上独立安装部署spark daizj linux 安装 spark 1.4 部署
下面讲一下linux上安装spark，以 Standalone Mode 安装 1）首先安装JDK 下载JDK：jdk-7u79-linux-x64.tar.gz ，版本是1.7以上都行，解压 tar -zxvf jdk-7u79-linux-x64.tar.gz 然后配置 ~/.bashrc&nb
Java 字节码之解析一周凡杨 java 字节码 javap
一： Java 字节代码的组织形式类文件 { OxCAFEBABE ，小版本号，大版本号，常量池大小，常量池数组，访问控制标记，当前类信息，父类信息，实现的接口个数，实现的接口信息数组，域个数，域信息数组，方法个数，方法信息数组，属性个数，属性信息数组 } &nbs
java各种小工具代码 g21121 java
1.数组转换成List import java.util.Arrays; Arrays.asList(Object[] obj); 2.判断一个String型是否有值 import org.springframework.util.StringUtils; if (StringUtils.hasText(str)) 3.判断一个List是否有值 import org.spring
加快FineReport报表设计的几个心得体会老A不折腾 finereport
一、从远程服务器大批量取数进行表样设计时，最好按“列顺序”取一个“空的SQL语句”，这样可提高设计速度。否则每次设计时模板均要从远程读取数据，速度相当慢！！二、找一个富文本编辑软件（如NOTEPAD+）编辑SQL语句，这样会很好地检查语法。有时候带参数较多检查语法复杂时，结合FineReport中生成的日志，再找一个第三方数据库访问软件（如PL/SQL）进行数据检索，可以很快定位语法错误。
mysql linux启动与停止墙头上一根草
如何启动/停止/重启MySQL一、启动方式1、使用 service 启动：service mysqld start2、使用 mysqld 脚本启动：/etc/inint.d/mysqld start3、使用 safe_mysqld 启动：safe_mysqld&二、停止1、使用 service 启动：service mysqld stop2、使用 mysqld 脚本启动：/etc/inin
Spring中事务管理浅谈 aijuans spring 事务管理
Spring中事务管理浅谈 By Tony Jiang@2012-1-20 Spring中对事务的声明式管理拿一个XML举例 [html] view plain copy print ? <?xml version="1.0" encoding="UTF-8"?>&nb
php中隐形字符65279（utf-8的BOM头）问题 alxw4616
php中隐形字符65279（utf-8的BOM头）问题今天遇到一个问题. php输出JSON 前端在解析时发生问题:parsererror. 调试: 1.仔细对比字符串发现字符串拼写正确.怀疑是非打印字符的问题. 2.逐一将字符串还原为unicode编码. 发现在字符串头的位置出现了一个 65279的非打印字符.
调用对象是否需要传递对象(初学者一定要注意这个问题) 百合不是茶对象的传递与调用技巧
类和对象的简单的复习,在做项目的过程中有时候不知道怎样来调用类创建的对象,简单的几个类可以看清楚,一般在项目中创建十几个类往往就不知道怎么来看为了以后能够看清楚,现在来回顾一下类和对象的创建,对象的调用和传递(前面写过一篇) 类和对象的基础概念: JAVA中万事万物都是类类有字段(属性),方法,嵌套类和嵌套接
JDK1.5 AtomicLong实例 bijian1013 java thread java多线程 AtomicLong
JDK1.5 AtomicLong实例类 AtomicLong 可以用原子方式更新的 long 值。有关原子变量属性的描述，请参阅 java.util.concurrent.atomic 包规范。AtomicLong 可用在应用程序中（如以原子方式增加的序列号），并且不能用于替换 Long。但是，此类确实扩展了 Number，允许那些处理基于数字类的工具和实用工具进行统一访问。
自定义的RPC的Java实现 bijian1013 java rpc
网上看到纯java实现的RPC，很不错。 RPC的全名Remote Process Call，即远程过程调用。使用RPC，可以像使用本地的程序一样使用远程服务器上的程序。下面是一个简单的RPC 调用实例，从中可以看到RPC如何
【RPC框架Hessian一】Hessian RPC Hello World bit1129 Hello world
什么是Hessian The Hessian binary web service protocol makes web services usable without requiring a large framework, and without learning yet another alphabet soup of protocols. Because it is a binary p
【Spark九十五】Spark Shell操作Spark SQL bit1129 shell
在Spark Shell上，通过创建HiveContext可以直接进行Hive操作 1. 操作Hive中已存在的表 [hadoop@hadoop bin]$ ./spark-shell Spark assembly has been built with Hive, including Datanucleus jars on classpath Welcom
F5　往header加入客户端的ip ronin47
when HTTP_RESPONSE {if {[HTTP::is_redirect]}{ HTTP::header replace Location [string map {:port/ /} [HTTP::header value Location]]HTTP::header replace Lo
java-61-在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差. 求所有数对之差的最大值。例如在数组{2, 4, 1, 16, 7, 5, bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/2541117420116135376632/ 写了个java版的 public class GreatestLeftRightDiff { /** * Q61.在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差。 * 求所有数对之差的最大值。例如在数组
mongoDB 索引开窍的石头 mongoDB索引
在这一节中我们讲讲在mongo中如何创建索引得到当前查询的索引信息 db.user.find(_id:12).explain(); cursor: basicCoursor 指的是没有索引 &
[硬件和系统]迎峰度夏 comsci 系统
从这几天的气温来看，今年夏天的高温天气可能会维持在一个比较长的时间内所以，从现在开始准备渡过炎热的夏天。。。。每间房屋要有一个落地电风扇，一个空调(空调的功率和房间的面积有密切的关系) 坐的，躺的地方要有凉垫，床上要有凉席电脑的机箱
基于ThinkPHP开发的公司官网 cuiyadll 行业系统
后端基于ThinkPHP，前端基于jQuery和BootstrapCo.MZ 企业系统轻量级企业网站管理系统运行环境:PHP5.3+, MySQL5.0 系统预览系统下载：http://www.tecmz.com 预览地址：http://co.tecmz.com 各种设备自适应响应式的网站设计能够对用户产生友好度，并且对于
Transaction and redelivery in JMS (JMS的事务和失败消息重发机制) darrenzhu jms 事务承认 MQ acknowledge
JMS Message Delivery Reliability and Acknowledgement Patterns http://wso2.com/library/articles/2013/01/jms-message-delivery-reliability-acknowledgement-patterns/ Transaction and redelivery in
Centos添加硬盘完全教程 dcj3sjt126com linux centos hardware
Linux的硬盘识别: sda 表示第1块SCSI硬盘 hda 表示第1块IDE硬盘 scd0 表示第1个USB光驱一般使用“fdisk -l”命
yii2 restful web服务路由 dcj3sjt126com PHP yii2
路由随着资源和控制器类准备，您可以使用URL如 http://localhost/index.php?r=user/create访问资源，类似于你可以用正常的Web应用程序做法。在实践中，你通常要用美观的URL并采取有优势的HTTP动词。例如，请求POST /users意味着访问user/create动作。这可以很容易地通过配置urlManager应用程序组件来完成如下所示
MongoDB查询(4)——游标和分页[八] eksliang mongodb MongoDB游标 MongoDB深分页
转载请出自出处：http://eksliang.iteye.com/blog/2177567 一、游标数据库使用游标返回find的执行结果。客户端对游标的实现通常能够对最终结果进行有效控制，从shell中定义一个游标非常简单，就是将查询结果分配给一个变量（用var声明的变量就是局部变量），便创建了一个游标，如下所示： > var
Activity的四种启动模式和onNewIntent() gundumw100 android
Android中Activity启动模式详解　　在Android中每个界面都是一个Activity，切换界面操作其实是多个不同Activity之间的实例化操作。在Android中Activity的启动模式决定了Activity的启动运行方式。　　Android总Activity的启动模式分为四种： Activity启动模式设置： <acti
攻城狮送女友的CSS3生日蛋糕 ini html Web html5 css css3
在线预览：http://keleyi.com/keleyi/phtml/html5/29.htm 代码如下： <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>攻城狮送女友的CSS3生日蛋糕-柯乐义<
读源码学Servlet（1）GenericServlet 源码分析 jzinfo tomcat Web servlet 网络应用网络协议
Servlet API的核心就是javax.servlet.Servlet接口，所有的Servlet 类（抽象的或者自己写的）都必须实现这个接口。在Servlet接口中定义了5个方法，其中有3个方法是由Servlet 容器在Servlet的生命周期的不同阶段来调用的特定方法。先看javax.servlet.servlet接口源码： package
JAVA进阶：VO(DTO)与PO(DAO)之间的转换 snoopy7713 java VO Hibernate po
PO即 Persistence Object　　VO即 Value Object 　VO和PO的主要区别在于：　　VO是独立的Java Object。　　PO是由Hibernate纳入其实体容器（Entity Map）的对象，它代表了与数据库中某条记录对应的Hibernate实体，PO的变化在事务提交时将反应到实际数据库中。　实际上，这个VO被用作Data Transfer
mongodb group by date 聚合查询日期统计每天数据（信息量） qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 1 */ { "_id" : ObjectId("557ac1e2153c43c320393d9d"), "msgType" : "text", "sendTime" : ISODate("2015-06-12T11:26:26.000Z")
java之18天常用的类(一) Luob. Math Date System Runtime Rundom
System类 import java.util.Properties; /** * System: * out:标准输出,默认是控制台 * in:标准输入,默认是键盘 * * 描述系统的一些信息 * 获取系统的属性信息:Properties getProperties(); * * * */ public class Sy
maven wuai maven
1、安装maven：解压缩、添加M2_HOME、添加环境变量path 2、创建maven_home文件夹，创建项目mvn_ch01,在其下面建立src、pom.xml，在src下面简历main、test、main下面建立java文件夹 3、编写类，在java文件夹下面依照类的包逐层创建文件夹，将此类放入最后一级文件夹 4、进入mvn_ch01 4.1、mvn compile ,执行后会在