视学算法

哈工大硕士生用 Python 实现了 11 种经典数据降维算法，源代码库已开放

点击上方“视学算法”，选择“星标”公众号

重磅干货，第一时间送达

转自：AI开发者

网上关于各种降维算法的资料参差不齐，同时大部分不提供源代码。这里有个 GitHub 项目整理了使用 Python 实现了 11 种经典的数据抽取（数据降维）算法，包括：PCA、LDA、MDS、LLE、TSNE 等，并附有相关资料、展示效果；非常适合机器学习初学者和刚刚入坑数据挖掘的小伙伴。

01 为什么要进行数据降维？

所谓降维，即用一组个数为 d 的向量 Zi 来代表个数为 D 的向量 Xi 所包含的有用信息，其中 d

通常，我们会发现大部分数据集的维度都会高达成百乃至上千，而经典的 MNIST，其维度都是 64。

MNIST 手写数字数据集

但在实际应用中，我们所用到的有用信息却并不需要那么高的维度，而且每增加一维所需的样本个数呈指数级增长，这可能会直接带来极大的「维数灾难」；而数据降维就可以实现：

使得数据集更易使用
确保变量之间彼此独立
降低算法计算运算成本
去除噪音

一旦我们能够正确处理这些信息，正确有效地进行降维，这将大大有助于减少计算量，进而提高机器运作效率。而数据降维，也常应用于文本处理、人脸识别、图片识别、自然语言处理等领域。

02 数据降维原理

往往高维空间的数据会出现分布稀疏的情况，所以在降维处理的过程中，我们通常会做一些数据删减，这些数据包括了冗余的数据、无效信息、重复表达内容等。

例如：现有一张 1024*1024 的图，除去中心 50*50 的区域其它位置均为零值，这些为零的信息就可以归为无用信息；而对于对称图形而言，对称部分的信息则可以归为重复信息。

因此，大部分经典降维技术也是基于这一内容而展开，其中降维方法又分为线性和非线性降维，非线性降维又分为基于核函数和基于特征值的方法。

线性降维方法：

PCA 、ICA LDA、LFA、LPP(LE 的线性表示)

非线性降维方法：

基于核函数的非线性降维方法——KPCA 、KICA、KDA

基于特征值的非线性降维方法（流型学习）——ISOMAP、LLE、LE、LPP、LTSA、MVU

哈尔滨工业大学计算机技术专业的在读硕士生 Heucoder 则整理了 PCA、KPCA、LDA、MDS、ISOMAP、LLE、TSNE、AutoEncoder、FastICA、SVD、LE、LPP 共 12 种经典的降维算法，并提供了相关资料、代码以及展示，下面将主要以 PCA 算法为例介绍降维算法具体操作。

03 主成分分析（PCA）降维算法

PCA 是一种基于从高维空间映射到低维空间的映射方法，也是最基础的无监督降维算法，其目标是向数据变化最大的方向投影，或者说向重构误差最小化的方向投影。它由 Karl Pearson 在 1901 年提出，属于线性降维方法。与 PCA 相关的原理通常被称为最大方差理论或最小误差理论。这两者目标一致，但过程侧重点则不同。

最大方差理论降维原理

将一组 N 维向量降为 K 维（K 大于 0，小于 N），其目标是选择 K 个单位正交基，各字段两两间 COV(X,Y) 为 0，而字段的方差则尽可能大。因此，最大方差即使得投影数据的方差被最大化，在这过程中，我们需要找到数据集 Xmxn 的最佳的投影空间 Wnxk、协方差矩阵等，其算法流程为：

算法输入：数据集 Xmxn；
按列计算数据集 X 的均值 Xmean，然后令 Xnew=X−Xmean；
求解矩阵 Xnew 的协方差矩阵，并将其记为 Cov；
计算协方差矩阵 COv 的特征值和相应的特征向量；
将特征值按照从大到小的排序，选择其中最大的 k 个，然后将其对应的 k 个特征向量分别作为列向量组成特征向量矩阵 Wnxk；
计算 XnewW，即将数据集 Xnew 投影到选取的特征向量上，这样就得到了我们需要的已经降维的数据集 XnewW。

最小误差理论降维原理

而最小误差则是使得平均投影代价最小的线性投影，这一过程中，我们则需要找到的是平方错误评价函数 J0(x0) 等参数。

详细步骤可参考《从零开始实现主成分分析 (PCA) 算法》：

https://blog.csdn.net/u013719780/article/details/78352262

04 主成分分析（PCA）代码实现

关于 PCA 算法的代码如下：

from __future__ import print_function
from sklearn import datasets
import matplotlib.pyplot as plt
import matplotlib.cm as cmx
import matplotlib.colors as colors
import numpy as np
%matplotlib inline


def shuffle_data(X, y, seed=None):
   if seed:
     np.random.seed(seed)


   idx = np.arange(X.shape[0])
   np.random.shuffle(idx)


   return X[idx], y[idx]


# 正规化数据集 X
def normalize(X, axis=-1, p=2):
   lp_norm = np.atleast_1d(np.linalg.norm(X, p, axis))
   lp_norm[lp_norm == 0] = 1
   return X / np.expand_dims(lp_norm, axis)
# 标准化数据集 X
def standardize(X):
   X_std = np.zeros(X.shape)
   mean = X.mean(axis=0)
   std = X.std(axis=0)


   # 做除法运算时请永远记住分母不能等于 0 的情形
   # X_std = (X - X.mean(axis=0)) / X.std(axis=0) 
   for col in range(np.shape(X)[1]):
     if std[col]:
       X_std[:, col] = (X_std[:, col] - mean[col]) / std[col]
   return X_std
# 划分数据集为训练集和测试集
def train_test_split(X, y, test_size=0.2, shuffle=True, seed=None):
   if shuffle:
     X, y = shuffle_data(X, y, seed)
   n_train_samples = int(X.shape[0] * (1-test_size))
   x_train, x_test = X[:n_train_samples], X[n_train_samples:]
   y_train, y_test = y[:n_train_samples], y[n_train_samples:]


   return x_train, x_test, y_train, y_test


# 计算矩阵 X 的协方差矩阵
def calculate_covariance_matrix(X, Y=np.empty((0,0))):
   if not Y.any():
      Y = X
   n_samples = np.shape(X)[0]
   covariance_matrix = (1 / (n_samples-1)) * (X - X.mean(axis=0)).T.dot(Y - Y.mean(axis=0))
   return np.array(covariance_matrix, dtype=float)
# 计算数据集 X 每列的方差
def calculate_variance(X):
   n_samples = np.shape(X)[0]
   variance = (1 / n_samples) * np.diag((X - X.mean(axis=0)).T.dot(X - X.mean(axis=0)))
   return variance
# 计算数据集 X 每列的标准差
def calculate_std_dev(X):
   std_dev = np.sqrt(calculate_variance(X))
   return std_dev


# 计算相关系数矩阵
def calculate_correlation_matrix(X, Y=np.empty([0])):
   # 先计算协方差矩阵
   covariance_matrix = calculate_covariance_matrix(X, Y)
   # 计算 X, Y 的标准差
   std_dev_X = np.expand_dims(calculate_std_dev(X), 1)
   std_dev_y = np.expand_dims(calculate_std_dev(Y), 1)
   correlation_matrix = np.divide(covariance_matrix, std_dev_X.dot(std_dev_y.T))


   return np.array(correlation_matrix, dtype=float)


class PCA():
   """
   主成份分析算法 PCA，非监督学习算法.
   """
   def __init__(self):
     self.eigen_values = None
     self.eigen_vectors = None
     self.k = 2


   def transform(self, X):
     """ 
     将原始数据集 X 通过 PCA 进行降维
     """
     covariance = calculate_covariance_matrix(X)


     # 求解特征值和特征向量
     self.eigen_values, self.eigen_vectors = np.linalg.eig(covariance)


     # 将特征值从大到小进行排序，注意特征向量是按列排的，即 self.eigen_vectors 第 k 列是 self.eigen_values 中第 k 个特征值对应的特征向量
     idx = self.eigen_values.argsort()[::-1]
     eigenvalues = self.eigen_values[idx][:self.k]
     eigenvectors = self.eigen_vectors[:, idx][:, :self.k]
     # 将原始数据集 X 映射到低维空间
     X_transformed = X.dot(eigenvectors)


     return X_transformed


def main():
   # Load the dataset
   data = datasets.load_iris()
   X = data.data
   y = data.target


   # 将数据集 X 映射到低维空间
   X_trans = PCA().transform(X)


   x1 = X_trans[:, 0]
   x2 = X_trans[:, 1]


   cmap = plt.get_cmap('viridis')
   colors = [cmap(i) for i in np.linspace(0, 1, len(np.unique(y)))]


   class_distr = []
   # Plot the different class distributions
   for i, l in enumerate(np.unique(y)):
       _x1 = x1[y == l]
       _x2 = x2[y == l]
       _y = y[y == l]
       class_distr.append(plt.scatter(_x1, _x2, color=colors[i]))


   # Add a legend
   plt.legend(class_distr, y, loc=1)


   # Axis labels
   plt.xlabel('Principal Component 1')
   plt.ylabel('Principal Component 2')
   plt.show()


if __name__ == "__main__":
   main()

最终，我们将得到降维结果如下。其中，如果得到当特征数 (D) 远大于样本数 (N) 时，可以使用一点小技巧实现 PCA 算法的复杂度转换。

PCA 降维算法展示

当然，这一算法虽然经典且较为常用，其不足之处也非常明显。它可以很好的解除线性相关，但是面对高阶相关性时，效果则较差；同时，PCA 实现的前提是假设数据各主特征是分布在正交方向上，因此对于在非正交方向上存在几个方差较大的方向，PCA 的效果也会大打折扣。

05 其它降维算法及代码地址

KPCA（kernel PCA）

KPCA 是核技术与 PCA 结合的产物，它与 PCA 主要差别在于计算协方差矩阵时使用了核函数，即是经过核函数映射之后的协方差矩阵。

引入核函数可以很好的解决非线性数据映射问题。kPCA 可以将非线性数据映射到高维空间，在高维空间下使用标准 PCA 将其映射到另一个低维空间。

KPCA 降维算法展示

详细内容可参见《Python 机器学习》之特征抽取——kPCA：

https://blog.csdn.net/weixin_40604987/article/details/79632888

代码地址：

https://github.com/heucoder/dimensionality_reduction_alo_codes/blob/master/codes/PCA/KPCA.py

LDA（Linear Discriminant Analysis）

LDA 是一种可作为特征抽取的技术，其目标是向最大化类间差异，最小化类内差异的方向投影，以利于分类等任务即将不同类的样本有效的分开。LDA 可以提高数据分析过程中的计算效率，对于未能正则化的模型，可以降低维度灾难带来的过拟合。

LDA 降维算法展示

详细内容可参见《数据降维—线性判别分析（LDA）》：

https://blog.csdn.net/ChenVast/article/details/79227945

代码地址：

https://github.com/heucoder/dimensionality_reduction_alo_codes/tree/master/codes/LDA

MDS（multidimensional scaling）

MDS 即多维标度分析，它是一种通过直观空间图表示研究对象的感知和偏好的传统降维方法。该方法会计算任意两个样本点之间的距离，使得投影到低维空间之后能够保持这种相对距离从而实现投影。

由于 sklearn 中 MDS 是采用迭代优化方式，下面实现了迭代和非迭代的两种。

MDS 降维算法展示

详细内容可参见《MDS 算法》

https://blog.csdn.net/zhangweiguo_717/article/details/69663452

代码地址：

https://github.com/heucoder/dimensionality_reduction_alo_codes/tree/master/codes/MDS

ISOMAP

Isomap 即等度量映射算法，该算法可以很好地解决 MDS 算法在非线性结构数据集上的弊端。

MDS 算法是保持降维后的样本间距离不变，Isomap 算法则引进了邻域图，样本只与其相邻的样本连接，计算出近邻点之间的距离，然后在此基础上进行降维保距。

ISOMAP 降维算法展示

详细内容可参见《Isomap》

https://blog.csdn.net/zhangweiguo_717/article/details/69802312

代码地址：

https://github.com/heucoder/dimensionality_reduction_alo_codes/tree/master/codes/ISOMAP

LLE（locally linear embedding）

LLE 即局部线性嵌入算法，它是一种非线性降维算法。该算法核心思想为每个点可以由与它相邻的多个点的线性组合而近似重构，然后将高维数据投影到低维空间中，使其保持数据点之间的局部线性重构关系，即有相同的重构系数。在处理所谓的流形降维的时候，效果比 PCA 要好很多。

LLE 降维算法展示

详细内容可参见《LLE 原理及推导过程》

https://blog.csdn.net/scott198510/article/details/76099630

代码地址：

https://github.com/heucoder/dimensionality_reduction_alo_codes/tree/master/codes/LLE

t-SNE

t-SNE 也是一种非线性降维算法，非常适用于高维数据降维到 2 维或者 3 维进行可视化。它是一种以数据原有的趋势为基础，重建其在低纬度（二维或三维）下数据趋势的无监督机器学习算法。

下面的结果展示参考了源代码，同时也可用 tensorflow 实现（无需手动更新参数）。

t-SNE 降维算法展示

详细内容可参见《t-SNE 使用过程中的一些坑》：

http://bindog.github.io/blog/2018/07/31/t-sne-tips/

代码地址：

https://github.com/heucoder/dimensionality_reduction_alo_codes/tree/master/codes/T-SNE

LE（Laplacian Eigenmaps）

LE 即拉普拉斯特征映射，它与 LLE 算法有些相似，也是以局部的角度去构建数据之间的关系。它的直观思想是希望相互间有关系的点（在图中相连的点）在降维后的空间中尽可能的靠近；以这种方式，可以得到一个能反映流形的几何结构的解。

LE 降维算法展示

详细内容可参见《拉普拉斯特征图降维及其 python 实现》：

https://blog.csdn.net/HUSTLX/article/details/50850342

代码地址：

https://github.com/heucoder/dimensionality_reduction_alo_codes/tree/master/codes/LE

LPP（Locality Preserving Projections）

LPP 即局部保留投影算法，其思路和拉普拉斯特征映射类似，核心思想为通过最好的保持一个数据集的邻居结构信息来构造投影映射，但 LPP 不同于 LE 的直接得到投影结果，它需要求解投影矩阵。

LPP 降维算法展示

详情请参见《局部保留投影算法 (LPP) 详解》：

https://blog.csdn.net/qq_39187538/article/details/90402961

代码地址：

https://github.com/heucoder/dimensionality_reduction_alo_codes/tree/master/codes/LPP

*《dimensionality_reduction_alo_codes》项目作者简介

Heucoder，目前是哈尔滨工业大学计算机技术在读硕士生，主要活跃于互联网领域，知乎昵称为「超爱学习」，其 github 主页地址为：https://github.com/heucoder。

Github 项目地址:

https://github.com/heucoder/dimensionality_reduction_alo_codes

感谢你的分享，点赞，在看三连↓

【Linux】Ubuntu中，如何创建软件的快捷方式放到桌面上 lijiatu10086 linux ubuntu 运维
本文主要介绍Ubuntu中，如何创建软件的快捷方式放到桌面上首先进入到/usr/share/applications/路径下，找到自己想要的软件，这里以我的vim为例子ricardo@DESKTOP-8T8LHV5:/usr/share/applications$lsbyobu.desktopio.snapcraft.SessionAgent.desktoppython2.7.desktopvim
C++实现学生管理系统 lijiatu10086 C++c++
文章目录实验要求一、实验平台二、代码1.结构体以及相关变量2.相关函数实现过程（1）判断一个学生是否已经存在（2）从文件中读写学生信息（3）增加学生（4）删除学生（5）修改学生（6）查询学生（7）main函数的实现3.整体代码总结实验要求实验要求：将班上同学的信息（编号（001对应第一个，008对应第八个），姓名，性别，年龄，学校，年级，班级，爱好……），使用自己设计的结构体来存储。并在此基础上结
Win11将右键菜单改回Win10右键菜单样式(右键菜单默认展开）前端页面仔 windows 开发语言
1，首先用鼠标右键点击“开始”按钮(或者按Win+X键），点击Windows终端(管理员)2，在终端应用程序里粘贴下面的代码win10右键菜单(展开)regadd"HKCU\Software\Classes\CLSID\{86ca1aa0-34aa-4e8b-a509-50c905bae2a2}\InprocServer32"/f/vetaskkill/f/imexplorer.exe&start
Python+Pymysql+PooledDB实现数据库连接池 liuage_ python 数据库
1.引言在测试中，频繁地创建和销毁数据库连接会消耗大量的资源，并且可能导致数据库连接的泄露或者性能下降。因此，使用连接池可以有效地管理数据库连接，提高程序的性能和可靠性。2.实现MySQL连接池的类我们将使用Python的pymysql库和dbutils库中的PooledDB来实现MySQL连接池。终端输入命令安装两个库pipinstallpymysqlpipinstalldbutils以下是实现
VSCode用ssh连接ubuntu虚拟机实现远程访问文件夹小熊@XiaoXiong linux环境高级编程 c语言嵌入式 vscode ssh ubuntu
1.ubuntu安装ssh服务1.1安装sudoapt-getinstallsshsudoapt-getinstallopenssh-server1.2启动ssh服务sudoservicesshstartsudoservicesshstatus#查看状态##或者用下面方式重启ssh服务##/etc/init.d/sshrestart1.3ssh服务加入开机启动
长链接-WebSocket ZhiguoXue_IT netty学习 websocket 网络服务器
技术主题马上工作了三年，回想起这三年的工作，和别的部门进行数据交互，一种是通过rpc接口，另一种是通过http接口，获取到自己想要的数据，或者给出自己的数据。在电商的业务场景中，通过设置调用的超时时间来满足一些调用比较慢的服务，所涉及的都是单相工通信。在IM的服务中，有多种业务场景需要客户端和服务端建立长链接，比如说语音转文字，客户端一直在输入语音，客户端和服务端保持通信，一直进行语音转化为文字，
深度学习 vs 传统机器学习：哪个更适合你的项目？ AI大模型应用之禅深度学习机器学习人工智能 ai
深度学习vs传统机器学习：哪个更适合你的项目？关键词：深度学习、传统机器学习、特征工程、数据量、计算资源、项目选择、算法对比摘要：本文将用"炒菜"和"拼图"等生活案例，从核心原理、适用场景、资源需求等维度对比深度学习与传统机器学习。通过具体代码示例和真实项目场景分析，帮助开发者和企业决策者快速判断：你的项目该选深度学习还是传统机器学习？背景介绍目的和范围随着AI技术普及，"该用深度学习还是传统机器
Node.js特训专栏-实战进阶：11. Redis缓存策略与应用场景爱分享的程序员 Node.js 前端网络相关 javascript node.js 前端
欢迎来到Node.js实战专栏！在这里，每一行代码都是解锁高性能应用的钥匙，让我们一起开启Node.js的奇妙开发之旅！Node.js特训专栏主页专栏内容规划详情Redis缓存策略与应用场景：从理论到实战的高性能解决方案一、Redis基础概述1.1Redis核心特性Redis作为高性能内存数据库，具备以下关键优势：1.1.1内存极速读写读写性能：基于纯内存操作，读写操作在微秒级完成，实测单节点QP
Python 机器学习实战：泰坦尼克号生还者预测 (从数据探索到模型构建) 程序员阿超的博客 Python python 机器学习开发语言泰坦尼克号 Kaggle Scikit-learn 实战教程
引言：挑战介绍泰坦尼克号的沉没是历史上最著名的海难之一。除了其悲剧色彩，它还为数据科学提供了一个经典且引人入胜的入门项目。Kaggle平台上的“Titanic:MachineLearningfromDisaster”竞赛，要求我们利用乘客数据来预测哪些人更有可能在这场灾难中幸存。这是一个典型的二元分类问题：目标变量Survived只有两个值，0（遇难）或1（生还）。这个项目之所以经典，是因为它涵盖
colour-demosaicing：实现多款CFA去马赛克算法的Python开源包常琚蕙
colour-demosaicing：实现多款CFA去马赛克算法的Python开源包colour-demosaicingCFA(ColourFilterArray)DemosaicingAlgorithmsforPython项目地址:https://gitcode.com/gh_mirrors/co/colour-demosaicing项目介绍在数字图像处理领域，马赛克效应（Mosaicing）是
Python Web开发之“基于flask的轻量级Web应用” 诚威_lol_中大努力中夏令营复习 python 前端 flask
参考文章1：https://cloud.tencent.com/developer/article/2373503参考文章2：基于Flask的自定义网站设计与实现（代码全文+讲解V1.0）_flask框架制作网页-CSDN博客参考文章3：Python+Flask+MysqL设计网页-李明惠-博客园(cnblogs.com)最基本的例子来源-参考文章1：说明：导入Flask类——>app=Flask
vue3 - 【完整源码】超详细实现网站 / H5 在线预览 pdf 文件功能，支持缩放、旋转、全屏预览、打印、下载、内容检索、主题色定制、侧边缩略图、页码跳转等等（最好用的pdf预览器，注释详细！）十一猫咪爱养鱼前端组件与功能(开箱即用)Vue组件与功能(工作经验)vue常见问题解决 vue3 pdf 预览器 vue3网页打开pdf文件 vue3 可自定义界面的pdf vue3 pdf 网页预览下载 vue3项目预览PDF插件组件
效果图在Vue3.js项目中，实现了快速高效的pdf预览器工具组件，附带详细的使用教程与详细的注释，保证一键复制轻松搞定！详细的注释很容易二次修改，很多实用功能，你也可以自定义界面上的样式、DIY一切！组件源码首先
pychram虚拟环境中安装不同python版本小炫y python
安装AnacondaAnaconda|TheWorld'sMostPopularDataSciencePlatform安装时选justme路径可以改，其他默认都可以。然后打开anacondaprompt输入指令安装需要的python版本，condacreate-npython39Python=3.9再输入y确认查看python虚拟环境路径，condainfo-e然后在pycharm中设置一下就可以
LLM大语言模型学习笔记（1） Arixs666 大语言模型语言模型笔记人工智能
1.概念大语言模型（LLM，LargeLanguageModel），也称大型语言模型，是一种旨在理解和生成人类语言的人工智能模型。LLM通常指包含数百亿（或更多）参数的语言模型，它们在海量的文本数据上进行训练，从而获得对语言深层次的理解。2.能力2.1涌现能力区分大语言模型（LLM）与以前的预训练语言模型（PLM）最显著的特征之一是它们的涌现能力。涌现能力是一种令人惊讶的能力，它在小型模型中不明显
Selenium浏览器驱动全面指南：Chrome、Firefox与IE
本文还有配套的精品资源，点击获取简介：Selenium是一个用于自动化Web应用程序测试的工具，支持多种浏览器，包括GoogleChrome、MozillaFirefox和InternetExplorer（IE）。本指南详细介绍如何配置和使用与这三种主流浏览器协同工作的Selenium驱动程序。包括ChromeDriver、GeckoDriver和IEDriverServer，以及在Python中
【python数据分析】数据建模之Kmeans聚类斑点鱼 SpotFish python 数据建模聚类 python 数据分析
K-means聚类：最常用的机器学习聚类算法，且为典型的基于距离的聚类算法。K均值：基于原型的、划分的距离技术，它试图发现用户指定个数(K)的簇以欧式距离作为相似度测度Kmeans聚类案例分析：make_blobs聚类数据生成器#导入模块from sklearn.cluster import KMeansfromsklearn.datasetsimportmake_blobs#创建数据x,y_tr
$.post 上传文件_基于 Laravel + Vue 组件实现文件异步上传 Clever Liu $.post 上传文件
我们在上一篇教程中已经演示了如何通过Request请求实例获取各种文本输入数据，但是还有一种输入数据我们没有涉及到，那就是文件上传。我们可以通过Request请求实例提供的file方法获取用户上传文件，并将其保存到指定目录从而完成文件上传，接下来，我们将从前端到后端实现一个完整的用户上传文件功能，包括视图、路由、控制器部分代码。定义文件上传路由首先我们在routes/web.php中定义上传文件涉
掌握Linux C++轻量级Web服务器开发：TinyWebServer项目实战老光私享
本文还有配套的精品资源，点击获取简介：TinyWebServer是一个用C++编写的轻量级Web服务器，专为Linux系统设计。它提供了深入学习Web服务器工作原理和本地开发小型项目的机会。项目涵盖了网络套接字编程、多线程处理、HTTP协议解析等关键系统编程技术，并允许通过源代码分析学习和实践。开发者可以通过扩展TinyWebServer来学习更多关于Web服务器的深入知识和技术。1.Linux下
Java ArrayList 扩容机制笑衬人心。 JAVA学习笔记 java 开发语言笔记后端
一、ArrayList简介ArrayList是Java集合框架中基于数组实现的可变长度列表，其核心特性是：支持随机访问（通过索引）支持动态扩容插入/删除效率较低（非尾部操作）二、底层数据结构//JDK11+transientObject[]elementData;//实际存储元素的数组三、容量与初始状态默认构造函数publicArrayList(){this.elementData=DEFAULT
Spring 中 Bean 的生命周期笑衬人心。 JAVA学习笔记 spring java 后端
一、什么是Bean生命周期？Spring中的Bean生命周期是指一个Bean从被容器创建到最终销毁所经历的一系列过程。它体现了SpringIOC容器在管理Bean实例时所执行的各个钩子流程，包括初始化、依赖注入、增强处理、销毁等多个环节。二、Bean生命周期完整流程（逻辑顺序）1.实例化（Constructor）2.属性注入（依赖注入，DI）3.感知阶段（Aware接口）4.初始化前处理（Bean
深刻解析如何解决在pycharm中导入tensorflow的子模块keras时的报错（导入语法正确） lovingf pycharm python tensorflow keras
只是导入时报错，但代码仍可以运行1.导入方式正确，但pycharm将其标红2.通过查看tensorflow的官方文件，猜测可能是python版本不适配python需为python3.6-3.9，而我的为python3.113.配置python3.9的环境（详情可看我的另一篇文章），但依然报错4.经过仔细分析，觉得可能是pycharm与tensorflow的适配问题，pycharm无法寻找到tens
如何快速开发一个鸿蒙app 深山技术宅鸿蒙 harmonyos 华为
快速开发一个鸿蒙（HarmonyOS）App的关键在于利用好官方提供的工具链、模板和资源。以下是一个高效且实用的步骤指南，帮助你快速上手：核心步骤概览：环境搭建创建项目（选择模板）理解核心概念&编写UI实现基础功能预览&调试编译&运行（可选）发布到AppGallery1.环境搭建（基础，必须）操作系统：Windows10(64位)/macOS10.13或更高版本。安装Node.js(>=14.19
Vue-pdf预览pdf文件流：让Vue项目中的PDF预览变得简单
Vue-pdf预览pdf文件流：让Vue项目中的PDF预览变得简单【下载地址】Vue-pdf预览pdf文件流Vue-pdf预览PDF文件流是一个专为Vue项目设计的开源解决方案，旨在帮助开发者轻松实现在线预览PDF文件的功能。通过集成vue-pdf插件，该项目简化了在Vue应用中嵌入和展示PDF文件的过程，支持流式传输，提升用户体验。开发者只需按照简单的步骤将插件引入项目，并根据需求配置文件路径或
链表重排序问题 VictorWuuu 算法链表数据结构后端
链表重排序问题（1→2→…→n变为1→n→2→n-1→…）问题分析这道题目要求我们将一个链表从1→2→...→n重排为1→n→2→n-1→...的形式，并且要求空间复杂度为O(1)。例如：输入：1→2→3→4→输出：1→4→2→3输入：1→2→3→4→5→输出：1→5→2→4→3解题思路由于空间复杂度限制为O(1)，我们不能使用额外的数据结构（如数组）来存储节点。可以通过以下步骤实现：找到链表中点
大语言模型LLM原理篇
大模型席卷全球，彷佛得模型者得天下。对于IT行业来说，以后可能没有各种软件了，只有各种各样的智体（Agent）调用各种各样的API。在这种大势下，笔者也阅读了很多大模型相关的资料，和很多新手一样，开始脑子里都是一团乱麻，随着相关文章越读越多，再进行内容梳理，终于理清了一条清晰的脉络。笔者写原理篇时心情是有些惴惴不安的，因为毕竟对大模型的研究有限，缺乏深度。但是，还是觉得有必要记录一下学习理解心得，
精通C++包括哪些方面 melonbo 百问 -C/C++c++
一、语言核心与标准特性多范式编程掌握过程式、面向对象（OOP）、泛型编程（模板）和函数式编程，能根据场景选择最佳范式。内存管理熟练使用new/delete、智能指针（unique_ptr、shared_ptr），理解RAII原则，避免内存泄漏。现代C++标准应用C++11/14/17/20特性（如移动语义、lambda表达式、协程），提升代码效率。模板与元编程实现函数/类模板，掌握SFINAE、变
计算整数二进制中1的个数 VictorWuuu 算法算法后端
Golang实现：计算整数二进制中1的个数（包含负数补码）问题分析这道题目要求我们计算一个整数的二进制表示中1的个数，对于负数需要考虑其补码形式。例如：输入：5（二进制：101）→输出：2输入：-3（二进制补码：1111...1101）→输出：31（32位系统下）解题思路我们可以利用位运算中的与运算（&）来检查整数的每一位是否为1。具体步骤如下：初始化计数器为0通过循环检查整数的每一位：将整数与1
我的第一个开源项目：用Python搭建轻量级静态网页服务器—— 零基础也能实现的Web开发初体验
一、为什么选择静态服务器？极简高效：无需数据库或复杂后端逻辑，适合展示简历、作品集等静态内容学习曲线平缓：是理解HTTP协议和Web服务原理的最佳入门方式资源消耗低：单文件Python脚本即可运行，内存占用小于10MB二、完整开发流程（含代码逐行解析）第一步：创建项目结构PWS/#项目根目录├──static/#静态资源文件夹│├──index.html#主页│├──style.css#样式表│└
深入游戏开发：瓦片地图与游戏引擎集成蓉蓉蓉蓉瓦片地图游戏引擎 Lua脚本库存管理动态滚动
背景简介在游戏开发领域，瓦片地图技术（Tilemap）是实现2D游戏世界构建的重要工具。它通过在网格上排列和渲染预制的瓦片图像，来创建游戏场景。本文将基于书籍章节内容，探讨瓦片地图的构建与优化，以及如何将脚本有效集成到游戏引擎中。瓦片地图构建与优化瓦片地图的构建涉及几个关键步骤，如位图的构建、库存和物品的管理。书中提到，位图可以通过编程方式动态生成，也可以从文件中加载。例如，通过调用loadTil
linux 互斥锁销毁_Linux系统编程 —互斥量mutex weixin_39609622 linux 互斥锁销毁
互斥量mutex前文提到，系统中如果存在资源共享，线程间存在竞争，并且没有合理的同步机制的话，会出现数据混乱的现象。为了实现同步机制，Linux中提供了多种方式，其中一种方式为互斥锁mutex(也称之为互斥量)。互斥量的具体实现方式为：每个线程在对共享资源操作前都尝试先加锁，成功加锁后才可以对共享资源进行读写操作，操作结束后解锁。互斥量不是为了消除竞争，实际上，资源还是共享的，线程间也还是竞争的，
java Illegal overloaded getter method with ambiguous type for propert的解决 zwllxs java jdk
好久不来iteye,今天又来看看，哈哈,今天碰到在编码时，反射中会抛出 Illegal overloaded getter method with ambiguous type for propert这么个东东，从字面意思看，是反射在获取getter时迷惑了，然后回想起java在boolean值在生成getter时，分别有is和getter，也许我们的反射对象中就有is开头的方法迷惑了jdk，
IT人应当知道的10个行业小内幕 beijingjava 工作互联网
10. 虽然IT业的薪酬比其他很多行业要好，但有公司因此视你为其“佣人”。　　尽管IT人士的薪水没有互联网泡沫之前要好，但和其他行业人士比较，IT人的薪资还算好点。在接下的几十年中，科技在商业和社会发展中所占分量会一直增加，所以我们完全有理由相信，IT专业人才的需求量也不会减少。　　然而，正因为IT人士的薪水普遍较高，所以有些公司认为给了你这么多钱，就把你看成是公司的“佣人”，拥有你的支配
java 实现自定义链表 CrazyMizzz java 数据结构
1.链表结构链表是链式的结构 2.链表的组成链表是由头节点，中间节点和尾节点组成节点是由两个部分组成： 1.数据域 2.引用域 3.链表的实现 &nbs
web项目发布到服务器后图片过一会儿消失麦田的设计者 struts2 上传图片永久保存
作为一名学习了android和j2ee的程序员，我们必须要意识到，客服端和服务器端的交互是很有必要的，比如你用eclipse写了一个web工程，并且发布到了服务器（tomcat）上，这时你在webapps目录下看到了你发布的web工程，你可以打开电脑的浏览器输入http://localhost:8080/工程/路径访问里面的资源。但是，有时你会突然的发现之前用struts2上传的图片
CodeIgniter框架Cart类 name 不能设置中文的解决方法 IT独行者 CodeIgniter Cart 框架　
今天试用了一下CodeIgniter的Cart类时遇到了个小问题，发现当name的值为中文时，就写入不了session。在这里特别提醒一下。在CI手册里也有说明，如下： $data = array( 'id' => 'sku_123ABC', 'qty' => 1, '
linux回收站 _wy_ linux 回收站
今天一不小心在ubuntu下把一个文件移动到了回收站，我并不想删，手误了。我急忙到Nautilus下的回收站中准备恢复它，但是里面居然什么都没有。后来我发现这是由于我删文件的地方不在HOME所在的分区，而是在另一个独立的Linux分区下，这是我专门用于开发的分区。而我删除的东东在分区根目录下的.Trash-1000/file目录下，相关的删除信息（删除时间和文件所在
jquery回到页面顶端知了ing html jquery css
html代码： <h1 id="anchor">页面标题</h1> <div id="container">页面内容</div> <p><a href="#anchor" class="topLink">回到顶端</a><
B树、B-树、B+树、B*树矮蛋蛋 B树
原文地址： http://www.cnblogs.com/oldhorse/archive/2009/11/16/1604009.html B树即二叉搜索树： 1.所有非叶子结点至多拥有两个儿子（Left和Right）； &nb
数据库连接池 alafqq 数据库连接池
http://www.cnblogs.com/xdp-gacl/p/4002804.html @Anthor:孤傲苍狼数据库连接池用MySQLv5版本的数据库驱动没有问题，使用MySQLv6和Oracle的数据库驱动时候报如下错误： java.lang.ClassCastException: $Proxy0 cannot be cast to java.sql.Connec
java泛型百合不是茶 java泛型
泛型在Java SE 1.5之前，没有泛型的情况的下，通过对类型Object的引用来实现参数的“任意化”，任意化的缺点就是要实行强制转换，这种强制转换可能会带来不安全的隐患泛型的特点：消除强制转换确保类型安全向后兼容简单泛型的定义：泛型：就是在类中将其模糊化，在创建对象的时候再具体定义 class fan
javascript闭包[两个小测试例子] bijian1013 JavaScript JavaScript
一.程序一 <script> var name = "The Window"; var Object_a = { 　　name : "My Object", 　　getNameFunc : function(){ var that = this; 　　　　return function(){ 　　　　
探索JUnit4扩展：假设机制（Assumption） bijian1013 java Assumption JUnit 单元测试
一.假设机制（Assumption）概述理想情况下，写测试用例的开发人员可以明确的知道所有导致他们所写的测试用例不通过的地方，但是有的时候，这些导致测试用例不通过的地方并不是很容易的被发现，可能隐藏得很深，从而导致开发人员在写测试用例时很难预测到这些因素，而且往往这些因素并不是开发人员当初设计测试用例时真正目的，
【Gson四】范型POJO的反序列化 bit1129 POJO
在下面这个例子中，POJO(Data类)是一个范型类，在Tests中，指定范型类为PieceData，POJO初始化完成后，通过 String str = new Gson().toJson(data); 得到范型化的POJO序列化得到的JSON串，然后将这个JSON串反序列化为POJO import com.google.gson.Gson; import java.
【Spark八十五】Spark Streaming分析结果落地到MySQL bit1129 Stream
几点总结： 1. DStream.foreachRDD是一个Output Operation，类似于RDD的action，会触发Job的提交。DStream.foreachRDD是数据落地很常用的方法 2. 获取MySQL Connection的操作应该放在foreachRDD的参数（是一个RDD[T]=>Unit的函数类型)，这样，当foreachRDD方法在每个Worker上执行时，
NGINX + LUA实现复杂的控制 ronin47 nginx lua
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-递归判断数组是否升序 bylijinnan java
public class IsAccendListRecursive { /*递归判断数组是否升序 * if a Integer array is ascending,return true * use recursion */ public static void main(String[] args){ IsAccendListRecursiv
Netty源码学习-DefaultChannelPipeline2 bylijinnan java netty
Netty3的API http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/ChannelPipeline.html 里面提到ChannelPipeline的一个“pitfall”：如果ChannelPipeline只有一个handler（假设为handlerA）且希望用另一handler（假设为handlerB）来
Java工具之JPS chinrui java
JPS使用熟悉Linux的朋友们都知道，Linux下有一个常用的命令叫做ps（Process Status)，是用来查看Linux环境下进程信息的。同样的，在Java Virtual Machine里面也提供了类似的工具供广大Java开发人员使用，它就是jps（Java Process Status)，它可以用来
window.print分页打印 ctrain window
function init() { var tt = document.getElementById("tt"); var childNodes = tt.childNodes[0].childNodes; var level = 0; for (var i = 0; i < childNodes.length; i++) {
安装hadoop时执行jps命令Error occurred during initialization of VM daizj jdk hadoop jps
在安装hadoop时，执行JPS出现下面错误 [slave16][email protected]:/tmp/hsperfdata_hdfs# jps Error occurred during initialization of VM java.lang.Error: Properties init: Could not determine current working
PHP开发大型项目的一点经验 dcj3sjt126com PHP 重构
一、变量最好是把所有的变量存储在一个数组中，这样在程序的开发中可以带来很多的方便，特别是当程序很大的时候。变量的命名就当适合自己的习惯，不管是用拼音还是英语，至少应当有一定的意义，以便适合记忆。变量的命名尽量规范化，不要与PHP中的关键字相冲突。二、函数 PHP自带了很多函数，这给我们程序的编写带来了很多的方便。当然，在大型程序中我们往往自己要定义许多个函数，几十
android笔记之--向网络发送GET/POST请求参数 dcj3sjt126com android
使用GET方法发送请求 private static boolean sendGETRequest (String path, Map<String, String> params) throws Exception{ //发送地http://192.168.100.91:8080/videoServi
linux复习笔记之bash shell (3) 通配符 eksliang linux 通配符 linux通配符
转载请出自出处： http://eksliang.iteye.com/blog/2104387 在bash的操作环境中有一个非常有用的功能，那就是通配符。下面列出一些常用的通配符，如下表所示符号意义 * 万用字符，代表0个到无穷个任意字符 ? 万用字符，代表一定有一个任意字符 [] 代表一定有一个在中括号内的字符。例如：[abcd]代表一定有一个字符，可能是a、b、c
Android关于短信加密 gqdy365 android
关于Android短信加密功能，我初步了解的如下（只在Android应用层试验）： 1、因为Android有短信收发接口，可以调用接口完成短信收发；发送过程：APP（基于短信应用修改）接受用户输入号码、内容——>APP对短信内容加密——>调用短信发送方法Sm
asp.net在网站根目录下创建文件夹 hvt .net C#hovertree asp.net Web Forms
假设要在asp.net网站的根目录下建立文件夹hovertree,C#代码如下： string m_keleyiFolderName = Server.MapPath("/hovertree"); if (Directory.Exists(m_keleyiFolderName)) { //文件夹已经存在 return; } else { try { D
一个合格的程序员应该读过哪些书 justjavac 程序员书籍
编者按：2008年8月4日，StackOverflow 网友 Bert F 发帖提问：哪本最具影响力的书，是每个程序员都应该读的？ “如果能时光倒流，回到过去，作为一个开发人员，你可以告诉自己在职业生涯初期应该读一本，你会选择哪本书呢？我希望这个书单列表内容丰富，可以涵盖很多东西。” 很多程序员响应，他们在推荐时也写下自己的评语。以前就有国内网友介绍这个程序员书单，不过都是推荐数
单实例实践跑龙套_az 单例
1、内部类 public class Singleton { private static class SingletonHolder { public static Singleton singleton = new Singleton(); } public Singleton getRes
PO VO BEAN 理解 q137681467 VO DTO po
PO：全称是 persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。 BO：全称是 business object:业务对象主要作用是把业务逻辑封装为一个对象。这个对
战胜惰性，暗自努力金笛子努力
偶然看到一句很贴近生活的话：“别人都在你看不到的地方暗自努力，在你看得到的地方，他们也和你一样显得吊儿郎当，和你一样会抱怨，而只有你自己相信这些都是真的，最后也只有你一人继续不思进取。”很多句子总在不经意中就会戳中一部分人的软肋，我想我们每个人的周围总是有那么些表现得“吊儿郎当”的存在，是否你就真的相信他们如此不思进取，而开始放松了对自己的要求随波逐流呢？我有个朋友是搞技术的，平时嘻嘻哈哈，以
NDK/JNI二维数组多维数组传递 wenzongliang 二维数组 jni NDK
多维数组和对象数组一样处理，例如二维数组里的每个元素还是一个数组用jArray表示，直到数组变为一维的，且里面元素为基本类型，去获得一维数组指针。给大家提供个例子。已经测试通过。 Java_cn_wzl_FiveChessView_checkWin( JNIEnv* env,jobject thiz,jobjectArray qizidata) { jint i,j; int s