新兴AI民工

机器学习读书笔记：样本降维

文章目录

k近邻算法
PCA主成分分析
- PCA代码
- 核化线性降维(KPCA)
低维嵌入(MDS)
流形学习
- 等度量映射(Isomap)
- 局部线性嵌入(LLE)
度量学习

k近邻算法

在《机器学习》这本书中，讲降维方法之前首先介绍了这个k近邻算法。开始不知道是为什么，仔细看完之后还是了解了作者的思路。

k近邻算法是一个不需要训练的分类算法，它的分类过程如下：

针对新样本 $x_i$ ，在已有的训练样本集 $D$ 中计算与自己最近的 $k$ 个最近距离的样本，距离计算可以参照聚类算法里面的介绍。
根据找到的这 $k$ 个样本的标记，根据某种决策方法(简单的投票，加权投票等，可以参考集成学习中的介绍：

)来进行输出，这个输出就是新样本 $x_i$ 的类别。
样本基于独立采样且同部分的前提。
不需要训练过程，而且可以慢慢的将所有样本累计成训练集，这种方式被称为“懒惰学习”。

这个算法介绍完之后，分析了这个算法中的特例，最近邻算法，也就是 $k = 1$ 的情况下的性能。 $k = 1$ 的话，那么新样本 $x_i$ 的类别就是依赖于训练样本集中最近的那个样本，那么分类错误的情况就是新样本的实际类别与最近的不一致。用贝叶斯分类器的逻辑来分析的话， $x_i$ 样本为类别 $c$ 的计算方式为 $P (c ∣ x)$ 。那么不一致的概率为 $1 - P (c ∣ x) P (c ∣ z)$ ， $z$ 为训练样本集中离 $x_i$ 最近的那个样本。

经过一堆的推导，这个简单的分类算法的错误率是不高于最优贝叶斯分类器错误率的两倍的。

但是，这个有一个重要的前提，就是需要样本 $x_i$ 和这个最近距离的样本 $z$ ，是可以在一个非常小的距离内，比如正数 $\epsilon = 0.001$ ，也就是 $x_i-z||=0.001$ 。

如果只有一个属性，需要有1000个样本才能达到如此的采样密度，两个属性就是1000*1000，也就是一百万个样本。在真实场景下，样本的属性数是远远大于这个数的，所以需要进行降维处理，才引出了后面这一截的内容，至于上面为什么要在一个非常小的距离内才能推导出来，咱也不懂，也不想搞懂了，估计也搞不懂了，咱知道这个结果就好。

PCA主成分分析

主成分分析是通过一系列的计算，分析得到样本 $d$ 个属性的重要度排序，然后就可以选择性的进行降维了，降到多少维( $d^{\prime}$ )，就取top $d^{\prime}$ 的属性就好了。作为一个数学不怎么好的码农，这里记录一下这个过程，至于为什么要这么计算，就不是我能说明白的了，有兴趣的朋友可以自行研究。

这里需要了解另外两个概念：协方差与特征值分解。我把这些记录在这里，便于自己后续查资料。

直接对着书上给出的过程进行简单的分析。

假设有样本集 $D=\lbrace x_1, x_2... x_m \rbrace$ ，每个样本 $x$ 有 $d$ 个属性。
协方差矩阵 $XX^T$ 是这么计算得到的：
$X=\begin{Bmatrix} x_{11} & x_{12} &\dots & x_{1d} \\ x_{21} & x_{22} &\dots & x_{2d} \\ \dots & \dots & \dots & \dots \\ x_{m1} & x_{m2} &\dots & x_{md} \\ \end{Bmatrix}$

每一行为一个样本，所以总共是 $d$ 列。

那么 $X^T$ 为 $X$ 的转置矩阵， $X^T$ 为一个 $d$ 行， $m$ 列的矩阵：
$X^T=\begin{Bmatrix} x_{11} & x_{21} &\dots & x_{m1} \\ x_{12} & x_{22} &\dots & x_{m2} \\ \dots & \dots & \dots & \dots \\ x_{1d} & x_{2d} &\dots & x_{md} \\ \end{Bmatrix}$
所以 $XX^T$ 就是一个矩阵乘法：其中新的矩阵的第i行第j列:
$XX^T_{ij} = x_{i1}*x_{j1}+x_{i2}*x_{j2}+ \dots +x_{id}*x_{jd}$
所有的 $x_i$ 都是经过了第一步中心化之后的值。
所有的样本 $x_i$ 都在第一步中做了中心化，而且，所有的样本都是基于独立采样获得的，也就是样本之间是无关的。所以可以得到：
$XX^T_{ij} = 0; i\neq j \\ XX^T_{ij} = \sum_{k=0}^d x_{ik}^2; i=j$
也就是说 $XX^T$ 是一个 $d * d$ 对角矩阵，对角线上以外的值均为0。所以可以对其做特征值分解。
书上描述是经过**“最近重构性”和“最大可分性”**两个角度去做推导可以得出(推导过程看不太懂，有兴趣的朋友自己去理解)：
$XX^TW=\lambda W$
这就是针对 $XX^T$ 做特征值分解，得到特征值 $\lambda$ 和特征向量 $W$ ，特征值分解也不说了，大家百度一下就知道了。可以直接用numpy包提供的函数就行求解。
根据特征值分解的情况， $XX^T$ 是一个 $d * d$ 的矩阵，所以会有 $d$ 个 $\lambda$ 特征值和对应的 $d$ 个特征向量 $W$ ， $w_i$ 为列向量，每个特征向量有 $d$ 个分量。
将 $d$ 个 $\lambda$ 进行排序获得 $(\lambda_1,\lambda_2 \dots \lambda_d)$ ，取其前面的 $d^{\prime}$ 个特征值和特征向量 $(w_1,w_2 \dots w_{d^{\prime}})$ 。
$d^\prime$ 个特征向量形成了一个转换矩阵（ $d*d^{\prime}$ ）：
$W=(w_1,w_2 \dots w_{d^{\prime}}) \\ W=\begin{Bmatrix} w_{11} & w_{21} & \dots & w_{d^{\prime}1} \\ w_{12} & w_{22} & \dots & w_{d^{\prime}2} \\ \dots & \dots & \dots & \dots \\ w_{1d} & w_{2d} & \dots & w_{d^{\prime}d} \\ \end{Bmatrix}$
所以用一个 $d$ 维样本 $x_i$ ，来乘以这个转换矩阵 $W$ ，根据矩阵乘法: $1 * d$ 的向量乘以一个 $d*d^{\prime}$ 的矩阵，可以获得一个 $1*d^{\prime}$ 的向量，从而起到了降维的效果。

PCA代码

def pca(dataMat, topNfeat=9999999):
    meanVals = mean(dataMat, axis=0)
    meanRemoved = dataMat - meanVals #remove mean
    covMat = cov(meanRemoved, rowvar=0)
    eigVals,eigVects = linalg.eig(mat(covMat))
    eigValInd = argsort(eigVals)            #sort, sort goes smallest to largest
    eigValInd = eigValInd[:-(topNfeat+1):-1]  #cut off unwanted dimensions
    redEigVects = eigVects[:,eigValInd]       #reorganize eig vects largest to smallest
    lowDDataMat = meanRemoved * redEigVects#transform data into new dimensions
    reconMat = (lowDDataMat * redEigVects.T) + meanVals
    return lowDDataMat, reconMat

核化线性降维(KPCA)

这一节在书中是另外的一章节，但是我不怎么看的明白，大概理解的意思是使用一个核函数将一个 $n$ 维的样本先升维到 $k, k > d$ 维，使得可以线性可分之后，然后再在 $k$ 维的基础上进行PCA分析。

至于核函数，在支持向量机那一章写过：

低维嵌入(MDS)

PCA主成分分析方法是基于样本的“最近重构性”和“最大可分性”两个角度进行分析得到的推导过程。而低维嵌入方法是基于如下思路：如果样本集 $D$ 在 $d$ 个属性中的距离 $dist_{ij}$ 能在缩放成 $d^{\prime}$ 后保持不变，那么就可以将 $d^{\prime}$ 个属性作为 $d$ 个属性的低维嵌入，这个过程是可以求得一个 $d*d^{\prime}$ 的转换矩阵 $W$ 对样本进行转换，成为“多维缩放”。

MDS算法的过程描述，实际上就是描述了这个矩阵的生成过程：

首先要获得基于样本集的距离（基于某种距离计算方法）矩阵 $D$ :
$D_{ij}=dist_{ij}\\ D=\begin{Bmatrix} dist_{11} & dist_{12} & \dots & dist_{1m} \\ dist_{21} & dist_{22} & \dots & dist_{2m} \\ \dots & \dots & \dots & \dots \\ dist_{m1} & dist_{m2} & \dots & dist_{mm} \\ \end{Bmatrix}$
通过这个距离矩阵计算一个内积矩阵 $B$ ，这个矩阵的定义是 $Z^TZ$ ， $Z$ 是降维之后样本的表达，也就是从样本空间 $X$ 中砍掉一些属性，此时 $Z$ 是未知数，需要通过先计算 $B$ 来得出。
经过一通骚气的推导，照旧不解释，大致的概念就是因为多维缩放的思路是距离保持不变，所以在样本空间中的距离 $x_i-x_j||$ 是等于在低维样本空间 $Z$ 下的 $z_i-z_j||$ 的。可以得到矩阵 $B$ 每个元素的计算方法：
$b_{ij} = -\frac{1}{2}(dist_{ij}^2-dist_{i·}^2-dist_{·j}^2+dist_{··}^2)$
其中：
$dist_{i·}^2=\frac{1}{m}\sum_{j=1}^mdist_{ij}^2; 第i行的平方和的均值 \\ dist_{·j}^2=\frac{1}{m}\sum_{i=1}^mdist_{ij}^2; 第j列的平方和的均值 \\ dist_{··}^2=\frac{1}{m^2}\sum_{i=1}^m\sum_{j=1}^mdist_{ij}^2; 距离矩阵D的平方和的均值 \\$
矩阵 $B$ 计算出来之后，对 $B$ 做特征值分解：$ B=V\Lambda V^{T$，V为特征向量组成的矩阵，$\Lambda$为特征值组成的对角阵。又因为$B=Z}TZ $，所以$ Z^TZ=V\Lambda V^{T$，所以可以得到$Z=\Lambda}{1/2}V^{T$，这个怎么算出来的不知道，只知道反过来验证一下：$Z}T=\Lambda^{{1/2}V$，因为$\Lambda$是对角阵，求个转置还是本身，$V}T $的转置就是$ V $，然后再乘一下就是$ V\Lambda V^T $。也就是说把矩阵$ B $做完特征值分解之后就可以直接计算得到降维之后样本空间$ Z$了。
在特征值分解中，如果 $\Lambda$ 包含了 $d^*$ 个非零的特征值， $d^*d∗<d$

流形学习

等度量映射(Isomap)

Isomap算法实际上就是将MDS中的dist距离计算增加了一种新的定义：

两个样本之间的距离计算不是通过闵可夫斯基距离或者欧式距离进行计算。而是通过下面几个步骤去计算 $x_i$ 与 $x_j$ 两个样本点之间的距离。

对所有样本点 $x_i$ ，找到样本点的k近邻，这个近邻寻找还是通过欧式距离进行计算，这就是所谓的局部的概念吧。
所有的样本点与k近邻之间的距离形成了一张无向图，然后再通过迪杰斯特拉算法找到 $x_i$ 和 $x_j$ 之间的最短距离，用这个距离作为MDS算法中矩阵D的值。

我自己对这个东西的理解是这样的，借用书上的图：

从某种意义上讲，高维的欧式距离，也就是图中的黑线距离是不可达的，也就是没有什么业务含义的。所以只能顺着这个分布图形的曲面去进行计算距离。而局部的欧式距离又是可以的(什么流形在局部与欧式距离同胚大概就是这个意思吧)。

局部线性嵌入(LLE)

对这个算法我是这么理解的，和MDS类似。MDS是想在降维后保证样本之间的距离不变。而LLE(Locally Linear Embedding)是试图保持样本 $x_i$ 与周边的近邻的线性关系。

比如 $x_i$ 的近邻参数 $k = 3$ ，那么近邻关系为:

$x_i = w_{ij}x_j+w_{ik}x_k+w_{il}x_l$

或者说 $x_i$ 可以通过他的近邻来进行表示。

然后算法试图找到一组 $w$ ，使得:

$\min_{w}\sum_{i=1}^m{||x_i-\sum_{j\in Q_i}{w_{ij}x_j}||_2^2} \\ s.t. \sum_{j\in Q_i}{w_{ij}=1}$

其中 $Q_i$ 是样本 $x_i$ 的近邻的下标集合。我理解这是要找到一组w，使得样本 $x_i$ 与其线性表示的差距最小。

然后可以求解出:
$w_{ij} = \frac{\sum_{k\in Q_i}C_{jk}^{-1}}{\sum_{l,s\in Q_i}C_{ls}^{-1}} \\ C_{jk}=(x_i-x_j)^T(x_i-x_k)$
$w$ 求出来之后，因为降维后与降维前的线性关系需要保持不变，所以对于降维后的样本表示 $z_i$ 必须满足：
$\min_z\sum_{i=1}^m{||z_i-\sum_{j\in Q_i}{w_{ij}z_j}||}$
上次是通过 $x$ 求解 $w$ ，这次是通过 $w$ 求解 $z$ 。
令 $M=(I-W)^T(1-W)$ ，将上面的公式可以改写为：
$min_Ztr(ZMZ^T) \\s.t. ZZ^T=I$
老套路，对M特征值分解，M分解完之后的 $d^{\prime}$ 个最小的特征值对应的特征向量组成的矩阵即为 $Z^T$ 。

度量学习

上述的几种降维方法，基本上都是基于某种距离度量(PCA的最近重构性，最大可分性，MDS的距离矩阵，流形学习的测地距离，最小路径计算等)，都是基于距离的某种度量。这些度量方法中都是确定的方法和参数进行计算，而度量学习是想将这些参数通过样本训练、学习来确定。

大概的过程如下：

在计算欧式距离的基础上增加属性的权重值 $W=(w_1,w_2 \dots w_d)$ ，是的计算距离公式变成：
$dist_{ij}=w_1dist_{ij,1}+w_2dist_{ij,2}+\dots+w_ddist_{ij,d}$
公式可以写成：
$x_i-x_j)^TW(x_i-x_j) \\ W=diag(w)$
其中的 $W$ 就是一个 $d * d$ 对角矩阵， $W_{ii} = w_i$ 。
上面的 $W$ 中的非对角元素为0，是因为所有的属性全部独立，无关联。如果有关联的话，对角元素就是非0的。然后这个矩阵就写成 $M$ ，成为度量矩阵。距离公式也成为马氏距离：
$x_i-x_j)^TM(x_i-x_j)$
学习的目标就是训练这个M。训练M的话就需要确认一个优化目标，需要根据某种学习方法来确定，书中给出的是按照近邻分类器这种学习方法来制定这个优化目标。一通推导之后优化目标是：

后面就是各种推导和学习计算了，书中没有，我也不想继续研究这个了。大概就是通过这个优化目标，通过训练集样本进行计算可以得到这个M的最优值。从而达到学习的效果。

20181207 旅一30王思宁
1.在文章中我学到的重要概念:讲故事不要平铺直叙2.这篇中我学到的怦然心动词汇:facialrecognition刷脸smogfog雾霾3.本篇文章中我最喜欢的句子:Forgetthememories,continuetobelife,miss,justpassby.4.本周学习中我遇到的困难:东西太多，不知道从哪开始复习5.语伴给我的建议:好好复习吧，别挂科6.我的一些其他感受和收获:游戏的坑真
2022暑假总结 yanpinghappy
这个假期，娃都是按照每天的学习计划做事（10天日照旅游期间除外），大概是因为之前两三个寒暑假都是如此规律，所以娃也适应了这种按部就班的节奏。学习时间表，几乎都是我俩商量的结果，中间遇到时间紧张或者无法执行的情况，我们会再做调整。美中不足的是，复盘这一项我俩做得极少，这一点下次寒假时一定要加强起来。暑假第一个月，报了两个课程奥数和《水浒传》，时间排得满满的，把头一年报的游泳课挤出去了，到了第二个月才
2020-5-7晨间日记邓芬芳
今天是什么日子起床：五点三十五就寝：十一点之前天气：阴天有雨心情：焦虑纪念日：高品质的生活需要适度的焦虑任务清单昨日完成的任务，最重要的三件事：打扫卫生、听课、准备复学第一课团体训练活动改进：团体训练活动准备的不理想习惯养成：科学、合理安排时间，提高效率，知行合一周目标·完成进度积极主动高效快速完成领导安排的任务学习·信息·阅读继续阅读《自卑与超越》《权宜之计》等书籍继续学习微笑主义——整合心理学
2023-07-22 付宇杰
在我看来，王老师对整个课堂节奏把控的很好，从开始王老师从现实生活入手，将数学与实际相结合，通过现实生活中的数学问题引导学生进入课堂，接着就是王老师准备的六个例题，诱导引入，变式深入，带领学生逐步深入，了解学习排列问题的本质，王老师用准确、清晰、易懂、生动的语言，呈现知识，践行“以学生为主体“的课堂模式，选择适合该龄段的教学方法，从而激发学生的学习兴趣，促进学生的思维活动,能注意因材施教、因人施教,
《第十五次网课收获》宛如初夏
伊川王利珍坚持原创分享第386天今天晚上是网络中级第15次课程。再有一次就要结束了，还真的有点恋恋不舍呢！刘老师已经开始提前给我们预告了，以期降低我们的分离焦虑！四个月的学习历程。我们彼此由陌生到熟悉。现在经常在一块约练的几个学员已经是老朋友的感觉。虽然从未谋面，但心灵相通，互相扶持，互相帮助。电波相连的情谊也是一种别样的美好！首先通过顾老师展示的案例，大家各抒己见，加上刘老师的讲解。又收获了很多
《自由人生》读书笔记 2 西红柿阿达
原文:问题：“人生有何意义？”其实这个问题是容易解答的。人生的意义全是各人自己寻出来，造出来的：高尚、卑劣、清贵、污浊、有用、无用……全靠自己的作为。生命本身不过是一件生物学的事实，有什么意义可说？生一个人与一只猫、一只狗，有什么分别？人生的意义不在于何以有生，而在于自己怎样生活。你若情愿把这六尺之躯葬送在白昼做梦之上，那就是你这一生的意义。你若发愤振作起来，决心去寻求生命的意义，去创造自己的生命
【HCIA】DHCP配置实验
DHCP（DynamicHostConfigurationProtocol）配置实验通常用于网络课程或网络管理工作中，目的是让学习者或网络管理员理解并掌握如何配置和管理DHCP服务器，以便自动分配IP地址给网络中的设备。一、导言DHCP（DynamicHostConfigurationProtocol）是一种网络协议，用于自动分配IP地址给网络中的设备。DHCP通过以下三种主要机制来分配IP地址：
学习与财富同行：大学生校园内的多元赚钱之路高省飞智导师
随着经济的发展和社会的进步，越来越多的人开始关注学校里的赚钱项目。这些项目不仅能为学校带来收益，同时也能为创业者提供很多商机。那么，学校里究竟有哪些赚钱项目呢？下面就为大家详细介绍一下。一、校园快递代领服务随着网购的普及，校园快递业务也日益繁忙。学生们常常因为上课、兼职等原因无法及时领取包裹，这时候校园快递代领服务应运而生。这个项目需要有一定的组织和协调能力，以及对校园环境的熟悉程度。通过与快递公
自我感动式的努力，真的有用吗？星辰同学
你曾经有过这种感受吗？我今天有努力学习哎，我看书看了两个个小时，我觉得自己很刻苦；我今天有努力跑步哎，跑了两公里，觉得自己很自律；我今天有努力工作哎；晚上10点才回去…其实，你看书两小时，手机不停看了一个多小时，你努力跑步，也只是坚持了两天而已，努力工作，也是因为工作拖拉，没办法加班…最后，你没有取得成就，却怀疑人生，我明明努力了呀？可是一无所获。这种属于努力吗？应该算是自我感动式的努力吧！其实，
日精进第三十五天金缔尊周大生珠宝玉玉
尊敬的李老师，智慧的马教授，亲爱的家人们:大家好，我是（刘翠平)刘总的人，今天是2018年9月17号我的日精进第三十五天，我们互相勉励，携手前行，每天进步一点点，距离成功便不远。比学习:学习同事的素转非技巧，如何打动顾客的心，让顾客成为我们的老顾客。比改变:只要进店看的都是要买的，相信家人相信自己是最棒的，大家互相帮助，互相加油！比付出:总监中午来给我们开会，给我们从专卖店调货来辛苦了。比感恩:感
JAVA学习-行为抽象和Lambda.Lambda表达式守护者170 java学习 java 学习开发语言
行为抽象和Lambda表达式是Java8引入的新特性，用于简化代码和提高代码的可读性。一、概述、特点、使用方法以及与其他比较和高级应用的说明：1.行为抽象：它是指将一段代码抽象为一种功能或行为，以便在需要时可以传递给其他方法或对象。行为抽象通常通过接口来定义，其中接口包含一个或多个抽象方法来表示不同的功能。2.Lambda表达式：Lambda表达式是一种简洁的语法，用于实现行为抽象。它可以替代匿名
开源模型应用落地-qwen模型小试-Qwen2.5-7B-Instruct-玩转ollama（一）开源技术探险家开源模型-实际应用落地 #深度学习自然语言处理语言模型
一、前言在AI大模型百花齐放的时代，很多人都对新兴技术充满了热情，都想尝试一下。然而，实际上要入门AI技术的门槛非常高。除了需要高端设备，还需要面临复杂的部署和安装过程，这让很多人望而却步。在这样的背景下，Ollama的出现为广大开发者和爱好者提供了一条便捷的道路，极大地降低了应用机器学习的门槛。Ollama的优势在于其极致的简化。通过这个平台，用户可以轻松下载、运行和管理各种机器学习模型，而无需
刘萍萍老师《基于新课标的情境活动与学习任务群设计策略》学习青箬笠0
刘萍萍新乡市基础教育教学研究室“让学生直接思考真实问题有助于激发和唤醒学生的理解。”（「美]格兰特·威金斯·「美」杰伊·麦克泰格《追求理解的教学设计》P44）所以要设计情境活动。一、情境活动与学习任务群概念从何而来“考试命题应以情境为载体，依据学生在真实情境下解决问题的过程和结果评定其素养水平。日常生活情境指向真实具体的社会生活，关注学生在生活场景中的语言实践，凸显语言交际活动的对象、目的和表述方
互相学习似水年华平
今晚受群内班主任的邀请，和大家分享我的学习心得。在晚上的分享会上，我听到了分享姐妹在讲述她们的故事，我不禁感叹，姐妹们的生活都是非常自律、人生有着清晰的目标。主播100课程班姐妹分享她每天早上如何练声，以及练声小技巧。蜕变100课程班姐妹分享她如何通过学习，制定人生的小目标、大目标以及终级目标。形象管理课程姐妹分享如何通过合理搭配穿衣打扮来提升自己的自信心。我和大家分享的是通过学习情商课，让我知道
一.初识C语言（1） Yu_Lijing C语言学习 c语言学习算法开发语言程序人生学习方法
目录1.前言2.什么是C语言3.第一个C语言代码4.数据类型5.常见内存单位6.变量①命名规则②全局变量和局部变量7.从键盘接收数据8.结尾1.前言本篇文章是学习《初识C语言》的总结，旨在复习，巩固，并产生新的理解。文中将会尽可能详尽阐述本章所学知识，会涉及知识的讲解，代码的演示，问题的探索。当然，这些都是浅尝辄止的，毕竟只是“初识”。2.什么是C语言在《初识C语言》中，我们首先先学习了什么是C语
2019-09-28 新明半岛
今日和一个朋友电话聊了一个半小时，哈哈好久没和人煲过电话粥了。主要聊最近各自在干嘛，关键主题是家庭英语启蒙。之前跟这这个朋友学习家庭英语启蒙，这位朋友也是我比较佩服的一个人，比较优秀，通过不断精进自己，学以致用，创造财富。我们都是普通的上班族，过去的我只知道做家务，照顾孩子，很少有时间去自我学习自我提升，很少去复盘我的人生，没有得到家庭的认可，亲子关系和亲密关系都没有处理好。今年七月份，我跟着这位
机器学习之——认识机器学习 -睡到自然醒~ golang 重构开发语言
首先，什么是机器学习？参照百度百科的讲解，“机器学习是一门多领域交叉学科，设计概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习能力，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。”什么意思呢？也就是说，机器学习是一门跨领域的学科，是一种能够让机器模仿人类学习能力的一种学科。在Andrew的课程中，提到了几个机器学习的定义：1，A
LWIP学习记录1——认识
一、LWIP是什么，有什么作用Lwip是一个阉割版的TCP/IP协议栈，开源的，它只实现了TCP/IP协议栈大部分功能。TCP/IP协议栈应该在生活中哪些产品？交换机、路由器、光纤收发机等等，这些产品都是使用TCP/IP协议栈来实现的。那么LWIP能做什么？云台接入、无线网关、工控器、远程模块、网络摄像头、嵌入式NAT无线路由器（注：LWIP没有NAT协议，之所以能实现是因为我们在LWIP基础上添
2021-01-12 蹦哒吧小蹦儿
终于开始明白为什么很多人不愿从舒适圈里出来，并不是因为舒适圈有多舒服，只是因为舒适圈外挑战太多了——需要去适应这个社会，需要去学习很多新的东西，需要去接受挑战……本来拍照就可以完成的事，现在需要拍摄视频，而如何拍出好的视频，并且剪辑好看，这真是一门技术呀。需要学习太多东西。为了能更好的拍片，特意买了云台，但是为什么云台不听使唤？令人发愁，于是又开始新一轮的学习。汽车领域的平台开始了讲师课，可以有更
大模型微调技术的详细解析及对比老兵发新帖人工智能大数据
以下是四种主流大模型微调技术的详细解析及对比，结合技术原理、适用场景与性能表现进行说明：1.Full-tuning（全量微调）核心原理：加载预训练模型的所有参数，用特定任务数据（通常为指令-回答对）继续训练，更新全部权重。相当于对模型整体知识结构进行重构。操作流程：加载预训练模型；用任务数据集（如分类文本）和优化目标（如最小化误差）训练；所有参数参与梯度更新。优势：模型充分学习任务特征，效果通常最
大模型训练中的“训练阶段”（如Pre-training、SFT、RLHF等）与“微调技术” 老兵发新帖人工智能深度学习机器学习
大模型训练中的“训练阶段”（如Pre-training、SFT、RLHF等）与“微调技术”（如Full-tuning、Freeze-tuning、LoRA、QLoRA）是两类不同维度的概念，二者共同构成模型优化的完整流程。以下是二者的关系解析及技术对照：一、训练阶段的核心流程与目标预训练（Pre-training）目标：在无标注通用数据（如互联网文本）上训练模型，学习语言、视觉等通用特征。微调技术
Epoch 老兵发新帖人工智能
在深度学习和机器学习中，Epoch（轮次或周期）是一个核心训练概念，指模型在整个训练数据集上完成一次完整遍历的过程。以下是关于Epoch的详细解析：一、核心定义基本含义Epoch表示模型将所有训练数据完整学习一次的过程。例如：若训练集有10,000个样本，则1个Epoch即模型用这10,000个样本训练一轮。与相关概念的关系Batch（批次）：数据集被分割成的小组（如每批32个样本）。Iterat
感恩日记（54）安然521
感恩天地，感恩大自然，感恩父母，感恩孩子，感恩自己所有的一切！1.今天早上开始内训，感恩自己5：00起床，高一内训第三天。2.感恩领导同事，有缘一起工作。3.感恩自己不断学习成长，今天在单位忙一天。4.感恩孩子自己旅游，玩的嗨。5.感恩孩子自己照顾自己，越放手越自律，越放手越成长！6.感恩老天送我这么一个有灵性的闺女！7.祝福孩子考上自己理想的二附中学校！祝福孩子一定能考上！8.感恩孩子来修行我，
学习安静地呆着和语
原创分享第713天周四我们是一个多么喜欢热闹的民族啊！热热闹闹过大年！欢欢喜喜迎新年！走街串巷去拜年！串门子！赶庙会！旅游！聚会喝酒！聚堆打麻将……一切我们喜欢和习惯的过年方式都因为一场突如其来的疫情改变了！大家都只能乖乖地呆在家里！这样的生活方式对我们来说是一种挑战！很多人都特别不适应！一家人团聚在一起，互相聊聊天，读读书，互相陪伴，这些平时期待的事情，反而觉得不重要了！越不让出去，越想出去……
【无标题】Python---day9 模块化编程概念（模块、包、导入）及常见系统模块总结和第三方模块管理 AnAn__kang python java 服务器
系列文章目录前言跟着博主学Python，今天我们来到了第九天的学习，模块化编程的概念。Python作为一门编程语言，本身就是用于对模块以及各种包的使用来达到我们自己想到创作的目的。所以今天博主就给大家盘点一下有关于各种常见的包以及如何进行导入的。一.模块Module，模块1.1基本概念定义：模块是一个Python文件，每个.py.py.py文件就是一个模块。作用：用于组织代码，避免代码重复，提高复
Python --- day 10 Opencv模块的使用 AnAn__kang python opencv 开发语言
系列文章目录前言今天博主带大家进入Opencv的学习，这是一个专门针对处理图像和视频的一个模块，大家以理解为主，增强自己的编程思维，再后续我们训练模型时会大批量的处理图片时会经常用到这个模块。1OpenCV介绍OpenCV（开放源代码计算机视觉库）是一个开源的计算机视觉和机器学习软件库。由一系列C++类和函数构成，用于图像处理、计算机视觉领域的算法实现。1.1OpenCV优势**开源免费：**完全
【无标题】Python --- Day5 函数的位置传参、关键词传参及其可变性和解包操作 AnAn__kang python 前端人工智能
系列文章目录前言今天小伙伴们跟我进入第五天的Python课程学习，主要是关于函数的位置传参，关键传参和可变性和解包传参这其中的具体定义以及它们的使用场景`一、调用传参函数调用时传递参数的方式有多种，包括位置传参、关键词传参、多个参数解包、参数默认值等。1.1位置传参最常见的传参方式，参数按定义的顺序依次传入函数。示例：defgreet(name,age):print(f"Hello,{name}.
大学英语四级阅读之细节阅读答题技巧英闻者说
长篇巨制！！建议收藏起来慢慢看~细节阅读是最为常见的一种阅读题型了，但是它在四级考试中又有独特之处。本文将从整体概况，题材体裁，出题特点，答题程序和答案特点五个部分对细节阅读做出剖析，同时会引用历年真题给出例证，仔细学习后自会对这种题型有着全新的理解和更好的把握。一、整体概况细节阅读一共2篇，字数大概都在350左右，分段情况不太好说，大多在5段以上（几乎没有平时模拟题里出现的两段或三段的情况）。想
STM32F4-ETH通信（lwip）——学习笔记_stm32 lwip 2401_84010497 程序员嵌入式
7、CSMA/CD冲突检测：8、MAC子层：MAC数据包、MAC数据包格式、MAC地址：MAC地址由48位数字组成，它是网卡的物理地址，在以太网传输的最底层，就是根据MAC地址来收发数据的。部分MAC地址用于广播和多播，在同一个网络里不能有两个相同的MAC地址。PC的网卡在出厂时已经设置好了MAC地址，但也可以通过一些软件来进行修改，在嵌入式的以太网控制器中可由程序进行配置。数据包中的DA是目标地
macOS 上安装 Kubernetes（k8s）老兵发新帖 macos kubernetes 容器
在macOS上安装Kubernetes（k8s）主要有三种主流方案，以下根据安装复杂度、资源占用和适用场景分类说明，并附详细步骤：⚙️一、推荐方案：Minikube（单节点本地集群）适用场景：学习、开发测试、资源有限（需2-4GB内存）。安装步骤：安装依赖工具安装DockerDesktop（推荐）或VirtualBox：brewinstall--caskdocker或brewinstallvirt
Java实现的简单双向Map，支持重复Value superlxw1234 java 双向map
关键字：Java双向Map、DualHashBidiMap 有个需求，需要根据即时修改Map结构中的Value值，比如，将Map中所有value=V1的记录改成value=V2，key保持不变。数据量比较大，遍历Map性能太差，这就需要根据Value先找到Key，然后去修改。即：既要根据Key找Value，又要根据Value
PL/SQL触发器基础及例子百合不是茶 oracle数据库触发器 PL/SQL编程
触发器的简介; 触发器的定义就是说某个条件成立的时候，触发器里面所定义的语句就会被自动的执行。因此触发器不需要人为的去调用，也不能调用。触发器和过程函数类似过程函数必须要调用, 一个表中最多只能有12个触发器类型的,触发器和过程函数相似触发器不需要调用直接执行, 触发时间：指明触发器何时执行，该值可取： before：表示在数据库动作之前触发
[时空与探索]穿越时空的一些问题 comsci 问题
我们还没有进行过任何数学形式上的证明,仅仅是一个猜想..... 这个猜想就是; 任何有质量的物体(哪怕只有一微克)都不可能穿越时空,该物体强行穿越时空的时候,物体的质量会与时空粒子产生反应,物体会变成暗物质,也就是说,任何物体穿越时空会变成暗物质..(暗物质就我的理
easy ui datagrid上移下移一行商人shang js 上移下移 easyui datagrid
/** * 向上移动一行 * * @param dg * @param row */ function moveupRow(dg, row) { var datagrid = $(dg); var index = datagrid.datagrid("getRowIndex", row); if (isFirstRow(dg, row)) {
Java反射 oloz 反射
本人菜鸟，今天恰好有时间，写写博客，总结复习一下java反射方面的知识，欢迎大家探讨交流学习指教首先看看java中的Class package demo; public class ClassTest { /*先了解java中的Class*/ public static void main(String[] args) { //任何一个类都
springMVC 使用JSR-303 Validation验证杨白白 spring mvc
JSR-303是一个数据验证的规范，但是spring并没有对其进行实现，Hibernate Validator是实现了这一规范的，通过此这个实现来讲SpringMVC对JSR-303的支持。 JSR-303的校验是基于注解的，首先要把这些注解标记在需要验证的实体类的属性上或是其对应的get方法上。登录需要验证类 public class Login { @NotEmpty
log4j 香水浓 log4j
log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, HTML, DATABASE #log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, ROLLINGFILE, HTML #console log4j.appender.STDOUT=org.apache.log4j.ConsoleAppender log4
使用ajax和history.pushState无刷新改变页面URL agevs jquery 框架 Ajax html5 chrome
表现如果你使用chrome或者firefox等浏览器访问本博客、github.com、plus.google.com等网站时，细心的你会发现页面之间的点击是通过ajax异步请求的，同时页面的URL发生了了改变。并且能够很好的支持浏览器前进和后退。是什么有这么强大的功能呢？ HTML5里引用了新的API，history.pushState和history.replaceState，就是通过
centos中文乱码 AILIKES centos OS ssh
一、CentOS系统访问 g.cn ，发现中文乱码。于是用以前的方式：yum -y install fonts-chinese CentOS系统安装后，还是不能显示中文字体。我使用 gedit 编辑源码，其中文注释也为乱码。后来，终于找到以下方法可以解决，需要两个中文支持的包： fonts-chinese-3.02-12.
触发器 baalwolf 触发器
触发器(trigger)：监视某种情况，并触发某种操作。触发器创建语法四要素：1.监视地点(table) 2.监视事件(insert/update/delete) 3.触发时间(after/before) 4.触发事件(insert/update/delete) 语法： create trigger triggerName after/before
JS正则表达式的i m g bijian1013 JavaScript 正则表达式
g:表示全局（global)模式，即模式将被应用于所有字符串，而非在发现第一个匹配项时立即停止。 i:表示不区分大小写（case-insensitive）模式，即在确定匹配项时忽略模式与字符串的大小写。 m:表示
HTML5模式和Hashbang模式 bijian1013 JavaScript AngularJS Hashbang模式 HTML5模式
我们可以用$locationProvider来配置$location服务（可以采用注入的方式，就像AngularJS中其他所有东西一样）。这里provider的两个参数很有意思，介绍如下。 html5Mode 一个布尔值，标识$location服务是否运行在HTML5模式下。 ha
[Maven学习笔记六]Maven生命周期 bit1129 maven
从mvn test的输出开始说起当我们在user-core中执行mvn test时，执行的输出如下： /software/devsoftware/jdk1.7.0_55/bin/java -Dmaven.home=/software/devsoftware/apache-maven-3.2.1 -Dclassworlds.conf=/software/devs
【Hadoop七】基于Yarn的Hadoop Map Reduce容错 bit1129 hadoop
运行于Yarn的Map Reduce作业，可能发生失败的点包括 Task Failure Application Master Failure Node Manager Failure Resource Manager Failure 1. Task Failure 任务执行过程中产生的异常和JVM的意外终止会汇报给Application Master。僵死的任务也会被A
记一次数据推送的异常解决端口解决 ronin47 记一次数据推送的异常解决
　　需求：从db获取数据然后推送到B 程序开发完成，上jboss,刚开始报了很多错，逐一解决，可最后显示连接不到数据库。机房的同事说可以ping 通。　　自已画了个图，逐一排除，把linux 防火墙　和　setenforce　设置最低。　　　service iptables stop
巧用视错觉-UI更有趣 brotherlamp UI ui视频 ui教程 ui自学 ui资料
我们每个人在生活中都曾感受过视错觉（optical illusion）的魅力。视错觉现象是双眼跟我们开的一个玩笑，而我们往往还心甘情愿地接受我们看到的假象。其实不止如此，视觉错现象的背后还有一个重要的科学原理——格式塔原理。格式塔原理解释了人们如何以视觉方式感觉物体，以及图像的结构，视角，大小等要素是如何影响我们的视觉的。在下面这篇文章中，我们首先会简单介绍一下格式塔原理中的基本概念，
线段树-poj1177-N个矩形求边长（离散化+扫描线） bylijinnan 数据结构算法线段树
package com.ljn.base; import java.util.Arrays; import java.util.Comparator; import java.util.Set; import java.util.TreeSet; /** * POJ 1177 (线段树+离散化+扫描线)，题目链接为http://poj.org/problem?id=1177
HTTP协议详解 chicony http协议
引言
Scala设计模式 chenchao051 设计模式 scala
Scala设计模式我的话：在国外网站上看到一篇文章，里面详细描述了很多设计模式，并且用Java及Scala两种语言描述，清晰的让我们看到各种常规的设计模式，在Scala中是如何在语言特性层面直接支持的。基于文章很nice，我利用今天的空闲时间将其翻译，希望大家能一起学习，讨论。翻译
安装mysql daizj mysql 安装
安装mysql (1)删除linux上已经安装的mysql相关库信息。rpm -e xxxxxxx --nodeps (强制删除) 执行命令rpm -qa |grep mysql 检查是否删除干净 (2)执行命令 rpm -i MySQL-server-5.5.31-2.el
HTTP状态码大全 dcj3sjt126com http状态码
完整的 HTTP 1.1规范说明书来自于RFC 2616，你可以在http://www.talentdigger.cn/home/link.php?url=d3d3LnJmYy1lZGl0b3Iub3JnLw%3D%3D在线查阅。HTTP 1.1的状态码被标记为新特性，因为许多浏览器只支持 HTTP 1.0。你应只把状态码发送给支持 HTTP 1.1的客户端，支持协议版本可以通过调用request
asihttprequest上传图片 dcj3sjt126com ASIHTTPRequest
NSURL *url =@"yourURL"; ASIFormDataRequest*currentRequest =[ASIFormDataRequest requestWithURL:url]; [currentRequest setPostFormat:ASIMultipartFormDataPostFormat];[currentRequest se
C语言中，关键字static的作用 e200702084 C++c C#
在C语言中，关键字static有三个明显的作用： 1)在函数体，局部的static变量。生存期为程序的整个生命周期，（它存活多长时间）；作用域却在函数体内（它在什么地方能被访问（空间））。一个被声明为静态的变量在这一函数被调用过程中维持其值不变。因为它分配在静态存储区，函数调用结束后并不释放单元，但是在其它的作用域的无法访问。当再次调用这个函数时，这个局部的静态变量还存活，而且用在它的访
win7/8使用curl geeksun win7
1. WIN7/8下要使用curl，需要下载curl-7.20.0-win64-ssl-sspi.zip和Win64OpenSSL_Light-1_0_2d.exe。下载地址： http://curl.haxx.se/download.html 请选择不带SSL的版本，否则还需要安装SSL的支持包 2. 可以给Windows增加c
Creating a Shared Repository; Users Sharing The Repository hongtoushizi git
转载自： http://www.gitguys.com/topics/creating-a-shared-repository-users-sharing-the-repository/ Commands discussed in this section: git init –bare git clone git remote git pull git p
Java实现字符串反转的8种或9种方法 Josh_Persistence 异或反转递归反转二分交换反转 java字符串反转栈反转
注：对于第7种使用异或的方式来实现字符串的反转，如果不太看得明白的，可以参照另一篇博客： http://josh-persistence.iteye.com/blog/2205768 /** * */ package com.wsheng.aggregator.algorithm.string; import java.util.Stack; /**
代码实现任意容量倒水问题 home198979 PHP 算法倒水
形象化设计模式实战 HELLO!架构 redis命令源码解析倒水问题：有两个杯子，一个A升，一个B升，水有无限多，现要求利用这两杯子装C
Druid datasource zhb8015 druid
推荐大家使用数据库连接池 DruidDataSource. http://code.alibabatech.com/wiki/display/Druid/DruidDataSource DruidDataSource经过阿里巴巴数百个应用一年多生产环境运行验证，稳定可靠。它最重要的特点是：监控、扩展和性能。下载和Maven配置看这里： http
两种启动监听器ApplicationListener和ServletContextListener spjich java spring 框架
引言:有时候需要在项目初始化的时候进行一系列工作，比如初始化一个线程池，初始化配置文件，初始化缓存等等，这时候就需要用到启动监听器，下面分别介绍一下两种常用的项目启动监听器 ServletContextListener 特点: 依赖于sevlet容器，需要配置web.xml 使用方法: public class StartListener implements
JavaScript Rounding Methods of the Math object 何不笑 JavaScript Math
The next group of methods has to do with rounding decimal values into integers. Three methods — Math.ceil(), Math.floor(), and Math.round() — handle rounding in differen