catcous

2020李宏毅学习笔记——11.Unsupervised Learning： Linear Methods（无监督学习）

文章目录

摘要
1. Introduction（介绍）
2.Clustering（聚类）
- 2.1 K-means
- 2.2 HAC
3. Dimension Reduction（降维）
- 3.1 How to do Dimension Reduction？
- 3.2 PCA算法（Principle component analysis）
- - 3.2.1 基于最大方差原理
  - - 1 . PCA for 1-D
    - 2. PCA for n-D
  - 3.2.2 基于最小化误差原理
  - 3.2.3 从NN角度理解PCA
  - 3.2.4 Weakness of PCA
  - 3.2.5 PCA for Pokemon（将PCA用于分析宝可梦的数据）
  - 3.2.6 PCA for MNIST
  - 3.2.7 PCA和NMF比较
总结与展望

摘要

本章首先介绍了什么是无监督学习及无监督学习的类别，主要分类两种，一种是化繁为简型，如聚类复杂的input输入，简单的output输出，另一种是无中生有型，没有input x只有output y。接着，讲解了具有的聚类算法，常用方法有K-means和HAC，K-means主要思想是更新中心点来聚类，而HAC的思想是通过build a tree和选取阈值来实现的。其次通过聚类的不足，引入Dimension Reduction（降维）并详细展开 ,可以简单使用Feature Selection（特征选择）但是有的不能简单使用Feature Selection的方法，引入更好一点的方式，PCA（主成分分析法），详细讲解了PCA的原理与数学推导，以及PCA的应用。

1. Introduction（介绍）

无监督学习可以分为两大类：

第一类：化繁为简

聚类(Clustering)
降维(Dimension Reduction)

第二类：无中生有(Generation)

对于无监督学习(Unsupervised Learning)来说，我们通常只会拥有（x,y^）中的x或者y，其中：
化繁为简：把复杂的input变成比较简单的output，比如把一大堆没有打上label的树图片转变为一棵抽象的树，此时training data只有input x，而没有output y^。
无中生有：就是随机给function一个数字，它就会生成不同的图像，此时training data没有input x ，而只有output y^。

2.Clustering（聚类）

聚类，顾名思义，就是把相近的样本划分为同一类，比如对下面这些没有标签的image进行分类，手动打上cluster 1、cluster 2、cluster 3的标签，这个分类过程就是化繁为简的过程。

那我们怎么去确定分几个cluster呢？（通常是emperical 以实验为根据的）
聚类中最常用的方法有：
（1）k-means：a.随机初始化k个类的中心点；b.每个样本以最靠近的中心点的所属类为类标签；c.根据新得到的分类更新中心点；d.重复步骤b、c，直到模型收敛。
（2）Hierarchical Agglomeratiive clustering （HAC）层次聚类方法：根据样本之间的两两相似程度来建立一颗树；

2.1 K-means

该方法的大致过程如下：
a: 现有一大堆的unlabeled data {x1,x2,…,xn}，我们要把它划分为K个cluster
b: initial的时候可以从training data里随机挑K个object xn 出来作为K个center ci的初始值
c: 遍历所有的object xn ，并判断它属于哪一个cluster，如果xn与第i个cluster的center ci最接近，那它就属于该cluster
d:更新center：把每个cluster里的所有object取平均值作为新的center值
e:重复从c,d步骤，直到收敛

K-Means 算法思想较为简单如下所示：

1.选择K个点作为初始质心
2. repeat
将每个点指派到最近的质心，形成K个簇
重新计算每个簇的质心
3. until 簇不发生变化或达到最大迭代次数

2.2 HAC

假设现在我们有5个样本点，想要做clustering：

step 1：build a tree
整个过程类似建立Huffman Tree，只不过Huffman是依据词频，而HAC是依据相似度建树：

对5个样本点两两计算相似度，挑出最相似的一对，假设样本点1和2最相似
将样本点1和2进行merge (可以对两个vector取平均)，生成代表这两个样本点的新结点
此时只剩下4个结点，再重复上述步骤进行样本点的合并，直到只剩下一个root结点

step 2: pick a threshold
选取阈值，形象来说就是在构造好的tree上横着切一刀，相连的叶结点属于同一个cluster

上图中绿色的切割线，则可分为途中四类cluster。不同颜色的横线和叶结点上不同颜色的方框对应着切法与cluster的分法。

HAC和K-means最大的区别在于如何决定cluster的数量，在K-means里，K的值是要你直接决定的；而在HAC里，你并不需要直接决定分多少cluster，而是去决定这一刀切在树的哪里。

3. Dimension Reduction（降维）

clustering的缺点是以偏概全，它强迫每个object都要属于某个cluster，但实际上某个object可能拥有多种属性，或者多个cluster的特征，如果把它强制归为某个cluster，就会失去很多信息。所以我们应该用一个vector来描述该object，这个vector的每一维都代表object的某种属性。

如果将这种高维的vector（比如图像）转化成低维的vector，就叫做Dimension Reduction（降维）。

从另一个角度来看为什么Dimension Reduction可能是有用的！
左边是data以螺旋状分布在3维空间里。但其实如右边的样子，以2维的空间就可以描述这些信息，这样就把简化了问题。

再举一个具体的例子：
如果以MNIST(手写数字集)为例，每一张image都是 $28 * 28$ 的dimension，但我们反过来想，大多数 $28 * 28$ dimension的vector转成image，看起来都不会像是一个数字，所以描述数字所需要的dimension可能远比28*28要来得少。

举一个极端的例子，下面这几张表示“3”的image，我们完全可以用中间这张image旋转角度来描述，也就是说，我们只需要用这一个dimension就可以描述原先28*28 dimension的图像。

上例中只要抓住角度的变化就可以知道28维空间中的变化，这里的28维pixel就是之前提到的樊一翁的胡子，而1维的角度则是他的头，也就是去芜存菁，化繁为简的思想。

3.1 How to do Dimension Reduction？

在Dimension Reduction里，我们要找一个function，这个function的input是原始的x，output是经过降维之后的z。

做dimension reduction常用的方法是

Feature selection（拿掉一些直观上就对结果没有影响的dimension）
Principle component analysis(PCA)（主要成分分析）

3.2 PCA算法（Principle component analysis）

PCA认为降维就是一个很简单的linear function，它的input x和output z之间是linear transform，即z=Wx，PCA要做的，就是根据一大堆的x把W给找出来(现在还不知道z长什么样子)。

3.2.1 基于最大方差原理

1 . PCA for 1-D

为了简化问题，这里我们假设z是1维的vector，也就是把x投影到一维空间，此时w是一个row vector（行向量），z1=w1x，其中w1表示w的第一个row vector，假设w1的长度为1，此时z1就是x在w1方向上的投影。
那应该怎么去选w呢？
我们希望选这样一个w1，它使得x经过投影之后得到的z1分布越大越好，也就是说，经过这个投影后，不同样本点之间的区别，应该仍然是可以被看得出来的，即：

我们希望找一个投影的方向，它可以让投影后的variance越大越好
我们不希望投影使这些data point通通挤在一起，导致点与点之间的奇异度消失

上图中给出了所有样本点在两个不同的方向上投影之后的variance比较情况，要选择让样本在所投影到的维度上的方差尽量大。

2. PCA for n-D

投影到更高维的空间，对z=Wx来说：

z1=w1x，表示x在w1方向上的投影
z2=w2x，表示x在w2方向上的投影
同上

上图中 z1,z2,…串起来就得到z，而w1,w2分别是的第1,2,…个row，需要注意的是，此时W是一个单位正交矩阵，即（w1,w2,w3,…）相互正交，且都是单位向量。

那我们怎么去找w1,w2 呢？怎么解决这个问题？

数学公式推导
第一点：先来求解w1，把投影后z=w1·x的协方差矩阵写出来~

第二点：问题变成了求解带条件的最大值问题，采用拉格朗日乘数法求解~，可求得w1是x的协方差矩阵S的特征向量，且是最大特征值对应的特征向量。（线代矩阵运算）

第三点：依次往后退，w2是S的第二大特征值所对应的特征向量。

第四点：PCA达到的效果就是decorrelation（去关联），所以最后投影之后得到z的协方差矩阵D是对角矩阵。

投影矩阵W是单位正交矩阵
W就是由x协方差矩阵S的特征向量组成

3.2.2 基于最小化误差原理

假设我们现在考虑的是手写数字识别，这些数字是由一些类似于笔画的basic component组成的，本质上就是一个vector，记做u1,u2,…，以MNIST为例，不同的笔画都是一个28×28的vector，把某几个vector加起来，就组成了一个28×28的digit
写成表达式就是：
其中x代表某张digit image中的pixel，它等于k个component的加权和加上所有image的平均值。

比如7就是x=u1+u3+u5，我们可以用来[ c1 c2 c3 … ck]T 表示一张digit image，如果component的数目k远比pixel的数目要小，那这个描述就是比较有效的。

实际上我们并不知道u1~uk具体的值，因此我们要找这样k个vector，使得之间越接近越好。

基本思想：将x^近似看成是由多个u组成的，然后求解最小化它们之间的error时的系数c和分量u。

矩阵形式，Matrix X就是x^,用下图中的矩阵相乘来表示，我们的目标是使等号两侧矩阵之间的差距越小越好。
为了求解c和u（component），可以将X做奇异值分解SVD，用分解后的U代替u，ΣxV代替系数c，得到的U矩阵就是协方差矩阵XXT的k个特征向量。

3.2.3 从NN角度理解PCA

由于w之间时互相正交的，CK,也就是说c可以表示成(下图中）这两者的乘。PCA相当于只含一层hidden layer的AutoEncode，即具有一层隐含层的神经网络（线性激活函数），即输入和输出之间的误差越小越好。

如果不是PCA的方法，只用neural network的解法不能够保证w之间是垂直的。但是如果用网络的话，可以用deep autoencode。（下一节会讲到）

3.2.4 Weakness of PCA

PCA有很明显的弱点：

PCA是无监督的，不知道数据的标签，这样在降维映射之后可能会把两类数据混到一起。（考虑数据标签的方法LDA（Linear Discriminant Analysis）可以避免这一问题，但这属于监督学习）。
PCA是线性的，把一个三维空间中的S形分布的数据做PCA之后的效果，就是把S形拍扁，而非展开。（对类似曲面空间的降维投影，需要用到non-linear transformation）

3.2.5 PCA for Pokemon（将PCA用于分析宝可梦的数据）

案例中800个宝可梦的cov(x)是6维，最多可以投影到6维空间，我们可以先找出6个特征向量和对应的特征值λi，其中λi表示第i个投影维度的variance有多大，计算6个特征值的ratio比重，舍去较小的（只取前四个特征值的特征向量作为新的特征，或者叫主成分PC）。（即特征值的意义是，PCA降维时，在相应维度的variance有多大。）

注意到新的维度本质上就是旧的维度的加权矢量和，下图给出了前4个维度的加权情况，从PC1到PC4这4个principle component都是6维度加权的vector，它们都可以被认为是某种组件，大多数的宝可梦都可以由这4种组件拼接而成，也就是用这4个6维的vector做linear combination的结果。

每个PC都是一个六维向量，分析它们在哪个维度是大的正值/负值，可以分析出这个PC所代表的意义。

3.2.6 PCA for MNIST

这个时候我们就可以熟练地把一张数字图像用多个组件(维度)表示出来了：
digit image = a1w1 + a2w2 + …，这里的wi就表示降维后的其中一个维度，同时也是一个组件，它是由原先28×28维进行加权求和的结果，因此wi也是一张28×28的图像，下图列出了通过PCA得到的前30个组件的形状：
在对MNIST和Face的PCA结果展示的时候，你可能会注意到我们找到的组件好像并不算是组件，比如MNIST找到的几乎是完整的数字雏形，而Face找到的也几乎是完整的人脸雏形，仔细思考了PCA的特性，就会发现得到这个结果是可能的，注意到linear combination的weight ai 可以是正的也可以是负的，因此我们可以通过把组件进行相加或相减来获得目标图像，这会导致你找出来的component不是基础的组件，但是通过这些组件的加加减减肯定可以获得基础的组件元素。

3.2.7 PCA和NMF比较

NMF：Non-negative Matrix Factorization，非负矩阵分解（这一节未细讲）

NMF分解之后的component的系数都是正的，就拿image来说，也就是说分解之后的component像是原始image的一部分。
PCA的系数可正可负，涉及到component的“加加减减”，而不是部分。

总结与展望

本章学习到了，无监督学习的种类，化繁为简型，包括聚类与降维，学习到了具体的聚类算法，K-means和HAC。HAC和K-means最大的区别在于如何决定cluster的数量，在K-means里，K的值是要你直接决定的；而在HAC里，你并不需要直接决定分多少cluster，而是去决定这一刀切在树的哪里。clustering的缺点是以偏概全，它强迫每个object都要属于某个cluster,我们应该用一个vector来描述该object，这个vector的每一维都代表object的某种属性,但有时候我们仅需要少量维度就可以表示是一个object。所以我们需要Dimension Reduction，我们可以使用feature selection和PCA等进行降维。其中PCA的应用更加广泛，但是PCA也有一些无法避免的缺陷。PCA与NMF有怎么样的区别与性能表现（自己去查阅补充）。下一节将会讲解降维算法(Dimension Reduction)的典型应用——词嵌入(word embedding)，以及如何用vector来表示一个word等，及相关应用。

【半夜爬起来学python】零基础学习Pygame|第一期|知识点+小球反弹游戏案例奈樱. python(pygame)pygame 学习游戏 pip
一.安装PygamePygame是跨平台Python模块，很多编译器不会向用户提供该模块，需要我们自己安装。安装步骤：打开Pygame官网：www.pygame.org点击PYGAME2.6.0-25JUN,2024下载好之后，解压压缩包，安装路径最好放在c盘里Administrator文件里在菜单栏点击搜索，输入cmd，找到“命令提示符”输入命令pipinstallpygame运行的时候会发现命
机器学习5——非参数估计平和男人杨争争山东大学机器学习期末复习机器学习概率论算法
非参数估计在参数估计中我们已经提到，想要估计后验概率P(ωi∣x)=p(x∣ωi)p(ωi)p(x)P\left(\omega_i\midx\right)=\frac{p\left(x\mid\omega_i\right)p\left(\omega_i\right)}{p(x)}P(ωi∣x)=p(x)p(x∣ωi)p(ωi)，就需要估计类条件概率p(x∣ωi)p\left(x\mid\omega
机器学习4——参数估计之贝叶斯估计平和男人杨争争山东大学机器学习期末复习机器学习人工智能
贝叶斯估计问题建模：后验概率公式：P(ωi∣x,D)=P(x∣ωi,Di)P(ωi)∑j=1cP(x∣ωj,Dj)P(ωj)P\left(\omega_i\mid\mathbf{x},\mathcal{D}\right)=\frac{P\left(\mathbf{x}\mid\omega_i,\mathcal{D}_i\right)P\left(\omega_i\right)}{\sum_{j=1
深度学习实战：基于嵌入模型的AI应用开发 AIGC应用创新大全 AI人工智能与大数据应用开发 MCP&Agent 云算力网络人工智能深度学习 ai
深度学习实战：基于嵌入模型的AI应用开发关键词：嵌入模型（EmbeddingModel）、深度学习、向量空间、语义表示、AI应用开发、相似性搜索、迁移学习摘要：本文将带你从0到1掌握基于嵌入模型的AI应用开发全流程。我们会用“翻译机”“数字身份证”等生活比喻拆解嵌入模型的核心原理，结合Python代码实战（BERT/CLIP模型）演示如何将文本、图像转化为可计算的语义向量，并通过“智能客服问答”“
鸿蒙开发：资讯项目实战之项目框架设计
前言本项目API>=13写了那么多的文章，总感觉缺少点什么，沉下心来细细一想，原来是没有把相关知识应用于实战，对于我们这些开发过项目，有过项目经验的人来说，项目开发小菜一点，但是对于刚接触鸿蒙的开发者而言，确实需要一个从0到1的项目进行磨炼一下，授人以鱼不如授人以渔，说干就干，那么接下来的一段时间，我会时不时的进行穿插项目实战的文章，当然了其他的技术文章也会不间断更新。关于项目实战，选来选去，最终
机器学习3——参数估计之极大似然估计平和男人杨争争山东大学机器学习期末复习机器学习人工智能算法
参数估计问题背景：P(ωi∣x)=p(x∣ωi)P(ωi)p(x)p(x)=∑j=1cp(x∣ωj)P(ωj)\begin{aligned}&P\left(\omega_i\mid\mathbf{x}\right)=\frac{p\left(\mathbf{x}\mid\omega_i\right)P\left(\omega_i\right)}{p(\mathbf{x})}\\&p(\mathbf
我的创作纪念日 BoAiB 其他
机缘起初，只是因为这个平台学习知识很方便，慢慢的有了记录自己“成长”的想法，也很想一直坚持下去。收获获得了100+粉丝的关注获得了6000+正向的反馈，如赞、评论、阅读量等关注了许多榜样大神学习习惯也变得更好了，会很认真仔细的记录自己的收获，也很开心能被大家认可我的分享日常创作已经是我生活的一部分了一边学习，一边实践，一边记录以前总觉得，做笔记太浪费时间了，总觉得实践才是硬道理，现在想想，真是愚昧
java课程设计体会_Java课程设计（阶段一） XY LIU java课程设计体会
1选题选题一算术运算测试题目要求实现十道100以内加减法数学题，能根据题目计算出答案，与输入答案对比，判断做题是否正确，最后计算分数。添加排行榜功能存放到文件或数据库中。使用Java知识String类IO：Reader、Writer类集合：ArrayLiastsort()方法选题二猜数游戏题目要求计算机产生随机数，猜中即胜，猜不中，提示是大了还是小了，继续猜，直至猜到，给出所用时间和评语。保留用户
推荐几本创业者需要掌握的财务管理类书籍 AI布道师阿彬单独的博客资料创业者财务管理书籍推荐创业
作为创业者，需要建立一个坚实的财务和管理知识体系。这不仅仅是“看书”，而是通过阅读经典来构建商业思维框架。以下是精心挑选的一系列书籍，并按照从**“入门认知”到“高手进阶”**的逻辑进行分类，每本书都附上了推荐理由，确保它们能精准地解决创业者在创业不同阶段可能遇到的问题。第一部分：财务思维篇(让您看懂钱、管好钱、用好钱)对于技术出身的创始人来说，财务知识不是为了让您成为会计，而是为了让您拥有**“
程序员面试中的故障排查：展现问题解决能力的黄金法则
程序员面试中的故障排查：展现问题解决能力的黄金法则关键词：故障排查、面试技巧、问题解决能力、结构化思维、技术沟通、根因分析、面试场景模拟摘要：在程序员面试中，故障排查类问题是考察候选人“实战能力”的核心环节——它不仅检验技术知识的深度，更能暴露逻辑思维、沟通表达和抗压能力的真实水平。本文将通过“侦探破案”式的类比，结合真实面试场景，拆解故障排查的黄金法则，帮助你在面试中从“解题者”升级为“问题解决
大模型RLHF强化学习笔记（一）：强化学习基础梳理Part1 Gravity! 大模型笔记大模型 LLM 算法机器学习强化学习人工智能
【如果笔记对你有帮助，欢迎关注&点赞&收藏，收到正反馈会加快更新！谢谢支持！】一、强化学习基础1.1Intro定义：强化学习是一种机器学习方法，需要智能体通过与环境交互学习最优策略基本要素：状态（State）：智能体在决策过程中需要考虑的所有相关信息（环境描述）动作（Action）：在环境中可以采取的行为策略（Policy）：定义了在给定状态下智能体应该选择哪个动作，目标是最大化智能体的长期累积奖
高通 QCS8550 大模型性能深度解析：从算力基准到场景实测的全维度 Benchmark 伊利丹~怒风 Qualcomm 人工智能 AI编程 python arm 自然语言处理
前言在人工智能技术狂飙突进的时代，大模型正以前所未有的速度重塑各行业生态，从智能客服到多模态交互，从边缘推理到端侧部署，其应用场景不断拓展。而这一切革新的背后，离不开底层硬件的强力支撑。高通QCS8550作为面向下一代智能设备的旗舰级计算平台，凭借高达48TOPS的AI算力与先进的第七代高通AI引擎，在大模型性能表现上极具竞争力。其异构多核架构不仅能高效处理复杂的神经网络计算，还通过软硬件协同优化
computed()、watch() 与 watchEffect() 前端岳大宝前端框架Vue vue.js javascript 前端
下面，我们来系统的梳理关于computed、watch与watchEffect的基本知识点：一、核心概念与响应式基础1.1响应式依赖关系Vue的响应式系统基于依赖收集和触发更新的机制：响应式数据依赖收集创建依赖关系数据变更触发更新执行副作用1.2三大API对比特性computedwatchwatchEffect返回值Ref对象停止函数停止函数依赖收集自动手动指定自动执行时机惰性求值响应变化立即执行
ref() 与 reactive() 前端岳大宝前端框架Vue javascript 前端 vue.js
下面，我们来系统的梳理关于ref()与reactive()的基本知识点：一、响应式编程核心概念1.1什么是响应式编程？响应式编程是一种声明式编程范式，它使数据变化能够自动传播到依赖它的代码部分。在Vue中，响应式系统实现了：数据驱动视图：数据变化自动更新DOM依赖追踪：自动跟踪数据依赖关系高效更新：最小化不必要的DOM操作1.2Vue响应式系统演进版本响应式实现特点Vue2Object.defin
从零开始理解零样本学习：AI人工智能必学技术 AI天才研究院 Agentic AI 实战 AI人工智能与大数据 AI大模型企业级应用开发实战 ai
从零开始理解零样本学习：AI人工智能必学技术关键词：零样本学习、人工智能、机器学习、知识迁移、语义嵌入摘要：本文旨在全面深入地介绍零样本学习这一在人工智能领域具有重要意义的技术。首先阐述零样本学习的背景和基本概念，通过详细的解释和直观的示意图让读者建立起对零样本学习的初步认识。接着深入剖析其核心算法原理，结合Python代码进行详细说明，同时引入相关数学模型和公式并举例阐释。通过项目实战部分，带领
2025 VUE常见面试题 hmildj vue.js 面试前端
前言总结一些VUE面试的基础知识，共同学习1.什么是Vue？答案：Vue.js（通常简称为Vue）是一个用于构建用户界面的‌渐进式JavaScript框架，Vue3是Vue.js框架的最新版本，它引入了许多改进和优化，包括性能提升、更好的类型支持、组合API等。2.MVVM模式是什么？Vue如何体现这一模式？‌答案：MVVM将视图（View）与数据（Model）通过ViewModel层解耦，Vue
软件测试从业者必备的SQL知识十二测试录数据库 sql 数据库
作为职场人，学一门技能是用来解决日常工作问题的，没必要从头到尾把这块知识弄透，没那么多时间。基于此，十二根据自己的经验，把软件测试从业者需要掌握的SQL知识，整理如下；只要跟着这个顺序，从头到尾执行即可。前置准备事项：1、在自己电脑上安装一个mysql数据库，文章见->虚拟机Centos下安装Mysql完整过程（图文详解）_虚拟机安装mysql-CSDN博客2、找一个mysql客户端链接工具：初学
卷积神经网络（Convolutional Neural Network, CNN）不想秃头的程序神经网络语音识别人工智能深度学习网络卷积神经网络
卷积神经网络（ConvolutionalNeuralNetwork,CNN）是一种专门用于处理图像、视频等网格数据的深度学习模型。它通过卷积层自动提取数据的特征，并利用空间共享权重和池化层减少参数量和计算复杂度，成为计算机视觉领域的核心技术。以下是CNN的详细介绍：一、核心思想CNN的核心目标是从图像中自动学习层次化特征，并通过空间共享权重和平移不变性减少参数量和计算成本。其关键组件包括：卷积层（
ResNet（Residual Network）不想秃头的程序神经网络语音识别人工智能深度学习网络残差网络神经网络
ResNet（ResidualNetwork）是深度学习中一种经典的卷积神经网络（CNN）架构，由微软研究院的KaimingHe等人在2015年提出。它通过引入残差连接（SkipConnection）解决了深度神经网络中的梯度消失问题，使得网络可以训练极深的模型（如上百层），并在图像分类、目标检测、语义分割等任务中取得了突破性成果。以下是ResNet的详细介绍：一、核心思想ResNet的核心创新是
P25：LSTM实现糖尿病探索与预测 ?Agony lstm 人工智能 rnn
本文为365天深度学习训练营中的学习记录博客原作者：K同学啊一、相关技术1.LSTM基本概念LSTM（长短期记忆网络）是RNN（循环神经网络）的一种变体，它通过引入特殊的结构来解决传统RNN中的梯度消失和梯度爆炸问题，特别适合处理序列数据。结构组成：遗忘门：决定丢弃哪些信息，通过sigmoid函数输出0-1之间的值，表示保留或遗忘的程度。输入门：决定更新哪些信息，同样通过sigmoid函数控制更新
什么是 QueryGPT？智能查询工具如何重塑信息检索的未来？镜舟科技 StarRocks QueryGPT 数据查询数据分析多模态交互
从客户行为数据到供应链信息，从市场趋势到内部运营指标，这些数据蕴含着巨大的商业价值。然而，数据量的激增也带来了前所未有的检索挑战：如何在海量信息中快速定位所需数据？如何确保查询结果的准确性和时效性？据统计，75%的企业正受困于低效的查询工具，这已成为阻碍企业数字化转型的关键痛点。传统的数据查询方式主要依赖SQL语句或特定的查询语言，这要求用户具备专业的编程知识和对数据结构的深入理解。即使对于数据分
Python训练营打卡——DAY16（2025.5.5） cosine2025 Python训练营打卡 python 开发语言机器学习
目录一、NumPy数组基础笔记1.理解数组的维度(Dimensions)2.NumPy数组与深度学习Tensor的关系3.一维数组(1DArray)4.二维数组(2DArray)5.数组的创建5.1数组的简单创建5.2数组的随机化创建5.3数组的遍历5.4数组的运算6.数组的索引6.1一维数组索引6.2二维数组索引6.3三维数组索引二、SHAP值的深入理解三、总结1.NumPy数组基础总结2.SH
＜script setup＞语法糖前端岳大宝前端框架Vue vue.js 前端 javascript
下面，我们来系统的梳理关于Vue3语法糖的基本知识点：一、核心概念1.1什么是？是Vue3中CompositionAPI的编译时语法糖，它通过简化组件声明方式，显著减少样板代码，提供更符合直觉的开发体验。1.2设计目标与优势目标实现方式优势减少样板代码自动暴露顶层绑定代码更简洁提升开发体验更自然的响应式写法开发更高效更好的类型支持原生TypeScript集成类型安全编译时优化编译阶段处理运行时更高
一些unity知识点乌趣 unity c#游戏引擎
变量类型Animatora:定义animator组件类型变量LayerMaska：定义存储图层的变量Texta：定义文本变量，如UI的TextLineRenderer：定义保存LineRenderer组件的变量（画线用的）Material:定义保存材质的变量使用UI和场景管理的方法时记得usingUnityEngine.UI;usingUnityEngine.SceneManagement;pub
深入详解：决策树算法的概念、原理、实现与应用场景猿享天开算法决策树机器学习
深入详解：决策树算法的概念、原理、实现与应用场景决策树（DecisionTree）是机器学习中一种直观且广泛应用的监督学习算法，适用于分类和回归任务。其树形结构易于理解，特别适合初学者。本文将从概念、原理、实现到应用场景，全面讲解决策树，并通过流程图和可视化示例增强理解，通俗易懂，帮助小白快速掌握决策树算法相关知识。1.决策树的概念1.1什么是决策树？决策树通过一系列条件判断（决策节点）将输入数据
Golang高性能并发：Goroutine调度器优化技巧 Golang编程笔记 golang 爬虫网络 ai
Golang高性能并发：Goroutine调度器优化技巧关键词：Golang、高性能并发、Goroutine、调度器、优化技巧摘要：本文深入探讨了Golang中Goroutine调度器的优化技巧，旨在帮助开发者充分发挥Golang在并发编程方面的优势，提升程序的性能。首先介绍了相关背景知识，包括目的范围、预期读者等，接着解释了核心概念，如Goroutine、调度器等，阐述了它们之间的关系。然后详细
Golang Fiber框架最佳实践：如何构建企业级应用 Golang编程笔记 Golang编程笔记 Golang开发实战 golang 开发语言后端 ai
GolangFiber框架最佳实践：如何构建企业级应用关键词：Golang、Fiber框架、企业级应用、最佳实践、Web开发摘要：本文聚焦于GolangFiber框架在企业级应用构建中的最佳实践。详细介绍了Fiber框架的背景、核心概念、算法原理、数学模型等基础知识，通过具体的代码案例展示了如何搭建开发环境、实现和解读源代码。同时探讨了Fiber框架在实际应用场景中的应用，推荐了相关的学习资源、开
Unity知识点-Renderer常用材质变量徐子竣 unity 材质游戏引擎
本篇总结了Unity中renderer的3种常用的材质相关的变量：renderer.material,renderer.sharedMaterial,renderer.MaterialPropertyBlock。以及三者对SRPBatcher的影响。一.介绍及对比1.概念介绍1.material定义：material是Render组件（如MeshRenderer）的实例化材质。特点：访问rende
深入研究 Golang 领域的 Fiber 框架架构 Golang编程笔记 golang 架构网络 ai
深入研究Golang领域的Fiber框架架构关键词：Golang、Fiber框架、架构、高性能、Web开发摘要：本文将深入探讨Golang领域的Fiber框架架构。我们会先介绍背景知识，包括目的、预期读者等。接着用通俗易懂的方式解释核心概念，如Fiber框架的各个组成部分，以及它们之间的关系。然后详细阐述核心算法原理、数学模型，通过实际代码案例展示其应用。还会介绍Fiber框架的实际应用场景、推荐
【RAG面试题】LLMs已经具备了较强能力,存在哪些不足点? 一叶千舟 AI面试题【RAG】RAG
目录LLMs核心不足点1、知识过时与静态性（LackofReal-Time&DynamicKnowledge）：2、幻觉与事实性错误（Hallucinations&FactualInaccuracies）：3、领域专业知识深度不足（LimitedDomain-SpecificExpertise）：4、缺乏透明度和可追溯性（LackofTransparency&Traceability）：5、上下文
java数字签名三种方式知了ing java jdk
以下3钟数字签名都是基于jdk7的 1，RSA String password="test"; // 1.初始化密钥 KeyPairGenerator keyPairGenerator = KeyPairGenerator.getInstance("RSA"); keyPairGenerator.initialize(51
Hibernate学习笔记 caoyong Hibernate
1>、Hibernate是数据访问层框架，是一个ORM(Object Relation Mapping)框架，作者为:Gavin King 2>、搭建Hibernate的开发环境 a>、添加jar包: aa>、hibernatte开发包中/lib/required/所
设计模式之装饰器模式Decorator（结构型）漂泊一剑客 Decorator
1. 概述若你从事过面向对象开发，实现给一个类或对象增加行为，使用继承机制，这是所有面向对象语言的一个基本特性。如果已经存在的一个类缺少某些方法，或者须要给方法添加更多的功能（魅力），你也许会仅仅继承这个类来产生一个新类—这建立在额外的代码上。
读取磁盘文件txt，并输入String 一炮送你回车库 String
public static void main(String[] args) throws IOException { String fileContent = readFileContent("d:/aaa.txt"); System.out.println(fileContent);
js三级联动下拉框 3213213333332132 三级联动
//三级联动省/直辖市<select id="province"></select> 市/省直辖<select id="city"></select> 县/区 <select id="area"></select>
erlang之parse_transform编译选项的应用 616050468 parse_transform 游戏服务器属性同步 abstract_code
最近使用erlang重构了游戏服务器的所有代码，之前看过C++/lua写的服务器引擎代码，引擎实现了玩家属性自动同步给前端和增量更新玩家数据到数据库的功能，这也是现在很多游戏服务器的优化方向，在引擎层面去解决数据同步和数据持久化，数据发生变化了业务层不需要关心怎么去同步给前端。由于游戏过程中玩家每个业务中玩家数据更改的量其实是很少
JAVA JSON的解析 darkranger java
// { // “Total”：“条数”， // Code: 1, // // “PaymentItems”:[ // { // “PaymentItemID”:”支款单ID”, // “PaymentCode”:”支款单编号”, // “PaymentTime”:”支款日期”, // ”ContractNo”:”合同号”， //
POJ-1273-Drainage Ditches aijuans ACM_POJ
POJ-1273-Drainage Ditches http://poj.org/problem?id=1273 基本的最大流，按LRJ的白书写的 #include<iostream> #include<cstring> #include<queue> using namespace std; #define INF 0x7fffffff int ma
工作流Activiti5表的命名及含义 atongyeye 工作流 Activiti
activiti5 - http://activiti.org/designer/update在线插件安装 activiti5一共23张表 Activiti的表都以ACT_开头。第二部分是表示表的用途的两个字母标识。用途也和服务的API对应。 ACT_RE_*: 'RE'表示repository。这个前缀的表包含了流程定义和流程静态资源（图片，规则，等等）。 A
android的广播机制和广播的简单使用百合不是茶 android 广播机制广播的注册
Android广播机制简介在Android中，有一些操作完成以后，会发送广播，比如说发出一条短信，或打出一个电话，如果某个程序接收了这个广播，就会做相应的处理。这个广播跟我们传统意义中的电台广播有些相似之处。之所以叫做广播，就是因为它只负责“说”而不管你“听不听”，也就是不管你接收方如何处理。另外，广播可以被不只一个应用程序所接收，当然也可能不被任何应
Spring事务传播行为详解 bijian1013 java spring 事务传播行为
在service类前加上@Transactional，声明这个service所有方法需要事务管理。每一个业务方法开始时都会打开一个事务。 Spring默认情况下会对运行期例外(RunTimeException)进行事务回滚。这
eidtplus operate 征客丶 eidtplus
开启列模式: Alt+C 鼠标选择 OR Alt+鼠标左键拖动列模式替换或复制内容(多行): 右键-->格式-->填充所选内容-->选择相应操作 OR Ctrl+Shift+V(复制多行数据,必须行数一致) -------------------------------------------------------
【Kafka一】Kafka入门 bit1129 kafka
这篇文章来自Spark集成Kafka(http://bit1129.iteye.com/blog/2174765)，这里把它单独取出来，作为Kafka的入门吧下载Kafka http://mirror.bit.edu.cn/apache/kafka/0.8.1.1/kafka_2.10-0.8.1.1.tgz 2.10表示Scala的版本，而0.8.1.1表示Kafka
Spring 事务实现机制 BlueSkator spring 代理事务
Spring是以代理的方式实现对事务的管理。我们在Action中所使用的Service对象，其实是代理对象的实例，并不是我们所写的Service对象实例。既然是两个不同的对象，那为什么我们在Action中可以象使用Service对象一样的使用代理对象呢？为了说明问题，假设有个Service类叫AService，它的Spring事务代理类为AProxyService，AService实现了一个接口
bootstrap源码学习与示例：bootstrap-dropdown（转帖） BreakingBad bootstrap dropdown
bootstrap-dropdown组件是个烂东西，我读后的整体感觉。一个下拉开菜单的设计： <ul class="nav pull-right"> <li id="fat-menu" class="dropdown">
读《研磨设计模式》-代码笔记-中介者模式-Mediator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 中介者模式（Mediator）：用一个中介对象来封装一系列的对象交互。 * 中介者使各对象不需要显式地相互引用，从而使其耦合松散，而且可以独立地改变它们之间的交互。 * * 在我看来，Mediator模式是把多个对象（
常用代码记录 chenjunt3 UI Excel J#
1、单据设置某行或某字段不能修改 //i是行号,"cash"是字段名称 getBillCardPanelWrapper().getBillCardPanel().getBillModel().setCellEditable(i, "cash", false); //取得单据表体所有项用以上语句做循环就能设置整行了 getBillC
搜索引擎与工作流引擎 comsci 算法工作搜索引擎网络应用
最近在公司做和搜索有关的工作，(只是简单的应用开源工具集成到自己的产品中)工作流系统的进一步设计暂时放在一边了，偶然看到谷歌的研究员吴军写的数学之美系列中的搜索引擎与图论这篇文章中的介绍，我发现这样一个关系(仅仅是猜想) -----搜索引擎和流程引擎的基础--都是图论，至少像在我在JWFD中引擎算法中用到的是自定义的广度优先
oracle Health Monitor daizj oracle Health Monitor
About Health Monitor Beginning with Release 11g, Oracle Database includes a framework called Health Monitor for running diagnostic checks on the database. About Health Monitor Checks Health M
JSON字符串转换为对象 dieslrae java json
作为前言,首先是要吐槽一下公司的脑残编译部署方式,web和core分开部署本来没什么问题,但是这丫居然不把json的包作为基础包而作为web的包,导致了core端不能使用,而且我们的core是可以当web来用的(不要在意这些细节),所以在core中处理json串就是个问题.没办法,跟编译那帮人也扯不清楚,只有自己写json的解析了.
C语言学习八结构体，综合应用，学生管理系统 dcj3sjt126com C语言
实现功能的代码： # include <stdio.h> # include <malloc.h> struct Student { int age; float score; char name[100]; }; int main(void) { int len; struct Student * pArr; int i,
vagrant学习笔记 dcj3sjt126com vagrant
想了解多主机是如何定义和使用的, 所以又学习了一遍vagrant 1. vagrant virtualbox 下载安装 https://www.vagrantup.com/downloads.html https://www.virtualbox.org/wiki/Downloads 查看安装在命令行输入vagrant 2.
14.性能优化-优化-软件配置优化 frank1234 软件配置性能优化
1.Tomcat线程池修改tomcat的server.xml文件： <Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" maxThreads="1200" m
一个不错的shell 脚本教程入门级 HarborChung linux shell
一个不错的shell 脚本教程入门级建立一个脚本　　Linux中有好多中不同的shell，但是通常我们使用bash (bourne again shell) 进行shell编程，因为bash是免费的并且很容易使用。所以在本文中笔者所提供的脚本都是使用bash（但是在大多数情况下，这些脚本同样可以在 bash的大姐，bourne shell中运行）。　　如同其他语言一样
Spring4新特性——核心容器的其他改进 jinnianshilongnian spring 动态代理 spring4 依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
Linux设置tomcat开机启动 liuxingguome tomcat linux 开机自启动
执行命令sudo gedit /etc/init.d/tomcat6 然后把以下英文部分复制过去。（注意第一句#!/bin/sh如果不写，就不是一个shell文件。然后将对应的jdk和tomcat换成你自己的目录就行了。 #!/bin/bash # # /etc/rc.d/init.d/tomcat # init script for tomcat precesses
第13章 Ajax进阶（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Troubleshooting Crystal Reports off BW blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Troubleshooting+Crystal+Reports+off+BW#TroubleshootingCrystalReportsoffBW-TracingBOE Quite useful, especially this part: SAP BW connectivity For t
Java开发熟手该当心的11个错误 tomcat_oracle java jvm 多线程单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
正则表达式大全 yang852220741 html 编程正则表达式
今天向大家分享正则表达式大全，它可以大提高你的工作效率正则表达式也可以被当作是一门语言，当你学习一门新的编程语言的时候，他们是一个小的子语言。初看时觉得它没有任何的意义，但是很多时候，你不得不阅读一些教程，或文章来理解这些简单的描述模式。一、校验数字的表达式数字：^[0-9]*$ n位的数字：^\d{n}$ 至少n位的数字：^\d{n,}$ m-n位的数字：^\d{m,n}$