uestc_Venn

SPSS PRO工具适用模型与辅助工具

内容或参考来源

https://www.spsspro.com/

数据预处理【工具】

数据标签

输入：一项定类变量。
输出：定类变量的文本标签修改。

数据编码

输入：一项定量或定类变量。
输出：对变量每个值进行重新编码。

异常值处理

详细解释

异常值可能是与整体数据情况偏离很大的数据点（常见的3σ准则），也可能在超过某个不合理范围的数据点，在分析中应该首先排除掉异常值，该方法可检测变量中的异常值，并对异常值进行置空或者是填补为其它有效值。

输入输出描述

输入：一项或以上的定量变量。
输出：对异常值置空或者是对异常值进行填补。

无效样本处理

详细解释

个案处理即按要求识别到满足条件的样本，并对其进行标记或者剔除。

输入输出描述

输入：两项及以上的定量或定类变量。
输出：对满足条件的样本进行删除或是标记（生成标记变量）。

生成变量

详细解释

生成变量是对单变量或多变量进行计算。其中平均值、求和、乘积（交互项）是多变量计算，即对多个变量的均值、加和、乘积的结果；自然对数、Log10是单变量计算，即对单个变量的数据的值进行计算。

输入输出描述

输入：对于平均值、求和、乘积（交互项）：至少2个定量变量；对于自然对数、Log10：仅1个定量变量。
输出：按照选项计算生成新变量。

数据标准化

详细解释

数据标准化包括去量纲化和一致化。去量纲化是指不同指标之间由于量纲不同以致于其不具可比性，故首先需将指标进行无量纲化，消除量纲影响后再进行接下来的分析。例如，某个变量的数值在1-10之间，而另一个变量的数值范围在100-1000之间，此时若进行综合评价，从数值的角度，很有可能数值变化范围大的变量，它的绝对作用就会较大，所占的比重较大。一致性是指将指标作用方向一致化，例如我们在评价多个不同指标的作用时，正向指标是数值越大越好，负向指标是数值越小越好，如果同时评价这两类指标的综合作用，由于他们的作用方向不同，不能将指标作用直接相加，此时我们就需要对逆指标进行一致化处理。

输入输出描述

输入：一项或以上定量变量。
输出：新生成标准化后的变量。

虚拟变量转换

详细解释

多分类变量是不能直接参与到回归计算中。对于有序定类变量，可以将它进行数据编码，利用数字来表示分类变量的有序等级；但是对于无序定类变量，需要将其转变为虚拟变量来处理。虚拟变量转换包括哑变量和独热编码，其中哑变量化比独热编码少了一列变量，这是因为独热编码容易造成共线性，而哑变量随机以一个选项作为参照项，下图例子以”其它“作为参照项，当学生=0且上班族=0时，很明显，此时就默认归为”其它“，且在对回归系数进行解释时，所有类别哑变量的回归系数，均表示该哑变量与参照项相比之后对因变量的影响。

输入输出描述

输入：一项定类变量。
输出：新生成哑变量或者独热编码。

缺失值处理

详细解释

缺失值即空值，该方法可以识对各个变量的空值进行识别和填补，其中包括统计量填补和规则填补。

输入输出描述

输入：一项或以上定量或定类变量。
输出：对缺失值进行填补。

时序数据滑动窗口转换

详细解释

时序数据滑窗转换用于将时间序列数据转为回归数据，简单地说，就是把一个单序列的数据变为X->Y的回归数据。如下图所示，步阶为2代表2个X（步阶多少就有多少个X），简单地说，就是用第1，2天的数据预测第3天，用第2，3天的数据预测第4天，以此类推。此种形式的数据进行回归就是时间序列预测问题。

输入输出描述

输入：一项定量变量。
输出：根据步阶划分的自变量和因变量。

缩尾/截尾处理

详细解释

样本数据足够多时为了剔除一些极端值对研究的影响，一般会对连续变量进行缩尾/截尾处理。首先对变量数值进行从小到大排列后，处理超出变量特定百分位范围的数值（被称作极端值）。缩尾是将这些极端值替换为其特定数值，截尾是直接删除这些极端值。

输入输出描述

输入：一项或以上定量变量。
输出：对极端值进行缩尾（填补）或截尾（删除）处理。

数据变换

数据变换是将数据准换成更适合数据分析的形式。其中Box-Cox变换的目的是为了让数据满足线性模型的基本假定。而小波变换和傅里叶变换能有效地提取相关的数据进行：小波变换可以同时提取时域信息和频域信息，而傅里叶变换只能提取频域信息。

示例：
在使用线性回归的时候，由于残差不符合正态分布而不满足建模的条件，这时候要对因变量Y进行Box-Cox变换，把数据变成正态的，可以一定程度上减小残差和预测变量的相关性。

输入输出描述

输入：一项定量变量。
输出：变换后的新序列。

样本均衡

详细解释

进行分类任务时，如果因变量不同类别的样本数量不均衡时，会严重影响模型训练。比如说对于一个二分类问题，某一类别有995个数据，另一类别有5个数据时，此时属于严重的数据样本分布不均衡，很难从中提取规律，所以当发现样本不均衡时，需要做样本均衡处理，增加样本量较少的类别样本或减少样本量较多的类别样本，从而使得因变量不同类别的样本数量相差不大。

输入输出描述

输入：至少两项定量变量。
输出：增加样本量较少的类别样本或减少样本量较多的类别样本。

处理类型

过采样

随机法
smote法
ADASYN法

下采样

随机法
Cluster Centroids法

组合采样

SMOTE ENN法
Tomek Link法

特征筛选

详细解释

特征数过多一方面增加了模型的复杂度，另一方面特征多也引入了更多的噪声数据，使模型更容易学到噪声，增大了发生过拟合的风险。所以变量（特征）过多时，需要从原始特征中选择出一些最有效特征以降低数据维度，从而有效提高模型性能。

输入输出描述

输入：至少两项定量变量。
输出：在变量名后标明应保留还是应剔除。

处理类型

方差选择法
随机森林特征重要度
XGBoost
相关系数法
互信息法
卡方检验法
VIF法
递归消除特征法

数据降维

详细解释

数据降维是采用某种映射方法，将原高维空间中的数据点映射到低维度的空间中，即将多列数据融合为更少列数据，且这些少列数据能够保留原数据的绝大部分有效信息。数据分析中存在部分变量是没有意义的，当这些无意义变量参与进分析的时候反而会对分析结果造成不利的影响，就可以进行降维处理；又或者想要对敏感隐私数据进行保护，也可进行降维来对数据进行变形整合。

输入输出描述

输入：至少两个定量变量（假设变量数为N）。
输出：新生成降维后的M个变量序列（M

处理类型

PCA（主成分分析）
LDA（线性判别法）:

LDA是一种监督学习的降维技术，也就是说它的数据集的每个样本是有类别输出的。这点和PCA不同。PCA是不考虑样本类别输出的无监督降维技术。LDA的思想为投影后类内方差最小，类间方差最大，也就是数据在低维度上进行投影，投影后希望每一种类别数据的投影点尽可能的接近，而不同类别的数据的类别中心之间的距离尽可能的大。

ISOMap: 通过等距映射的非线性降维，是一种无监督算法。
LLE(局部线性嵌入算法)：和Isomap都属于流形学习方法。与Isomap不同的是，LLE在降维中，试图保持邻域内样本之间的线性关系，使得样本之间的映射坐标能够在低维空间中得以保持。
KPCA：

PCA只能是降维，把m维的数据降至k维。KPCA不仅可以降维，也可以升维，把m维的数据升至k维。他们共同的目标都是让数据在目标维度中（线性）可分，即PCA的最大可分性。
t-SNE：用于在二维或三维的低维空间中表示高维数据集，从而使其可视化，与其他降维算法(如PCA)相比，t-SNE创建了一个缩小的特征空间，相似的样本由附近的点建模，不相似的样本由高概率的远点建模。

描述性分析（算法）

频数分析

详细解释

频数分析是对一组数据的不同数值的频数，或者数据落入指定区域内的频数进行统计，了解其数据分布状况的方式。通过频数分析，能在一定程度上反映出样本是否具有总体代表性，抽样是否存在系统偏差，并以此证明以后相关问题分析的代表性和可信性。

输入输出描述

输入：一个或多个定类变量。
输出：每个定类变量中不同类别样本的的分布状况与频数统计。

交叉分析

详细解释

用于分析两两分组变量之间的交叉分布，然后比较各组的分布状况，以寻找变量间的关系。

输入输出描述

输入：一个定类变量X与一个或者多个字段Y。
输出：两两分组变量之间的交叉分布情况。

描述性统计（e.g. boxplot）

详细解释

描述性统计分析是对调查总体所有变量的有关数据进行统计性描述，包括数据的集中趋势与离散趋势。  
![descriptive_1.efc73118.png](https://img-blog.csdnimg.cn/img_convert/6197838dd77d9fc3a277ad23e70aa51e.png)

输入输出描述

输入：一个或多个定量变量。
输出：对总体数据的各项统计指标（字段）进行整体描述分析，包括样本量、最大值、最小值、算术平均值、中位数等统计量。

分类汇总

详细解释

根据定类变量分类进行汇总（按照某一标准进行分类，然后在分完类的基础上对各类别相关数据分别进行求和、求平均数、求个数、求最大值、求最小值等方法的汇总。又名列联表分析）。  
![aggregate_1.62fab5a8.png](https://img-blog.csdnimg.cn/img_convert/95577aacc6c589c93e319570cfcc2441.png)

输入输出描述

输入：分组项为一个或多个定类变量，汇总项为一个或多个定类变量。
输出：在分完类的基础上对各类别相关数据分别进行求和、求平均数、求个数、求最大值、求最小值等统计量。

正态性检验

输入输出描述

输入：一个或多个定量变量（如30名员工这个月的工资）。
输出：模型检验的结果，数据满足/不满足正态分布。

综合评价【重点】

层次分析法（AHP）

详细解释

层次分析法是一种解决**多目标的复杂问题的定性与定量相结合的决策分析方法**。该方法将定量分析与定性分析结合起来，用决策者的经验判断**各衡量目标之间能否实现的标准之间的相对重要程度**，例如通过构建评价指标（景色、费用，居住，饮食、旅途）对候选旅游地（桂林、黄山，北戴河）量化评价，进行选择。在专业版里面，系统健全对方案层的层次总排序，如不需层次总排序，请选择层次分析法（AHP简化版）。  
![ahp_sample_1.b2ed57a9.png](https://img-blog.csdnimg.cn/img_convert/12ca5bce8546f15d140177c9a174660d.png) 
示例：
通过构建评价指标（景色、费用，居住，饮食、
旅途）对候选旅游地（桂林、黄山，北戴河）
量化评价，进行选择。

输入输出描述

输入：根据提示进行指标或者方案两两对比。
输出：各方案的量化得分或者同一级的指标权重。

因子分析（计算权重）

详细解释

因子分析是基于**降维**的思想，在尽可能不损失或者少损失原始数据信息的情况下，**将错综复杂的众多变量聚合成少数几个独立的公共因子**，这几个公共因子可以**反映原来众多变量的主要信息**，在减少变量个数的同时，又反映了变量之间的内在联系。通常因子分析有三种作用：一是用于**因子降维**，二是**计算因子权重**，三是**计算加权计算因子汇总综合得分**。  
![factor_analysis_1.82fc2ccb.png](https://img-blog.csdnimg.cn/img_convert/9f3f7844c8c898fdb5dd48fc678a614c.png)

输入输出描述

输入：2个或两个以上的定量变量（假设为N个变量）。
输出：最低可降维成1维（一个变量，一般用于综合评价），最多可降维成N个变量（一般用于数据脱敏），同时可以获取降维后各个变量的组成权重，用于代表原先变量的数据保留情况。

数据包络分析（DEA）

详细解释

数据包络分析是**评价多输入指标和多输出指标**的较为有效的方法，**将多投入与多产出进行比较**，得到效率分析，可广泛使用于业绩评价。

输入输出描述

输入：数据包络分析的输入是投入、产出的指标（定量变量）。
输出：效率评估结果，包含具体需要增大或减小哪些投入变量，如何调整产出变量，才能达到最优效率。

模糊综合评价【重点】

详细解释

模糊综合评价借助模糊数学的一些概念，对实际的综合评价问题提供评价，即模糊综合评价以模糊数学为基础，应用模糊关系合成原理，将一些边界不清、不易定量的因素定量化，进而进行综合性评价的一种方法。

输入输出描述

输入：至少两项或以上的定量变量。
输出：反应考核指标在量化评价中的综合得分。

TOPSIS法（优劣解距离法）

详细解释

TOPSIS 法是一种常用的**组内综合评价**方法，能充分利用原始数据的信息，其结果能精确地反映**各评价方案之间的差距**。基本过程为基于归一化后的原始数据矩阵，采用余弦法找出有限方案中的最优方案和最劣方案，然后分别计算各评价对象与最优方案和最劣方案间的距离，获得各评价对象**与最优方案的相对接近程度**，以此作为评价优劣的依据。该方法对数据分布及样本含量没有严格限制，数据计算简单易行。  
![topAnalysis_1.144eec39.png](https://img-blog.csdnimg.cn/img_convert/d38080577bbaaf6873add06d5accb86c.png)

输入输出描述

输入：至少两项或以上的定量变量。
输出：反应考核指标在量化评价中的综合得分。

秩和比综合评价法（RSR）【用于效益-成本分析】

详细解释

秩和比(RSR)指将效益型指标从小到大排序进行排名、成本型指标从大到小排序进行排名，再计算秩和比，最后统计回归、分档排序。通过秩转换，获得无量纲统计量RSR，以RSR值对评价对象的优劣直接排序或分档排序，从而对评价对象做出综合评价。

输入输出描述

输入：至少两项或以上的定量变量。
输出：反应考核指标在量化评价中的综合得分（RSR）与分档。

耦合协调度

详细解释

耦合协调度模型用于分析事物的协调发展水平。耦合度指两个或两个以上系统之间的相互作用影响，实现协调发展的动态关联关系，可以反映系统之间的相互依赖相互制约程度。协调度指耦合相互作用关系中良性耦合程度的大小，它可体现出协调状况的好坏。

输入输出描述

输入：至少两项或以上的定量变量。
输出：以样本（行）为单位，各个单位综合各个变量的耦合协调程度。

多指标综合评价赋权系列

熵值法【多指标综合评价，计算指标权重】

详细解释

熵值法根据信息熵的定义，对于某项指标，可以用熵值来判断某个指标的离散程度，其信息熵值越小，**指标的离散程度越大， 该指标对综合评价的影响（即权重）就越大**，如果某项指标的值全部相等，则该指标在综合评价中不起作用。因此，可利用信息熵这个工具，计算出各个指标的权重，为**多指标综合评价**提供依据。

输入输出描述

输入：至少两项或以上的定量变量（正向指标与负向指标）。
输出：输入定量变量对应的权重值。

CRITIC权重法【多指标综合评价-减少指标堆叠时用】

详细解释

CRITIC权重法是一种客观赋权法。其思想在于用两项指标，分别是对比强度和冲突性指标。对比强度使用标准差进行表示，如果数据标准差越大说明波动越大，权重会越高；冲突性使用相关系数进行表示，如果指标之间的相关系数值越大，说明冲突性越小，那么其权重也就越低。对于多指标多对象的综合评价问题，CRITIC法去消除一些相关性较强的指标的影响，减少指标之间信息上的重叠，更有利于得到可信的评价结果。

输入输出描述

输入：至少两项或以上的定量变量（可以做正、负向处理，但是不要做标准化）。
输出：输入定量变量对应的权重值。

独立性权系数法【多指标综合评价-共线性】

详细解释

独立性权系数法是一种客观赋权法。其思想在于根据各指标与其他指标之间的共线性强弱来确定指标权重的，**若指标之间的共线性关系越强**，越容易由其他指标的线性组合表示，重复信息越多，因此**该指标的权重也就应该越小**。

输入输出描述

输入：至少两项或以上的定量变量。
输出：输入定量变量对应的权重值。

变异系数法【打分系统赋权】

详细解释

根据各评价指标当前值与目标值的变异程度来对各指标进行赋权，**当各指标现有值与目标值差距较大时，说明该指标较难实现目标值，应该赋予较大的权重，反之则应该赋予较小的权重**，其原理较为简单，通常用于专家评价打分的差异分析。

输入输出描述

输入：至少两项或以上的定量变量。
输出：输入定量变量对应的权重值。

灰色关联分析【单一目标指标的情况用】【常考】

详细解释

灰色关联分析是指对一个系统发展变化态势的定量描述和比较的方法，其基本思想是**通过确定参考数据列和若干个比较数据列的几何形状相似程度来判断其联系是否紧密，它反映了曲线间的关联程度**。  
![greyRelationalAnalysis_1.86cf5118.png](https://img-blog.csdnimg.cn/img_convert/4db2967ffd5835e9b4b2dca01de92466.png)
 示例：
 分析近10年内，影院数量，观影人数，上 
 座率，票价、电影上线数量等因素对全年 
 电影票房的影响。其中电影票房是母序 
 列，影院数量，观影人数，上座率，票 
 价、电影上线数量等因素是特征序列。

输入输出描述

输入：特征序列为至少两项或以上的定量变量，母序列（关联对象）为1项定量变量。
输出：反应考核指标与母序列的关联程度。

应用举例：寻求各项指标与年龄（母序列）的关系

关联度结果
评价项	关联度	排名
身高cm	0.844	1
体重kg	0.839	2
心率	0.799	3
夜宵情况	0.783	4
逛街情况	0.759	5
玩电脑游戏情况	0.748	6
日常锻炼情况	0.74	7
吃零食情况	0.697	8

多准则妥协解排序法（VIKOR模型，用于对评价对象排序，类似于TOPSIS法）

详细解释

VIKOR模型是一种**对评价对象进行排序**的方法。基本过程为**首先计算评价对象总的最优解和最差解**，然后比较各评价对象与最优解和最差解之间的距离大小来确定评价对象的排序，进而获得待评价对象的优劣级别。 
![vikor.8a2097cd.png](https://img-blog.csdnimg.cn/img_convert/0f8fe72acb237fe475b22fb38adfcfc0.png)

输入输出描述

输入：至少两项或以上的定量变量。
输出：反应考核指标在量化评价中的综合得分。

解释结构模型（SIM）

详细解释

解释结构模型(ISM)是一种系统分析方法，用于得到**要素之间的复杂相互关系和层次**。其思想是先通过调查或者技术手段找出问题的组成要素或影响因素，然后通过矩阵模型分析各要素之间的联系，得到一个多级递阶结构模型。

输入输出描述

输入：要素之间浅显的相互关系。
输出：要素之间复杂的相互关系和层次。

差异性分析自动求解器【工具】

详细解释

系统将根据拖入的变量提示可用的差异性分析方法。

输入输出描述

输入：若干定类变量和定量变量。
输出：模型检验的结果。

差异性分析——参数检验

单样本T检验【正态性检验】

详细解释

单样本T检验用于比较样本数据与一个特定数值之间的差异情况，同时要求数据呈现正态性分布。

输入输出描述

输入：设定的检验值，如上示例的100，以及还有一个定量变量数据，如上示例的50瓶食品的重量。
输出：该定量变量数据是否与该特定数值分布呈现一致性。

配对样本T检验

详细解释

用于比较配对的连续变量X1与连续变量X2之间的差异情况，同时**要求配对变量差值呈现正态性分布**。  
![paired_sample_t_test_1.4483bbc2.png](https://img-blog.csdnimg.cn/img_convert/a59a9896fab23c385150ce4f899c4a61.png) 
示例：
 检验某医院30个病人注射某药剂前后血压是否一致。

输入输出描述

输入：样本数相同，且差值呈现正态分布的两个定量变量。
输出：这两个定量变量是否存在差异性。

独立样本T检验【分析一个二分类变量与定量变量之间有无明显差异】

详细解释

独立样本T检验用于分析**一个定类变量与一个或者多个定量变量之间有无明显差异**，需要特别注意的是，该定类变量为二分类变量（三分类及以上使用方差分析），各分类频数可以不相等。

输入输出描述

输入：一个定类变量X（如学校字段，包括甲学校、乙学校）与定量字段Y（如甲40名学生与乙学校60名学生的高考数学成绩）。
输出：模型检验的结果，如甲学校与乙学校的学生高考数学成绩存在/不存在显著性差异。

单因素方差分析（F检验）

详细解释

方差分析（单因素方差分析或F检验）用于**定类字段（X）与1个或1个以上的定量字段（Y）之间的差异性研究**。需要注意的是，一个定类字段称为单因素方差分析，两个定类字段及以上称为多因素方差分析，与独立样本T检验不同的是，方差分析可用于多分类定类字段数据的差异性分析，T检验只能作用于二分类定类变量。  
![varianceAnalysis_1.db7882be.png](https://img-blog.csdnimg.cn/img_convert/5429f6640a3327d0c11ae927453d6ec5.png)
 示例：
 分析个人受教育程度（定类变量）是否给 
 个人的经济收入（定量变量）带来显著性 
 影响。

输入输出描述

输入：一个定类字段（如受教育程度）、一个或多个定量字段（如工资、家庭年收入）。
输出：模型检验的结果：同一因素不同分组（如：不同的受教育程度X）对定量变量（如：工资Y）产生/不产生显著性影响。

事后多重比较【基于方差分析】

详细解释

事后多重比较是指**方差分析后对各样本平均数间是否有显著差异的假设检验**的统称。方差分析只能判断各总体平均数间是否有差异，**多重比较可用来进一步确定哪两个平均数间有差异，哪两个平均数间没有差异**。  
![shihouduochongbijiao.325cd41e.png](https://img-blog.csdnimg.cn/img_convert/20c8e5b239f4984ac20a3394e4291afe.png)
 示例：
 已知个人受教育程度给个人的经济收入存在显著性影响，分析不同受教育程度的具体影响情况如何。

输入输出描述

输入：一个定类分组字段以及一个或以上的定量字段。
输出：在同一因素不同分组对定量变量存在显著性影响时的具体差异情况。

双因素方差分析【两个定类因素是否决定定量结果】

详细解释

双因素方差分析是一种统计分析方法，可以用来分析**两个因素的不同水平对最终结果是否有显著影响**。且分为两种，**一种是无交互作用的双因素方差分析**，它假定因素A和因素B的效应之间是相互独立的。另一种是**有交互作用的双因素方差分析**，它假定因素A和因素B的结合会产生出一种新的效应。  
![shuangyinsufangchafenxi.cb4cd80c.png](https://img-blog.csdnimg.cn/img_convert/30c74ae6200abd447106949487188714.png)
 示例：
 某研究机构分析主流品牌的智能手机 
 在四个地区销售的销售情况，分析手 
 机销售量是否由于品牌的不同和地区 
 的不同而存在差异。

输入输出描述

输入：两个分组定类字段和一个待分析定量字段，以及可选的协变量。
输出：两个因素的对结果是否显著影响，以及两因素之间的交互效应。

三因素方差分析【三个定类因素，一个定量结果】

详细解释

用来**分析三个因素的不同水平对最终结果是否有显著影响**。且分为两种，一种是无交互作用的三因素方差分析，它假定三个因素之间是相互独立的。另一种是有交互作用的三因素方差分析，它假定因素因素两两之间或三个因素之间会产生出一种新的效应。

输入输出描述

输入：三个分组定类字段和一个待分析定量字段，以及可选的协变量。
输出：三个因素的对结果是否显著影响，因素之间的交互效应。

多因素方差分析

输入：多个分组定类字段和一个待分析定量字段。
输出：多个因素的对结果是否显著影响。

摘要单因素方差分析【单因素方差分析缺少原始数据时用】

详细解释

一般进行**单因素方差分析**需要原始数据进行分析，但**有时没有原始数据，如数据缺失或者验证论文时。此时只有样本量，平均值，标准差这样的汇总数据**，可以使用摘要单因素方差分析检验差异是否显著。  
![zhaiyaodanyinsufangchafenxi.942198ea.png](https://img-blog.csdnimg.cn/img_convert/d7f6edc1296a036e498ebff2f0377b27.png)
 示例：
 验证三组病人的血糖是否存在差异性，但是数据缺失，只有汇总数据。一组病人（34人）的饭后血糖均值为4.63，标准差为0.8。一组(40人)的饭后血糖均值为 4.89，标准差为0.62。一组（36人），均值为4.78，标准差为 0.53。使用摘要单因素方差分析检验差异是否显著。

输入输出描述

输入：摘要数据(样本量、均值、标准差)以及对应的置信度级别。
输出：单因素方差分析的结果。

摘要T检验【T检验缺少原始数据时用】

详细解释

一般进行T检验需要原始数据进行分析，但有时没有原始数据，如数据缺失或者验证论文时。此时只有样本量，平均值，标准差这样的汇总数据，可以使用摘要数据T检验分析差异是否显著。

输入输出描述

输入：摘要数据(样本量、均值、标准差)以及对应的置信度级别。
输出：单样本T检验或者独立样本T检验的结果。

差异性分析——非参数检验

卡方检验【定类-定类之间的差异性分析】

详细解释

卡方检验主要是比较定类变量与定类变量之间的差异性分析。通过统计样本的实际观测值与理论推断值之间的偏离程度，实际观测值与理论推断值之间的偏离程度就决定卡方值的大小，如果卡方值越大，二者偏差程度越大；反之，二者偏差越小；若两个值完全相等时，卡方值就为0，表明理论值完全符合。

示例：
如从某高中学随机抽取两个以上的班级，
调查他们对待文理分科的态度是否有显著
差异。

输入输出描述

输入：一个定类变量X（如学校字段，包括甲学校、乙学校）与定类字段Y（如甲学校40名学生与乙学校60名学生的体育成绩等级）。
输出：模型检验的结果，如甲学校与乙学校的学生体育成绩等级存在/不存在显著性差异。

单样本Wilcoxon符号秩检验【非正态数据的“T检验”】

详细解释

单样本Wilcoxon符号秩检验用于比较样本数据中位数与一个特定数值之间的差异情况，与单样本T检验不同的是，它不需要数据呈现正态性分布。

输入输出描述

配对样本Wilcoxon符号秩检验【样本差值不呈现正态分布的配对T检验】

详细解释

配对样本Wilcoxon符号秩检验用于比较配对的连续变量X1与连续变量X2之间的差异情况，同时配对变量差值不呈现正态性分布。

输入输出描述

输入：样本数相同，且差值不呈现正态分布的两个定量变量。
输出：这两个定量变量是否存在差异性。

独立样本MannWhitney检验【非正态的独立样本T检验】

详细解释

MannWhitney检验用于分析**一个定类变量与一个或者多个定量变量之间有无明显差异**，与独立样本T检验不同的是，**MannWhitney检验不需要数据呈现正态分布**，需要特别注意的是，以上说到的**定类变量为二分类变量**（三分类及以上使用Kruskal-Wallis检验），各分类频数可以不相等。

输入输出描述

多配对样本Friedman检验【变量不符合正态分布时，替代方差分析】

详细解释

Friedman检验用于分析多组样本数一致的定量变量之间有无明显差异，需要特别注意的是，这些定量变量适用于非正态分布，如果变量数据呈现正态分布，建议选择方差分析。

示例：
检验某医院300个病人注射某药剂第一、二、三、四周的血压是否一致。

输入输出描述

输入：样本数相同，且不呈现正态分布的3个或者3个以上定量变量
输出：这些定量变量整体是否存在差异性，哪些变量两两之间存在差异，以及他们的差异程度怎样。

多独立样本Kruskal-Wallis检验【K-W检验】

详细解释

多独立样本Kruskal-Wallis检验用于定类字段（X）与1个或1个以上的定量字段（Y，不需要正态分布）之间的差异性研究。需要注意的是，Kruskal-Wallis检验可用于多分类定类字段数据的差异性分析，MannWhitney U检验只能作用于二分类定类变量。

输入输出描述

输入：一个定类字段（如受教育程度）、一个或多个定量字段（如工资、家庭年收入）。
输出：模型检验的结果：同一因素不同分组（如：不同的受教育程度X）对定量变量（如：工资Y）产生/不产生显著性影响。

卡方拟合优度检验

详细解释

卡方拟合优度检验是基于卡方统计量用于判断期望频数与观察频数是否有显著差异。

输入输出描述

输入：各分组项的期望比例。
输出：判断收集的数据分布与预期是否呈显著性差异。

预测模型【重点】

线性回归（最小二乘法）

输入输出描述

输入：自变量X至少一项或以上的定量变量，因变量Y要求为定量变量（若为定类变量，请使用逻辑回归）。
输出：模型检验优度的结果，自变量对因变量的线性关系等等。

岭回归（Ridge)

详细解释

岭回归(Ridge)是一种针对小样本数据，处理自变量多重共线性问题（一般VIF值大于10）的一种有偏估计回归方法。岭回归通过引入一个正数改进正规方程组，提供一种有偏估计的方法消除共线影响。当K=0时，即为最小二乘估计，由于岭回归为有偏估计，K的取值应尽可能小。岭回归放弃了普通最小二乘法的无偏估计，损失了部分信息，因此岭回归方程的R²通常会稍低于普通最小二乘回归，但其估计的偏回归系数往往更接近真实的情况，从而提高了模型的稳定性和可靠性，对于病态数据的修复和拟合，具有较好的效果。

示例：
通过自变量（房子年龄、是否有电梯、楼
层高度、房间平方、房子单价）拟合预测
因变量（房价），现在发现房子单价与楼
层高度之间有着很强的共线性，VIF值高
于20；不能使用常见的最小二乘法OLS回
归分析，需要使用岭回归模型。

输入输出描述

输入：自变量X至少一项或以上的定量变量，因变量Y要求为定量变量（若为定类变量，请使用逻辑回归）。
输出：模型检验优度的结果，自变量对因变量的线性关系等等。

分层回归【检验某个变量是否是不可或缺的】

详细描述

分层回归（层次回归）本质上是建立在回归分析基础上，区别在于分层回归可分为多层，用于研究两个或者多个回归模型之间的差异。分层回归将核心研究的变量放在最后一步进入模型，以考察在排除了其他变量的贡献的情况下，该变量对回归方程的贡献。如果变量仍然有明显的贡献，那么就可以做出该变量确实具有其他变量所不能替代的独特作用的结论。这种方法主要用于，当自变量之间有较高的相关，其中一个自变量的独特贡献难以确定的情况。例如，在研究学习疲倦感中，将性别、年龄、学历等（控制变量）放置在第一层，第二层放置工作压力（核心研究变量）。常用于中介作用或者调节作用研究。
示例：

某高校随机抽取600名大学生，调查其身高、体重、
胸围、体育成绩和肺呼量（Y）数据，控制身高、体
重、体育成绩，分析胸围对肺呼量的影响程度。

输入输出描述

输入：多层次的线性回归数据。
输出：上一个层次与下一个层次的拟合变化情况，用于分析多加入的变量对自变量（Y）的影响程度。

灰色预测模型GM（1,1）【重点/含不确定因素的系统】

详细解释

灰色预测是一种对含有不确定因素的系统进行预测的方法。灰色预测通过鉴别系统因素之间发展趋势的相异程度，即进行关联分析，并对原始数据进行生成处理来寻找系统变动的规律，生成有较强规律性的数据序列，然后建立相应的微分方程模型，从而预测事物未来发展趋势的状况。
示例：

基于2000-2021年某产品的年销售
量，使用灰色预测模型对未来年销售
量进行预测。

输入输出描述

输入：１个时间序列定量变量。
输出：灰色预测的拟合预测结果。

聚类分析K-means【重点/常用】

详细解释

聚类分析是一种基于中心的聚类算法（K均值聚类），通过迭代，将样本分到K个类中，使得每个样本与其所属类的中心或均值的距离之和最小。与分层聚类等按照字段进行聚类的算法不同的是，快速聚类分析是按照样本进行聚类。
示例：

根据调研用户的收入、年龄、学历等变量
进行聚类，分为高质量人类，精英人士与
普通人3个类别。

输入输出描述

输入：1个或一个以上的定类变量（独热编码非必选）或者定量变量，预先设定类别个数。
输出：根据预先设定的类别个数，划分为其设定的类别。

逻辑回归【多定量自变量是否决定某个定类因变量】

详细解释

逻辑回归是研究二分类因变量与一些影响因素之间关系的一种多变量分析方法。但如果因变量是多个类别的，则要用到多分类逻辑回归去研究因变量与一些影响因素之间的关系。

输入输出描述

输入：因变量Y为分类变量，自变量X为至少一项定量变量。
输出：逻辑回归系数估计以及分类预测的效果评价。

Lasso回归【一般用于处理自变量多重共线性问题】

详细解释

Lasso方法是一种替代最小二乘法的压缩估计方法。Lasso的基本思想是建立一个L1正则化模型，在模型建立过程中会压缩一些系数和设定一些系数为零，当模型训练完成后，这些权值等于0的参数就可以舍去，从而使模型更为简单，并且有效防止模型过拟合。被广泛用于存在多重共线性数据的拟合和变量选择。
示例：

现对一批糖尿病患者进行分析，
分别获得了年龄、性别、体重指
数、平均⾎压等数据，现使用
Lasso回归分析⼀年后疾病进展
的测量值和重要影响变量。

输入输出描述

输入：自变量X至少一项或以上的定量变量或二分类定类变量，因变量Y要求为定量变量（若为定类变量，请使用逻辑回归）。
输出：模型检验优度的结果，自变量对因变量的线性关系和变量筛选结果等。

分层聚类【生成树状图关系时用】

详细解释

分层聚类法是一种常见的聚类算法。其基本思想是:先将待聚类的元素各自看成一类。然后,选择距离最小的两个类合并成一个新类,并计算出所得新类和其它各类的距离;接着再将距离最近的两类合并,直至将所有的样本都合并成一类为止。这种连续合并的过程可用树状图来表示,从而给出最终的聚类情况。
示例：

根据16个地区的每人平均生活消费支
出情况的六个指标，对这16个地区进
行分层聚类分析。

输入输出描述

输入：一个以上的定量变量和可选的索引项。
输出：个体或者变量被划分的类别和树状图（谱系图）。

有序逻辑回归【适用于因变量为等级或者程度差别的有序变量】

详细解释

有序逻辑回归适用于因变量为等级或者程度差别的有序变量，如因变量满意度分为不满意记为1，满意记为2，非常满意记为3。目的是为了研究有序分类因变量与一些影响因素之间的关系。

输入输出描述

输入：因变量Y为有序分类变量，自变量X至为少一项或以上的定量变量。
输出：有序逻辑回归系数估计以及分类预测的效果评价。

偏最小二乘回归（PLSR）【用一组变量去预测另一组变量】

详细解释

偏最小二乘回归(PLSR)是一种多对多线性回归建模的方法，用一组变量去预测另一组变量，常用于当两组变量（列）数很多，且都存在多重相关性，而观测数据的样本量（行）又较少时的情况。其原理是整合了主成分分析，典型相关分析和线性回归三种方法，在分析结果中，不仅可以提供一个的回归模型，也附带一些主成分分析和典型相关分析的内容。
示例：

分析健身俱乐部的20位中年男子的体能数据。第一组是身体特征指标X，包括：体重、腰围、脉搏。第二组变量是训练结果指标Y，包括：单杠、弯曲、跳高。粗略分析发现数据量少且相关性较高，故使用偏最小二乘回归(PLSR)进行分析。

输入输出描述

输入：自变量Y至少一项或以上的定量变量，因变量X要求为至少两项或以上的定量变量。
输出：主成分分析和回归分析的结果等。

二分类概率单位回归（Probit）【二分类概率单位回归(Probit)以及分类预测的效果评价】

详细解释

概率单位回归(Probit)是一种与逻辑回归类似的定性回归模型，逻辑回归的系数约为概率单位回归的1.6倍。这是因为逻辑回归的连接函数为Logit累计概率函数，而概率单位回归(Probit)的连接函数为正态分布的累计概率函数，如果在概率单位回归过程选择Logit变换，即可得到逻辑回归模型。
示例：

某公司需要调查员工流失的原
因，收集了约200名员工的工
作数据（员工满意度/月均工
作时长/薪资水平等），试分
析员工离职的原因并进行预测。

输入输出描述

输入：因变量Y为二分类定类变量，自变量X至为少一项或以上的定量变量。
输出：二分类概率单位回归(Probit)以及分类预测的效果评价。

Deming’s回归【自变量X可存在明显误差时替代最小二乘法】

详细解释

Deming’s 回归类似于普通最小二乘法的回归模型（OLS）。OLS法的前提条件较为严格，其认为自变量X应无明显误差，而Deming’s回归则无此前提，在系数估计上同时考虑了自变量X和因变量Y的残差波动。实际应用中，主要用于对方法的比较研究，也用作自变量和因变量均为随机数据的拟合和预测。

输入输出描述

输入：因变量Y、自变量X各为一个定量变量。
输出：Deming’s回归的方程以及部分检验结果。

统计建模

主成分分析（PCA）【用原始变量求出线性组合的目标函数】【重点】

详细解释

主成分分析将多个有一定相关性的指标进行线性组合，以最少的维度解释原数据中尽可能多的信息为目标进行降维，降维后的各变量间彼此线性无关，最终确定的新变量是原始变量的线性组合，且越往后主成分在方差中的比重也小，综合原信息的能力越弱，与因子分析不同的是，因子分析是利用少数几个公共因子去解释较多个要观测变量中存在的关系，它不是对原始变量的重新组合。

输入输出描述

典型相关分析

详细解释

典型相关分析是研究多个变量和多个变量之间的线性相关关系，能够揭示出两组变量之间的内在联系。首先在每组变量中找到变量的线性组合，使得两组的线性组合之间具有最大的相关系数。然后选取和最初挑选的这对线性组合不相关的线性组合，使其配对，并选取相关系数最大的那一组。如此继续配对，直到两组变量之间的相关性被提取完。
示例：

研究200名大学生四个学术得分变量
与三个心理得分变量之间的关系。

输入输出描述

输入：集合Y为至少两项或以上的定量变量或有序定类变量，集合Y为至少两项或以上的定量变量或有序定类变量。
输出：成对典型变量的相关性，以及典型变量对研究变量的解释比例。

泊松分布检验【检验某种事件是否发生概率很低，但一定会发生，且很稳定】

详细解释

泊松分布描述的是一个小概率事件在单位时间内发生的次数，如每个小时进入银行办理业务的人数、报纸上每一页的错别字数量、某个网页的点击量等，简单地说，就是泊松检验的是某种事件是否发生概率很低，且很稳定，同时发生频数的大小之间没有影响关系，例如在一定时间内产品产生的用户需求数，上周发生的用户提的需求数跟这周的没关系。

输入输出描述

输入：一个定量变量。
输出：是否呈现泊松分布。

游程检验【检验一件事情发生的概率是否为随机的】

逐步回归【在回归分析的基础上，通过剔除不太重要的变量来进行变量的筛选】

线性判别（LDA）【常用于数据降维，可在数据处理的降维部分使用】

详细解释

线性判别的原理是将样本投影到一条直线上，使得同类样本的投影点尽可能接近，不同样本的投影点尽可能远离；在对新样本进行分类时，将其投影到同样的直线上，再根据投影点的位置来确定新样本的类别。其中线性判别(LDA)也常用于数据降维，可在数据处理的降维部分使用。
示例：

根据红酒的颜色强度，脯氨酸，
类黄酮等变量，生成一个能够区
分琴酒，雪莉，贝尔摩德三种品
种的红酒的线性判别模型。

输入输出描述

输入：自变量X为1个或1个以上的定量变量，因变量Y为一个定类变量。
输出：模型的分类结果和模型分类的评价效果。

极差分析【通过比较极差大小来分析数据的方法，主要用于正交试验的数据分析】

拟合工具箱【工具】

详细解释

拟合工具箱适用于对二维、三维数据的进行线性、非线性拟合。

输入输出描述

输入：因变量为一个定量变量；自变量为不超过2个的定量变量。
输出：拟合效果以及可视化拟合情况。

机器学习分类

决策树分类

详细解释

决策树中每个内部节点都是一个分裂问题：指定了对实例的某个属性的测试，它将到达该节点的样本按照某个特定的属性进行分割，并且该节点的每一个后继分支对应于该属性的一个可能值。分类决策树叶节点所含样本中，其输出变量的众数就是分类结果。
示例：

根据红酒的颜色强度，脯
氨酸，类黄酮等变量，生
成一个能够区分琴酒，雪
莉，贝尔摩德三种品种的
红酒的决策树。

输入输出描述

输入：自变量X为1个或1个以上的定量变量，因变量Y为一个定类变量。
输出：模型输出的决策树结构图及模型的分类效果。

随机森林分类【多棵决策树组合在一起的多数投票结果】

详细解释

随机森林分类在生成众多决策树的过程中，是通过对建模数据集的样本观测和特征变量分别进行随机抽样，每次抽样结果均为一棵树，且每棵树都会生成符合自身属性的规则和分类结果，而森林最终集成所有决策树的规则和分类结果，实现随机森林算法的分类。
示例：

根据红酒的颜色强度，脯
氨酸，类黄酮等变量，生
成一个能够区分琴酒，雪
莉，贝尔摩德三种品种的
红酒的随机森林。

输入输出描述

输入：自变量X为1个或1个以上的定量变量，因变量Y为一个定类变量。
输出：模型的分类结果和模型的分类评价情况。

K近邻分类(KNN)【判断新样本类别的一种有监督算法】

详细解释

K近邻(KNN)分类器是有监督学习中普遍使用的分类器之一，将观察值的分类判定为离它最近的k个观察值中所占比例最大的分类。
示例：

根据高质量人类，精英
人士与普通人3个类别的
收入、年龄训练一个
KNN分类器，用于对一
个新用户进行分类。

输入输出描述

输入：自变量X为1个或1个以上的定量变量，因变量Y为一个定类变量。
输出：模型的分类结果和模型分类的评价效果。

BP神经网络分类【MLP】

详细解释

bp神经网络是一种按误差逆传播算法训练的多层前馈网络，是目前应用最广泛的神经网络模型之一。bp神经网络的学习规则是使用最速下降法，通过反向传播来不断调整网络的权值和阈值，使网络的分类错误率最小。
示例：

有一批Iris花，已知这批Iris花可
分为3个品种，现需要对其进行
分类。根据花萼长度、花萼宽
度、花瓣长度、花瓣宽度的数
据。用已有的数据训练一个神
经网络用作分类器。

输入输出描述

输入：自变量X为1个或1个以上的定量变量，因变量Y为一个定类变量。
输出：模型的分类结果和模型分类的评价效果。

支持向量机（SVM）分类【有监督学习二分类】

详细解释

支持向量机(SVM)是一类按监督学习方式对数据进行二元分类的广义线性分类器，其决策边界是对学习样本求解的最大边距超平面。
示例：

根据2种产品的最低工作温
度和最长寿命(年)，生成一
个可以区分这两种产品的
支持向量机(SVM)分类器。

输入输出描述

输入：自变量X为1个或1个以上的定量变量，因变量Y为一个定类变量。
输出：模型的分类结果和模型分类的评价效果。

朴素贝叶斯分类【假设特征之间独立的条件下以贝叶斯为基础的简单概率分类器】

详细解释

朴素贝叶斯分类器（Naive Bayes classifier），在机器学习中是一系列以假设特征之间强（朴素）独立下运用贝叶斯定理为基础的简单概率分类器。
示例：

根据一封邮件的内容，
用一个朴素贝叶斯分类
器，计算这封邮件是否
属于垃圾邮件。

输入输出描述

输入：自变量X为1个或1个以上的定量变量，因变量Y为一个定类变量。
输出：模型的分类结果和模型分类的评价效果。

逻辑回归（梯度下降法）【多分类非决策问题，BP神经网络不会用时考虑】

详细解释

逻辑回归，是一种名为“回归”的线性分类器，其本质是由线性回归变化而来的，一种广泛使用于分类问题中的广义回归算法。
示例：

以肺炎病情分析为例，选择两组人群，
一组是肺炎组，一组是非肺炎组，两组
人群必定有不同的体征与生活方式（自
变量），比如年龄、性别、饮食习惯、
是否吸烟等，因变量就是是否得肺炎，
值为”是“或”否“。

输入输出描述

输入：自变量X为1个或1个以上的定量变量，因变量Y为一个定类变量。
输出：模型的分类结果和模型分类的评价效果。

机器学习回归【可以和预测模型中的算法对比，取更优者,原理基于机器学习分类中的基础算法】

规划自动求解器【工具】【重点】

系统将根据输入的目标函数，约束条件和未知数取值范围自动判断其规划类型然后提示可用的求解方法。

最优解问题——线性规划

内点法

单纯形法

修正单纯形法

最优解问题——非线性规划

下山单纯形法

改进BFGS拟牛顿法

改进共轭方向法

（边界）截断牛顿法

线性近似束优化法

序贯最小二乘规划算法

信赖域算法

整数规划

分支定界法

0-1规划

枚举法

启发式算法【重点】

遗传算法（GA）【重点】

详细解释

模拟物竞天择的生物进化过程，通过维护一个潜在解的群体执行了多方向的搜索，并支持这些方向上的信息构成和交换。
示例：
通过遗传算法对非线性规划问题进行求解。

输入输出描述

输入：目标函数，约束条件和未知数。
输出：规划求解结果，以及规划求解方程导出。

粒子群算法（PSO）

详细解释

将每个解看作搜索空间中的一个粒子。每个粒子都有一定的速度，其大小根据自身历史经验和种群经验进行动态调整，通过不断地迭代飞行来寻找空间中最优解的位置。

输入输出描述

输入：目标函数，约束条件和未知数。
输出：规划求解结果，以及规划求解方程导出。

模拟退火算法（SA）【重点】【寻找全局最优解】

详细解释

其出发点是基于物理中固体物质的退火过程与一般组合优化问题之间的相似性。从某一较高初温出发，伴随温度参数的不断下降,结合概率突跳特性在解空间中随机寻找目标函数的全局最优解。

输入输出描述

输入：目标函数，约束条件和未知数。
输出：规划求解结果，以及规划求解方程导出。

蒙特卡洛算法【不建议】

详细解释

是一种使用随机数来解决规划问题的方法，其精确度很大程度取决于实验次数。

输入输出描述

输入：目标函数，约束条件和未知数。
输出：规划求解结果，以及规划求解方程导出。

你可能感兴趣的:(机器学习,数学建模,SPSS,数学建模,大数据,机器学习,人工智能,学习)

AIGC视觉生成革命：文生图、图生图与视频生成垂直模型发展全景报告（2025） Liudef06小白 AIGC 人工智能 AI作画语言模型
一、引言：从实验工具到产业引擎的跃迁人工智能生成内容（AIGC）技术正经历从文本向多模态的范式转移。2023-2025年间，文生图、图生图与视频生成垂直模型逐步跨越技术奇点，从实验室玩具进化为工业化生产力工具。这一进程的核心驱动力在于架构创新、数据优化与场景深耕的三重突破：扩散模型与Transformer的融合催生了更高保真度的图像生成；十亿级多模态数据训练解决了复杂语义理解难题；而面向影视、电商
【一起来学AI大模型】支持向量机（SVM）：核心算法深度解析运器123 AI大模型支持向量机机器学习人工智能 ai 大数据 AI编程算法
一、算法核心思想支持向量机（SVM）是一种强大的监督学习算法，核心思想是通过寻找最优超平面实现分类或回归：分类目标：找到能最大化两类数据间隔的超平面回归目标：找到包含最多数据点的ε带关键概念图解超平面：w·x+b=0/\/\+1|支持向量|-1|●●||●●||●●||_________________|最大间隔(margin)二、数学原理与优化问题1.线性可分情况目标函数：\min_{w,b}\
2022项目实训“异步分布式联邦学习”第五周报告
一、本周工作进度我在本周的工作进度主要集中于两个技术要点——即Axios和WebSocket。这两种技术方法有着本质上的不同，因而具体实现出来之后的效果也有所不同，下面将会分别说明。1.Axios（Ajax封装）首先要谈的内容是Axios，Axios是一个基于promise的HTTP库，是目前前端最流行的ajax请求库。Axios的优势在于，相比传统的Ajax本身是针对MVC的编程，Axios更加
Spring Boot分层架构详解：从Controller到Service再到Mapper的完整流程 Leaton Lee spring boot 架构后端 java
引言：为什么学习SpringBoot分层架构？在现代企业级应用开发中，分层架构是至关重要的。它不仅提高了代码的可维护性，还使得团队协作更加高效。SpringBoot作为Java后端开发的事实标准，其分层架构模式几乎贯穿了所有企业级应用的开发流程。本文将以一个实际案例（用户管理系统）为例，详细解析SpringBoot中Controller、POJO、Mapper、Service、ServiceImp
[论文阅读] 人工智能 | 读懂Meta-Fair：让LLM摆脱偏见的自动化测试新方法张较瘦_ 前沿技术论文阅读人工智能
读懂Meta-Fair：让LLM摆脱偏见的自动化测试新方法论文标题：Meta-Fair:AI-AssistedFairnessTestingofLargeLanguageModelsarXiv:2507.02533Meta-Fair:AI-AssistedFairnessTestingofLargeLanguageModelsMiguelRomero-Arjona,JoséA.Parejo,Jua
上位机李工架构之一 zhxup606 架构
本篇将围绕半导体可靠性测试机上位机开发，提供一个系统性教程与学习路线，结合C#高级编程（反射、接口、抽象类、泛型、设计模式、集合、特性、索引、委托事件、匿名方法、多线程、面向对象等）和异步/同步对比，深入讲解如何高效开发上位机系统。同时，基于前文的实时数据可视化（WPF、LiveCharts2、WebSocket）、AI异常检测（ML.NET隔离森林）和异步任务调度（DAG调度、PID控制），本篇
【ESP32最全学习笔记（基础篇）——7.ESP32 ADC – 使用 Arduino IDE 读取模拟值】「已注销」 ESP32学习笔记学习 ESP32 单片机嵌入式硬件 Arduino
关于本教程：ESP32基础篇1.ESP32简介2.ESP32Arduino集成开发环境3.VS代码和PlatformIO4.ESP32引脚5.ESP32输入输出6.ESP32脉宽调制7.ESP32模拟输入☑8.ESP32中断定时器9.ESP32深度睡眠
深度 |AI高质量数据集交易爆发式增长数智前沿数字化转型人工智能数据集
AI产业从通用模型向行业垂直应用快速融合下沉的阶段演进，人工智能三大基本要素之一数据，面临的高质量数据不足问题却凸显。财联社记者最新从业内获悉，目前各大模型企业迫切希望获得更多更好的高质量数据集，需求集中于头部企业行业知识底座构建，人工智能高质量数据集的需求量、交易量激增，已成为数据流通最活跃的领域。不过，高质量数据集的建设、流通环节均面临诸多问题，目前数据交易所并非模型语料最主要的采购途径。需求
轻量化分布式AGI架构：基于区块链构建终端神经元节点的互联网智脑探客木木夕分布式 agi 人工智能架构区块链
在2025年的技术发展背景下，轻量化分布式AGI架构正成为人工智能领域的重要突破方向。通过将终端设备转化为神经元节点，结合区块链技术构建去中心化的互联网智脑，不仅能够突破传统AGI开发的算力瓶颈，还能实现数据安全共享与价值分配。**这一架构将重塑人工智能的发展范式，使AGI能力从中心化实验室扩散至全球终端设备网络，最终形成一个去中心化、自演进、高可用的互联网级智能系统**。研究显示，通过知识密度提
VTK着色器MarbleShader代码学习(4) 点PY 三维渲染着色器学习
代码链接https://examples.vtk.org/site/Cxx/Shaders/MarbleShader/这段代码是一个使用VTK（VisualizationToolkit）实现的复杂着色器渲染示例，主要用于在3D模型上模拟大理石纹理效果。下面是对代码的详细解析：1.核心功能程序实现了一个基于Perlin噪声的大理石纹理着色器，主要特点包括：动态静脉纹理生成多级噪声叠加几何扭曲效果参数
写测试太烦？Copilot + Jest 让你 3 分钟搞定单元测试
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
60天python训练营打卡day46
学习目标：60天python训练营打卡学习内容：DAY46通道注意力(SE注意力)知识点回顾：1.不同CNN层的特征图：不同通道的特征图2.什么是注意力：注意力家族，类似于动物园，都是不同的模块，好不好试了才知道。3.通道注意力：模型的定义和插入的位置4.通道注意力后的特征图和热力图学习时间：2025.06.29@浙大疏锦行
Python 训练营打卡 Day 46 2401_86382089 Python打卡 python
通道注意力一、什么是注意力注意力机制是一种让模型学会「选择性关注重要信息」的特征提取器，就像人类视觉会自动忽略背景，聚焦于图片中的主体（如猫、汽车）。transformer中的叫做自注意力机制，他是一种自己学习自己的机制，他可以自动学习到图片中的主体，并忽略背景。我们现在说的很多模块，比如通道注意力、空间注意力、通道注意力等等，都是基于自注意力机制的。从数学角度看，注意力机制是对输入特征进行加权求
如何在YashanDB中实现多级缓存策略数据库
随着大数据时代的到来，数据存储和访问的效率要求越来越高。数据库技术在面对海量数据、高并发访问时，性能瓶颈逐渐凸显，尤其是响应时间和系统吞吐量成为开发者和DBA关注的重点。为了解决这些问题，缓存策略被引入作为一种有效的解决方案。然而，不同类型的缓存（如内存缓存、磁盘缓存等）之间需要协调工作，以达到最佳性能。在此背景下，YashanDB作为一个云原生数据库，支持多级缓存策略，为数据访问提供了灵活的加速
Java2025最新学习路线（从入门到精通）亭亦青学习 java spring boot
注：这份学习路线结合了2025年春招Java开发岗位要求和2024年Java就业市场需求，要求较高，并且省略了大多数基础部分，如果目标不是中大厂，可以适当放低学习的要求，但是请完成云原生之前的所有内容，并且经常性进行项目实践，切实提升编程能力。Java学习路线一键预览版：JavaSE-Mysql-JavaWeb(htmlcssjsjqUI组件框架-bootstrapelementUIVUE)-My
Kubernetes：容器编排技术从入门到精通 IYA1738
本文还有配套的精品资源，点击获取简介：Kubernetes（K8s）是一个开源的容器编排系统，由CNCF维护，用于自动化容器化应用的部署、扩展和管理。本资料将深入探讨K8s的核心组件、架构以及如何优化Java应用的部署和运行。学习K8s将涵盖Master节点和Worker节点的功能、Pod管理、服务抽象、存储管理、资源组织、Java应用优化以及高级特性等内容。通过实践操作，加深对K8s的理解，提升
基于迁移学习的多视图卷积神经网络在乳腺超声自动分类中的应用 despacito, 论文精读-乳腺超声分类
BREASTCANCERCLASSIFICATIONINAUTOMATEDBREASTULTRASOUNDUSINGMULTIVIEWCONVOLUTIONALNEURALNETWORKWITHTRANSFERLEARNINGYIWANG,*,1EUNJUNGCHOI,y,1YOUNHEECHOI,*HAOZHANG,*GONGYONGJIN,yandSEOK-BUMKO*TAGGEDEND*De
Vue 3 - JavaScript细节大揭秘碧海蓝天· vue.js javascript 前端 JavaScript
在学习Vue3的过程中，我们可能会发现一些令人惊讶的JavaScript细节，这些细节可能之前我们并不知道。本文将探讨一些Vue3中的JavaScript细节，并提供相应的源代码示例。CompositionAPIVue3引入了CompositionAPI，它是一种新的API风格，可以让我们更灵活地组织我们的代码。在Vue2中，我们使用OptionsAPI来定义组件，而在Vue3中，我们可以选择使用
Python训练营打卡 Day50
预训练模型+CBAM模块知识点回顾：resnet结构解析CBAM放置位置的思考针对预训练模型的训练策略差异化学习率三阶段微调预训练模型+CBAM模块知识点回顾ResNet结构解析残差块：ResNet的核心是残差块，它通过残差连接解决了深层网络的梯度消失问题。残差块允许梯度直接传播到后面的层，从而使得网络能够训练得更深。网络结构：ResNet由多个残差块组成，每个残差块包含两个或三个卷积层，以及一个
Python编程电子书：从基础到实践王奥雷
本文还有配套的精品资源，点击获取简介：Python电子书汇集了基础语法、面向对象编程、标准及第三方库使用、文件操作、网络编程、并发编程、单元测试与调试、Python2与Python3的区别等核心知识点。通过实例和项目案例，帮助读者在Web开发、数据分析、人工智能等应用领域提升编程技能，跟上Python的技术进步。1.Python基础语法介绍Python作为一种高级编程语言，其易读性和简洁的语法使其
Axure常用交互功能案例-免费 AxureMost axure 模板-素材 axure 交互 photoshop
以下是一些Axure常用功能的案例：包含了几百个组件案例可供学习。链接地址：交互样式案例按钮的悬停和按下效果：将一个矩形元件设为按钮，在“交互”板块中为其添加“鼠标悬停”样式，如改变按钮颜色或添加阴影，让用户知道鼠标在按钮上方。还可添加“鼠标按下”样式，如使按钮稍微缩小，模拟真实的按钮按下效果，增强交互体验。文本框的状态样式：对于文本框元件，除了Axure默认的“提示”和“禁用”样式，还可添加“鼠
驱动程序与源代码解析 AR新视野
本文还有配套的精品资源，点击获取简介：驱动程序和源代码是软件开发的核心，它们负责操作系统与硬件设备之间的通信，并构成软件的可执行基础。本主题涵盖驱动程序的分类、特定类型的驱动（如字符设备和网络驱动）、性能优化技术、内核源代码剖析、开源驱动的特点与贡献、驱动程序开发流程、安装与更新方法以及调试技术。同时，提供了学习资源，如代码示例和教程文档，以加深对驱动程序和源代码开发的理解。1.驱动程序分类与作用
从技术支持到UX设计大师：Adam Schilling的成长之路 AR新视野用户体验设计职业转型持续学习视觉传达技术支持
背景简介本篇博文基于AdamSchilling的访谈记录，他是一位从技术支持成功转型为用户体验（UX）设计师的专业人士。通过Adam的故事，我们将探讨如何在技术领域内发展设计思维，并成功转型为UX设计师。AdamSchilling的设计之路早期学习与兴趣培养Adam的旅程始于南澳大利亚大学的视觉传达课程，虽然没有完成，但他从中学习到了平面设计原则和插画技能。在闲暇时间，他为朋友免费进行网页设计和开
开源模型应用落地-OpenAI Agents SDK-集成MCP与Qwen3-8B模型的创新应用探索（七）开源技术探险家开源模型-实际应用落地开源 python ai 人工智能
一、前言在人工智能技术飞速发展的今天，如何将先进的模型和技术无缝结合，成为推动行业变革的关键。OpenAIAgents通过集成模型上下文协议（MCP）和阿里巴巴推出的Qwen3-8B模型，正开启一场智能应用的革命。这种创新的结合不仅提升了AI代理与外部工具之间的通信能力，还在多模态任务处理、个性化服务等领域展现出巨大潜力。本文将深入探讨这一技术组合的实际应用场景，揭示其在改善客户体验和提升运营效率
开源模型应用落地-OpenAI Agents SDK-集成Qwen3-8B-探索output_guardrail的创意应用（六）开源技术探险家开源模型-实际应用落地开源 python ai 人工智能
一、前言随着人工智能技术的迅猛发展，大语言模型（LLM）在各行各业的应用日益广泛。然而，模型生成的内容是否安全、合规、符合用户预期，成为开发者和企业不可忽视的问题。为此，OutputGuardrail应运而生，作为一种关键的安全机制，它在模型生成结果之后进行内容审核与过滤，确保输出不偏离道德、法律和业务规范。通过检测不当的内容，不仅提升了AI系统的可信度，也为构建更加稳健和负责任的人工智能应用提供
什么是深度学习框架中的计算图？杰瑞学AI Computer knowledge NLP/LLMs AI/AGI 深度学习人工智能 pytorch
在深度学习框架中，计算图是核心的数据结构和抽象概念，它用来表示和定义深度学习模型的计算过程。我们可以把它想象成一个描述数学运算如何组合和执行的有向图。以下是计算图的关键要素和作用：节点：代表操作或变量。操作：数学运算，如加法(+)、乘法(*)、矩阵乘法(matmul)、激活函数(ReLU,sigmoid)、卷积(conv2d)、损失函数(cross_entropy)等。变量：通常是张量，即存储数据
Activity各类控件学习小结：实现简单的用户界面 giaoho 安卓开发学习学习 ui windows
Activity各类控件学习小结：实现简单的用户界面目标：实现不同用户的图片的选择与显示对应图片的demo（1）默认添加10个照片文件到app中，p1到p10（2）主要控件和逻辑：一个ImageView，显示用户头像；一个下拉框，显示用户的姓名列表信息，默认两个用户，下拉选择后更新用户头像，并显示年龄和身高在头像下面；三个输入框，输入姓名、年龄，身高；一个添加按钮，点击添加按钮后，把新增的用户添加
Python日志模块
Python日志模块学习教程：b站王铭东老师Python中logging模块能够完成相关信息的记录，在debug时使用它事半功倍一、模块介绍日志级别DEBUG、INFO、WARNING、ERROR、CRITICAL默认是WARNING，当在WARNING或其之上时才被跟踪日志格式logging.basicConfig函数中，可以指定日志的输出格式format，这个参数可以输出很多有用的信息一般使用
【5.1.6 漫画JUC并发包】
漫画JUC并发包学习目标掌握JUC包核心工具类的原理和使用理解并发编程的底层机制掌握高频面试考察点能够在实际项目中正确使用并发工具故事开始小明:“老王，我在面试中总是被JUC包的问题难住，什么CountDownLatch、CyclicBarrier、Semaphore，听起来就头疼！”架构师老王:“哈哈，JUC包确实是Java并发编程的核心，但别担心，我用漫画的方式给你讲解，保证你能轻松掌握！”小
Linux系统学习：文件、目录操作，简单语法橙小花 linux 学习
DAY2文件系统Linux本质上就是一个文件系统。Linux文件系统是操作系统组织、存取、保存数据的一种手段。整体采用层级式的倒状目录结构。倒状树结构中的目录/:根目录/bin：主要存放系统普通指令/boot：主要存放系统的引导程序/dev：存放硬件设备对应的文件（Linux应用开发阶段，访问其中的文件）/etc：存放系统和应用程序的配置文件（如：profile）/home：家目录，存放当前系统下
redis学习笔记——不仅仅是存取数据 Everyday都不同 returnSource expire/del incr/lpush 数据库分区 redis
最近项目中用到比较多redis，感觉之前对它一直局限于get/set数据的层面。其实作为一个强大的NoSql数据库产品，如果好好利用它，会带来很多意想不到的效果。（因为我搞java，所以就从jedis的角度来补充一点东西吧。PS：不一定全，只是个人理解，不喜勿喷） 1、关于JedisPool.returnSource(Jedis jeids) 这个方法是从red
SQL性能优化-持续更新中。。。。。。 atongyeye oracle sql
1 通过ROWID访问表--索引你可以采用基于ROWID的访问方式情况,提高访问表的效率, , ROWID包含了表中记录的物理位置信息..ORACLE采用索引(INDEX)实现了数据和存放数据的物理位置(ROWID)之间的联系. 通常索引提供了快速访问ROWID的方法,因此那些基于索引列的查询就可以得到性能上的提高. 2 共享SQL语句--相同的sql放入缓存 3 选择最有效率的表
[JAVA语言]JAVA虚拟机对底层硬件的操控还不完善 comsci JAVA虚拟机
如果我们用汇编语言编写一个直接读写CPU寄存器的代码段，然后利用这个代码段去控制被操作系统屏蔽的硬件资源，这对于JVM虚拟机显然是不合法的，对操作系统来讲，这样也是不合法的，但是如果是一个工程项目的确需要这样做，合同已经签了，我们又不能够这样做，怎么办呢？那么一个精通汇编语言的那种X客，是否在这个时候就会发生某种至关重要的作用呢？ &n
lvs- real 男人50 LVS
#!/bin/bash # # Script to start LVS DR real server. # description: LVS DR real server # #. /etc/rc.d/init.d/functions VIP=10.10.6.252 host='/bin/hostname' case "$1" in sta
生成公钥和私钥 oloz DSA 安全加密
package com.msserver.core.util; import java.security.KeyPair; import java.security.PrivateKey; import java.security.PublicKey; import java.security.SecureRandom; public class SecurityUtil {
UIView 中加入的cocos2d，背景透明 374016526 cocos2d glClearColor
要点是首先pixelFormat:kEAGLColorFormatRGBA8，必须有alpha层才能透明。然后view设置为透明glView.opaque = NO;[director setOpenGLView:glView];[self.viewController.view setBackgroundColor:[UIColor clearColor]];[self.viewControll
mysql常用命令香水浓 mysql
连接数据库 mysql -u troy -ptroy 备份表 mysqldump -u troy -ptroy mm_database mm_user_tbl > user.sql 恢复表（与恢复数据库命令相同） mysql -u troy -ptroy mm_database < user.sql 备份数据库 mysqldump -u troy -ptroy
我的架构经验系列文章 - 后端架构 - 系统层面 agevs JavaScript jquery css html5
系统层面：高可用性所谓高可用性也就是通过避免单独故障加上快速故障转移实现一旦某台物理服务器出现故障能实现故障快速恢复。一般来说，可以采用两种方式，如果可以做业务可以做负载均衡则通过负载均衡实现集群，然后针对每一台服务器进行监控，一旦发生故障则从集群中移除；如果业务只能有单点入口那么可以通过实现Standby机加上虚拟IP机制，实现Active机在出现故障之后虚拟IP转移到Standby的快速
利用ant进行远程tomcat部署 aijuans tomcat
在javaEE项目中，需要将工程部署到远程服务器上，如果部署的频率比较高，手动部署的方式就比较麻烦，可以利用Ant工具实现快捷的部署。这篇博文详细介绍了ant配置的步骤（http://www.cnblogs.com/GloriousOnion/archive/2012/12/18/2822817.html），但是在tomcat7以上不适用，需要修改配置，具体如下： 1.配置tomcat的用户角色
获取复利总收入 baalwolf 获取
public static void main(String args[]){ int money=200; int year=1; double rate=0.1; &
eclipse.ini解释 BigBird2012 eclipse
大多数java开发者使用的都是eclipse，今天感兴趣去eclipse官网搜了一下eclipse.ini的配置，供大家参考，我会把关键的部分给大家用中文解释一下。还是推荐有问题不会直接搜谷歌，看官方文档，这样我们会知道问题的真面目是什么，对问题也有一个全面清晰的认识。 Overview 1、Eclipse.ini的作用 Eclipse startup is controlled by th
AngularJS实现分页功能 bijian1013 JavaScript AngularJS 分页
对于大多数web应用来说显示项目列表是一种很常见的任务。通常情况下，我们的数据会比较多，无法很好地显示在单个页面中。在这种情况下，我们需要把数据以页的方式来展示，同时带有转到上一页和下一页的功能。既然在整个应用中这是一种很常见的需求，那么把这一功能抽象成一个通用的、可复用的分页（Paginator）服务是很有意义的。 &nbs
[Maven学习笔记三]Maven archetype bit1129 ArcheType
archetype的英文意思是原型，Maven archetype表示创建Maven模块的模版，比如创建web项目，创建Spring项目等等. mvn archetype提供了一种命令行交互式创建Maven项目或者模块的方式， mvn archetype 1.在LearnMaven-ch03目录下，执行命令mvn archetype:gener
【Java命令三】jps bit1129 Java命令
jps很简单，用于显示当前运行的Java进程，也可以连接到远程服务器去查看 [hadoop@hadoop bin]$ jps -help usage: jps [-help] jps [-q] [-mlvV] [<hostid>] Definitions: <hostid>: <hostname>[:
ZABBIX2.2 2.4 等各版本之间的兼容性 ronin47
zabbix更新很快，从2009年到现在已经更新多个版本，为了使用更多zabbix的新特性，随之而来的便是升级版本，zabbix版本兼容性是必须优先考虑的一点客户端AGENT兼容 zabbix1.x到zabbix2.x的所有agent都兼容zabbix server2.4：如果你升级zabbix server，客户端是可以不做任何改变，除非你想使用agent的一些新特性。 Zabbix代理（p
unity 3d还是cocos2dx哪个适合游戏？ brotherlamp unity自学 unity教程 unity视频 unity资料 unity
unity 3d还是cocos2dx哪个适合游戏？问：unity 3d还是cocos2dx哪个适合游戏？答：首先目前来看unity视频教程因为是3d引擎，目前对2d支持并不完善，unity 3d 目前做2d普遍两种思路，一种是正交相机，3d画面2d视角，另一种是通过一些插件，动态创建mesh来绘制图形单元目前用的较多的是2d toolkit，ex2d，smooth moves，sm2，
百度笔试题：一个已经排序好的很大的数组，现在给它划分成m段，每段长度不定，段长最长为k，然后段内打乱顺序，请设计一个算法对其进行重新排序 bylijinnan java 算法面试百度招聘
import java.util.Arrays; /** * 最早是在陈利人老师的微博看到这道题： * #面试题#An array with n elements which is K most sorted，就是每个element的初始位置和它最终的排序后的位置的距离不超过常数K * 设计一个排序算法。It should be faster than O(n*lgn)。
获取checkbox复选框的值 chiangfai checkbox
<title>CheckBox</title> <script type = "text/javascript"> doGetVal: function doGetVal() { //var fruitName = document.getElementById("apple").value;//根据
MySQLdb用户指南 chenchao051 mysqldb
原网页被墙，放这里备用。 MySQLdb User's Guide Contents Introduction Installation _mysql MySQL C API translation MySQL C API function mapping Some _mysql examples MySQLdb
HIVE 窗口及分析函数 daizj hive 窗口函数分析函数
窗口函数应用场景：（1）用于分区排序（2）动态Group By （3）Top N （4）累计计算（5）层次查询一、分析函数用于等级、百分点、n分片等。函数说明 RANK() &nbs
PHP ZipArchive 实现压缩解压Zip文件 dcj3sjt126com PHP zip
PHP ZipArchive 是PHP自带的扩展类，可以轻松实现ZIP文件的压缩和解压，使用前首先要确保PHP ZIP 扩展已经开启，具体开启方法就不说了，不同的平台开启PHP扩增的方法网上都有，如有疑问欢迎交流。这里整理一下常用的示例供参考。一、解压缩zip文件 01 02 03 04 05 06 07 08 09 10 11
精彩英语贺词 dcj3sjt126com 英语
I'm always here 我会一直在这里支持你 &nb
基于Java注解的Spring的IoC功能 e200702084 java spring bean IOC Office
java模拟post请求 geeksun java
一般API接收客户端（比如网页、APP或其他应用服务）的请求，但在测试时需要模拟来自外界的请求，经探索，使用HttpComponentshttpClient可模拟Post提交请求。此处用HttpComponents的httpclient来完成使命。 import org.apache.http.HttpEntity ; import org.apache.http.HttpRespon
Swift语法之 ---- ?和!区别 hongtoushizi ?swift !
转载自： http://blog.sina.com.cn/s/blog_71715bf80102ux3v.html Swift语言使用var定义变量，但和别的语言不同，Swift里不会自动给变量赋初始值，也就是说变量不会有默认值，所以要求使用变量之前必须要对其初始化。如果在使用变量之前不进行初始化就会报错： var stringValue : String //
centos7安装jdk1.7 jisonami jdk centos
安装JDK1.7 步骤1、解压tar包在当前目录 [root@localhost usr]#tar -xzvf jdk-7u75-linux-x64.tar.gz 步骤2：配置环境变量在etc/profile文件下添加 export JAVA_HOME=/usr/java/jdk1.7.0_75 export CLASSPATH=/usr/java/jdk1.7.0_75/lib
数据源架构模式之数据映射器 home198979 PHP 架构数据映射器 datamapper
前面分别介绍了数据源架构模式之表数据入口、数据源架构模式之行和数据入口数据源架构模式之活动记录，相较于这三种数据源架构模式，数据映射器显得更加“高大上”。一、概念数据映射器（Data Mapper）：在保持对象和数据库（以及映射器本身）彼此独立的情况下，在二者之间移动数据的一个映射器层。概念永远都是抽象的，简单的说，数据映射器就是一个负责将数据映射到对象的类数据。 &nb
在Python中使用MYSQL pda158 mysql python
缘由　　近期在折腾一个小东西须要抓取网上的页面。然后进行解析。将结果放到数据库中。　　了解到 Python在这方面有优势，便选用之。　　由于我有台 server上面安装有 mysql，自然使用之。在进行数据库的这个操作过程中遇到了不少问题，这里记录一下，大家共勉。　　 python中mysql的调用　　百度之后能够通过MySQLdb进行数据库操作。
单例模式 hxl1988_0311 java 单例设计模式单件
package com.sosop.designpattern.singleton; /* * 单件模式：保证一个类必须只有一个实例，并提供全局的访问点 * * 所以单例模式必须有私有的构造器，没有私有构造器根本不用谈单件 * * 必须考虑到并发情况下创建了多个实例对象 * */ /** * 虽然有锁，但是只在第一次创建对象的时候加锁，并发时不会存在效率
27种迹象显示你应该辞掉程序员的工作 vipshichg 工作
1、你仍然在等待老板在2010年答应的要提拔你的暗示。 2、你的上级近10年没有开发过任何代码。 3、老板假装懂你说的这些技术，但实际上他完全不知道你在说什么。 4、你干完的项目6个月后才部署到现场服务器上。 5、时不时的，老板在检查你刚刚完成的工作时，要求按新想法重新开发。 6、而最终这个软件只有12个用户。 7、时间全浪费在办公室政治中，而不是用在开发好的软件上。 8、部署前5分钟才开始测试。