学無芷境

机器学习-（第二部分：神经网络/深度学习）-吴恩达-学习总结

神经网络模型

神经网络层（Neural network layer）

更复杂的神经网络

使用向前传播做预测（Inference_making predictions(forward propagation)）

TensorFlow工具

在TensorFlow中构建神经网络（Building a neural network）

单层中的向前传播（Forword prop in a single layer）

神经网络矢量化（Vectorization）

训练神经网络

激活函数 Activation Functions（sigmoid函数的替代方案）

sigmoid函数

Tanh函数

ReLU函数

如何选择激活函数

多分类 Multiclass Classification

softmax回归算法

softmax回归的代价函数

softmax应用在神经网络

多标签分类问题（multi-lable classification）

Adam算法进阶优化（Advanced Optimization）

Additional Layer Tpyes 卷积层

诊断方法

模型评估（Evaluating a mould）

模型选择&交叉验证（Model selection & tranining/cross validation）

方差与偏差（Bias and variance）

正则化 and 偏差方差

为性能建立一个基线（Establishing a baseline level of performance）

学习曲线（Learing curves）

遇到高偏差、高方差，解决方法

误差分析（Error analysis）

添加数据（Adding data）

迁移学习（Transfer leaning）

如何处理偏态数据（skewed data）数据倾斜

权衡精确率和召回率

决策树

测量存度（Measuring purity）

选择拆分信息增益

信息增益比

独热编码（one-hot encoding）

连续值的特征（Continuous valued features）

缺失值处理

回归树（Regression Tress）

集成学习：使用多个决策树 - 集成树（tree ensembles）

有放回抽样（sampling with replacement）

随机森林法则

增强决策树（boosted descion tree）

XGBoost 极端梯度增强（eXtreme Gradient Boosting）

决策树和神经网络

剪枝策略

需求预测（Demand Prediction）

左边三个神经元称为一层，一层也可以像右边只有一个神经元。

将负担性、知名度、感知质量等特征称为激活项

它有多层，每层输入一个向量，输出另一个向量。输入层-隐藏层-输出层

神经网络一个很好的特点是：当你从数据中训练它时，你不需要明确第决定其他什么特征，比如知名度等等，神经网络可以自己计算出它想要在这个隐藏层中使用的特征。

神经网络模型

神经网络层（Neural network layer）

隐藏层中是如何计算的

用上标【i】来表示神经网络的第几层；

用a来表示逻辑回归算法的输出

g()还有一个名字叫做激活函数，输出的向量叫激活值，上式为sigmoid函数，也叫logistic函数

在正向传播的过程中 w,b是已知的。

更复杂的神经网络

使用向前传播做预测（Inference_making predictions(forward propagation)）

向前传播算法：如上图x->a1->a2->a3,从左到右前进的方向进行计算（当你靠近输出层时，隐藏单元的数量就会减少）

神经网络的一个显著特点是：同一个算法模型可以有不同的应用场景

TensorFlow工具

TensorFlow是实现深度学习算法的主流框架之一

基于TensorFlow实现推理模型的语法：

TensorFlow是如何表示数据的

在TensorFlow中构建神经网络（Building a neural network）

Sequential,TensorFlow中的顺序函数，另一种方式：在学习的同时也向前传播；将刚刚创建的两层按顺序连接起来

单层中的向前传播（Forword prop in a single layer）

通用人工智能 AGI(artificial general intelligence)

神经网络矢量化（Vectorization）

matmul 是 NumPy执行矩阵乘法的方法

向量化代码：

训练神经网络

TensorFlow实现（TensorFlow implementation）

1.制定模型，告诉TensorFlow如何计算推断

2.编译模型，使用特定的损失函数

3.训练模型

epoch，术语：指你想学习算法进行梯度下降的步数

激活函数 Activation Functions（sigmoid函数的替代方案）

只有激活函数才能给神经元引入非线性因素，使得神经网络逼近非线性函数，当网络足够复杂的时候就可以逼近任意函数

之前讨论的激活函数为g(z)sigmoid函数，还有其他的激活函数：ReLU(Rectified Linear Unit)修正线性单元、线性激活函数、softmax激活函数

sigmoid函数

Tanh函数

ReLU函数

如何选择激活函数

取决于目标。如果是研究二元分类问题：在输出层使用sigmoid；房价，不能为负值：ReLU

y值是一个数，并且可正可负：线性函数

相比sigmoid，ReLU计算速度更快、学习的更快

多分类 Multiclass Classification

多分类是指可以有不只两个可能输出标签的分类问题

softmax回归算法

是逻辑回归算法的泛化，是一种针对多分类环境的二元分类算法

w1-4 , b1-4 是softmax函数的参数；aj被解释为，在给定输入特征x的情况下，y=j的概率估计

softmax回归的代价函数

softmax应用在神经网络

注意，a1是包含z1~10的函数，所以每一个激活值，都取决于z的值。这是softmax输出独有的一个属性。

如何在tensorflow中实现

并且减少计算过程中数值舍入误差

代码部分

多标签分类问题（multi-lable classification）

每张图片都有很多的、与之相关的标签。（输出不再是一个数字，而是多个数字代表不同标签，例如自动驾驶视觉）。需要训练单一的神经网络，来同时检测多种物体

Adam算法进阶优化（Advanced Optimization）

和梯度下降一样，是优化算法，用来最小化代价函数

Adam(Adaptive Moment estimation):可以自动调整学习率，模型的每个参数都会有不同的学习率，沿相同方向移动，提高学习率（步子迈得更大）。

Additional Layer Tpyes 卷积层

全连接层（dense layer）类型：其中每一层的神经元都从前一层得到所有的激活。

卷积层（convolutional layer）:这种层的每个神经元只关注输入图像的一个区域，需要训练的数据更少，也更不容易过拟合

当w增加一个小的值Epsilon时，J(w)的值会改变：J(w)对w的倒数 × Epsilon。

诊断方法

模型评估（Evaluating a mould）

70%的数据放入训练集，30%的数据放入测试集。利用训练集上的数据去训练模型的参数，然后在测试集上测试模型的表现。

使用测试集去评估模型的性能（不包括正则化的一项）

模型选择&交叉验证（Model selection & tranining/cross validation）

为机器学习算法自动选择一个好的模型

将数据分为三部分：训练集，交叉验证集（cross-validation set），测试集.

计算出：训练误差、交叉验证误差、测试误差

观察哪个模型的交叉检验误差最低，选出模型，最后为了表现泛化误差估计的这个模型在新数据上表现有多好，使用测试集求出J(w4,b4)测试误差.(这样测试集就变得很公平，而不是对泛化误差的过度乐观估计)

训练误差是在训练集上计算的错误率，反映了模型在训练数据上的表现。
交叉验证误差（本身包含训练集和验证集）是通过交叉验证方法，在验证集上计算的平均错误率，更能够评估模型的泛化性能。

在交叉验证中，Fold 1 和 Fold 2 表示数据集被分成的两个不重叠的子集，它们在不同的交叉验证迭代中用作训练集和验证集。

具体来说，假设我们使用 2 折交叉验证，将数据集按照 6:2 的比例划分为两个子集。交叉验证的过程如下：

Fold 1：
- 训练集：前 6 条数据
- 验证集：后 2 条数据
Fold 2：
- 训练集：后 6 条数据
- 验证集：前 2 条数据

在每个 Fold 中，我们将训练集用于模型的训练，然后使用验证集来评估模型的性能。每次交叉验证迭代时，交替选择不同的 Fold 作为验证集，直到所有 Fold 都被用作验证集为止。最后，我们将所有交叉验证迭代的结果平均，得到交叉验证误差。

测试误差是在独立的测试集上计算的错误率，用于评估模型在未见过的数据上的表现。

方差与偏差（Bias and variance）

诊断方差偏差

当你有多特征的时候，你就没法用画图的方式直观判断出它是否表现的那么好。所以，一个更系统的判断算法是否有高偏差或高方差的方法是，看你的算法在训练集和交叉检验集上的表现。

高偏差算法的一个特点是：欠拟合

高方差算法的一个特点是：J_cv比j_train高得多

高偏差意味着算法在训练集上表现不好

高方差意味着算法在交叉验证集的表现比训练集上差得多

正则化 and 偏差方差

正则化参数的选择是如何影响算法的偏差和方差

$\lambda$ 非常大时，模型有高偏差（欠拟合）； $\lambda$ 非常小时，高方差（过拟合）

L2正则化

使用正则化，如何选择合适的 $\lambda$ ：交叉验证

为性能建立一个基线（Establishing a baseline level of performance）

为性能建立一个基线（baseline），我们就更容易判断j_train,j_cv的值，是高还是低。

第一组数据：高方差；第二组数据高偏差

学习曲线（Learing curves）

学习曲线是一种帮助你了解学习算法性能如何的方式，曲线随着经验的数量发生变化

交叉验证误差，通常比训练误差高，因为你调整参数去拟合训练集，是希望训练集上的性能得到提升，或者当m很小时，训练集上的表现，至少比交叉验证集好。

训练误差是模型在训练数据上的性能，而交叉验证误差是模型在未见过的测试数据上的性能。通常情况下，交叉验证误差会比训练误差高，这是因为模型在训练数据上可能过度拟合，导致在未见过的数据上表现不佳。

高偏差 vs 高方差的学习曲线

学习算法有高偏差：获取更多的训练数据本身不会有太大帮助

学习算法有高方差：可以通过扩大训练集来降低交叉验证误差，从而让算法表现更好

遇到高偏差、高方差，解决方法

我们该怎么做

算法方差很大解决方法:获取更多的训练数据，或简化模型（用更小的特征集或增大正则化参数）

算法偏差很大 解决方法：使模型更强大，或给予他更大的灵活性，以拟合更复杂的函数（添加特征或添加多项式特征或减少正则化参数）

误差分析（Error analysis）

误差分析过程是指人工检查错误的样本，并试图找出算法出错的地方

添加数据（Adding data）

为机器学习应用添加数据或收集更多的数据

更强的指向性，添加那些出过错的例子，模型会学习的更好

数据增强：用一个已有的训练例子来创建一个新的训练例子（旋转、放大、缩小已有的例子）

迁移学习（Transfer leaning）

可以使用来自不同任务的数据帮助你结局当前的任务，使用其他训练好的神经网络的前几层（包括参数）。

首先在大型数据集上进行训练（监督预训练），然后在较小的数据集上进行进一步参数调优（微调）

如何处理偏态数据（skewed data）数据倾斜

正负样本的比例十分倾斜，远不是五五开，我们就无法通过准确率来判断算法是否好坏（一直输出y=0的例子，反而准确率高）。

所以，评估一个罕见类的学习算法的性能，一个有用的算法是构造一个混淆矩阵

计算精确度和召回

精确度：真阳性在阳性中的比例（找的对）

召回：真阳性在实际阳性中的比例（所有患病人中正确检测到的比例）（找的全）

权衡精确率和召回率

提高阈值--会导致更高的精度、更低的召回，反之亦然。

还有另一个指标，叫 F1 score，它可以自动结合精度和召回率，帮你选择最佳权衡值

此方程也被称为P 和 R 的调和均值（是一种取平均值的方式，但是更强调较小的值）

决策树

决策树模型

输入值，同样也是二元的，具有分类价值 Categorical（discrete values）

学习过程（Learning Process）

如何让算法学习基于训练集的的特定决策树？

构建树的过程：人为划分

如何选取特征：看哪些特征能使左右分支标签的纯度最大（分完后没有异类）

什么时候停止划分：百分百确定是一个类的时候；或达到设定的最大深度时（保持树更小，防止过拟合）；或纯度提高，低于某个阈值时

测量存度（Measuring purity）

在熵(entropy)的定义下（衡量纯度的一种方式），如何决定分割一个节点

用熵函数（H（p_1））测量组样本的不纯度:五五开的时候熵值最高

定义p0=不是猫的比例，熵函数定义为：

选择拆分信息增益

决定用什么特征来划分一个节点，取决于什么样的特征选择最能减少熵。

熵的减少称为信息增益

把左右分支的熵，做加权平均和（左右分支被分到的数量也同样重要，因为如果分到的数量更多，那这边的熵值更低就更重要）,选择根节点，计算根节点的熵（H(0.5)）.，选择最大的那一个。

整个式子衡量的是：树在分裂过程中熵的减少（把能最大程度降低熵的特征作为节点）

信息增益比

独热编码（one-hot encoding）

使用one-hot编码来解决：特征取两个以上的离散值的问题。通过创建k个只能取值为0或1的二进制特征来替换。

连续值的特征（Continuous valued features）

如果特征不只是离散值，而是连续值呢？

当使用划分时，你只需要考虑不同的值来划分，执行通常的信息增益计算，选择高的并决定对其进行分割

缺失值处理

回归树（Regression Tress）

可以用来预测一个数字

如何选择哪个特征：首先做的是，尽量减少这些数据子集中体重的方差（衡量一组样本的离散程度，方差越大数据点越分散）。

与熵类似，对于回归树，我们同样测量方差的减少。选大的，降低的越多越好

集成学习：使用多个决策树 - 集成树（tree ensembles）

使用单一决策树的缺点：它可能对数据中的微小变化高度敏感（比如仅改变单个训练样本，具有最高信息增益的结点就可能发生改变，进而产生完全不同的树，说明这个算法不是那么健壮）

在新样本上运行这三个树，并让它们投票做出最终预测

这样我们就不用担心整体算法会对任何一棵树的预测过于敏感

有放回抽样（sampling with replacement）

将有放回抽样应用于构建集成树的方式如下：

创建新训练集

随机森林法则

在根节点或根节点附近的几个节点会有相同的特征选择，所以，进一步尝试随机每个节点的特征选择，会导致树之间变得更加不同，预测会更加准确。

选择k个小于n个特征的随机子集，只允许算法从这k个特征子集中挑选信息增益最大的特征来划分。当n很大是，k的典型选择是 $\sqrt{}$ n，最终得到的就是随机森林

增强决策树（boosted descion tree）

对于我们已经训练过的决策树，专注于我们还没做好的地方，然后在构建下一个决策树时，我们会把更多的注意力集中在做的不好的例子上。

例：第二次循环：用有放回的方式生成另一个含有10个示例的训练集。增强的步骤会在每一次迭代过程中做B次，就会有更高的概率选择这样的例子（以前样本树集合做的不太好的例子）

XGBoost 极端梯度增强（eXtreme Gradient Boosting）

不要用有放回的XGBoost，，它实际上不需要产生很多随机选择的训练集，甚至比使用有放回采样更有效。

决策树和神经网络

决策树和集成树通常可以很好的处理表格数据（结构化数据）。对于决策树一次只能训练一颗

神经网络适用于所有类型的数据，包括结构化和非结构化、以及混合数据。神经网络可能比决策树慢，但它可以和迁移学习一起使用

剪枝策略

剪枝原因：提高泛化能力

剪枝（Pruning）是一种用于降低决策树复杂性的策略，目的是防止过拟合，提高模型的泛化能力。决策树在构建过程中可能会生成过于复杂的树结构，这可能导致模型在训练数据上表现得很好，但在新数据上表现较差。剪枝策略的目标是削减决策树中的一些子树，从而降低模型的复杂性，使其更具泛化能力。

预剪枝

在决策树构建的过程中，预剪枝是在每次节点分裂前进行的。在分裂节点之前，会根据一些预定义的条件来判断是否应该继续分裂。一些常见的预剪枝条件包括：

最大深度：限制树的最大深度。
最小样本数：限制每个叶节点的最小样本数。
最小信息增益：仅在信息增益超过某个阈值时才进行分裂。

后剪枝

后剪枝是在决策树构建完成后，通过修剪一些子树来减小模型的复杂性。后剪枝的过程通常涉及到递归地检查子树，然后判断是否应该将子树替换为叶节点。常见的后剪枝策略包括：

验证集剪枝：将数据集划分为训练集和验证集，在验证集上评估剪枝后的模型性能，根据性能来决定是否剪枝。
决策树复杂度度量：通过度量子树的复杂度（比如叶节点数）来选择哪些子树需要剪枝。

MySQL中基于机器学习的自适应缓存热点识别优化策略——开启数据库性能新纪元墨夶数据库学习资料1 数据库 mysql 机器学习
在数据驱动的世界里，数据库的性能直接影响到整个应用系统的响应速度和用户体验。随着业务量的增长和技术的发展，传统的缓存机制逐渐暴露出局限性。如何更智能地识别并利用热点数据进行缓存优化，成为提升数据库性能的关键所在。今天，我们将深入探讨一种创新的方法——基于机器学习的自适应缓存热点识别优化策略，并分享其在MySQL中的具体实现方案。为什么选择机器学习？‍传统上，开发者们依赖于手动配置或预设规则来决定哪
Open3D 点云DBSCAN聚类算法 MelaCandy 算法聚类 numpy 计算机视觉图像处理 3d
目录一、DBSCAN基本原理二、代码实现2.1关键函数2.2完整代码三、实现效果3.1原始点云3.2聚类后点云Open3D点云算法汇总及实战案例汇总的目录地址：Open3D点云算法与点云深度学习案例汇总（长期更新）-CSDN博客一、DBSCAN基本原理DBSCAN（Density-BasedSpatialClusteringofApplicationswithNoise）是一种基于密度的聚类算法，
目标检测领域总结：从传统方法到 Transformer 时代的革新 DoYangTan 目标检测系列目标检测 transformer 人工智能
目标检测领域总结：从传统方法到Transformer时代的革新目标检测是计算机视觉领域的一个核心任务，它的目标是从输入图像中识别并定位出目标物体。随着深度学习的兴起，目标检测方法已经取得了显著的进展。从最早的传统方法到现如今基于Transformer的先进算法，目标检测的发展经历了多个重要的阶段。本文将详细总结目标检测领域的演进，涵盖传统方法、两阶段检测方法、单阶段检测方法和基于Transform
2024MathorCup数学建模之——MathorCup奖杯”获得者经验思路分享美赛数学建模数学建模
一、经验分享1.工具选择：顺手即可。Matlab和Python都是比较主流的选择，二者的应用场合各有不同。Python在数据分析、深度学习方面的优势愈发明显，而Matlab更适合进行物理仿真和数值计算。不过随着Python社区不断发展，其功能也愈发全面与强大，因此我们比较推荐学有余力的情况下可以更早接触Python。2.模型算法：多多益善。不一定要精通所有的算法，但是手上至少要准备一些常用的算法（
万字深度解析：DeepSeek-V3为何成为大模型时代的“速度之王“？羊不白丶大模型算法
引言在AI军备竞赛白热化的2024年，DeepSeek-V3以惊人的推理速度震撼业界：相比前代模型推理速度提升3倍，训练成本降低70%。这背后是十余项革命性技术的叠加创新，本文将为您揭开这艘"AI超跑"的性能密码。DeepSeek-V3的技术路径证明：计算效率的本质是知识组织的效率。其MoE架构中2048个专家的动态协作，恰似人脑神经网络的模块化运作——每个专家不再是被动执行计算的"劳工"，而是具
AI人工智能软件开发方案：开启智能时代的创新钥匙广州硅基技术官方人工智能
一、引言：AI浪潮下的软件开发新机遇近年来，人工智能（AI）技术的迅猛发展如同一股汹涌澎湃的浪潮，席卷了全球各个领域。从最初的概念提出到如今的广泛应用，AI历经了漫长的发展历程，终于迎来了属于它的黄金时代。回首过去，AI的发展并非一帆风顺，早期由于计算能力和算法的限制，经历了多次起伏。但随着大数据、云计算、机器学习、深度学习等技术的不断突破，AI迎来了爆发式增长。如今，AI已经深入到人们生活和工作
深度学习框架PyTorch——从入门到精通（6.2）自动微分机制 Fansv587 深度学习 pytorch 人工智能经验分享 python 机器学习
本节自动微分机制是上一节自动微分的扩展内容自动微分是如何记录运算历史的保存张量非可微函数的梯度在本地设置禁用梯度计算设置requires_grad梯度模式（GradModes）默认模式（梯度模式）无梯度模式推理模式评估模式（`nn.Module.eval()`）自动求导中的原地操作原地操作的正确性检查多线程自动求导CPU上的并发不确定性计算图保留自动求导节点的线程安全性C++钩子函数不存在线程安全
神经网络中层与层之间的关联 iisugar 神经网络深度学习计算机视觉
目录1.层与层之间的核心关联：数据流动与参数传递1.1数据流动（ForwardPropagation）1.2参数传递（BackwardPropagation）2.常见层与层之间的关联模式2.1典型全连接网络（如手写数字分类）2.2卷积神经网络（CNN，如图像分类）2.3循环神经网络（RNN/LSTM，如文本生成）2.4Transformer（如机器翻译）3.层间关联的核心原则3.1数据传递的“管道
Pytorch深度学习教程_9_nn模块构建神经网络 tRNA做科研深度学习保姆教程深度学习 pytorch 神经网络
欢迎来到《深度学习保姆教程》系列的第九篇！在前面的几篇中，我们已经介绍了Python、numpy及pytorch的基本使用，进行了梯度及神经网络的实践并学习了激活函数和激活函数，在上一个教程中我们学习了优化算法。今天，我们将开始使用pytorch构建我们自己的神经网络。欢迎订阅专栏进行系统学习：深度学习保姆教程_tRNA做科研的博客-CSDN博客目录1.理解nn模块：(1)使用nn.Sequent
【机器学习】算法分类 CH3_CH2_CHO 什么？！是机器学习！！机器学习算法有监督学习无监督学习半监督学习强化学习
1、有监督学习1.1定义使用带标签的数据训练模型。有监督学习是机器学习中最常见的一种类型，它利用已知的输入特征和对应的输出标签来训练模型，使模型能够学习到特征与标签之间的映射关系。在训练过程中，模型会不断地调整自身的参数，以最小化预测值与真实标签之间的误差，从而提高预测的准确性。1.2回归问题1.2.1目标预测连续值。回归问题的目标是预测一个连续的数值结果，模型的输出是一个实数值。1.2.2解释回
图神经网络实战——分层自注意力网络盼小辉丶图神经网络从入门到项目实战神经网络人工智能深度学习
图神经网络实战——分层自注意力网络0.前言1.分层自注意力网络1.1模型架构1.2节点级注意力1.3语义级注意力1.4预测模块2.构建分层自注意力网络相关链接0.前言在异构图数据集上，异构图注意力网络的测试准确率为78.39%，比之同构版本有了较大提高，但我们还能进一步提高准确率。在本节中，我们将学习一种专门用于处理异构图的图神经网络架构，分层自注意力网络(hierarchicalself-att
Radiance Fields from VGGSfM和Mast3r:两种先进3D重建方法的比较与分析 2401_87458718 3d
VGGSfM和Mast3r:3D场景重建的新方向在计算机视觉和3D重建领域,如何从2D图像重建3D场景一直是一个充满挑战的研究课题。近年来,随着深度学习技术的发展,一些新的方法被提出并取得了显著的进展。本文将重点介绍两种最新的基于深度学习的3D重建方法:VGGSfM和Mast3r,并通过GaussianSplatting技术对它们的性能进行全面比较和分析。VGGSfM:基于视觉几何的深度结构运动恢
基于 PyTorch 的 MNIST 手写数字分类模型欣然～ pytorch 分类人工智能
一、概述本代码使用PyTorch框架构建了一个简单的神经网络模型，用于解决MNIST手写数字分类任务。代码主要包括数据的加载与预处理、神经网络模型的构建、损失函数和优化器的定义、模型的训练、评估以及最终模型的保存等步骤。二、依赖库torch：PyTorch深度学习框架的核心库，提供了张量操作、自动求导等功能。torch.nn：PyTorch的神经网络模块，包含了各种神经网络层、损失函数等。torc
使用 Baseten 部署和运行机器学习模型的指南 shuoac 机器学习人工智能 python
随着机器学习模型在各个行业中的广泛应用，如何高效地部署和运行这些模型成为一个关键问题。本文将介绍如何使用Baseten平台来部署和服务机器学习模型。Baseten是LangChain生态系统中的一个重要提供者，它提供了所需的基础设施来高效地运行模型。无论是开源模型如Llama2和Mistral，还是专有或经过微调的模型，Baseten都能在专用GPU上运行。技术背景介绍Baseten提供了一种不同
高效快速教你DeepSeek如何进行本地部署并且可视化对话大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 经验分享
科技文章：高效快速教你DeepSeek如何进行本地部署并且可视化对话摘要：随着自然语言处理（NLP）技术的进步，DeepSeek作为一款基于深度学习的语义搜索技术，广泛应用于文本理解、对话系统及信息检索等多个领域。本文将探讨如何高效快速地在本地部署DeepSeek，并结合可视化工具实现对话过程的监控与分析。通过详尽的步骤、案例分析与代码示例，帮助开发者更好地理解和应用DeepSeek技术。同时，本
机器学习——分类、回归、聚类、LASSO回归、Ridge回归（自用）代码的建筑师模型学习模型训练机器学习机器学习分类回归正则化项 LASSO Ridge 朴素
纠正自己的误区：机器学习是一个大范围，并不是一个小的方向，比如：线性回归预测、卷积神经网络和强化学都是机器学习算法在不同场景的应用。机器学习最为关键的是要有数据，也就是数据集名词解释：数据集中的一行叫一条样本或者实例，列名称为特征或者属性。样本的数量称为数据量，特征的数量称为特征维度机器学习常用库：Numpy和sklearn朴素的意思是特征的各条件都是相互独立的机器学习（模型、策略、算法）损失函数
量化交易系统中如何处理机器学习模型的训练和部署？ openwin_top 量化交易系统开发机器学习人工智能量化交易
microPythonPython最小内核源码解析NI-motion运动控制c语言示例代码解析python编程示例系列python编程示例系列二python的Web神器Streamlit如何应聘高薪职位量化交易系统中，机器学习模型的训练和部署需要遵循一套严密的流程，以确保模型的可靠性、性能和安全性。以下是详细描述以及相关的示例：1.数据收集和预处理数据收集在量化交易中，数据是最重要的资产。收集的数
Python基于深度学习的动物图片识别技术的研究与实现 Java老徐 Python 毕业设计 python 深度学习开发语言深度学习的动物图片识别技术 Python动物图片识别技术
博主介绍：✌程序员徐师兄、7年大厂程序员经历。全网粉丝12w+、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌文末获取源码联系精彩专栏推荐订阅不然下次找不到哟2022-2024年最全的计算机软件毕业设计选题大全：1000个热门选题推荐✅Java项目精品实战案例《100套》Java微信小程序项目实战《100套》感兴趣的可以先收藏起来，还有大家
【深度学习与大模型基础】第7章-特征分解与奇异值分解 lynn-66 深度学习与大模型基础算法机器学习人工智能
一、特征分解特征分解（EigenDecomposition）是线性代数中的一种重要方法，广泛应用于计算机行业的多个领域，如机器学习、图像处理和数据分析等。特征分解将一个方阵分解为特征值和特征向量的形式，帮助我们理解矩阵的结构和性质。1.特征分解的定义对于一个n×n的方阵A，如果存在一个非零向量v和一个标量λ，使得：则称λ为矩阵A的特征值，v为对应的特征向量。特征分解将矩阵A分解为：其中：Q是由特征
【论文阅读】Persistent Homology Captures the Generalization of Neural Networks Without A Validation Set 开心星人论文阅读论文阅读
将神经网络表征为加权的无环图，直接根据模型的权重矩阵构造PD。计算相邻batch的权重矩阵PD之间的距离。比较同调收敛性与神经网络的验证精度变化趋势摘要机器学习从业者通常通过监控模型的某些指标来估计其泛化误差，并在训练数值收敛之前停止训练，以防止过拟合。通常，这种误差度量或任务相关的指标是通过一个验证集（holdoutset）来计算的。因为这些数据没有直接用于更新模型参数，通常假设模型在验证集上的
震惊！ “深度学习”都在学习什么扉间798 深度学习学习人工智能
常见的机器学习分类算法俗话说三个臭皮匠胜过诸葛亮这里面集成学习就是将单一的算法弱弱结合算法融合用投票给特征值加权重AdaBoost集成学习算法通过迭代训练一系列弱分类器，给予分类错误样本更高权重，使得后续弱分类器更关注这些样本，然后将这些弱分类器线性组合成强分类器，提高整体分类性能。（一）投票机制投票是一种直观且常用的算法融合策略。在多分类问题中，假设有多个分类器对同一数据进行分类判断。每个分类器
【论文阅读】Availability Attacks Create Shortcuts 开心星人论文阅读论文阅读
还得重复读这一篇论文，有些地方理解不够透彻可用性攻击通过在训练数据中添加难以察觉的扰动，使数据无法被机器学习算法利用，从而防止数据被未经授权地使用。例如，一家私人公司未经用户同意就收集了超过30亿张人脸图像，用于构建商业人脸识别模型。为解决这些担忧，许多数据投毒攻击被提出，以防止数据被未经授权的深度模型学习。它们通过在训练数据中添加难以察觉的扰动，使模型无法从数据中学习太多信息，从而导致模型在未见
深度学习 | pytorch + torchvision + python 版本对应及环境安装 zfgfdgbhs 深度学习 python pytorch
目录一、版本对应二、安装命令（pip）1.版本（1）v2.5.1~v2.0.0（2）v1.13.1~v1.11.0（3）v1.10.1~v1.7.02.安装全过程（1）选择版本（2）安装结果参考文章一、版本对应下表来自pytorch的github官方文档：pytorch/vision:Datasets,TransformsandModelsspecifictoComputerVisionpytor
机器学习 Day01人工智能概述山北雨夜漫步机器学习人工智能
1.什么样的程序适合在gpu上运行计算密集型的程序：此类程序主要运算集中在寄存器，寄存器读写速度快，而GPU拥有强大的计算能力，能高效处理大量的寄存器运算，因此适合在GPU上运行。像科学计算中的数值模拟、密码破解等场景的程序，都属于计算密集型，在GPU上运行可大幅提升运算速度。易于并行的程序：GPU采用SIMD架构，有众多核心，同一时间每个核心适合做相同的事。易于并行的程序能充分利用GPU这一特性
卷积神经网络 - 理解卷积核的尺寸 k×k×Cin 谦亨有终 AI学习笔记 cnn 人工智能神经网络深度学习机器学习
卷积神经网络中，每个卷积核的尺寸为k×k×Cin，这一设计的核心原因在于多通道输入的数据结构和跨通道特征整合的需求。以下是详细解释：1.输入数据的结构输入形状：假设输入数据为三维张量，形状为H×W×Cin，其中：H：高度（Height）W：宽度（Width）Cin：通道数（Channelsin）多通道的物理意义：对于RGB图像，Cin=3（红、绿、蓝三通道）。对于中间层的特征图，Cin可能为64、
机器学习：让计算机学会思考的艺术平凡而伟大. 机器学习机器学习人工智能
目录什么是机器学习？机器学习的基本步骤常见的机器学习算法机器学习的实际应用如何入门机器学习？结语在当今数字化时代，机器学习（MachineLearning,ML）已经成为一个炙手可热的话题。从推荐系统到自动驾驶汽车，再到语音助手，机器学习的应用无处不在。然而，对于许多人来说，机器学习仍然是一个神秘而复杂的领域。本文将用通俗易懂的语言，带你走进机器学习的世界，了解它的基本原理和应用。什么是机器学习？
机器学习中的 K-均值聚类算法及其优缺点平凡而伟大. 机器学习机器学习算法均值算法
K-均值聚类是一种常用的无监督学习算法，用于将数据集中的样本分成K个簇。其基本原理是将所有样本点划分到K个簇使得簇内样本点之间的距离尽可能接近，而不同簇之间的距离尽可能远。算法流程如下：随机选择K个样本点作为初始的聚类中心。将每个样本点分配到与其最近的聚类中心所在的簇。更新每个簇的聚类中心为该簇所有样本点的平均值。重复第2步和第3步，直到聚类中心不再变化或者达到最大迭代次数。优点：简单且易于实现。
一文讲清楚深度学习和机器学习平凡而伟大. 机器学习人工智能深度学习机器学习人工智能
目录1.定义机器学习（MachineLearning,ML）深度学习（DeepLearning,DL）2.工作原理机器学习深度学习3.应用场景机器学习深度学习4.主要区别5.为什么选择深度学习？6.总结深度学习和机器学习是人工智能（AI）领域中两个密切相关但有所区别的概念。要清楚地解释它们之间的关系，我们可以从定义、工作原理、应用场景以及两者的主要区别等方面进行探讨。1.定义机器学习（Machin
DeepSeek：智能搜索与分析的新纪元 XRC2231 学习
在人工智能浪潮席卷全球的今天，DeepSeek如同一颗璀璨的新星，以其独特的魅力和强大的功能，在AI领域脱颖而出。DeepSeek，这一基于深度学习和数据挖掘技术的智能搜索与分析系统，不仅重新定义了搜索引擎的边界，更以其卓越的性能和广泛的应用场景，为全球用户带来了前所未有的智能体验。本文将从DeepSeek的定义、特点、应用场景、优势等方面进行全面而深入的介绍，带您领略这一新兴技术的独特魅力。一、
机器学习knnlearn1 XW-ABAP 机器学习机器学习人工智能
importmatplotlib.pyplotaspltimportnumpyasnpimportoperator#定义一个函数用于创建数据集defcreateDataSet():#定义特征矩阵，每个元素是一个二维坐标点，代表不同策略数据点的坐标group=np.array([[20,3],[15,5],[18,1],[5,17],[2,15],[3,20]])#定义每个数据点对应的标签，用于区分
ios内付费 374016526 ios 内付费
近年来写了很多IOS的程序，内付费也用到不少，使用IOS的内付费实现起来比较麻烦，这里我写了一个简单的内付费包，希望对大家有帮助。具体使用如下: 这里的sender其实就是调用者，这里主要是为了回调使用。 [KuroStoreApi kuroStoreProductId:@"产品ID" storeSender:self storeFinishCallBa
20 款优秀的 Linux 终端仿真器 brotherlamp linux linux视频 linux资料 linux自学 linux教程
终端仿真器是一款用其它显示架构重现可视终端的计算机程序。换句话说就是终端仿真器能使哑终端看似像一台连接上了服务器的客户机。终端仿真器允许最终用户用文本用户界面和命令行来访问控制台和应用程序。（LCTT 译注：终端仿真器原意指对大型机-哑终端方式的模拟，不过在当今的 Linux 环境中，常指通过远程或本地方式连接的伪终端，俗称“终端”。）你能从开源世界中找到大量的终端仿真器，它们
Solr Deep Paging(solr 深分页) eksliang solr深分页 solr分页性能问题
转载请出自出处：http://eksliang.iteye.com/blog/2148370 作者：eksliang(ickes) blg:http://eksliang.iteye.com/ 概述长期以来，我们一直有一个深分页问题。如果直接跳到很靠后的页数，查询速度会比较慢。这是因为Solr的需要为查询从开始遍历所有数据。直到Solr的4.7这个问题一直没有一个很好的解决方案。直到solr
数据库面试题 18289753290 面试题数据库
1.union ,union all 网络搜索出的最佳答案： union和union all的区别是,union会自动压缩多个结果集合中的重复结果，而union all则将所有的结果全部显示出来，不管是不是重复。 Union：对两个结果集进行并集操作，不包括重复行，同时进行默认规则的排序； Union All：对两个结果集进行并集操作，包括重复行，不进行排序； 2.索引有哪些分类？作用是
Android TV屏幕适配酷的飞上天空 android
先说下现在市面上TV分辨率的大概情况两种分辨率为主 1.720标清，分辨率为1280x720. 屏幕尺寸以32寸为主，部分电视为42寸 2.1080p全高清，分辨率为1920x1080 屏幕尺寸以42寸为主，此分辨率电视屏幕从32寸到50寸都有适配遇到问题，已1080p尺寸为例：分辨率固定不变，屏幕尺寸变化较大。如：效果图尺寸为1920x1080，如果使用d
Timer定时器与ActionListener联合应用永夜-极光 java
功能:在控制台每秒输出一次代码: package Main; import javax.swing.Timer; import java.awt.event.*; public class T { private static int count = 0; public static void main(String[] args){
Ubuntu14.04系统Tab键不能自动补全问题解决随便小屋 Ubuntu 14.04
Unbuntu 14.4安装之后就在终端中使用Tab键不能自动补全，解决办法如下： 1、利用vi编辑器打开/etc/bash.bashrc文件（需要root权限） sudo vi /etc/bash.bashrc 接下来会提示输入密码 2、找到文件中的下列代码 #enable bash completion in interactive shells #if
学会人际关系三招轻松走职场 aijuans 职场
要想成功，仅有专业能力是不够的，处理好与老板、同事及下属的人际关系也是门大学问。如何才能在职场如鱼得水、游刃有余呢？在此，教您简单实用的三个窍门。　　第一，多汇报最近，管理学又提出了一个新名词“追随力”。它告诉我们，做下属最关键的就是要多请示汇报，让上司随时了解你的工作进度，有了新想法也要及时建议。不知不觉，你就有了“追随力”，上司会越来越了解和信任你。　　第二，勤沟通团队的力
《O2O：移动互联网时代的商业革命》读书笔记 aoyouzi 读书笔记
移动互联网的未来：碎片化内容+碎片化渠道=各式精准、互动的新型社会化营销。 O2O：Online to OffLine 线上线下活动 O2O就是在移动互联网时代，生活消费领域通过线上和线下互动的一种新型商业模式。手机二维码本质：O2O商务行为从线下现实世界到线上虚拟世界的入口。线上虚拟世界创造的本意是打破信息鸿沟，让不同地域、不同需求的人
js实现图片随鼠标滚动的效果百合不是茶 JavaScript 滚动属性的获取图片滚动属性获取页面加载
1,获取样式属性值 top 与顶部的距离 left 与左边的距离 right 与右边的距离 bottom 与下边的距离 zIndex 层叠层次例子:获取左边的宽度,当css写在body标签中时 <div id="adver" style="position:absolute;top:50px;left:1000p
ajax同步异步参数async bijian1013 jquery Ajax async
开发项目开发过程中，需要将ajax的返回值赋到全局变量中，然后在该页面其他地方引用，因为ajax异步的原因一直无法成功，需将async:false，使其变成同步的。格式： $.ajax({ type: 'POST', ur
Webx3框架（1） Bill_chen eclipse spring maven 框架 ibatis
Webx是淘宝开发的一套Web开发框架，Webx3是其第三个升级版本；采用Eclipse的开发环境，现在支持java开发；采用turbine原型的MVC框架，扩展了Spring容器，利用Maven进行项目的构建管理，灵活的ibatis持久层支持，总的来说，还是一套很不错的Web框架。 Webx3遵循turbine风格，velocity的模板被分为layout/screen/control三部
【MongoDB学习笔记五】MongoDB概述 bit1129 mongodb
MongoDB是面向文档的NoSQL数据库，尽量业界还对MongoDB存在一些质疑的声音，比如性能尤其是查询性能、数据一致性的支持没有想象的那么好，但是MongoDB用户群确实已经够多。MongoDB的亮点不在于它的性能，而是它处理非结构化数据的能力以及内置对分布式的支持(复制、分片达到的高可用、高可伸缩)，同时它提供的近似于SQL的查询能力，也是在做NoSQL技术选型时，考虑的一个重要因素。Mo
spring/hibernate/struts2常见异常总结白糖_ Hibernate
Spring ①ClassNotFoundException: org.aspectj.weaver.reflect.ReflectionWorld$ReflectionWorldException 缺少aspectjweaver.jar，该jar包常用于spring aop中 ②java.lang.ClassNotFoundException: org.sprin
jquery easyui表单重置(reset)扩展思路 bozch form jquery easyui reset
在jquery easyui表单中尚未提供表单重置的功能，这就需要自己对其进行扩展。扩展的时候要考虑的控件有： combo,combobox,combogrid,combotree,datebox,datetimebox 需要对其添加reset方法，reset方法就是把初始化的值赋值给当前的组件，这就需要在组件的初始化时将值保存下来。在所有的reset方法添加完毕之后，就需要对fo
编程之美-烙饼排序 bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; /* *《编程之美》的思路是：搜索+剪枝。有点像是写下棋程序：当前情况下，把所有可能的下一步都做一遍；在这每一遍操作里面，计算出如果按这一步走的话，能不能赢（得出最优结果）。 *《编程之美》上代码有很多错误，且每个变量的含义令人费解。因此我按我的理解写了以下代码： */
Struts1.X 源码分析之ActionForm赋值原理 chenbowen00 struts
struts1在处理请求参数之前，首先会根据配置文件action节点的name属性创建对应的ActionForm。如果配置了name属性，却找不到对应的ActionForm类也不会报错，只是不会处理本次请求的请求参数。如果找到了对应的ActionForm类，则先判断是否已经存在ActionForm的实例，如果不存在则创建实例，并将其存放在对应的作用域中。作用域由配置文件action节点的s
[空天防御与经济]在获得充足的外部资源之前,太空投资需有限度 comsci 资源
这里有一个常识性的问题: 地球的资源,人类的资金是有限的,而太空是无限的..... 就算全人类联合起来,要在太空中修建大型空间站,也不一定能够成功,因为资源和资金,技术有客观的限制.... &
ORACLE临时表—ON COMMIT PRESERVE ROWS daizj oracle 临时表
ORACLE临时表转临时表：像普通表一样，有结构，但是对数据的管理上不一样，临时表存储事务或会话的中间结果集，临时表中保存的数据只对当前会话可见，所有会话都看不到其他会话的数据，即使其他会话提交了，也看不到。临时表不存在并发行为，因为他们对于当前会话都是独立的。创建临时表时，ORACLE只创建了表的结构（在数据字典中定义），并没有初始化内存空间，当某一会话使用临时表时，ORALCE会
基于Nginx XSendfile+SpringMVC进行文件下载 denger 应用服务器 Web nginx 网络应用 lighttpd
在平常我们实现文件下载通常是通过普通 read-write方式，如下代码所示。 @RequestMapping("/courseware/{id}") public void download(@PathVariable("id") String courseID, HttpServletResp
scanf接受char类型的字符 dcj3sjt126com c
/* 2013年3月11日22:35:54 目的：学习char只接受一个字符 */ # include <stdio.h> int main(void) { int i; char ch; scanf("%d", &i); printf("i = %d\n", i); scanf("%
学编程的价值 dcj3sjt126com 编程
发一个人会编程, 想想以后可以教儿女, 是多么美好的事啊, 不管儿女将来从事什么样的职业, 教一教, 对他思维的开拓大有帮助像这位朋友学习: http://blog.sina.com.cn/s/articlelist_2584320772_0_1.html VirtualGS教程 (By @林泰前): 几十年的老程序员，资深的
二维数组（矩阵）对角线输出飞天奔月二维数组
今天在BBS里面看到这样的面试题目, 1，二维数组（N*N），沿对角线方向，从右上角打印到左下角如N=4： 4*4二维数组 { 1 2 3 4 } { 5 6 7 8 } { 9 10 11 12 } {13 14 15 16 } 打印顺序 4 3 8 2 7 12 1 6 11 16 5 10 15 9 14 13 要
Ehcache（08）——可阻塞的Cache——BlockingCache 234390216 并发 ehcache BlockingCache 阻塞
可阻塞的Cache—BlockingCache 在上一节我们提到了显示使用Ehcache锁的问题，其实我们还可以隐式的来使用Ehcache的锁，那就是通过BlockingCache。BlockingCache是Ehcache的一个封装类，可以让我们对Ehcache进行并发操作。其内部的锁机制是使用的net.
mysqldiff对数据库间进行差异比较 jackyrong mysqld
mysqldiff该工具是官方mysql-utilities工具集的一个脚本，可以用来对比不同数据库之间的表结构，或者同个数据库间的表结构如果在windows下，直接下载mysql-utilities安装就可以了，然后运行后，会跑到命令行下： 1）基本用法 mysqldiff --server1=admin:12345
spring data jpa 方法中可用的关键字 lawrence.li java spring
spring data jpa 支持以方法名进行查询/删除/统计。查询的关键字为find 删除的关键字为delete/remove (>=1.7.x) 统计的关键字为count (>=1.7.x) 修改需要使用@Modifying注解 @Modifying @Query("update User u set u.firstna
Spring的ModelAndView类 nicegege spring
项目中controller的方法跳转的到ModelAndView类，一直很好奇spring怎么实现的？ /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version 2.0 (the "License"); * yo
搭建 CentOS 6 服务器(13) - rsync、Amanda rensanning centos
（一）rsync Server端 # yum install rsync # vi /etc/xinetd.d/rsync service rsync { disable = no flags = IPv6 socket_type = stream wait
Learn Nodejs 02 toknowme nodejs
（1）npm是什么 npm is the package manager for node 官方网站：https://www.npmjs.com/ npm上有很多优秀的nodejs包，来解决常见的一些问题，比如用node-mysql，就可以方便通过nodejs链接到mysql，进行数据库的操作在开发过程往往会需要用到其他的包，使用npm就可以下载这些包来供程序调用 &nb
Spring MVC 拦截器 xp9802 spring mvc
Controller层的拦截器继承于HandlerInterceptorAdapter HandlerInterceptorAdapter.java 1 public abstract class HandlerInterceptorAdapter implements HandlerIntercep

机器学习-（第二部分：神经网络/深度学习）-吴恩达-学习总结

神经网络模型

神经网络层（Neural network layer）

更复杂的神经网络

使用向前传播做预测（Inference_making predictions(forward propagation)）

TensorFlow工具

在TensorFlow中构建神经网络（Building a neural network）

单层中的向前传播（Forword prop in a single layer）

神经网络矢量化（Vectorization）

训练神经网络

激活函数 Activation Functions（sigmoid函数的替代方案）

sigmoid函数

Tanh函数

ReLU函数

如何选择激活函数

多分类 Multiclass Classification

softmax回归算法

softmax回归的代价函数

softmax应用在神经网络

多标签分类问题（multi-lable classification）

Adam算法 进阶优化（Advanced Optimization）

Additional Layer Tpyes 卷积层

诊断方法

模型评估（Evaluating a mould）

模型选择&交叉验证（Model selection & tranining/cross validation）

方差与偏差（Bias and variance）

正则化 and 偏差方差

为性能建立一个基线（Establishing a baseline level of performance）

学习曲线（Learing curves）

遇到高偏差、高方差，解决方法

误差分析（Error analysis）

添加数据（Adding data）

迁移学习（Transfer leaning）

如何处理偏态数据（skewed data）数据倾斜

权衡精确率和召回率

决策树

测量存度（Measuring purity）

选择拆分 信息增益

信息增益比

独热编码（one-hot encoding）

连续值的特征（Continuous valued features）

缺失值处理

回归树（Regression Tress）

集成学习：使用多个决策树 - 集成树（tree ensembles）

有放回抽样（sampling with replacement）

随机森林法则

增强决策树（boosted descion tree）

XGBoost 极端梯度增强（eXtreme Gradient Boosting）

决策树和神经网络

剪枝策略

你可能感兴趣的:(机器学习,深度学习,神经网络)

Adam算法进阶优化（Advanced Optimization）

选择拆分信息增益