linyuxi_loretta

吴恩达机器学习2022 第一课

一共有三个部分：Supervised Machine Learning: Regression and Classification,Advanced Learning Algorithms,Unsupervised Learning, Recommenders, Reinforcement

逻辑回归的代价函数 7.1 Cost function for logistic regression_哔哩哔哩_bilibili

Introduction

AGI即Artificial general intelligence的简写，人工通用智能

AGI源于AI，但是由于主流AI研究逐渐走向某一领域的智能化（如机器视觉、语音输入等），因此为了与它们相区分，增加了general

学习算法最常用两个类型就是监督学习、无监督学习。

监督学习是指，我们将教计算机如何去完成任务，

而在无监督学习中，我们打算让它自己进行学习。

数据集“正确答案”

这个“房价预测”例子是一种特殊类型的监督学习，regression

另一种监督学习的类型“classification”

学习算法可能会找到一些边界，通过数据拟合出boundary

怎么处理无限多个特征，甚至怎么存储这些特征都存在问题，你电脑的内存肯定不够用。我们以后会讲一个算法，叫支持向量机，里面有一个巧妙的数学技巧，能让计算机处理无限多个特征。想象一下，我没有写下这两种和右边的三种特征，而是在一个无限长的列表里面，一直写一直写不停的写，写下无限多个特征，

1 - 4 - Unsupervised Learning

we call it unsupervised because we're not trying to supervise the algorithm.

针对数据集，无监督学习就能判断出数据有两个不同的聚集簇。

这是一个，那是另一个，二者不同。是的，无监督学习算法可能会把这些数据分成两个不同

的簇。所以叫做聚类算法(clustering algorithm)。

what's cool is that this clustering algorithm figures out on his own which words suggest, that certain articles are in the same group.

some other types of unsupervised learning algorithms.

anomaly detection异常检测，用于金融系统中的欺诈检测 fraud detection in the financial system,

dimensionality reduction降维.

The most widely used tool by machine learning and data science practitioners today is the Jupyter Notebooks .

Linear Regression Model

监督学习过程完整的流程

the first model of this course, Linear Regression Model.

线性回归模型是一种特殊的监督学习模型，叫做回归模型

Linear regression is one example of a regression model.

why use linear func.？

sometimes you want to fit more complex non-linear functions as well, like a curve

But since this linear function is relatively simple and easy to work with, let's use a line as a foundation that will eventually help you to get to more complex models that are non-linear.

cost func.

the cost function will tell us how well the model is doing so that we can try to get

it to do better.

the squared error cost function is by far the most commonly used one for linear regression and for that matter, for all regression problems where it seems to give good results for many applications.

3D表面图

contour plot等高线图

github上有源码，用jupyter打开lab的文件

week1下的work文件夹里的lab04文件

4.1 梯度下降

一种自动查找参数w和b的值，提供最佳拟合线的算法-----梯度下降

the most advanced NN models, also called deep learning models.

What this expression is saying is, after your parameter w by taking the current value of w and adjusting it a small amount,

α learning rate.

usually a small positive number between 0 and 1 and it might be say, 0.01.

What Alpha does is, it basically controls how big of a step you take downhill.

导数项 in which direction you want to take your baby step.

4.2 梯度下降的实现

assignment operations 赋值操作

repeat these two update steps until the algorithm converges.

By converges, I mean that you reach the point at a local minimum where the parameters w and b no longer change much with each additional step that you take.

一个细节：simultaneously update

要同时更新。从一元函数的泰勒展开推导到梯度下降引申到多元函数就可以知道是同时下降的

导数决定梯度下降方向，学习率决定步长

4.3 理解梯度下降

4.4 学习率

所以可以得到解析解的话，可以把所有导数为零的点求出来，然后取最小的那个值对应的w，就是最小的

4.5 用于线性回归的梯度下降

我们已经学习了线性回归模型、 cost function, 梯度下降算法

本节，我们用 the squared error cost function平方误差成本函数 for the linear regression model
with gradient descent.

This will allow us to train the linear regression model to fit a straight line。

4.6 运行梯度下降

其主要区别在训练数据的选择上。

1、批量梯度下降法BGD
　　批梯度下降法(Batch Gradient Descent)针对的是整个数据集，通过对所有的样本的计算来求解梯度的方向。

week2

1.1 多维特征

multiple linear regression多元线性回归

多元回归( multivariate regression)（多元回归是统计学里的概念）

1.2 向量化

一个非常巧妙的技巧：向量化

使用向量化既可以减少代码量，又可以运行得更高效，

写向量化代码时，我们会用到现代数值线性代数的函数库 allow you to take advantage of modern numerical linear algebra libraries, NumPy

也会用到计算机的GPU硬件、一般来说，GPU是一种用来提高电脑处理图像速度的硬件

但当我们在写向量化代码时，使用它可以加快代码执行的速度

特别是当n很大的时候，它会比前面的两个代码示例运行的快得多。

向量化能加快运行速度的原因在于，我们有个幕后帮手

NumPy dot函数能够调用计算机中的并行硬件，

无论你是在一台普通电脑上用CPU，还是用GPU（经常用于加速机器学习任务）来运行这个算法，

与之相反，NumPy中的dot函数通过计算机硬件实现向量化

计算机可以得到向量w和x的所有值，在一步中，

它同时并行地将w和x相乘。

然后，计算机调用专门的硬件，非常高效地计算这16个数字的和

而不需要一个接一个地做不同的加法来计算这16个数的和

当你在大型数据集上运行算法或训练大模型时（机器学习通常就是这种情况），这点尤其重要

1.4 用于多元线性回归的梯度下降法

an alternative way for finding w and b for linear regression. This method is called
the normal equation 正规方程

技巧：

picking and scaling features

Alpha率选择

2.1 特征缩放

特征缩放的技术，它能让梯度下降运行得更快。

look at the relationship between the size of 特征 and the size of its associated parameter.

scatterplot散点图

总结一下，当你有不同的特征且取值范围

差异较大，它可能会导致梯度下降运行缓慢，但

通过重新放缩这些特征，使它们都具有可比较的值范围。

可显著加快梯度下降速度。

做法：

2. 均值归一化

3. Z-score标准化（也叫做Z-score归一化/规范化）

就是通过缩放尽量让所有特征的取值在差不多范围，这样它们的变化对预测值的影响都是接近的

基本意思是，保证各个特征的数量级一致

2.3 判断梯度下降是否收敛

how to check if gradient descent is really working?

= finding you the global minimum or something close to it.

= how to recognize if gradient descent is converging,

请注意，机器学习中使用了几种不同类型的学习曲线，

如果梯度下降正常运作，那么每次在迭代后代价J应该会降低。

如果成本J的值在一次迭代后反而增加了，

这意味着要么学习率α选择得不好，通常意味着Alpha太大，要么代码有bug

顺便说一下，不同的运用场景中，梯度下降的收敛速度可能有很大差异。

事实证明，我们很难事先知道梯度下降要经过多少次迭代才能收敛，

所以你可以先画个学习曲线图，看看你需要在迭代多少次之后停止模型的训练。

另一种帮助你决定什么时候完成模型训练的方法是使用自动收敛测试。

我经常发现，选出正确的 ε 是相当困难的。

实际上我倾向于看像左边这样的图，而不是依赖于自动收敛测试。

2.4 如何设置学习率

小技巧：所以如果梯度下降无法正常工作，我经常做的一件事就是将α设为一个很小的数字，看看是否每次迭代的代价都降低。

所以当我使用梯度下降法时，我通常会尝试一系列学习率α值。

对于每一个α选择，你可以用梯度下降法进行少量的迭代并绘制代价函数J、作为迭代次数的函数。在尝试了几个不同的α值之后，你可能会选择能快速且持续降低代价的α值

2.5 特征工程

choosing custom features自定义特征选取, which will also allow you to fit curves帮助你拟合曲线, not just a straight line to your data.

特征的选取对你的学习算法的性能有很大的影响。事实上，在许多实际应用中，选择或输入合适的特征才是 a critical step to making the algorithm work well.

a different way to use these features in the model that could be even more effective.

你可能会有一种直觉，即土地面积更能预测价格，

特征工程的一个特色，它不仅能帮你拟合直线，

2.6 多项式回归

让我们结合多元线性回归和特征工程的概念

来提出一种叫做多项式回归的新算法，polynomial regression, ,which will let you fit curves, non-linear functions,

一个流行的开源工具包，scikit-learn

week3 classification

3.1 motivation

事实证明，线性回归并不是解决分类问题的好算法。让我们看看为什么，由此也引入另一种算法：逻辑回归。

二分类问题binary classification

在这些问题中，我将交替使用类（classes）和类别（categories）这两个术语，它们的意思基本上是一样的。

需要明确的是，正负样本并不意味着样本的好坏，

这样说只是为了传达”absence/zero/false" 或者 “presence/one/true"的概念,

就非垃圾邮件和垃圾邮件而言，用 0/false 还是 1/true 来表示它们，取决于你的心情。

所以，不同的工程师，叫法可能正好反过来。正样本可以是封正常的邮件、

其中有一类是 1（positive/yes 良性肿瘤 )，还有一类是 0 （negtive/no 恶性肿瘤)。

我在横轴上标出了肿瘤的大小 x ，在纵轴上标出了对应的标签y。

但这不是我们想要的，因为添加一个训练样本并不应该改变任何我们之前判定肿瘤良恶性时下的结论

decision boundary决策边界

logistic regression 实际上是用来解决输出标签y为0或1的二元分类问题的。

它输出的结果值总在0到1之间。

1.2 逻辑回归

6.2 逻辑回归 Logistic regression_哔哩哔哩_bilibili

相比之下，逻辑回归的结果是拟合出这样一条曲线，一条s型曲线去拟合这个数据集。

算法输出0.7，说明这个肿瘤很有可能是恶性的。

但是输出标签y不会等于0.7，只会是0或1。

要想创建逻辑回归算法，我们需要引入一个重要的数学函数：Sigmoid函数，有时也叫做逻辑函数。

现在，让我们用这个sigmoid函数来建立逻辑回归算法。2 steps

接下来，让我们看看如何解释逻辑回归的输出。

把这个输出看作是在给定输入x的情况下，类别或标签y等于1的概率。

For a long time, 许多线上广告实际上是靠着逻辑回归的微小变化而选择投放的。

1.3 决策边界

decision boundary. 它能提供几种不同的方法来映射模型输出的数字，(This will give you a few different ways to map the numbers that this model outputs,) 例如0.3、0.7或0.65，以预测y实际上是0还是1。

如果你想要算法预测出的值是0或1该怎么办？

你可以设置一个阈值（threshold），超过这个阈值则预测 y=1，或者说让预测值 y帽=1。

我们常把阈值设置为0.5。如果f (x)大于等于0.5，那么 y帽=1

visualize how to model makes predictions：

在决策边界上，y=0 or 1的概率几乎一致。

当然，如果你选择不同的参数，决策边界将会是不同的线。

怎么知道每个特征值都要平方呢

通过观察数据分布，假设特征值表达式，对图像进行初步拟合，再经过梯度下降寻找w和b。

不用观察，用之前的多项式迭代就能得出表达式(?)

用多项式特征，可以得到非常复杂的决策边界。

通过这个可视化，我希望你现在能够对逻辑回归可能得到的模型范围有一个概念。

现在你已经知道了f (x)可以计算出什么，

让我们看看如何训练逻辑回归模型。

我们先来看看逻辑回归的成本函数然后，算出如何应用梯度下降法。

2.1 逻辑回归中的代价函数

还记得代价函数吗，它可以测量出一组特定参数与训练数据的吻合程度。从而为我们提供了一种选择更好参数的方法。

在这个视频中，我们会看到平方误差代价函数并不是逻辑回归的理想代价函数。

我们来看一个不同的成本函数，它可以帮助逻辑回归选择更好的参数。

这里有个可以使得代价函数再次凸化的代价函数，保证梯度下降可以收敛到全局最小值。

稍微改变一下代价函数J(w,b)的定义，

当 y=1时，损失函数推动算法做出更准确的预测，因为当f(x)预测的值接近1时，损失是最低的。

事实上，当预测值接近1时，损失实际上接近于无穷大。

以上，我们定义了单个训练样本的损失，并提出了逻辑回归损失函数的新定义。

选择这个损失函数后，整个代价函数就是凸函数了，此时你就可以安心的使用梯度下降法以得到全局最小值。

我们还会学到一种简写版的代价函数，这样以后运行梯度下降时，可以为逻辑回归找到好的参数。

2.2 简化逻辑回归代价函数

你可能会想，明明我们有那么多其他的代价函数可以选，非得要选这个？

这个特殊的代价函数是用一种叫做极大似然估计的统计原理中推导出来的，

统计学，idea on how to efficiently find parameters from different models

这种代价函数具有凸函数的优点。

逻辑回归的梯度下降 7.3 Gradient Descent Implementation_哔哩哔哩_bilibili

你可能会想，线性回归实际上和逻辑回归是一样的吗?

虽然这些方程看起来是一样的，但这并不是线性回归，因为函数f (x)的定义变了。

same concept with线性回归：

如何监视梯度下降以确保它收敛。（learning curve）

用向量化的逻辑回归，使其梯度下降的速度更快。

特征缩放就是将所有特征缩放到相似的值范围，比如在- 1和+ 1之间，它使得梯度下降更快地收敛。

过拟合 8.1 The problem of overfitting_哔哩哔哩_bilibili

一些处理过拟合的技巧。正则化会帮助你最小化出现过拟合的概率，让你的算法更好地工作。

该算法不能很好地拟合训练数据。用专业术语描述，就是模型对训练数据的拟合不足（欠拟合underfitting）。或者说：the algorithm has high bias，算法连训练集都没办法很好的拟合。

希望算法也能适用于没出现在训练集中的样本，这样的能力称为“泛化”（Generalization）。

有了这个四次多项式，你就可以精确地拟合出通过所有五个训练例子的曲线。

过拟合或高方差背后的直觉是算法非常努力地拟合每一个训练样本。

如果你的特征太少，就像左边的这个例子，它欠拟合了，并且有高方差。

8.2 解决过拟合Addressing overfitting_哔哩哔哩_bilibili

如果过拟合的情况已经发生了，那我们能做些什么？

首要做法。收集更多的训练数据。在有了更大的训练集之后，算法就会拟合出一个不那么摇摆不定的函数。

解决过拟合问题的第二个方法，观察是否可以使用更少的特征。

1.不用这么多个多项式特征。

2.feature selection，用直觉

in course 2，你还将看到一些算法，可以自动选择最合适的特征集，用于我们的预测任务。

第三种方法，正则化

其实正则化减少特征影响的方式算是比较温和了，它不是暴力的直接抹掉这个特征。正则化所做的是尽可能地让算法缩小参数的值，而不是要求一定要把参数变成0。

事实证明，即使你拟合一个像这样的高次多项式，只要你能让算法使用更小的参数值w1, w2, w3, w4，最终得到的曲线会更好地拟合数据。

正则化的作用是，它让你保留所有的特征，但防止特征权重过大，这有时会导致过拟合。

顺便说一下，按照惯例，我们通常只需要减小参数wj的大小，也就是从w1到wn。对参数b正不正则化没有太大差别。你想的话就可以。我通常不会这样做，正则化w1到wn的效果就挺不错了，但我并不鼓励缩小参数b的值。在实践中，是否对b进行正则化应该没有太大区别。

8.3 带有正则化的代价函数 Cost function with regularization_哔哩哔哩_bilibili

在上个视频中我们学习了正则化，通过缩小参数w1到wn的值，以减少过拟合的风险。

在这个视频中，我们将基于这种直觉, 改进算法中的代价函数，

如果这样做，那么我们最终会得到一个更接近二次函数的数据，其中也有 x³ 和 x⁴ 的小小贡献。

正则化背后的逻辑：参数值越小，模型可能会简单。也许是因为一个模型的特征变少了，那它过拟合的可能性也变小了。

更普遍的，你有很多特征，比如100个特征，你可能不知道哪些是最重要的，哪些应该被正则化。所以正则化的实现方式通常是惩罚所有的特征，或者更准确地说，你惩罚所有的wj参数。

λ，正则化参数。和学习率α有点类似，你也要为正则化参数 λ 选择一个具体的数字。

说明：

按照惯例，我们不用 λ * Σ wj² ，而是用 λ/2m * Σ wj²，所以第一项和第二项都乘以1 / 2m。用同样的方式缩放这两项，我们选择λ的值就更容易了。特别地，即使你的训练集规模变大，比如说你有了更多的训练样本，此时m的值（训练集大小）变大，你会发现之前确定的 λ 可能现在还能用，前提是你使用了这个2m倍的缩放（缩小）。

这个新的代价函数权衡了两个目标。

最小化第一项，可以让（预测值 - 真实值）² 尽可能的小，从而算法能更好地拟合数据（第一个目标：拟合数据）。

然后最小化第二项，

让参数 wj 尽可能的小（第二个目标），这样可以减小过拟合的风险。

你选择的 λ 值体现了相对重要性或相对权衡，就是说这两个目标你是如何取舍的。

8.4 线性回归的正则化 Regularized linear regression_哔哩哔哩_bilibili

α very small positive number

λ usually a small number

so，这一项意味着，每次迭代时，你会用w_j乘以一个略小于1的数字，before carrying out the usual update. 使得w_j缩小了一点点，这也给了我们另一种视角理解正则化为什么可以在每次迭代中缩小wj的值。这就是正则化的原理

在特征多和训练样本少时，使用正则化线性回归可以减少过拟合的风险。

请进空间看下一部分8.5 Regularized logistic regression_哔哩哔哩_bilibili

通常来说，when you train logistic regression with 很多features，whether多项式特征or some other features，发生过拟合的风险增加了。

实际上它们是相同的方程，只不过f的定义不再是线性函数，

你可能感兴趣的:(机器学习,机器学习,算法,聚类)

DS/ML：数据科学技术之数据科学生命周期(四大层次+机器学习六大阶段+数据挖掘【5+6+6+4+4+1】步骤)的全流程最强学习路线讲解之详细攻略一个处女座的程序猿资深文章(前沿/经验/创新)DataScience ML 数据科学数据科学的生命周期机器学习
DS/ML：数据科学技术之数据科学生命周期(四大层次+机器学习六大阶段+数据挖掘【5+6+6+4+4+1】步骤)的全流程最强学习路线讲解之详细攻略导读：本文章是博主在数据科学和机器学习领域，先后实战过几百个应用案例之后的精心总结，应该是完全覆盖了数据科学的整个生命周期及其各个阶段的要点。其中机器学习领域六大阶段更是在整个数据科学生命周期中扮演着极其重要的角色。同时，因为涉及到博主出书中出版社要求在
c++算法赛万能模板个人笔记适用蓝桥杯，天梯赛，acm等赛事 a东方青个人笔记 c++算法笔记
算法笔记-更新与2025-3-22点赞收藏+关注持续更新算法基础二分整数二分//在一个单调区间里面去找答案boolcheck(intx){/*...*/}//检查x是否满足某种性质//区间[l,r]被划分成[l,mid]和[mid+1,r]时使用：intbsearch_1(intl,intr){while(l>1;if(check(mid))r=mid;//check()判断mid是否满足性质el
一切皆是映射：实现神经网络的硬件加速技术：GPU、ASIC（专用集成电路）和FPGA（现场可编程门阵列） AI天才研究院 AI大模型企业级应用开发实战 DeepSeek R1 &大数据AI人工智能大模型计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
文章目录一切皆是映射：实现神经网络的硬件加速技术：GPU、ASIC（专用集成电路）和FPGA（现场可编程门阵列）1.背景介绍2.核心概念与联系3.核心算法原理&具体操作步骤3.1算法原理概述3.2算法步骤详解3.2.1GPU加速3.2.2ASIC加速3.2.3FPGA加速3.3算法优缺点GPUASICFPGA3.4算法应用领域4.数学模型和公式&详细讲解&举例说明4.1数学模型构建4.2公式推导过
堆数据结构：从基础原理到高效算法实现的技术探讨 Everyrt 课程设计
摘要堆作为一种特殊的树形数据结构，在多种算法场景中发挥着核心作用。本文深入剖析堆的基础原理，详细阐述堆的构建、插入、删除等操作的实现细节，并探讨其在优先队列、堆排序等高效算法中的应用，助力读者全面掌握堆数据结构及其应用技术。一、引言堆数据结构以其独特的特性，能够高效地获取集合中的最大（或最小）元素。无论是操作系统中的进程调度，还是搜索算法中的最优解筛选，堆都扮演着不可或缺的角色。理解堆的原理与实现
蓝桥大使【算法赛】----贪心算法 wyshh119 算法学习贪心算法
这里比较的难点在于sort排序的根据是什么，为什么是两人的报酬差，我的理解是当两人报酬差越大，那么总报酬的损失就越大，其实是缺少具体的证明的，但是通过就说明确实是这样。也就不深究证明了。#include#includeusingnamespacestd;longlongans=0;constintN=100005;structnode{//结构体inta;intb;};nodea[N];intma
算法设计与分析4（变治法） songx_99 算法设计与分析算法
变治法将问题转化为一个或数个有一定关联当形式上不同的更加简单或更加好解决的子问题。变治法的应用：预排序思想用预排序可以简化许多问题，如检查元素唯一性，检查出现次数最多的元素等堆算法堆的定义首先它是一个完全二叉树，完全二叉树表明树的每一层都是满的，只有最后一层最右边的元素有可能缺位。且父结点的值大于它的两个子节点，则称是一个大根堆，若值小于两个子节点，称小根堆堆化有向下调整，向上调整两种，大致思路相
动态规划算法--找零方式大王算法数据结构和算法实战宝典算法动态规划 c++
一、问题介绍给定数组arr，arr中所有的值都为正数且不重复。每个值代表一种面值的货币，每种面值的货币可以使用任意张，再给定一个整数aim，代表要找的钱数，求所有的找零方法有多少种。二、算法思路枚举法，列出使用某张钞票n次的所有可能。1、暴力递归intprocess1(intn,intarr[],intindex,intrest){if(index==n)returnrest==0?1:0;int
位图思想详解：用一个小小的比特征服整个世界 Joseit 优选算法 java 算法
位图思想详解：用一个小小的比特征服整个世界一、什么是位图？二、位图的形象理解三、位图的Java实现四、位图的算法原理剖析五、实际应用案例：网站用户活跃度统计五、真实的应用场景：布隆过滤器的基础六、算法题：判断字符是否唯一（easy）一、什么是位图？位图是一种超级节省空间的数据结构，他利用二进制位（0/1）来表示某个元素是否存在或某种状态是否为真。想象一下，用一个小小的比特位就能记录一个信息，这简直
给普通人看的深度学习说明书：用快递系统理解AI如何思考嵌入式Jerry Python AI 人工智能深度学习
第一章：理解AI的思维方式（快递版）1.1快递分拣站的故事假设你管理一个快递分拣站：传统方法：手动制定规则（比如根据邮编分拣）机器学习：观察老员工的分拣记录，总结规律深度学习：搭建自动分拣流水线，自主发现隐藏规则1.2神经网络就像智能分拣机传送带（输入层）：接收包裹信息（图片像素/文字等）#就像扫描快递单input_data=[0.2,0.7,0.1]#归一化后的特征数据分拣工人（隐藏层）：每个工
简单理解机器学习中top_k、top_p、temperature三个参数的作用无级程序员机器学习人工智能
在机器学习中，top_k、top_p和temperature是用于控制生成模型（如语言模型）输出质量的参数，尤其在文本生成任务中常见。然而，网上文章很多很全，但大多晦涩难懂，今天我们来用最简单的语言谈谈它们的具体作用：1.点菜式筛选法：top_k参数英文全称：top-k中文名称：前k个具体意义：top_k参数就像是你在餐厅点菜时，服务员只给你推荐菜单上前k名的招牌菜。在AI文本生成中，top_k参
PCL基础：pcl::SACSegmentation＜PointXYZRGBN＞函数全面说明，一遍文章精通平面分割算法多宝Kim #PCL点云库使用笔记 c++算法 windows visual studio
创作不易，如果本篇文章能够给你提供帮助，请点赞鼓励+收藏备查+关注获取最新技术动态，支持作者输出高质量干货！（一般在周末更新技术干货）`pcl::SACSegmentation`是PointCloudLibrary(PCL)中用于进行随机抽样一致性（RandomSampleConsensus，RANSAC）平面分割的类模板，模板参数`PointXYZRGBN`表示点云中点的类型，该类型包含三维坐标
算法及数据结构系列 - 动态规划诺亚凹凸曼算法及数据结构算法数据结构动态规划
系列文章目录算法及数据结构系列-二分查找算法及数据结构系列-BFS算法文章目录框架思路子序列问题解题模板一维dp数组二维dp数组经典题型322.零钱兑换暴力递归带备忘录的暴力递归动态规划300.最长上升子序列1143.最长公共子序列72.编辑距离框架思路动态规划问题的一般形式就是求最值。动态规划其实是运筹学的一种最优化方法，只不过在计算机问题上应用比较多，比如说求最长递增子序列，最小编辑距离等等。
Python 向量检索库Faiss使用懒大王爱吃狼 python python 开发语言自动化 Python基础 python教程
Faiss（FacebookAISimilaritySearch）是一个由FacebookAIResearch开发的库，它专门用于高效地搜索和聚类大量向量。Faiss能够在几毫秒内搜索数亿个向量，这使得它非常适合于实现近似最近邻（ANN）搜索，这在许多应用中都非常有用，比如图像检索、推荐系统和自然语言处理。以下是如何使用Faiss的基本步骤和示例：1.安装Faiss首先，你需要安装Faiss。你可
小白零基础学数学建模系列-引言与课程目录川川菜鸟数学建模小白到精通系列数学建模
目录引言一、我们的专辑包含哪些内容？第一周：数学建模基础与工具第二周：高级数学建模技巧与应用第三周：机器学习基础与数据处理第四周：监督学习与无监督学习算法第五周：神经网络二、学完本专辑能收获到什么？三、适合什么样的人群学习？四、如何学习本专辑？课程目录第1周：数学建模基础与工具第1天：数学建模入门介绍第2天：数学建模工具介绍第3天：线性回归与曲线拟合第4天：线性规划第5天：动态规划第2周：高级数学
C++基础系列【26】排序和查找算法程序喵大人 C++基础系列 c语言算法开发语言 c++
博主介绍：程序喵大人35-资深C/C++/Rust/Android/iOS客户端开发10年大厂工作经验嵌入式/人工智能/自动驾驶/音视频/游戏开发入门级选手《C++20高级编程》《C++23高级编程》等多本书籍著译者更多原创精品文章，首发gzh，见文末记得订阅专栏，以防走丢C++基础系列专栏C语言基础系列专栏C++大佬养成攻略专栏C++训练营排序与查找算法的重要性不用过多介绍了吧，面试也经常考察。
遗传算法-变异算法 ArthurKingYs 遗传算法遗传算法神经网络
遗传算法系列（4）变异算法在基因交叉之后产生的子代个体，其变量可能以很小的概率或者步长发生转变，这个过程称为变异(Mutation)。如果进化的目标函数极值是单峰值的，那么，将变异概率p设置为种群数量n的倒数是一个比较好的选择。如果变异概率很大，那么整个搜索过程就退化为一个随机搜索过程。所以，比较稳妥的做法是，进化过程刚刚开始的时候，取p为一个比较大的概率，随着搜索过程的进行，p逐渐缩小到0附近。
初始OpenCV 指尖下的技术 OpenCV opencv 人工智能计算机视觉
OpenCV是一个功能强大、应用广泛的计算机视觉库，它为开发人员提供了丰富的工具和算法，可以帮助他们快速构建各种视觉应用。随着计算机视觉技术的不断发展，OpenCV也将会继续发挥重要的作用。OpenCV提供了大量的计算机视觉算法和图像处理工具，广泛应用于图像和视频的处理、分析以及机器学习领域。所以学习人计算机视觉或者图像处理方面的知识，OpenCV是一个要重点学习的工具库。首先介绍一下OpenCV
遗传算法均匀变异 huahua20190514
importnumpyasnpimportrandompop_1=np.array([[1,11,21,9,16,10,8,17],[2,12,22,10,17,11,9,18],[3,13,23,11,18,12,10
01年实习生被曝负责字节RL核心算法！系字节LLM攻坚小组成员量子位
一个超越DeepSeekGRPO的关键RL算法出现了！用上该算法后，Qwen2.5-32B模型只经过RL训练，不引入蒸馏等其他技术，在AIME2024基准上拿下50分，优于相同setting下使用GRPO算法的DeepSeek-R1-Zero-Qwen，且DAPO使用的训练步数还减少了50%。这个算法名为DAPO，字节、清华AIR联合实验室SIALab出品，现已开源。论文通讯作者和开源项目负责人都
CSP-J备考冲刺必刷题（C++） | AcWing 1253 家谱热爱编程的通信人 c++开发语言
本文分享的必刷题目是从蓝桥云课、洛谷、AcWing等知名刷题平台精心挑选而来，并结合各平台提供的算法标签和难度等级进行了系统分类。题目涵盖了从基础到进阶的多种算法和数据结构，旨在为不同阶段的编程学习者提供一条清晰、平稳的学习提升路径。欢迎大家订阅我的专栏：算法题解：C++与Python实现！附上汇总贴：算法竞赛备考冲刺必刷题（C++）|汇总【题目来源】Acwing：1253.家谱-AcWing题库
栈和队列基础 Luther coder 算法
目录一.队列简述二.栈三.例题一.队列简述队列多用于辅助，很少有单独的题目。例如图的BFS，需要队列辅助实现。常见运用：单调队列：概念和单调栈类似。应用很少，多用于对一些算法的优化（动态规划等），不再赘述。优先队列：普通的队列是一种先进先出的数据结构，元素在队列尾追加，而从队列头删除。在优先队列中，元素被赋予优先级。当访问元素时，具有最高优先级的元素最先删除。优先队列具有最高级先出的特征。基于堆（
机器学习结合伏羲模型高精度多尺度气象分析与降尺度实现 Hardess-god WRF 算法人工智能
随着人工智能的发展，机器学习技术在气象预报领域展现出巨大潜力。本文详细探讨如何结合机器学习（ML）和伏羲模型进行高精度多尺度气象模拟分析，并提供详细的实现步骤和相关代码。1.研究目标与技术路线目标：结合机器学习模型与伏羲气象模式，实现区域和局地高精度降尺度。技术路线：伏羲模型提供大尺度气象数据和预报使用机器学习模型（如CNN、LSTM、XGBoost）进行降尺度2.数据准备与处理2.1气象数据获取
华为OD机试 - 相对开音节 - 正则表达式（Python/JS/C/C++ 2024 E卷 100分）哪吒华为od 正则表达式 python
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述相对开音节构成的结构为辅音+元音（aeiou）+辅音(r除外)+
华为OD机试 - 数列描述 - 动态规划（Python/JS/C/C++ 2024 B卷 100分）哪吒华为od 动态规划 python
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述有一个数列a[N](N=60)，从a[0]开始，每一项都是一个数
华为OD机试 - 输出单向链表中倒数第k个结点 - 双指针（Python/JS/C/C++ 2024 B卷 100分）哪吒华为od 链表 python
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述输入一个单向链表，输出该链表中倒数第k个结点，链表的倒数第1个结
华为OD机试 - 图片整理（Python/JS/C/C++ 2024 B卷 100分）哪吒华为od python javascript
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述Lily上课时使用字母数字图片教小朋友们学习英语单词，每次都需要
华为OD机试 - 宜居星球改造计划 - 图的多源BFS（Python/JS/C/C++ 2023 B卷 100分）哪吒华为od 宽度优先 python
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述2XXX年，人类通过对火星的大气进行宜居改造分析，使得火星已在理
华为OD机试 - 红黑图（Python/JS/C/C++ 2023 B卷100分）哪吒华为od python javascript
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述众所周知红黑树是一种平衡树，它最突出的特性就是不能有两个相邻的红
华为OD机试 - DNA序列（Python/JS/C/C++ 2023 B卷 100分）哪吒华为od python javascript
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述一个DNA序列由A/C/G/T四个字母的排列组合组成。G和C的比
华为OD机试 - 书籍叠放 - 逻辑分析（Python/JS/C/C++ 2024 B卷 200分）哪吒华为od python javascript
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述书籍的长、宽都是整数对应(l,w)。如果书A的长宽度都比B长宽大
如何用ruby来写hadoop的mapreduce并生成jar包 wudixiaotie mapreduce
ruby来写hadoop的mapreduce，我用的方法是rubydoop。怎么配置环境呢： 1.安装rvm：不说了网上有 2.安装ruby：由于我以前是做ruby的，所以习惯性的先安装了ruby，起码调试起来比jruby快多了。 3.安装jruby： rvm install jruby然后等待安
java编程思想 -- 访问控制权限百合不是茶 java 访问控制权限单例模式
访问权限是java中一个比较中要的知识点,它规定者什么方法可以访问,什么不可以访问一:包访问权限; 自定义包: package com.wj.control; //包 public class Demo { //定义一个无参的方法 public void DemoPackage(){ System.out.println("调用
[生物与医学]请审慎食用小龙虾 comsci 生物
现在的餐馆里面出售的小龙虾,有一些是在野外捕捉的,这些小龙虾身体里面可能带有某些病毒和细菌,人食用以后可能会导致一些疾病,严重的甚至会死亡..... 所以,参加聚餐的时候,最好不要点小龙虾...就吃养殖的猪肉,牛肉,羊肉和鱼,等动物蛋白质
org.apache.jasper.JasperException: Unable to compile class for JSP: 商人shang maven 2.2 jdk1.8
环境： jdk1.8 maven tomcat7-maven-plugin 2.0 原因： tomcat7-maven-plugin 2.0 不知吃 jdk 1.8，换成 tomcat7-maven-plugin 2.2就行，即 <plugin>
你的垃圾你处理掉了吗?GC oloz GC
前序:本人菜鸟，此文研究学习来自网络，各位牛牛多指教　 1.垃圾收集算法的核心思想　　Java语言建立了垃圾收集机制，用以跟踪正在使用的对象和发现并回收不再使用(引用)的对象。该机制可以有效防范动态内存分配中可能发生的两个危险：因内存垃圾过多而引发的内存耗尽，以及不恰当的内存释放所造成的内存非法引用。　　垃圾收集算法的核心思想是：对虚拟机可用内存空间，即堆空间中的对象进行识别
shiro 和 SESSSION 杨白白 shiro
shiro 在web项目里默认使用的是web容器提供的session，也就是说shiro使用的session是web容器产生的，并不是自己产生的，在用于非web环境时可用其他来源代替。在web工程启动的时候它就和容器绑定在了一起，这是通过web.xml里面的shiroFilter实现的。通过session.getSession()方法会在浏览器cokkice产生JESSIONID，当关闭浏览器，此
移动互联网终端淘宝客如何实现盈利小桔子移動客戶端淘客淘寶App
2012年淘宝联盟平台为站长和淘宝客带来的分成收入突破30亿元，同比增长100%。而来自移动端的分成达1亿元，其中美丽说、蘑菇街、果库、口袋购物等App运营商分成近5000万元。可以看出，虽然目前阶段PC端对于淘客而言仍旧是盈利的大头，但移动端已经呈现出爆发之势。而且这个势头将随着智能终端(手机，平板)的加速普及而更加迅猛
wordpress小工具制作 aichenglong wordpress 小工具
wordpress 使用侧边栏的小工具，很方便调整页面结构小工具的制作过程 1 在自己的主题文件中新建一个文件夹(如widget)，在文件夹中创建一个php(AWP_posts-category.php) 小工具是一个类,想侧边栏一样，还得使用代码注册，他才可以再后台使用，基本的代码一层不变 <?php class AWP_Post_Category extends WP_Wi
JS微信分享 AILIKES js
// 所有功能必须包含在 WeixinApi.ready 中进行 WeixinApi.ready(function(Api) { // 微信分享的数据 var wxData = { &nb
封装探讨百合不是茶 JAVA面向对象封装
//封装属性方法将某些东西包装在一起，通过创建对象或使用静态的方法来调用，称为封装；封装其实就是有选择性地公开或隐藏某些信息，它解决了数据的安全性问题，增加代码的可读性和可维护性在 Aname类中申明三个属性，将其封装在一个类中：通过对象来调用例如 1： //属性将其设为私有姓名 name 可以公开
jquery radio/checkbox change事件不能触发的问题 bijian1013 JavaScript jquery
我想让radio来控制当前我选择的是机动车还是特种车，如下所示： <html> <head> <script src="http://ajax.googleapis.com/ajax/libs/jquery/1.7.1/jquery.min.js" type="text/javascript"><
AngularJS中安全性措施 bijian1013 JavaScript AngularJS 安全性 XSRF JSON漏洞
在使用web应用中，安全性是应该首要考虑的一个问题。AngularJS提供了一些辅助机制，用来防护来自两个常见攻击方向的网络攻击。一.JSON漏洞当使用一个GET请求获取JSON数组信息的时候（尤其是当这一信息非常敏感，
[Maven学习笔记九]Maven发布web项目 bit1129 maven
基于Maven的web项目的标准项目结构 user-project user-core user-service user-web src
【Hive七】Hive用户自定义聚合函数(UDAF) bit1129 hive
用户自定义聚合函数，用户提供的多个入参通过聚合计算(求和、求最大值、求最小值)得到一个聚合计算结果的函数。问题：UDF也可以提供输入多个参数然后输出一个结果的运算，比如加法运算add(3，5)，add这个UDF需要实现UDF的evaluate方法,那么UDF和UDAF的实质分别究竟是什么？ Double evaluate(Double a, Double b)
通过 nginx-lua 给 Nginx 增加 OAuth 支持 ronin47
前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGeek 在过去几年中取得了发展，我们已经积累了不少针对各种任务的不同管理接口。我们通常为新的展示需求创建新模块，比如我们自己的博客、图表等。我们还定期开发内部工具来处理诸如部署、可视化操作及事件处理等事务。在处理这些事务中，我们使用了几个不同的接口来认证： &n
利用tomcat-redis-session-manager做session同步时自定义类对象属性保存不上的解决方法 bsr1983 session
在利用tomcat-redis-session-manager做session同步时，遇到了在session保存一个自定义对象时，修改该对象中的某个属性，session未进行序列化，属性没有被存储到redis中。在 tomcat-redis-session-manager的github上有如下说明： Session Change Tracking As noted in the &qu
《代码大全》表驱动法-Table Driven Approach-1 bylijinnan java 算法
关于Table Driven Approach的一篇非常好的文章： http://www.codeproject.com/Articles/42732/Table-driven-Approach package com.ljn.base; import java.util.Random; public class TableDriven { public
Sybase封锁原理 chicony Sybase
昨天在操作Sybase IQ12.7时意外操作造成了数据库表锁定，不能删除被锁定表数据也不能往其中写入数据。由于着急往该表抽入数据，因此立马着手解决该表的解锁问题。无奈此前没有接触过Sybase IQ12.7这套数据库产品，加之当时已属于下班时间无法求助于支持人员支持，因此只有借助搜索引擎强大的
java异常处理机制 CrazyMizzz java
java异常关键字有以下几个，分别为 try catch final throw throws 他们的定义分别为 try： Opening exception-handling statement. catch： Captures the exception. finally： Runs its code before terminating
hive 数据插入DML语法汇总 daizj hive DML 数据插入
Hive的数据插入DML语法汇总1、Loading files into tables语法：1) LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)]解释：1)、上面命令执行环境为hive客户端环境下： hive>l
工厂设计模式 dcj3sjt126com 设计模式
使用设计模式是促进最佳实践和良好设计的好办法。设计模式可以提供针对常见的编程问题的灵活的解决方案。工厂模式工厂模式（Factory）允许你在代码执行时实例化对象。它之所以被称为工厂模式是因为它负责“生产”对象。工厂方法的参数是你要生成的对象对应的类名称。 Example #1 调用工厂方法（带参数） <?phpclass Example{
mysql字符串查找函数 dcj3sjt126com mysql
FIND_IN_SET(str,strlist) 假如字符串str 在由N 子链组成的字符串列表strlist 中，则返回值的范围在1到 N 之间。一个字符串列表就是一个由一些被‘,’符号分开的自链组成的字符串。如果第一个参数是一个常数字符串，而第二个是type SET列，则 FIND_IN_SET() 函数被优化，使用比特计算。如果str不在strlist 或st
jvm内存管理 easterfly jvm
一、JVM堆内存的划分分为年轻代和年老代。年轻代又分为三部分：一个eden,两个survivor。工作过程是这样的：e区空间满了后，执行minor gc，存活下来的对象放入s0, 对s0仍会进行minor gc，存活下来的的对象放入s1中，对s1同样执行minor gc，依旧存活的对象就放入年老代中；年老代满了之后会执行major gc，这个是stop the word模式，执行
CentOS-6.3安装配置JDK-8 gengzg centos
JAVA_HOME=/usr/java/jdk1.8.0_45 JRE_HOME=/usr/java/jdk1.8.0_45/jre PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib export JAVA_HOME
【转】关于web路径的获取方法 huangyc1210 Web 路径
假定你的web application 名称为news,你在浏览器中输入请求路径： http://localhost:8080/news/main/list.jsp 则执行下面向行代码后打印出如下结果： 1、 System.out.println(request.getContextPath()); //可返回站点的根路径。也就是项
php里获取第一个中文首字母并排序远去的渡口数据结构 PHP
很久没来更新博客了，还是觉得工作需要多总结的好。今天来更新一个自己认为比较有成就的问题吧。最近在做储值结算，需求里结算首页需要按门店的首字母A-Z排序。我的数据结构原本是这样的： Array ( [0] => Array ( [sid] => 2885842 [recetcstoredpay] =&g
java内部类 hm4123660 java 内部类匿名内部类成员内部类方法内部类
　在Java中，可以将一个类定义在另一个类里面或者一个方法里面，这样的类称为内部类。内部类仍然是一个独立的类，在编译之后内部类会被编译成独立的.class文件，但是前面冠以外部类的类名和$符号。内部类可以间接解决多继承问题,可以使用内部类继承一个类，外部类继承一个类，实现多继承。 &nb
Caused by: java.lang.IncompatibleClassChangeError: class org.hibernate.cfg.Exten zhb8015
maven pom.xml关于hibernate的配置和异常信息如下，查了好多资料，问题还是没有解决。只知道是包冲突，就是不知道是哪个包....遇到这个问题的分享下是怎么解决的。。 maven pom: <dependency> <groupId>org.hibernate</groupId> <ar
Spark 性能相关参数配置详解－任务调度篇 Stark_Summer spark cache cpu 任务调度 yarn
随着Spark的逐渐成熟完善, 越来越多的可配置参数被添加到Spark中来, 本文试图通过阐述这其中部分参数的工作原理和配置思路, 和大家一起探讨一下如何根据实际场合对Spark进行配置优化。由于篇幅较长，所以在这里分篇组织，如果要看最新完整的网页版内容，可以戳这里：http://spark-config.readthedocs.org/，主要是便
css3滤镜 wangkeheng html css
经常看到一些网站的底部有一些灰色的图标，鼠标移入的时候会变亮，开始以为是js操作src或者bg呢，搜索了一下，发现了一个更好的方法：通过css3的滤镜方法。 html代码： <a href='' class='icon'><img src='utv.jpg' /></a> css代码： .icon{-webkit-filter: graysc

吴恩达 机器学习2022 第一课