Leokadia Rothschild

独家思维导图！让你秒懂李宏毅2020机器学习（一）

前言：博主为一名大二本科生，最近决心开始看李宏毅的深度学习系列课程，每学一个阶段决定写篇博客来归纳记录一下所学的东西，也希望自己的理解对大家有所帮助！

Introduction

第一课的内容我用借鉴李宏毅老师ppt所画的一张图来总结（就不再过多赘述了）

Regression

案例——预测宝可梦进化后的CP值

先与Introduction的部分回顾一下，确定

Senario: Supervised Learining
Task: Regresssion
Model: 多种选择

接下来用机器学习常见的三步来展现回归的过程：

Gradient Descent

只要是可微分的，gradient descent都可以拿来寻找使Loss function最小的参数。

Gradient Descent的缺点

gradient descent有⼀个令⼈担⼼的地⽅，也就是我之前⼀直提到的，它每次迭代完毕，寻找到的梯度为0的点必然是极⼩值点，local minima；却不⼀定是最⼩值点，global minima
这会造成⼀个问题是说，如果loss function⻓得⽐较坑坑洼洼(极⼩值点⽐较多)，⽽每次初始化的取值⼜是随机的，这会造成每次gradient descent停下来的位置都可能是不同的极⼩值点；⽽且当遇到梯度⽐较平缓(gradient≈0)的时候，gradient descent也可能会效率低下甚⾄可能会stuck卡住；

但是！在linear regression⾥，loss function实际上是convex的，是⼀个凸函数，是没有local optimal 局部最优解的，他只有⼀个global minima，visualize出来的图像就是从⾥到外⼀圈⼀圈包围起来的椭圆形的等⾼线(就像前⾯的等⾼线图)，因此随便选⼀个起始点，根据gradient descent最终找出来的，都会是同⼀组参数

关于η（learning rate）的讨论

learning rate的重要性：（引用李宏毅老师的例子）

gradient descent过程中，影响结果的⼀个很关键的因素就是learning rate的⼤⼩

如果learning rate刚刚好，就可以像下图中红⾊线段⼀样顺利地到达到loss的最⼩值
如果learning rate太⼩的话，像下图中的蓝⾊线段，虽然最后能够⾛到local minimal的地⽅，但是它可能会⾛得⾮常慢，以⾄于你⽆法接受
如果learning rate太⼤，像下图中的绿⾊线段，它的步伐太⼤了，它永远没有办法⾛到特别低的地
⽅，可能永远在这个“⼭⾕”的⼝上振荡⽽⽆法⾛下去
如果learning rate⾮常⼤，就会像下图中的⻩⾊线段，⼀瞬间就⻜出去了，结果会造成update参数以后，loss反⽽会越来越⼤(这⼀点在上次的demo中有体会到，当lr过⼤的时候，每次更新loss 反⽽会变⼤)

Adaptive Learning rates

最基本、最简单的⼤原则是：learning rate通常是随着参数的update越来越⼩的
第一种常规想法：（t为updata的次数）

这种⽅法使所有参数以同样的⽅式同样的learning rate进⾏update，⽽最好的状况是每个参数都给他不同的learning rate去update

Adagrad

最终得到Adagrad表达式

p.s.解释表达式中一些矛盾的事情
我们在做gradient descent的时候，希望的是当梯度值即微分值越⼤的时候(此时斜率越⼤，还没有接近最低点)更新的步伐要更⼤⼀些，但Adagrad的表达式中，分⺟表⽰梯度越⼤步伐越⼤，分⼦却表⽰梯度越⼤步伐越⼩，两者似乎相互⽭盾

Adagrad要考虑的是，这个gradient有多surprise，即反差有多⼤，假设t=4的时候与前⾯的gradient反差特别⼤，那么g^t与分母之间的⼤⼩反差就会⽐较⼤，它们的商就会把这⼀反差效果体现出来

gradient越⼤，离最低点越远这件事情在有多个参数的情况下是不⼀定成⽴的

如下图所⽰，w1和w2分别是loss function的两个参数，loss的值投影到该平⾯中以颜⾊深度表⽰⼤⼩，分别在w2和w1处垂直切⼀⼑(这样就只有另⼀个参数的gradient会变化)，对应的情况为右边的两条曲线，可以看出，⽐起a点，c点距离最低点更近，但是它的gradient却越⼤

实际上，对于⼀个⼆次函数来说，最⼩值点的x=-b/2a，⽽对于任意⼀点x0 ，它迈出最好的步伐⻓度是|x0+b/2a|=|2ax0+b/2a| (这样就⼀步迈到最⼩值点了)，联系该函数的⼀阶导数y’=2ax+b和⼆阶导数y’’=2a ，可以发现最好的步伐⻓度是 |y’/y’’| ，也就是说他不仅跟⼀阶导数(gradient)有关，还跟⼆阶导数有关，因此我们可以通过这种⽅法重新⽐较上⾯的a和c点，就可以得到⽐较正确的答案。

在Adagrad表达式中，gt为一阶导，分母反应二阶导的大小，所以Adagrad想要做的事情就是，在不增加任何额外运算的前提下，想办法去估测⼆次微分的值

Stochastic Gradicent Descent

李老师还介绍了一种梯度下降的方法Stochastic Gradicent Descent：
随机梯度下降的⽅法可以让训练更快速，传统的gradient descent的思路是看完所有的样本点之后再构建loss function，然后去update参数；⽽stochastic gradient descent的做法是，看到⼀个样本点就update⼀次，因此它的loss function不是所有样本点的error平⽅和，⽽是这个随机样本点的error平⽅

stochastic gradient descent与传统gradient descent的效果对⽐如下：

后面李老师介绍了特征缩放在梯度下降的应用和梯度下降的数学原理，在这里就不多做赘述了。

然后我来重点总结下如何更好的回归拟合。

How can we do better?

我们有没有办法做得更好呢？这时就需要我们重新去设计model；如果仔细观察⼀下上图的data，就会发现在原先的cp值⽐较⼤和⽐较⼩的地⽅，预测值是相当不准的。

增加高次项

实际上，从结果来看，最终的function可能不是⼀条直线，可能是稍微更复杂⼀点的曲线，于是我们选择增加高次项来优化。

考虑2次的model

考虑3次的model

考虑4次的model

考虑5次的model

5个model的对⽐
这5个model的training data的表现：随着的⾼次项的增加，对应的average error会不断地减⼩；实际上这件事情⾮常容易解释，实际上低次的式⼦是⾼次的式⼦的特殊情况(令⾼次项对应的为0，⾼次式就转化成低次式)也就是说，在gradient descent可以找到best function的前提下(多次式为Non-linear model，存在local optimal局部最优解，gradient descent不⼀定能找到global minima)，function所包含的项的次数越⾼，越复杂，error在training data上的表现就会越来越⼩；但是，我们关⼼的不是model在training data上的error表现，⽽是model在testing data上的error表现在training data上，model越复杂，error就会越低；但是在testing data上，model复杂到⼀定程度之后，error⾮但不会减⼩，反⽽会暴增，在该例中，从含有项的model开始往后的model， testing data上的error出现了⼤幅增⻓的现象，通常被称为overfitting过拟合

因此model不是越复杂越好，⽽是选择⼀个最适合的model，在本例中，3次的式⼦是最适合的model

上面提到增加高次项优化回归拟合，之后李老师又介绍了另一个优化的思路，增加新的input变量，即增加参数。

增加参数

这里李老师引入物种xs的影响


分别得到了改进后的在training data和testing data上测试的结果：

可以看出，结果比之前要稍微好一点。
那为什么不设计个超级无敌复杂的最终model呢？这样会不会更好呢？
考虑Hp值、height值、weight值的影响，设计出超复杂的model

算出的training error=1.9，但是，testing error=102.3！这么复杂的model很⼤概率会发⽣overfitting(overfitting实际上是我们多使⽤了⼀些input的变量或是变量的⾼次项使曲线跟training data拟合的更好，但不幸的是这些项并不是实际情况下被使⽤的，于是这个model在testing data上会表现得很糟糕)，overfitting就相当于是那个范围更⼤的⻙恩图，它包含了更多的函数更⼤的范围，代价就是在准确度上表现得更糟糕。

如果要更好的解释这个error，我们需要引入两种error。

Where does the error come from?

这里用思维导图说明：

怎么样？看了这个思维导图是不是一目了然呢？

也就是说我们的工作需要找到实际error最小的点，使bias和variance的大小达到平衡，得到表现最好的model。

在这里补充一下regularization和model selection

regulazation

regularization就是在原来的loss function的基础上加上了⼀项λ∑(wi) ，就是把这个model⾥⾯所有的wi的平⽅和⽤λ加权。其作用是我们期待wi越小甚至接近于0的function，即比较平滑的function。

如果我们有⼀个⽐较平滑的function，由于输出对输⼊是不敏感的，测试的时候，⼀些noises噪声对这个平滑的function的影响就会⽐较⼩，⽽给我们⼀个⽐较好的结果

我们喜欢⽐较平滑的function，因为它对noise不那么sensitive；但是我们⼜不喜欢太平滑的function，因为它就失去了对data拟合的能⼒；⽽function的平滑程度，就需要通过调整λ来决定。
就像下图中，当λ=100时，在testing data上的error最⼩，因此我们选择λ=100。

用刚刚bias和variance的几何意义来解释regularization的过程：

蓝⾊区域代表最初的情况，此时model⽐较复杂，function set的space范围⽐较⼤，包含了target
靶⼼，但由于data不够，⽐较分散，variance⽐较⼤。
红⾊区域代表进⾏regularization之后的情况，此时model的function set范围被缩⼩成只包含平滑的曲线，space减⼩，variance当然也跟着变⼩，但这个缩⼩后的space实际上并没有包含原先已经包含的target靶⼼，因此该model的bias变⼤。
橙⾊区域代表增⼤regularization的weight的情况，增⼤weight实际上就是放⼤function set的space，慢慢调整⾄包含target靶⼼，此时该model的bias变⼩，⽽相较于⼀开始的case，由于限定了曲线的平滑度(由weight控制平滑度的阈值)，该model的variance也⽐较⼩。

实际上，通过regularization优化model的过程就是上述的1、2、3步骤，不断地调整regularization的weight，使model的bias和variance达到⼀个最佳平衡的状态(可以通过error来评价状态的好坏， weight需要慢慢调参)。

Model Selection

接下来我们来说model selection(这部分会有点绕，讲得不好还请多多包涵)

李老师指出了我们在选model时不应该做的事情：
即现在手头上有training set（训练集）和 testing set（测试集），我用训练集去训练3个不同的model得到三个 f1*,f2*,f3*，再用我手头上的测试集去测试这三个训练出来的function，找出Error最小的即认为他的model是最好的。

这样的理解是错误的！
原因在于我们⼿头上的testing set，只是是我们⾃⼰拿来衡量model好坏的testing set，而真正的testing set是我们还没有，他是未知的；而我们手头上的testing set有⾃⼰的⼀个bias(可以理解为⾃⼰的testing data跟实际的testing data会有⼀定的偏差存在)。

所以用我们手头上这个testing set来选择最好的model的时候，它在真正的testing set上不⻅得是最好的model，通常是⽐较差的，所以你实际得到的error是会⼤于你在⾃⼰的testing set上估测到的0.5。

那怎样做才是正确的呢？

把training set分成两组：

training set(训练集) —— training model
validation set(验证集) —— selecting model（not training model)
先用training set训练出三个model的function ，接下来看⼀下它们在validation set上的performance
假设现在model3的performance最好，那你可以直接把这个model3的结果拿来apply在testing data上，如果你担⼼现在把training set分成training和validation两部分，感觉training data变少的话，可以这样做：已经从validation决定model3是最好的model，那就定住model3不变(function的表达式不变)，然后⽤全部的data在model3上⾯再训练⼀次(使⽤全部的data去更新model3表达式的参数)

这个时候，如果你把这个训练好的model的apply到public testing set上⾯，你可能会得到⼀个⼤于0.5的error，虽然这么做，你得到的error表⾯上看起来是⽐较⼤的，但是这个时候的error才能够真正反映你在private set上的error。

training data(训练集) -> ⾃⼰的testing data(测试集) -> 实际的testing data (该流程没有考虑⾃⼰的testing data的bias)
training set(部分训练集) -> validation set(部分验证集) -> ⾃⼰的testing data(测试集) -> 实际的testing data
(该流程使⽤⾃⼰的testing data和validation来模拟testing data的bias误差，可以真实地反映出在实际的data上出现的error)

N-flod Cross Validation

当然分training set有很多种不确定因素，为避免偶然性，可以分多次。

例如可以把training set分成三份，你每⼀次拿其中⼀份当做validation set，另外两份当training；分别在每个情境下都计算⼀下3个model的error，然后计算⼀下它的average error；然后你会发现在这三个情境下的average error，是model1最好。

然后接下来，你就把⽤整个完整的training data重新训练⼀遍model1的参数；然后再去testing data上test。

原则上是，如果你少去根据public testing set上的error调整model的话，那你在private testing set上⾯得到的error往往是⽐较接近public testing set上的error的。

总结来说就是选择model的时候呢，我们⼿头上的testing data与真实的testing data之间是存在偏差的，因此我们要将training data分成training set和validation set两部分，经过validation挑选出来的model再⽤全部的training data训练⼀遍参数，最后⽤testing data去测试error，这样得到的error是模拟过testing bias的error，与实际情况下的error会⽐较符合

好的，关于李老师机器学习中introduction和regression的部分到此讲完了，下篇讲classification。
我总结的顺序可能跟李老师上课时的不一样，我根据自己的理解融合了某些章节的内容并调整了顺序，同时，可能省略了一些推导，详情还是多看老师视频，看PPT回顾哟！

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
python中zeros用法_Python中的numpy.zeros()用法江平舟 python中zeros用法
numpy.zeros()函数是最重要的函数之一,广泛用于机器学习程序中。此函数用于生成包含零的数组。numpy.zeros()函数提供给定形状和类型的新数组,并用零填充。句法numpy.zeros(shape,dtype=float,order='C'参数形状：整数或整数元组此参数用于定义数组的尺寸。此参数用于我们要在其中创建数组的形状,例如(3,2)或2。dtype：数据类型(可选)此参数用于
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
计算机视觉中，Pooling的作用 Wils0nEdwards 计算机视觉人工智能
在计算机视觉中，Pooling（池化）是一种常见的操作，主要用于卷积神经网络（CNN）中。它通过对特征图进行下采样，减少数据的空间维度，同时保留重要的特征信息。Pooling的作用可以归纳为以下几个方面：1.降低计算复杂度与内存需求Pooling操作通过对特征图进行下采样，减少了特征图的空间分辨率（例如，高度和宽度）。这意味着网络需要处理的数据量会减少，从而降低了计算量和内存需求。这对大型神经网络
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
神经网络-损失函数红米煮粥神经网络人工智能深度学习
文章目录一、回归问题的损失函数1.均方误差（MeanSquaredError,MSE）2.平均绝对误差（MeanAbsoluteError,MAE）二、分类问题的损失函数1.0-1损失函数（Zero-OneLossFunction）2.交叉熵损失（Cross-EntropyLoss）3.合页损失（HingeLoss）三、总结在神经网络中，损失函数（LossFunction）扮演着至关重要的角色，它
【中国国际航空-注册_登录安全分析报告】风控牛验证码接口安全评测系列安全行为验证极验网易易盾智能手机
前言由于网站注册入口容易被黑客攻击，存在如下安全问题：1.暴力破解密码，造成用户信息泄露2.短信盗刷的安全问题，影响业务及导致用户投诉3.带来经济损失，尤其是后付费客户，风险巨大，造成亏损无底洞所以大部分网站及App都采取图形验证码或滑动验证码等交互解决方案，但在机器学习能力提高的当下，连百度这样的大厂都遭受攻击导致点名批评，图形验证及交互验证方式的安全性到底如何？请看具体分析一、中国国际航空PC
java杨辉三角 3213213333332132 java基础
package com.algorithm; /** * @Description 杨辉三角 * @author FuJianyong * 2015-1-22上午10:10:59 */ public class YangHui { public static void main(String[] args) { //初始化二维数组长度 int[][] y
《大话重构》之大布局的辛酸历史白糖_ 重构
《大话重构》中提到“大布局你伤不起”，如果企图重构一个陈旧的大型系统是有非常大的风险，重构不是想象中那么简单。我目前所在公司正好对产品做了一次“大布局重构”，下面我就分享这个“大布局”项目经验给大家。背景公司专注于企业级管理产品软件，企业有大中小之分，在2000年初公司用JSP/Servlet开发了一套针对中
电驴链接在线视频播放源码 dubinwei 源码电驴播放器视频 ed2k
本项目是个搜索电驴（ed2k）链接的应用,借助于磁力视频播放器（官网： http://loveandroid.duapp.com/ 开放平台），可以实现在线播放视频，也可以用迅雷或者其他下载工具下载。项目源码： http://git.oschina.net/svo/Emule,动态更新。也可从附件中下载。项目源码依赖于两个库项目，库项目一链接： http://git.oschina.
Javascript中函数的toString()方法周凡杨 JavaScript js toString function object
简述 The toString() method returns a string representing the source code of the function. 简译之，Javascript的toString()方法返回一个代表函数源代码的字符串。句法 function.
struts处理自定义异常 g21121 struts
很多时候我们会用到自定义异常来表示特定的错误情况，自定义异常比较简单，只要分清是运行时异常还是非运行时异常即可，运行时异常不需要捕获，继承自RuntimeException，是由容器自己抛出，例如空指针异常。非运行时异常继承自Exception，在抛出后需要捕获，例如文件未找到异常。此处我们用的是非运行时异常，首先定义一个异常LoginException: /** * 类描述：登录相
Linux中find常见用法示例 510888780 linux
Linux中find常见用法示例 ·find path -option [ -print ] [ -exec -ok command ] {} \; find命令的参数；
SpringMVC的各种参数绑定方式 Harry642 springMVC 绑定表单
1. 基本数据类型(以int为例，其他类似)： Controller代码： @RequestMapping("saysth.do") public void test(int count) { } 表单代码： <form action="saysth.do" method="post&q
Java 获取Oracle ROWID aijuans java oracle
A ROWID is an identification tag unique for each row of an Oracle Database table. The ROWID can be thought of as a virtual column, containing the ID for each row. The oracle.sql.ROWID class i
java获取方法的参数名 antlove java jdk parameter method reflect
reflect.ClassInformationUtil.java package reflect; import javassist.ClassPool; import javassist.CtClass; import javassist.CtMethod; import javassist.Modifier; import javassist.bytecode.CodeAtt
JAVA正则表达式匹配查找替换提取操作百合不是茶 java 正则表达式替换提取查找
正则表达式的查找;主要是用到String类中的split(); String str; str.split();方法中传入按照什么规则截取,返回一个String数组常见的截取规则: str.split("\\.")按照.来截取 str.
Java中equals()与hashCode()方法详解 bijian1013 java set equals()hashCode()
一.equals()方法详解 equals()方法在object类中定义如下： public boolean equals(Object obj) { return (this == obj); } 很明显是对两个对象的地址值进行的比较（即比较引用是否相同）。但是我们知道，String 、Math、I
精通Oracle10编程SQL(4)使用SQL语句 bijian1013 oracle 数据库 plsql
--工资级别表 create table SALGRADE ( GRADE NUMBER(10), LOSAL NUMBER(10,2), HISAL NUMBER(10,2) ) insert into SALGRADE values(1,0,100); insert into SALGRADE values(2,100,200); inser
【Nginx二】Nginx作为静态文件HTTP服务器 bit1129 HTTP服务器
Nginx作为静态文件HTTP服务器在本地系统中创建/data/www目录，存放html文件(包括index.html) 创建/data/images目录，存放imags图片在主配置文件中添加http指令 http { server { listen 80; server_name
kafka获得最新partition offset blackproof kafka partition offset 最新
kafka获得partition下标，需要用到kafka的simpleconsumer import java.util.ArrayList; import java.util.Collections; import java.util.Date; import java.util.HashMap; import java.util.List; import java.
centos 7安装docker两种方式 ronin47
第一种是采用yum 方式 yum install -y docker
java-60-在O(1)时间删除链表结点 bylijinnan java
public class DeleteNode_O1_Time { /** * Q 60 在O(1)时间删除链表结点 * 给定链表的头指针和一个结点指针(!!)，在O(1)时间删除该结点 * * Assume the list is: * head->...->nodeToDelete->mNode->nNode->..
nginx利用proxy_cache来缓存文件 cfyme cache
user zhangy users; worker_processes 10; error_log /var/vlogs/nginx_error.log crit; pid /var/vlogs/nginx.pid; #Specifies the value for ma
[JWFD开源工作流]JWFD嵌入式语法分析器负号的使用问题 comsci 嵌入式
假如我们需要用JWFD的语法分析模块定义一个带负号的方程式，直接在方程式之前添加负号是不正确的，而必须这样做： string str01 = "a=3.14;b=2.71;c=0;c-((a*a)+(b*b))" 定义一个0整数c,然后用这个整数c去
如何集成支付宝官方文档 dai_lm android
官方文档下载地址 https://b.alipay.com/order/productDetail.htm?productId=2012120700377310&tabId=4#ps-tabinfo-hash 集成的必要条件 1. 需要有自己的Server接收支付宝的消息 2. 需要先制作app，然后提交支付宝审核，通过后才能集成调试的时候估计会真的扣款，请注意
应该在什么时候使用Hadoop datamachine hadoop
原帖地址：http://blog.chinaunix.net/uid-301743-id-3925358.html 存档，某些观点与我不谋而合，过度技术化不可取，且hadoop并非万能。 --------------------------------------------万能的分割线-------------------------------- 有人问我，“你在大数据和Hado
在GridView中对于有外键的字段使用关联模型进行搜索和排序 dcj3sjt126com yii
在GridView中使用关联模型进行搜索和排序首先我们有两个模型它们直接有关联: class Author extends CActiveRecord { ... } class Post extends CActiveRecord { ... function relations() { return array( '
使用NSString 的格式化大全 dcj3sjt126com Objective-C
格式定义The format specifiers supported by the NSString formatting methods and CFString formatting functions follow the IEEE printf specification; the specifiers are summarized in Table 1. Note that you c
使用activeX插件对象object滚动有重影蕃薯耀 activeX插件滚动有重影
使用activeX插件对象object滚动有重影 <object style="width:0;" id="abc" classid="CLSID:D3E3970F-2927-9680-BBB4-5D0889909DF6" codebase="activex/OAX339.CAB#
SpringMVC4零配置 hanqunfeng springmvc4
基于Servlet3.0规范和SpringMVC4注解式配置方式，实现零xml配置，弄了个小demo，供交流讨论。项目说明如下： 1.db.sql是项目中用到的表，数据库使用的是oracle11g 2.该项目使用mvn进行管理，私服为自搭建nexus,项目只用到一个第三方 jar，就是oracle的驱动； 3.默认项目为零配置启动，如果需要更改启动方式，请
《开源框架那点事儿16》：缓存相关代码的演变 j2eetop 开源框架
问题引入上次我参与某个大型项目的优化工作，由于系统要求有比较高的TPS，因此就免不了要使用缓冲。该项目中用的缓冲比较多，有MemCache，有Redis，有的还需要提供二级缓冲，也就是说应用服务器这层也可以设置一些缓冲。当然去看相关实现代代码的时候，大致是下面的样子。 [java] view plain copy print ? public vo
AngularJS浅析 kvhur JavaScript
概念 AngularJS is a structural framework for dynamic web apps. 了解更多详情请见原文链接：http://www.gbtags.com/gb/share/5726.htm Directive 扩展html，给html添加声明语句，以便实现自己的需求。对于页面中html元素以ng为前缀的属性名称，ng是angular的命名空间
架构师之jdk的bug排查(一)---------------split的点号陷阱 nannan408 split
1.前言. jdk1.6的lang包的split方法是有bug的,它不能有效识别A.b.c这种类型,导致截取长度始终是0.而对于其他字符,则无此问题.不知道官方有没有修复这个bug. 2.代码 String[] paths = "object.object2.prop11".split("'"); System.ou
如何对10亿数据量级的mongoDB作高效的全表扫描 quentinXXZ mongodb
本文链接: http://quentinXXZ.iteye.com/blog/2149440 一、正常情况下，不应该有这种需求首先，大家应该有个概念，标题中的这个问题，在大多情况下是一个伪命题，不应该被提出来。要知道，对于一般较大数据量的数据库，全表查询，这种操作一般情况下是不应该出现的，在做正常查询的时候，如果是范围查询，你至少应该要加上limit。说一下，
C语言算法之水仙花数 qiufeihu c 算法
/** * 水仙花数 */ #include <stdio.h> #define N 10 int main() { int x,y,z; for(x=1;x<=N;x++) for(y=0;y<=N;y++) for(z=0;z<=N;z++) if(x*100+y*10+z == x*x*x
JSP指令 wyzuomumu jsp
jsp指令的一般语法格式： <%@ 指令名属性 =”值 ” %> 常用的三种指令： page,include,taglib page指令语法形式： <%@ page 属性 1=”值 1” 属性 2=”值 2”%> include指令语法形式： <%@include file=”relative url”%> (jsp可以通过 include

独家思维导图！让你秒懂李宏毅2020机器学习（一）

独家思维导图！让你秒懂李宏毅2020机器学习（一）

Introduction

Regression

案例——预测宝可梦进化后的CP值

Gradient Descent

Gradient Descent的缺点

关于η（learning rate）的讨论

learning rate的重要性：（引用李宏毅老师的例子）

Adaptive Learning rates

Adagrad

Stochastic Gradicent Descent

How can we do better?

增加高次项

增加参数

Where does the error come from?

regulazation

Model Selection

你可能感兴趣的:(深度学习,机器学习,人工智能,神经网络)