Leokadia Rothschild

独家思维导图！让你秒懂李宏毅2020机器学习（二）—— Classification分类

在上一篇文章我总结了李老师Introduction和regression的具体内容，即1-4课的内容，这篇我将会总结classification的内容（包括Generative Model和Discriminative Model）,即5-6课的内容（第6课Logistic Regression虽然名字叫regression实际上也是classification的内容），这两课的内容有点难懂，博主花了好长时间才理出头绪，当然，说的有不准确的地方还请各位大佬批评指正！

上一篇文章传送门独家思维导图！让你秒懂李宏毅2020机器学习（一）—— Regression回归

文章目录

独家思维导图！让你秒懂李宏毅2020机器学习（二）—— Classification分类
- Classification
- - 概念描述
  - 特征数值化
  - How to classification
  - - Why not apply Regression?
  - Prepositional knowledge
- Generative model
- - - Binary Classification
- Logistic Regression（Discriminative）
- - Step 1： Function set
  - Step 2： Goodness of a function
  - Step 3： Find the best function
  - - Logistic Regression VS Linear Regression
    - Why not apply Square error?
- Multi-class Classification
- Limitation of Logistic Regression
- - Powerful Cascading Logistic Regression

Classification

概念描述

分类（classification），即找一个函数判断输入数据所属的类别，可以是二类别问题（是/不是），也可以是多类别问题（在多个类别中判断输入数据具体属于哪一个类别）。与回归问题（regression）相比，分类问题的输出不再是连续值，而是离散值，用来指定其属于哪个类别。分类问题在现实中应用非常广泛，比如垃圾邮件识别，手写数字识别，人脸识别，语音识别等。

简单来说就是找一个function，它的input是一个object，它的输出是这个object属于哪一个class

特征数值化

上面说到classification的input是一个object，但object怎么输入呢？
我们需要用数字来表示这个object的特征，李老师宝可梦的例子是
用⽣命值(HP)、攻击⼒(Attack)、防御⼒(Defense)、特殊攻击⼒(Special Attack)、特殊防御⼒(Special defend)、速度(Speed)七种特性的数值所组成的vector来描述一只皮卡丘。

How to classification

好了，解决了input的问题，就需要找分类的方法了，一个直观的想法就是看能不能套用前面回归的做法。

Why not apply Regression?

总结一下，就是：
1.Regression的output是连续性质的数值，⽽classification要求的output是离散性质的点，我们很难找到⼀个Regression的function使⼤部分样本点的output都集中在某⼏个离散的点附近。
2. 线性回归用来解决分类问题时，稳定性差。当样本分布比较复杂时，线性回归无法做到准确的分类。

过于抽象？用李老师的例子来解释一下：
以binary classification为例，我们在Training时让输⼊为class 1的输出为1，输⼊为class 2的输出为-1；那么在testing的时候，regression的output是⼀个数值，它接近1则说明它是class 1，它接近-1则说明它是class 2

假设现在我们的model是 y=b+w1x1+w2x2，input是两个feature(x1,x2)
有两个class，蓝⾊的是class 1，红⾊的是class 2，
我们希望
蓝⾊的属于class 1的宝可梦，input到Regression的model，output越接近1越好；
红⾊的属于class 2的宝可梦，input到Regression的model，output越接近-1越好。
假设我们真的找到了这个function，如图所⽰，绿⾊的线表⽰b+w1x1+w2x2=0，也就是class 1和class 2的分界线，这种情况下，值接近-1的宝可梦都集中在绿线的左上⽅，值接近1的宝可梦都集中在绿线的右下⽅，这是合理的。

但是上述现象只会出现在样本点⽐较集中地分布在output为-1和1的情况，如果像下图所⽰，显然绿线为最好的那个model的分界线
但如果将所有样本点通过Regression训练出来的model，会是紫⾊这条分界线对应的model
因为相对于绿线，它“减⼩”了由右下⻆这些点所带来的error，也就是说，regression会考虑相距分界线较远的点

也就是说，
Regression对样本分布太敏感了
假如现在负样本比较多，那么回归线将会更靠近负样本，使得正样本的预测值下降。
为了使损失函数（均方差）最小化，回归线要朝着负样本的方向移动；
即上面的的function会为了使损失函数（均方差）最小化，由绿线的位置向右下角距离较远的蓝色样本点偏移，变成紫色部分。

所以，Regression定义model好坏的定义⽅式对classification来说是不适⽤的
再简单点说，两点pass掉了regression：
1.线性回归的预测值是连续值的形式，不是概率的形式
2.对数据分布比较敏感

好的，接下来我们终于可以进入正题了！
Wait！还需要一点概率论的前置知识，当然，熟练掌握概率论的大佬请跳过

Prepositional knowledge

Generative model

终于步入正题了！

Binary Classification

首先考虑⼆元分类的问题，我们拿到⼀个input x，想要知道这个x来自于class 1或class 2的概率
这不就是我上文讲的贝叶斯公式嘛！

由图我们可以得到以下两个公式


先提一点，在这里P(C1|x)+P(C2|x)=1哟，也就是说，我们只需求一即可。
当P(C1|x)>0.5 我们就说x是属于C1的

其中P(C1),P(C2)这两个值还是比较好求的
在Training data⾥⾯，有79只⽔系，61只⼀般系
P(C1)=79/(79+61)=0.56
P(C2)=61/(79+61)=0.44

关键在于如何得到P(x|C1)和P(x|C2)

错误的想法：
假设我们的x是⼀只新来的海⻳，但是在我们79只⽔系的宝可梦training data⾥⾯根本就没有海⻳，所以挑⼀只海⻳出来的可能性根本就是0啊！

实际上，这这已有的79只⽔系宝可梦的data其实只是冰⼭⼀⻆，这些只是从一个概率密度函数中挑出来的样本，设这个概率密度函数为f(x),则
P(x|C1)=f(x)

在这里，李老师设这个概率密度函数为Gaussian,我们要通过这79个已知的样本点来找出生成这些样本点可能性最大的Gaussian,即由冰山一角推算整个冰山。

很自然的想到用极大似然估计法来估测这个Gaussian（实际上就是求μ和Σ）做法是
找出最特殊的那对μ和Σ，从它们共同决定的⾼斯函数中再次采样出79个点，使”得到的分布情况与当前已知79点的分布情况相同“这件事情发⽣的可能性最⼤

假设这79个样本独立同分布（极大似然法条件）可得到李老师如下极大似然函数

极大似然函数
实际上就是该事件发⽣的概率就等于每个点都发⽣的概率之积，我们只需要把79个点中每⼀个点的data代进去，就可以得到⼀个关于μ和Σ的函数，分别求偏导，解出微分是0的点，即使L最⼤的那组参数，便是最终的估测值，通过微分得到的⾼斯函数的 μ和Σ的最优解如下：

即μ刚好是数学期望，Σ刚好是协⽅差（这个可以当作公式来记忆）

李老师最终算的值如下：

然后其实就可以算概率进行分类了
当P(C1|x)>0.5 —— x->C1
当P(C1|x)<0.5 —— x->C2

老师把testing data上得到的结果可视化出来

注意，划重点，由刚刚两个样本分别求出来的自己的μ和Σ得到的boundary是曲线
同时，这个准确率也不好

Why？

->还记得之前的两个Error吗？
其实variance是跟input的feature size的平⽅成正⽐的，所以当feature的数量很⼤的时候，Σ⼤⼩的增⻓是可以⾮常快的，在这种情况下，给不同的Gaussian以不同的Σ（covariance matrix），会造成model的参数太多，⽽参数多会导致该model的variance过⼤，出现overfitting的现象，因此对不同的class使⽤同⼀个Σ（covariance matrix），可以有效减少参数

于是，常见的做法是：不同的 class可以share同⼀个Σ(covariance matrix),注意不同class自己的概率密度函数的μ还是不同的

此时就把μ1、μ2和共同的Σ⼀起去合成⼀个极⼤似然函数，此时可以发现，得到的 μ1、μ2和原来⼀样，还是各⾃的均值，⽽Σ则是原先两个Σ1和Σ2的加权

然后像上面那样对结果进行可视化：

惊讶的发现，不仅共用后正确率提高了而且：
没有共⽤covariance matrix——分界线：⼀条曲线；
如果共⽤covariance matrix——分界线：⼀条直线；

奇怪，这直线怎么解释呢？
我们可以把原来要求的概率形式化简一下：
表达式上下同除以分⼦，有没有觉得形式很像一个常用函数（划重点）

sigmoid function(S函数)，我们把该式设成这个函数

引入参数z，再反解z，再化简z

可以看出，当Σ1和Σ2不相等时z是一大堆复杂的式子时：
boundary(分界线)为P(x|C1)=0.5的那条线，即z=0的那条线
此时z=0显然为曲线。

但当Σ1和Σ2相等时

此时分界线z=0为一条直线。

以上就是Generative Model的分类方法，可以看出，这个方法我们先有一个预设的概率密度函数模型，然后再用极大似然法来寻找预设概率密度函数模型的参数，求出我们基于贝叶斯公式的那个概率来判断分类，那能不能我们不预设概率密度函数模型呢？能不能我们不算，自动把那个概率密度函数找出来呢？于是我们就有了分类的第二个处理手段Logistic Regression

Logistic Regression（Discriminative）

还记得上节在Gaussian的distribution下考虑class 1和class 2共⽤Σ，可以得到⼀个线性的z吗？
其实很多其他的Probability model经过化简以后也都可以得到同样的结果，这节我们就基于z为线性来展开

即用上面的贝叶斯模型，可以将求P(C1|x)的问题转化为求sigmoid(z)的问题，即转换为求z的问题，也就是求线性z函数的w和b，于是我们节的任务说白了就是找w和b

还记得我上篇提到的机器学习的三个步骤吗？
Step 1： Function set
Step 2： Goodness of a function
Step 3： Find the best function

Step 1： Function set

这⾥的function set就是Logistic Regression——逻辑回归

Step 2： Goodness of a function

像刚刚一样，我们还是要找一个最有可能生成我们这些样本点的概率密度函数概率密度函数
但这次，我们不做预设，只是简简单单的把它看作f(x)=sigmoid(z)=P(C1|x)
于是我们表示出生成这些样本点的概率（就是极大似然估计函数）

并作如下化简：

(由于class 1和class 2的概率表达式不统⼀，上⾯的式⼦⽆法写成统⼀的形式，为了统⼀格式，这⾥将Logistic Regression⾥的所有Training data都打上0和1的标签，即output y^=1 代表class 1，output y=2 代表class 2)

即我们要找的参数实际上就是：

这⾥xn表⽰第n个样本点，yn表⽰第n个样本点的class标签(1表⽰class 1,0表⽰class 2)，最终这个summation的形式，⾥⾯其实是两个Bernouli distribution(两点分布)的cross entropy(交叉熵)
交叉熵实际上表达的是希望这个function的output和它的target越接近越好

不过这个argmin你们有没有觉得眼熟呢？
还记得上文的Loss函数吗，博主感觉，这里的交叉熵就可以看作Loss函数

Step 3： Find the best function

那既然可以看作Loss函数，Find the best function的方法就直接照搬了——gradient descent

还记得上一篇的gradient descent吗？回顾一下：

因此，我们要求偏导了
Tip:sigmoid function的微分:

得到最终的结果：

首先分析下，原来update取决于三件事：

⾃⼰设定的 learning rate
来⾃于data的 xi
代表function的output跟理想target的差距有多⼤，如果离⽬标越远，update的步伐就要越⼤

其次，有没有发现这个式子有点眼熟？
我们直接放出Logistic Regression与Linear Regression的对比图

Logistic Regression VS Linear Regression

Logistic Regression和linear Regression的 update的⽅式是⼀模⼀样的！
唯⼀不⼀样的是，Logistic Regression的target 和output 都必须是在0和1之间的，
⽽linear Regression的target和output的范围可以是任意值。

还有一点值得我们注意的是，为什么Logistic Regression的Loss function不用Square error而用交叉熵呢？

Why not apply Square error?

那我们就用Square error来当Loss函数试一下呗！

通过计算可以发现用Square Error在far from target的地方，梯度也接近于0，这样就会使Loss fuction一直Stuck停滞不前,具体可以可视化如下图：

Multi-class Classification

上面无论是Generative model还是Discriminative model都是拿Binary Classification举例的，对于多元的，其实流程是一样的，不过有两个小的改变

上面二元的是采用sigmoid来分类的，三元我们采用softmax来分类：

我们把丢进⼀个softmax的function，softmax做的事情是这样三步：

取exponential，得到e^z1,e^z2, e^z3
把三个exponential累计求和，得到totalsum=Σe^zi
将total sum分别除去这三项(归⼀化)，得到 y1,y2,y3

原来的output z可以是任何值，但是做完softmax之后，你的output的值⼀定是介于0~1之间，并且它们的和⼀定是1

假设我们⽤的是Gaussian distribution(共⽤covariance)，经过⼀般推导以后可以得到softmax的function，⽽从information theory也可以推导出softmax function，Maximum entropy本质内容和Logistic Regression是⼀样的，这就跟二元是用sigmoid同理。

第二个改变是
我们在训练的时候还需要有⼀个target，因为是三个class， output是三维的，对应的target也是三维的，为了满⾜交叉熵的条件，target 也必须是probability distribution，这⾥我们不能使⽤1,2,3作为class的区分，为了保证所有class之间的关系是⼀样的，这⾥使⽤类似于one-hot编码的⽅式，即

然后接下来就是一样的流程，我就不做过多赘述了

这一章最后还有个有趣的东西，即由Limitation of Logistic Regression引出了Deep Learning

Limitation of Logistic Regression

李老师举了个例子来说明这个limitation

这个例子中，我们无法通过一条直线来分割Class1和Class2

但是，如果变化一下feature space，就能重新分个，例如
假设这⾥定义
x1’是原来的点到(0,0)之间的距离，x2’是原来的点到(1,1) 之间的距离，重新映射之后如下
图右侧(红⾊两个点重合)，此时Logistic Regression就可以把它们划分开来

然而，我们人工找这样的变换是十分困难的，我们需要用机器来找

因此着整个流程是，先⽤n个Logistic Regression做feature Transformation(n为每个样本点的feature数量)，⽣成n个新的feature，然后再⽤⼀个Logistic Regression作classifier
Logistic Regression的boundary⼀定是⼀条直线，它可以有任何的画法，但肯定是按照某个⽅向从⾼到低的等⾼线分布，具体的分布是由Logistic Regression的参数决定的，每⼀条直线都是由z=b+Σwⁱxⁱ组成的(⼆维feature的直线画在⼆维平⾯上，多维feature的直线则是画在多维空间上)
下图是⼆维feature的例⼦，分别表⽰四个点经过transform之后的x1’和x2’ ，在新的feature space中可以通过最后的Logistic Regression划分开来

Powerful Cascading Logistic Regression

通过上⾯的例⼦，我们发现，多个Logistic Regression连接起来会产⽣powerful的效果，我们把每⼀个
Logistic Regression叫做⼀个neuron(神经元)，把这些Logistic Regression串起来所形成的network，就叫做Neural Network，就是类神经⽹路，这个东西就是Deep Learning！

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
python中zeros用法_Python中的numpy.zeros()用法江平舟 python中zeros用法
numpy.zeros()函数是最重要的函数之一,广泛用于机器学习程序中。此函数用于生成包含零的数组。numpy.zeros()函数提供给定形状和类型的新数组,并用零填充。句法numpy.zeros(shape,dtype=float,order='C'参数形状：整数或整数元组此参数用于定义数组的尺寸。此参数用于我们要在其中创建数组的形状,例如(3,2)或2。dtype：数据类型(可选)此参数用于
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
【中国国际航空-注册_登录安全分析报告】风控牛验证码接口安全评测系列安全行为验证极验网易易盾智能手机
前言由于网站注册入口容易被黑客攻击，存在如下安全问题：1.暴力破解密码，造成用户信息泄露2.短信盗刷的安全问题，影响业务及导致用户投诉3.带来经济损失，尤其是后付费客户，风险巨大，造成亏损无底洞所以大部分网站及App都采取图形验证码或滑动验证码等交互解决方案，但在机器学习能力提高的当下，连百度这样的大厂都遭受攻击导致点名批评，图形验证及交互验证方式的安全性到底如何？请看具体分析一、中国国际航空PC
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
损失函数与反向传播 Star_. PyTorch pytorch 深度学习 python
损失函数定义与作用损失函数(lossfunction)在深度学习领域是用来计算搭建模型预测的输出值和真实值之间的误差。1.损失函数越小越好2.计算实际输出与目标之间的差距3.为更新输出提供依据（反向传播)常见的损失函数回归常见的损失函数有：均方差（MeanSquaredError，MSE）、平均绝对误差（MeanAbsoluteErrorLoss，MAE）、HuberLoss是一种将MSE与MAE
统一思想认识永夜-极光思想
1.统一思想认识的基础,才能有的放矢原因: 总有一种描述事物的方式最贴近本质,最容易让人理解. 如何让教育更轻松,在于找到最适合学生的方式. 难点在于,如何模拟对方的思维基础选择合适的方式. &
Joda Time使用笔记 bylijinnan java joda time
Joda Time的介绍可以参考这篇文章： http://www.ibm.com/developerworks/cn/java/j-jodatime.html 工作中也常常用到Joda Time，为了避免每次使用都查API，记录一下常用的用法： /** * DateTime变化（增减） */ @Tes
FileUtils API eksliang FileUtils FileUtils API
转载请出自出处：http://eksliang.iteye.com/blog/2217374 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
各种新兴技术不懂事的小屁孩技术
1:gradle Gradle 是以 Groovy 语言为基础，面向Java应用为主。基于DSL（领域特定语言）语法的自动化构建工具。现在构建系统常用到maven工具，现在有更容易上手的gradle，搭建java环境: http://www.ibm.com/developerworks/cn/opensource/os-cn-gradle/ 搭建android环境： http://m
tomcat6的https双向认证酷的飞上天空 tomcat6
1.生成服务器端证书 keytool -genkey -keyalg RSA -dname "cn=localhost,ou=sango,o=none,l=china,st=beijing,c=cn" -alias server -keypass password -keystore server.jks -storepass password -validity 36
托管虚拟桌面市场势不可挡蓝儿唯美
用户还需要冗余的数据中心，dinCloud的高级副总裁兼首席营销官Ali Din指出。该公司转售一个MSP可以让用户登录并管理和提供服务的用于DaaS的云自动化控制台，提供服务或者MSP也可以自己来控制。在某些情况下，MSP会在dinCloud的云服务上进行服务分层，如监控和补丁管理。 MSP的利润空间将根据其参与的程度而有所不同，Din说。 “我们有一些合作伙伴负责将我们推荐给客户作为个
spring学习——xml文件的配置 a-john spring
在Spring的学习中，对于其xml文件的配置是必不可少的。在Spring的多种装配Bean的方式中，采用XML配置也是最常见的。以下是一个简单的XML配置文件： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.or
HDU 4342 History repeat itself 模拟 aijuans 模拟
来源：http://acm.hdu.edu.cn/showproblem.php?pid=4342 题意：首先让求第几个非平方数，然后求从1到该数之间的每个sqrt(i)的下取整的和。思路：一个简单的模拟题目，但是由于数据范围大，需要用__int64。我们可以首先把平方数筛选出来，假如让求第n个非平方数的话，看n前面有多少个平方数，假设有x个，则第n个非平方数就是n+x。注意两种特殊情况，即
java中最常用jar包的用途 asia007 java
java中最常用jar包的用途 jar包用途axis.jarSOAP引擎包commons-discovery-0.2.jar用来发现、查找和实现可插入式接口，提供一些一般类实例化、单件的生命周期管理的常用方法.jaxrpc.jarAxis运行所需要的组件包saaj.jar创建到端点的点到点连接的方法、创建并处理SOAP消息和附件的方法，以及接收和处理SOAP错误的方法. w
ajax获取Struts框架中的json编码异常和Struts中的主控制器异常的解决办法百合不是茶 js json编码返回异常
一:ajax获取自定义Struts框架中的json编码出现以下问题: 1,强制flush输出 json编码打印在首页 2, 不强制flush js会解析json 打印出来的是错误的jsp页面却没有跳转到错误页面 3, ajax中的dataType的json 改为text 会
JUnit使用的设计模式 bijian1013 java 设计模式 JUnit
JUnit源代码涉及使用了大量设计模式 1、模板方法模式（Template Method）定义一个操作中的算法骨架，而将一些步骤延伸到子类中去，使得子类可以不改变一个算法的结构，即可重新定义该算法的某些特定步骤。这里需要复用的是算法的结构，也就是步骤，而步骤的实现可以在子类中完成。
Linux常用命令（摘录） sunjing crond chkconfig
chkconfig --list 查看linux所有服务 chkconfig --add servicename 添加linux服务 netstat -apn | grep 8080 查看端口占用 env 查看所有环境变量 echo $JAVA_HOME 查看JAVA_HOME环境变量安装编译器 yum install -y gcc
【Hadoop一】Hadoop伪集群环境搭建 bit1129 hadoop
结合网上多份文档，不断反复的修正hadoop启动和运行过程中出现的问题，终于把Hadoop2.5.2伪分布式安装起来，跑通了wordcount例子。Hadoop的安装复杂性的体现之一是，Hadoop的安装文档非常多，但是能一个文档走下来的少之又少，尤其是Hadoop不同版本的配置差异非常的大。Hadoop2.5.2于前两天发布，但是它的配置跟2.5.0，2.5.1没有分别。 &nb
Anychart图表系列五之事件监听白糖_ chart
创建图表事件监听非常简单：首先是通过addEventListener('监听类型',js监听方法)添加事件监听，然后在js监听方法中定义具体监听逻辑。以钻取操作为例，当用户点击图表某一个point的时候弹出point的name和value，代码如下： <script> //创建AnyChart var chart = new AnyChart(); //添加钻取操作&quo
Web前端相关段子 braveCS web前端
Web标准：结构、样式和行为分离使用语义化标签 0）标签的语义：使用有良好语义的标签，能够很好地实现自我解释，方便搜索引擎理解网页结构，抓取重要内容。去样式后也会根据浏览器的默认样式很好的组织网页内容，具有很好的可读性，从而实现对特殊终端的兼容。 1）div和span是没有语义的：只是分别用作块级元素和行内元素的区域分隔符。当页面内标签无法满足设计需求时，才会适当添加div
编程之美-24点游戏 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Arrays; import java.util.HashSet; import java.util.List; import java.util.Random; import java.util.Set; public class PointGame { /**编程之美
主页面子页面传值总结 chengxuyuancsdn 总结
1、showModalDialog returnValue是javascript中html的window对象的属性,目的是返回窗口值,当用window.showModalDialog函数打开一个IE的模式窗口时,用于返回窗口的值主界面 var sonValue=window.showModalDialog("son.jsp"); 子界面 window.retu
[网络与经济]互联网+的含义 comsci 互联网+
互联网+后面是一个人的名字 = 网络控制系统互联网+你的名字 = 网络个人数据库每日提示:如果人觉得不舒服,千万不要外出到处走动,就呆在床上,玩玩手游,更不能够去开车,现在交通状况不
oracle 创建视图 with check option daizj 视图 view oralce
我们来看下面的例子： create or replace view testview as select empno,ename from emp where ename like ‘M%’ with check option; 这里我们创建了一个视图，并使用了with check option来限制了视图。然后我们来看一下视图包含的结果： select * from testv
ToastPlugin插件在cordova3.3下使用 dibov Cordova
自己开发的Todos应用，想实现“ 再按一次返回键退出程序 ”的功能，采用网上的ToastPlugins插件，发现代码或文章基本都是老版本，运行问题比较多。折腾了好久才弄好。下面吧基于cordova3.3下的ToastPlugins相关代码共享。 ToastPlugin.java package&nbs
C语言22个系统函数 dcj3sjt126com c function
C语言系统函数一、数学函数下列函数存放在math.h头文件中Double floor(double num) 求出不大于num的最大数。Double fmod(x, y) 求整数x/y的余数。Double frexp(num, exp); double num; int *exp; 将num分为数字部分（尾数）x和以2位的指数部分n，即num=x*2n，指数n存放在exp指向的变量中，返回x。D
开发一个类的流程 dcj3sjt126com 开发
本人近日根据自己的开发经验总结了一个类的开发流程。这个流程适用于单独开发的构件，并不适用于对一个项目中的系统对象开发。开发出的类可以存入私人类库，供以后复用。以下是开发流程： 1. 明确类的功能，抽象出类的大概结构 2. 初步设想类的接口 3. 类名设计（驼峰式命名） 4. 属性设置(权限设置) 判断某些变量是否有必要作为成员属
java 并发 shuizhaosi888 java 并发
能够写出高伸缩性的并发是一门艺术在JAVA SE5中新增了3个包 java.util.concurrent java.util.concurrent.atomic java.util.concurrent.locks 在java的内存模型中，类的实例字段、静态字段和构成数组的对象元素都会被多个线程所共享，局部变量与方法参数都是线程私有的，不会被共享。
Spring Security（11）——匿名认证 234390216 Spring Security ROLE_ANNOYMOUS 匿名
匿名认证目录 1.1 配置 1.2 AuthenticationTrustResolver 对于匿名访问的用户，Spring Security支持为其建立一个匿名的AnonymousAuthenticat
NODEJS项目实践0.2[ express,ajax通信...] 逐行分析JS源代码 Ajax nodejs express
一、前言通过上节学习，我们已经 ubuntu系统搭建了一个可以访问的nodejs系统，并做了nginx转发。本节原要做web端服务及 mongodb的存取，但写着写着，web端就
在Struts2 的Action中怎样获取表单提交上来的多个checkbox的值 lhbthanks java html struts checkbox
第一种方法：获取结果String类型在 Action 中获得的是一个 String 型数据，每一个被选中的 checkbox 的 value 被拼接在一起，每个值之间以逗号隔开(,)。所以在 Action 中定义一个跟 checkbox 的 name 同名的属性来接收这些被选中的 checkbox 的 value 即可。以下是实现的代码：前台 HTML 代码：
003.Kafka基本概念 nweiren hadoop kafka
Kafka基本概念：Topic、Partition、Message、Producer、Broker、Consumer。 Topic：消息源（Message）的分类。 Partition： Topic物理上的分组，一
Linux环境下安装JDK roadrunners jdk linux
1、准备工作创建JDK的安装目录： mkdir -p /usr/java/ 下载JDK，找到适合自己系统的JDK版本进行下载： http://www.oracle.com/technetwork/java/javase/downloads/index.html 把JDK安装包下载到/usr/java/目录，然后进行解压： tar -zxvf jre-7
Linux忘记root密码的解决思路 tomcat_oracle linux
1：使用同版本的linux启动系统，chroot到忘记密码的根分区passwd改密码　　2：grub启动菜单中加入init=/bin/bash进入系统，不过这时挂载的是只读分区。根据系统的分区情况进一步判断. 　　3: grub启动菜单中加入 single以单用户进入系统. 　　4:用以上方法mount到根分区把/etc/passwd中的root密码去除　　例如: 　　ro
跨浏览器 HTML5 postMessage 方法以及 message 事件模拟实现 xueyou jsonp jquery 框架 UI html5
postMessage 是 HTML5 新方法，它可以实现跨域窗口之间通讯。到目前为止，只有 IE8+, Firefox 3, Opera 9, Chrome 3和 Safari 4 支持，而本篇文章主要讲述 postMessage 方法与 message 事件跨浏览器实现。postMessage 方法 JSONP 技术不一样，前者是前端擅长跨域文档数据即时通讯，后者擅长针对跨域服务端数据通讯，p

独家思维导图！让你秒懂李宏毅2020机器学习（二）—— Classification分类

独家思维导图！让你秒懂李宏毅2020机器学习（二）—— Classification分类

文章目录

Classification

概念描述

特征数值化

How to classification

Why not apply Regression?

Prepositional knowledge

Generative model

Binary Classification

Logistic Regression（Discriminative）

Step 1： Function set

Step 2： Goodness of a function

Step 3： Find the best function

Logistic Regression VS Linear Regression

Why not apply Square error?

Multi-class Classification

Limitation of Logistic Regression

Powerful Cascading Logistic Regression

你可能感兴趣的:(深度学习,机器学习,人工智能,深度学习)