自学AI的鲨鱼儿

SVM 支持向量机

一、SVM基础知识

1、SVM知识回顾

（1）梯度下降法

1、梯度下降法：
    1.1、算法目的：求凸函数极值（最值）
    1.2、适用场景：目标函数必须是凸函数（数学上称作下凹函数）
    1.3、梯度下降的公式：x1 = x1 - α * df(x1)
    1.4、BGD、SGD、MSGD的关系：
        • 当样本量为m的时候，每次迭代BGD算法中对于参数值更新一次，SGD 算法中对于参数值更新m次，MBGD算法中对于参数值
          更新m/n次，相对 来讲SGD算法的更新速度最快； 
        • SGD算法中对于每个样本都需要更新参数值，当样本值不太正常的时候， 就有可能会导致本次的参数更新会产生相反的影
          响，也就是说SGD算法的 结果并不是完全收敛的，而是在收敛结果处波动的； 
        • SGD算法是每个样本都更新一次参数值，所以SGD算法特别适合样本数 据量大的情况以及在线机器学习(Online ML)。

    1.5、梯度下降的调优：
        • 学习率的选择：学习率过大，表示每次迭代更新的时候变化比较大，有可能会跳过最优解；学 习率过小，表示每次迭代更
          新的时候变化比较小，就会导致迭代速度过慢，很长时间都不能结 束； 
        • 算法初始参数值的选择：初始值不同，最终获得的最小值也有可能不同，因为梯度下降法求解 的是局部最优解，所以一般
          情况下，选择多次不同初始值运行算法，并最终返回损失函数最小 情况下的结果值； 
        • 标准化：由于样本不同特征的取值范围不同，可能会导致在各个不同参数上迭代速度不同，为 了减少特征取值的影响，可
          以将特征进行标准化操作。

问题一：梯度与切线、法向向量的关系

pass

问题二：BGD、SGD、MBGD

（2）拉格朗日乘子法

1、目的：求解有约束条件函数的极值问题
2、分类：等式条件约束、不等式条件约束（KKT条件）

等式条件约束函数求极值

pass

不等式条件约束函数求极值

KKT条件，详情下文

2、对偶问题的概念

3、KKT条件

1、KKT条件的用途： KKT条件是泛拉格朗日乘子法的一种形式；主要应用在当我们的优化函数存在不等值约束的情况下的一种最优
    化求解方式；

（1）KKT条件构造拉格朗日函数

（2）KKT条件理解

理解：

（3）不等式条件拉格朗日函数计算方法

基本原理公式：

优化后：

最终结果：

（4）KKT条件的总结：

（5）KKT条件转换等式拉格朗日函数的步骤

2、高中距离知识回顾

二、感知器模型

https://blog.csdn.net/m0_37306360/article/details/79885858 ---------- 感知机详解

1、数据线性可分：感知器模型寻找的就是一个超平面，能够把所有的二元类别分割开（允许有错误样本）。

1、感知器算法的概念：最古老的分类算法之一，原理比较简单，不过模型的分类泛化 能力比较弱，不过感知器模型是SVM、神经网络
   、深度学习等算法的基础。
2、感知器算法：只能做二分类问题，
3、感知器算法应用场景：用于线性可分数据（可以包含噪声点）
4、预测结果只有两种，决策函数 θX < 0  预测值 为 +1，θX > 0 预测值为 -1  
5、注意：感知模型求出的超平面并不是唯一的，SVM算法就是求得支持向量数据点间隔最大的超平面

感知器模型损失函数

理解：

感知器模型损失函数求极值：SGD求解

三、SVM 算法（线性可分数据）

1、SVM算法使用场景：线性分类和非线性分 类的分类应用，并且也能够直接将SVM应用于回归应用中同时通过OvR 或者OvO的方式
    我们也可以将SVM应用在多元分类领域中。

1、线性可分SVM

1、SVM的本质：寻找支持向量数据点间隔距离最大的超平面
2、SVM间隔距离最大的目的：提高模型的泛化能力，即提高模型的鲁棒性（防止过拟合）
3、SVM分割数据的方法：我们只要让离超平面比较近的点 尽可能的远离这个超平面(找一个最大间隔的超平面)，

• 线性可分(Linearly Separable)：在数据集中，如果可以找出一个超平 面，将两组数据分开，那么这个数据集叫做线性可分数据。 
• 线性不可分(Linear Inseparable)：在数据集中，没法找出一个超平面， 能够将两组数据分开，那么这个数据集就叫做线性不可
  分数据。 
• 分割超平面(Separating Hyperplane)：将数据集分割开来的直线/平 面叫做分割超平面。 
• 支持向量(Support Vector)：离分割超平面最近的那些点叫做支持向量。 
• 间隔(Margin)：支持向量数据点到分割超平面的距离称为间隔。

2、SVM损失函数的推导过程

理解：

获取损失函数

3、SVM损失函数求解方法

（1）使用KKT条件

（2）优化计算方法

第一步：求模型参数一阶导数，β看做常数

注意：w是权重系数向量，是一个列向量

理解：

第二步：将 w最小值代入拉格朗日函数中

（3）获得loss函数

由 β >>>>> w,b值

（4）线性可分SVM算法流程

理解：β > 0 >>>>>> 支持向量机的样本

（5）例题

理解：

4、线性SVM算法的总结

• 1. 要求数据必须是线性可分的； 
• 2. 纯线性可分的SVM模型对于异常数据的预测可能会不太准； 
• 3. 对于线性可分的数据，线性SVM分类器的效果非常不错。

四、带有异常数据的线性数据的SVM算法

1、带有异常数据的线性数据：该数据是线性数据，即 本可以 可用 wx + b 的超平面将数据分隔开，但是由于数        
     据中存在异常噪声数据，导致不能用一个超平面分开。
2、注意：带有异常数据的线性数据 虽说是线性数据，但它是线性不可分的，因为他无法用硬间隔的方式分隔数据模型的准确率是 100% 。

1、SVM的软间隔模型

1、硬间隔：上文中线性可分的数据的超平面就是一个硬间隔，它表示极其严格的划分，必须保证准确率  100% 。
2、软件隔：对于训练集的每一个样本都加入一个松弛因子，使得每个样到超平面的函数距离 >= 1，这样模型对超平面的选取就松弛了
    （即允许出现分割误差）。

（1）松弛因子

松弛因子理解：

（2）SVM的软间隔模型 LOSS函数推导

不等式约束条件

1、C越小，表示模型越允许分割错误，即支持向量的样本数更多（| wx + b <= 1 |）    ------ 仅仅在skearn 库代码中；
    而数学公式中 认为 y(wx + b) = 1 是支持向量样本

基于KKT条件转化等式的拉格朗日函数求极值问题

过程一

过程二

（3）SVM的软间隔模型的 LOSS 函数

（4）SVM的软间隔模型

理解：

（5）SVM的软间隔模型算法流程

（6）SVM的软间隔模型总结

• 1. 可以解决线性数据中携带异常点的分类模型构建的问题； 
• 2. 通过引入惩罚项系数(松弛因子)，可以增加模型的泛化能力，即鲁棒性； 
• 3. 如果给定的惩罚项系数C越小，表示在模型构建的时候，就允许存在越多 的分类错误的样本， 也就表示此时模型的准确率
    会比较低；如果惩罚项系数 越大，表示在模型构建的时候，就越不允许存在分类错误的样本，也就表示 此时模型的准确率
    会比较高。
------------------------------------------------------------------------------------------
• 4. 软间隔与硬间隔模型 都是线性SVM模型      ----------------- 线性模型SVM 可以获得 权重系数和截距项。

五、非线性数据的SVM算法

1、非线性数据：在当前维度数据不存在明显的线性映射关系（wx + b）
2、不管是线性可分SVM还是加入惩罚系数后的软间隔线性可分SVM其实都要 求数据本身是线性可分的，对于完全不可以线性可分
    的数据，这两种算法模 型就没法解决这个问题了

1、多项式扩展的回顾

1、多项式扩展的本质：低维空间中 线性关系较弱数据，将其映射到高维空间中后，变成了 线性关系较强的数据。
2、多项式扩展的作用：一定程度解决欠拟合问题。

2、非线性可分SVM 算法的思想

1、将低维的线性关系较弱的数据通过多项式扩展转化为高维线性关系较强的数据，从而就可以使用线性可分SVM模型或者软间隔线性
    可分SVM模型。

3、非线性可分SVM 算法LOSS函数

4、非线性可分SVM 算法多项式扩展的局限性

1、拿到非线性数据，就找一个映射， 然后一股脑把原来的数据映射到新空间中，再做线性 SVM 即可。不过事 实上没有这么简单！
    其实刚才的方法稍想一下就会发现有问题：在最初 的例子里做了一个二阶多项式的转换，对一个二维空间做映射，选择的 新空
    间是原始空间的所有一阶和二阶的组合，得到了5个维度；如果原始 空间是三维，那么我们会得到9维的新空间；如果原始空间是
    n维，那么 我们会得到一个n(n+3)/2维的新空间；这个数目是呈爆炸性增长的，这 给计算带来了非常大的困难，而且如果遇到无
    穷维的情况，就根本无从 计算。

5、非线性可分SVM的核函数

1、核函数的基本思想：由于多项式扩展数据特征属性的维度后，LOSS损失函数的计算方法不变，只是需要计算特征属性扩展后的
    特征向量的点积，因此可以定义一个函数（自变量是原数据的特征属性向量 x.T 与 x），用其函数值来代替高维的特征属性
    向量点积。
2、核函数的本质：用低维的特征向量函数值来代替高维特征向量的内积值，已达到用低维度的计算量来近似得到高维度扩展的效果。 
    通过核函数，可以将非线性可分的数据转换为线性可分数据来进行SVM划分
3、注意：带有核函数的非线性SVM算法本质上没有扩展维度，因此并不能获取 模型的权重系数和截距项。

（1）核函数的定义

（2）核函数的理解

（3）常见的核函数

（4）核函数总结

（5）不同核函数的效果

六、SMO算法

1、SMO算法：序列最小优化算法(Sequential minimal optimization, SMO)是一种用于解决 SVM训练过程中所产生的优化问题
    的算法           ------------ 目的：求使得目标函数最小时的β
2、SMO算法的思想：
    • 从而可以得到解决问题的思路如下： 
        • 首先，初始化后一个β值，让它满足对偶问题的两个初始限制条件； 
        • 然后不断优化这个β值，使得由它确定的分割超平面满足g(x)目标条件； 而且在优化过程中，始终保证β值满足初始限
          制条件。 
    • 备注：这个求解过程中，和传统的思路不太一样，不是对目标函数求最小值，而是让g(x)目标条件尽可能的满足，且每一
          次迭代都使得目标函数不断减小

    • 因为目标函数中存在m个变量，直接优化比较难，利用启发式的 方法/EM算法的思想，每次优化的时候，只优化两个变量，将
      其它的变量看成常数项，这 样SMO算法就将一个复杂的优化算法转换为一个比较简单的两变量优化问题了。

SMO算法两个基本原则：
    • 每次优化的时候，必须同时优化β的两个分量（优化两个分量是为了满足初始化条件，因为如果只优化一个分量的话，新的β值
      就没法满足初始限制条件中的等式约束条件了。而优化多个分量计算量较大）。
    • 每次优化的两个分量应该是违反g(x)目标条件比较多的（即 | E1 - E2 | 最大的）。也就是说，本来应当是大于等于1的，
      越是小于1违反g(x)目标条件就越多。

β初始值的定义

1、β的初始值通常将所有的正例样本计数m，所有负例样本计数n，则正例样本β的初始值为x/m （x是0<= β <= C间的一个值），负例样
    本β的初始值为x/n

1、SMO算法的推导过程

（1）基本知识

（2）SMO算法的目标条件

（3）SMO算法结果公式

（4）例题

七、SVM回归算法的理解

1、SVM回归算法SVR

1、SVR原理理解：
    1.1、给定误差ε，寻找支持向量（使得支持向量到超平面的间隔最大(相比于分类SVC，SVR寻找的是较远的点作为支持向量)），并
        且使得大部分的样本尽量离超平面较近，即处于支持向量与超平面之间。
    1.2、当数据不能达到上诉条件时，我们也可以用SVC中软间隔的思想。

2、SVR的不等式约束

（1）未加松弛因子

（2）加松弛因子

3、KKT条件的朗日函数

4、SVR的LOSS函数

八、SVM API 使用

1、线性的SVM（LinearSVC、LinearSVR）

利用liblinear实现回归的可扩展线性支持向量机

class sklearn.svm.LinearSVC(penalty='l2', loss='squared_hinge', dual=True, tol=0.0001, 
    C=1.0, multi_class='ovr', fit_intercept=True, intercept_scaling=1, class_weight=None, 
    verbose=0, random_state=None, max_iter=1000)
'''
        C=1.0                           松弛因子系数
        penalty='l2'                    线性回归的正则项
        loss='squared_hinge'            损失函数
        tol=0.0001                      容忍停止标准
        multi_class='ovr'               多分类
        max_iter=1000                   要运行的最大迭代次数。
'''

class sklearn.svm.LinearSVR(epsilon=0.0, tol=0.0001, C=1.0, loss='epsilon_insensitive', 
    fit_intercept=True, intercept_scaling=1.0, dual=True, verbose=0, random_state=None, 
    max_iter=1000)

'''
        epsilon=0.0                         ---------- 回归允许误差
        tol = 0.0001
        C = 1.0
        loss ='epsilon_insensitive'  'epsilon_insensitive'或'squared_epsilon_insensitive'
                                     损失函数（默认是）epsilon_insensitive，'l1'是epsilon不        
                                     敏感的损失（标准SVR），而'l2'是平方的epsilon不敏感的损失。
               
        fit_intercept = True
'''

2、带有核函数的SVM（SVC，SVR）

（1）SVC、SVR

from sklearn import tree
from sklearn.preprocessing import LabelEncoder
from sklearn.metrics import classification_report
from sklearn.externals import joblib
from sklearn.svm import SVC

--------------------------------------------------------------------------------------------
class sklearn.svm.SVC(C=1.0, kernel='rbf', degree=3, gamma='auto', coef0=0.0, 
    shrinking=True, probability=False, tol=0.001, cache_size=200, class_weight=None, 
    verbose=False, max_iter=-1, decision_function_shape=None, random_state=None)
 """
        C: 惩罚性系数，C值越大，表示越不允许模型在训练数据上出错，也就是模型容易导致过拟合
        kernel：核函数，可选值：poly、rbf、linear，一般选择默认rbf即可。
        gamma：gamma反映了做rbf核函数的时候，映射到高维空间中的特征分布情况。gamma值越小，模型的泛化能力越强(测试)，
            但是过小的话，就会退化成为线性的SVM模型，gamma值越大，就表示越关注样本附件的样本数据点，模型会更多的关注细节
            信息，也就是理论上来讲，当gamma足够大的时候，可以让模型拟合任意非线性数据(训练)。
        probability: 是否计算概率值，默认是不计算概率值。
        degree    多项式核函数的次数（'poly'）。被所有其他内核忽略。
        coef0     核函数中的独立项。它只在'poly'和'sigmoid'中很重要
        tol       容忍停止标准
        max_iter=-1          求解器内迭代的硬限制，或无限制的-1。  

    NOTE: 有的时候为了比较好的均衡过拟合以及欠拟合的情况，一般选择C值比较大，gamma比较小的值。如果模型过拟合，减小C
            值或者减小gamma值; 如果模型欠拟合，增大C或者gamma值。一般情况下，取值范围:[1e-6,1e-5,1e-4,1e-3,1e-2,
            1e-1,1.0,10.0100.0]
    NOTE: gamma值越大，支持向量越少，gamma值越小的，支持向量越多。

 """

class sklearn.svm.SVR(kernel='rbf', degree=3, gamma='auto', coef0=0.0, tol=0.001, C=1.0, 
    epsilon=0.1, shrinking=True, cache_size=200, verbose=False, max_iter=-1)
'''
        epsilon=0.1                         ---------- 回归允许误差
'''

（2）支持向量机用于使用libsvm

支持向量机用于使用libsvm实现的回归，使用参数来控制支持向量的数量。

--------------------------------------------------------------------------------------------
class sklearn.svm.NuSVC(nu=0.5, kernel='rbf', degree=3, gamma='auto', coef0=0.0, 
    shrinking=True, probability=False, tol=0.001, cache_size=200, class_weight=None, 
    verbose=False, max_iter=-1, decision_function_shape=None, random_state=None)
'''
        nu=0.5             作用相当于SVC、SVR中的 参数C
'''

class sklearn.svm.NuSVR(nu=0.5, C=1.0, kernel='rbf', degree=3, gamma='auto', coef0=0.0,     
    shrinking=True, tol=0.001, cache_size=200, verbose=False, max_iter=-1)

（3）选取异常样本SVM

1、作用相当于集成学习中的 IF 算法        ------------- 用于检测异常样本

class sklearn.svm.OneClassSVM(kernel='rbf', degree=3, gamma='auto', coef0=0.0, tol=0.001, 
    nu=0.5, shrinking=True, cache_size=200, verbose=False, max_iter=-1, random_state=None)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
python中zeros用法_Python中的numpy.zeros()用法江平舟 python中zeros用法
numpy.zeros()函数是最重要的函数之一,广泛用于机器学习程序中。此函数用于生成包含零的数组。numpy.zeros()函数提供给定形状和类型的新数组,并用零填充。句法numpy.zeros(shape,dtype=float,order='C'参数形状：整数或整数元组此参数用于定义数组的尺寸。此参数用于我们要在其中创建数组的形状,例如(3,2)或2。dtype：数据类型(可选)此参数用于
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
【中国国际航空-注册_登录安全分析报告】风控牛验证码接口安全评测系列安全行为验证极验网易易盾智能手机
前言由于网站注册入口容易被黑客攻击，存在如下安全问题：1.暴力破解密码，造成用户信息泄露2.短信盗刷的安全问题，影响业务及导致用户投诉3.带来经济损失，尤其是后付费客户，风险巨大，造成亏损无底洞所以大部分网站及App都采取图形验证码或滑动验证码等交互解决方案，但在机器学习能力提高的当下，连百度这样的大厂都遭受攻击导致点名批评，图形验证及交互验证方式的安全性到底如何？请看具体分析一、中国国际航空PC
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
七.正则化愿风去了
吴恩达机器学习之正则化（Regularization）http://www.cnblogs.com/jianxinzhou/p/4083921.html从数学公式上理解L1和L2https://blog.csdn.net/b876144622/article/details/81276818虽然在线性回归中加入基函数会使模型更加灵活，但是很容易引起数据的过拟合。例如将数据投影到30维的基函数上，模
机器学习-------数据标准化罔闻_spider 数据分析算法机器学习人工智能
什么是归一化，它与标准化的区别是什么？一作用在做训练时，需要先将特征值与标签标准化，可以防止梯度防炸和过拟合；将标签标准化后，网络预测出的数据是符合标准正态分布的—StandarScaler()，与真实值有很大差别。因为StandarScaler()对数据的处理是（真实值-平均值）/标准差。同时在做预测时需要将输出数据逆标准化提升模型精度：标准化/归一化使不同维度的特征在数值上更具比较性，提高分类
分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统 spark大数据毕设项目（源码、调试、LW、开题、PPT) 计算机源码社 Python项目大数据大数据 python hadoop 计算机毕业设计选题计算机毕业设计源码数据分析 spark毕设
作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
使用最大边际相关性(MMR)选择示例：提高AI模型的多样性和相关性 aehrutktrjk 人工智能 easyui 前端 python
使用最大边际相关性(MMR)选择示例：提高AI模型的多样性和相关性引言在机器学习和自然语言处理领域，选择合适的训练示例对模型性能至关重要。最大边际相关性(MaximalMarginalRelevance,MMR)是一种优秀的示例选择方法，它不仅考虑了示例与输入的相关性，还注重保持所选示例之间的多样性。本文将深入探讨如何使用MMR来选择示例，以提高AI模型的性能和泛化能力。什么是最大边际相关性(MM
LangChain集成指南:如何利用多样化的AI提供商 aehrutktrjk 人工智能 langchain python
LangChain集成指南:如何利用多样化的AI提供商引言在人工智能和机器学习领域,LangChain已成为一个强大而灵活的框架,允许开发者轻松集成各种AI服务提供商。本文将深入探讨LangChain的集成能力,介绍如何利用不同的AI提供商来增强你的应用程序,并提供实用的代码示例。LangChain集成概览LangChain支持多种AI提供商的集成,这些集成可以分为两类:独立包集成:这些提供商有独
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
【机器学习与R语言】1-机器学习简介苹果酱0567 面试题汇总与解析 java 中间件开发语言 spring boot 后端
1.基本概念机器学习：发明算法将数据转化为智能行为数据挖掘VS机器学习：前者侧重寻找有价值的信息，后者侧重执行已知的任务。后者是前者的先期准备过程：数据——>抽象化——>一般化。或者：收集数据——推理数据——归纳数据——发现规律抽象化：训练：用一个特定模型来拟合数据集的过程用方程来拟合观测的数据：观测现象——数据呈现——模型建立。通过不同的格式来把信息概念化一般化：一般化：将抽象化的知识转换成可用
Python前沿技术：机器学习与人工智能 4.0啊 Python 人工智能 python 机器学习
Python前沿技术：机器学习与人工智能一、引言随着科技的飞速发展，机器学习和人工智能（AI）已经成为了计算机科学领域的热门话题。Python作为一门易学易用且功能强大的编程语言，已经成为了这两个领域的首选语言之一。本文将深入探讨Python在机器学习和人工智能领域的应用，以及一些前沿技术和工具。二、Python机器学习基础2.1机器学习概述机器学习是人工智能（AI）的一个关键子集，它的核心在于让
chatgpt赋能python：如何在Python中计算平均值 tulingtest ChatGpt python chatgpt numpy 计算机
如何在Python中计算平均值计算平均值是数据分析、统计和机器学习等许多领域中的常见任务。Python作为一门功能强大且易于学习的编程语言，为计算平均值提供了多种方法。在本文中，我们将介绍如何在Python中计算平均值。什么是平均值简单来说，平均值是一组数字的总和除以数字的数量。例如，对于数字序列1，3，5，7，9，平均值是(1+3+5+7+9)/5=5。平均值在数据分析中非常有用，因为它可以提供
Python 初学者入门必知： Anaconda是什么？有什么作用？怎么使用？懒大王爱吃狼 Python基础 python 开发语言 python基础 python学习 anaconda anaconda安装 python教程
初学者在学习Python时，经常看到的一个名字是Anaconda。究竟什么是Anaconda，为什么它如此受欢迎？在这篇文章中，我们将探讨Anaconda，了解Anaconda的从安装到使用的。Anaconda是一个免费开源的Python和R编程发行版，包含上千个适用于数据科学和机器学习的包。同时，配备了Spyder和Jupyternotebook等工具，初学者可以使用它们来学习Python，使用
每天五分钟玩转深度学习PyTorch：模型参数优化器torch.optim 幻风_huanfeng 深度学习框架pytorch 深度学习 pytorch 人工智能神经网络机器学习优化算法
本文重点在机器学习或者深度学习中，我们需要通过修改参数使得损失函数最小化(或最大化)，优化算法就是一种调整模型参数更新的策略。在pytorch中定义了优化器optim，我们可以使用它调用封装好的优化算法，然后传递给它神经网络模型参数，就可以对模型进行优化。本文是学习第6步(优化器)，参考链接pytorch的学习路线随机梯度下降算法在深度学习和机器学习中，梯度下降算法是最常用的参数更新方法，它的公式
一切皆是映射：AI的去中心化：区块链技术的融合 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
一切皆是映射：AI的去中心化：区块链技术的融合作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词：AI，区块链，去中心化，智能合约，共识机制，数据安全，隐私保护，分布式账本技术，机器学习，数据隐私1.背景介绍1.1问题的由来随着人工智能（AI）技术的快速发展，其在各个领域的应用越来越广泛，从自动驾驶、智能医疗到金融服务，AI正在改变着我们的生活。
第五届核磁机器学习班（训练营：2023.6.5~6.17）茗创科技
茗创科技专注于脑科学数据处理，涵盖（EEG/ERP,fMRI,结构像,DTI,ASL,FNIRS）等，欢迎留言讨论及转发推荐，也欢迎了解茗创科技的脑电课程，数据处理服务及脑科学工作站销售业务，可添加我们的工程师（微信号MCKJ-zhouyi或17373158786）咨询。★课程简介★基于血氧水平依赖的功能磁共振成像(fMRI)技术,利用其数据构建的功能性脑网络后,发现脑并不是一个单纯对外界刺激进行
如何有效的学习AI大模型？ Python程序员罗宾学习人工智能语言模型自然语言处理架构
学习AI大模型是一个系统性的过程，涉及到多个学科的知识。以下是一些建议，帮助你更有效地学习AI大模型：基础知识储备：数学基础：学习线性代数、概率论、统计学和微积分等，这些是理解机器学习算法的数学基础。编程技能：掌握至少一种编程语言，如Python，因为大多数AI模型都是用Python实现的。理论学习：机器学习基础：了解监督学习、非监督学习、强化学习等基本概念。深度学习：学习神经网络的基本结构，如卷
scala的option和some 矮蛋蛋编程 scala
原文地址： http://blog.sina.com.cn/s/blog_68af3f090100qkt8.html 对于学习 Scala 的 Java™ 开发人员来说，对象是一个比较自然、简单的入口点。在本系列前几期文章中，我介绍了 Scala 中一些面向对象的编程方法，这些方法实际上与 Java 编程的区别不是很大。我还向您展示了 Scala 如何重新应用传统的面向对象概念，找到其缺点
NullPointerException Cb123456 android BaseAdapter
java.lang.NullPointerException: Attempt to invoke virtual method 'int android.view.View.getImportantForAccessibility()' on a null object reference 出现以上异常.然后就在baidu上
PHP使用文件和目录天子之骄 php文件和目录读取和写入 php验证文件 php锁定文件
PHP使用文件和目录 1.使用include()包含文件 (1)：使用include()从一个被包含文档返回一个值 (2)：在控制结构中使用include() include_once()函数需要一个包含文件的路径，此外，第一次调用它的情况和include()一样，如果在脚本执行中再次对同一个文件调用，那么这个文件不会再次包含。在php.ini文件中设置
SQL SELECT DISTINCT 语句何必如此 sql
SELECT DISTINCT 语句用于返回唯一不同的值。 SQL SELECT DISTINCT 语句在表中，一个列可能会包含多个重复值，有时您也许希望仅仅列出不同（distinct）的值。 DISTINCT 关键词用于返回唯一不同的值。 SQL SELECT DISTINCT 语法 SELECT DISTINCT column_name,column_name F
java冒泡排序 3213213333332132 java 冒泡排序
package com.algorithm; /** * @Description 冒泡 * @author FuJianyong * 2015-1-22上午09:58:39 */ public class MaoPao { public static void main(String[] args) { int[] mao = {17,50,26,18,9,10
struts2.18 +json,struts2-json-plugin-2.1.8.1.jar配置及问题！ 7454103 DAO spring Ajax json qq
struts2.18 出来有段时间了！（貌似是稳定版）闲时研究下下！貌似 sruts2 搭配 json 做 ajax 很吃香！实践了下下！不当之处请绕过！呵呵网上一大堆 struts2+json 不过大多的json 插件都是 jsonplugin.34.jar strut
struts2 数据标签说明 darkranger jsp bean struts servlet Scheme
数据标签主要用于提供各种数据访问相关的功能，包括显示一个Action里的属性，以及生成国际化输出等功能数据标签主要包括： action ：该标签用于在JSP页面中直接调用一个Action，通过指定executeResult参数，还可将该Action的处理结果包含到本页面来。 bean ：该标签用于创建一个javabean实例。如果指定了id属性，则可以将创建的javabean实例放入Sta
链表.简单的链表节点构建 aijuans 编程技巧
/*编程环境WIN-TC*/ #include "stdio.h" #include "conio.h" #define NODE(name, key_word, help) \ Node name[1]={{NULL, NULL, NULL, key_word, help}} typedef struct node { &nbs
tomcat下jndi的三种配置方式 avords tomcat
jndi(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。命名服务将名称和对象联系起来，使得我们可以用名称访问对象。目录服务是一种命名服务，在这种服务里，对象不但有名称，还有属性。 tomcat配置
关于敏捷的一些想法 houxinyou 敏捷
从网上看到这样一句话：“敏捷开发的最重要目标就是：满足用户多变的需求，说白了就是最大程度的让客户满意。” 感觉表达的不太清楚。感觉容易被人误解的地方主要在“用户多变的需求”上。第一种多变，实际上就是没有从根本上了解了用户的需求。用户的需求实际是稳定的，只是比较多，也比较混乱，用户一般只能了解自己的那一小部分，所以没有用户能清楚的表达出整体需求。而由于各种条件的，用户表达自己那一部分时也有
富养还是穷养，决定孩子的一生 bijian1013 教育人生
是什么决定孩子未来物质能否丰盛？为什么说寒门很难出贵子，三代才能出贵族？真的是父母必须有钱，才能大概率保证孩子未来富有吗？-----作者：@李雪爱与自由事实并非由物质决定，而是由心灵决定。一朋友富有而且修养气质很好，兄弟姐妹也都如此。她的童年时代，物质上大家都很贫乏，但妈妈总是保持生活中的美感，时不时给孩子们带回一些美好小玩意，从来不对孩子传递生活艰辛、金钱来之不易、要懂得珍惜
oracle 日期时间格式转化征客丶 oracle
oracle 系统时间有 SYSDATE 与 SYSTIMESTAMP； SYSDATE：不支持毫秒，取的是系统时间； SYSTIMESTAMP：支持毫秒，日期，时间是给时区转换的，秒和毫秒是取的系统的。日期转字符窜：一、不取毫秒： TO_CHAR(SYSDATE, 'YYYY-MM-DD HH24:MI:SS') 简要说明， YYYY 年 MM 月
【Scala六】分析Spark源代码总结的Scala语法四 bit1129 scala
1. apply语法 FileShuffleBlockManager中定义的类ShuffleFileGroup，定义： private class ShuffleFileGroup(val shuffleId: Int, val fileId: Int, val files: Array[File]) { ... def apply(bucketId
Erlang中有意思的bug bookjovi erlang
代码中常有一些很搞笑的bug，如下面的一行代码被调用两次（Erlang beam） commit f667e4a47b07b07ed035073b94d699ff5fe0ba9b Author: Jovi Zhang <[email protected]> Date: Fri Dec 2 16:19:22 2011 +0100 erts:
移位打印10进制数转16进制-2008-08-18 ljy325 java 基础
/** * Description 移位打印10进制的16进制形式 * Creation Date 15-08-2008 9:00 * @author 卢俊宇 * @version 1.0 * */ public class PrintHex { // 备选字符 static final char di
读《研磨设计模式》-代码笔记-组合模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; abstract class Component { public abstract void printStruct(Str
利用cmd命令将.class文件打包成jar chenyu19891124 cmd jar
cmd命令打jar是如下实现：在运行里输入cmd，利用cmd命令进入到本地的工作盘符。(如我的是D盘下的文件有此路径 D:\workspace\prpall\WEB-INF\classes) 现在是想把D:\workspace\prpall\WEB-INF\classes路径下所有的文件打包成prpall.jar。然后继续如下操作： cd D: 回车 cd workspace/prpal
[原创]JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 comsci eclipse 设计模式算法工作 swing
JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 &nb
SecureCRT右键粘贴的设置 daizj secureCRT 右键粘贴
一般都习惯鼠标右键自动粘贴的功能，对于SecureCRT6.7.5 ，这个功能也已经是默认配置了。老版本的SecureCRT其实也有这个功能，只是不是默认设置，很多人不知道罢了。菜单： Options->Global Options ...->Terminal 右边有个Mouse的选项块。 Copy on Select Paste on Right/Middle
Linux 软链接和硬链接 dongwei_6688 linux
1.Linux链接概念Linux链接分两种，一种被称为硬链接（Hard Link），另一种被称为符号链接（Symbolic Link）。默认情况下，ln命令产生硬链接。【硬连接】硬连接指通过索引节点来进行连接。在Linux的文件系统中，保存在磁盘分区中的文件不管是什么类型都给它分配一个编号，称为索引节点号(Inode Index)。在Linux中，多个文件名指向同一索引节点是存在的。一般这种连
DIV底部自适应 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
Centos6.5使用yum安装mysql——快速上手必备 dcj3sjt126com mysql
第1步、yum安装mysql [root@stonex ~]# yum -y install mysql-server 安装结果： Installed: mysql-server.x86_64 0:5.1.73-3.el6_5 &nb
如何调试JDK源码 frank1234 jdk
相信各位小伙伴们跟我一样，想通过JDK源码来学习Java，比如collections包，java.util.concurrent包。可惜的是sun提供的jdk并不能查看运行中的局部变量，需要重新编译一下rt.jar。下面是编译jdk的具体步骤： 1.把C:\java\jdk1.6.0_26\sr
Maximal Rectangle hcx2013 max
Given a 2D binary matrix filled with 0's and 1's, find the largest rectangle containing all ones and return its area. public class Solution { public int maximalRectangle(char[][] matrix)
Spring MVC测试框架详解——服务端测试 jinnianshilongnian spring mvc test
随着RESTful Web Service的流行，测试对外的Service是否满足期望也变的必要的。从Spring 3.2开始Spring了Spring Web测试框架，如果版本低于3.2，请使用spring-test-mvc项目（合并到spring3.2中了）。 Spring MVC测试框架提供了对服务器端和客户端（基于RestTemplate的客户端）提供了支持。 &nbs
Linux64位操作系统（CentOS6.6）上如何编译hadoop2.4.0 liyong0802 hadoop
一、准备编译软件 1.在官网下载jdk1.7、maven3.2.1、ant1.9.4，解压设置好环境变量就可以用。环境变量设置如下：（1）执行vim /etc/profile （2）在文件尾部加入: export JAVA_HOME=/home/spark/jdk1.7 export MAVEN_HOME=/ho
StatusBar 字体白色 pangyulei status
[[UIApplication sharedApplication] setStatusBarStyle:UIStatusBarStyleLightContent]; /*you'll also need to set UIViewControllerBasedStatusBarAppearance to NO in the plist file if you use this method
如何分析Java虚拟机死锁 sesame java thread oracle 虚拟机 jdbc
英文资料： Thread Dump and Concurrency Locks Thread dumps are very useful for diagnosing synchronization related problems such as deadlocks on object monitors. Ctrl-\ on Solaris/Linux or Ctrl-B
位运算简介及实用技巧（一）：基础篇 tw_wangzhengquan 位运算
http://www.matrix67.com/blog/archives/263 去年年底写的关于位运算的日志是这个Blog里少数大受欢迎的文章之一，很多人都希望我能不断完善那篇文章。后来我看到了不少其它的资料，学习到了更多关于位运算的知识，有了重新整理位运算技巧的想法。从今天起我就开始写这一系列位运算讲解文章，与其说是原来那篇文章的follow-up，不如说是一个r
jsearch的索引文件结构 yangshangchuan 搜索引擎 jsearch 全文检索信息检索 word分词
jsearch是一个高性能的全文检索工具包，基于倒排索引，基于java8，类似于lucene，但更轻量级。 jsearch的索引文件结构定义如下： 1、一个词的索引由=分割的三部分组成：第一部分是词第二部分是这个词在多少

SVM 支持向量机

一、SVM基础知识

1、SVM知识回顾

（1）梯度下降法

（2）拉格朗日乘子法

2、对偶问题的概念

3、KKT条件

（1）KKT条件构造拉格朗日函数

（2）KKT条件理解

（3）不等式条件拉格朗日函数计算方法

（4）KKT条件的总结：

（5）KKT条件 转换等式拉格朗日函数的步骤

2、高中距离知识回顾

二、感知器模型

三、SVM 算法（线性可分数据）

1、线性可分SVM

2、SVM损失函数的推导过程

3、SVM损失函数求解方法

（1）使用KKT条件

（2）优化计算方法

（3）获得loss函数

（4）线性可分SVM算法流程

（5）例题

4、线性SVM算法的总结

四、带有异常数据的线性数据的SVM算法

1、SVM的软间隔模型

（1）松弛因子

（2）SVM的软间隔模型 LOSS函数推导

（3）SVM的软间隔模型的 LOSS 函数

（4）SVM的软间隔模型

（5）SVM的软间隔模型算法流程

（6）SVM的软间隔模型总结

五、非线性数据的SVM算法

1、多项式扩展的回顾

2、非线性可分SVM 算法的思想

3、非线性可分SVM 算法LOSS函数

4、非线性可分SVM 算法多项式扩展的局限性

5、非线性可分SVM的核函数

（1）核函数的定义

（2）核函数的理解

（3）常见的核函数

（4）核函数总结

（5）不同核函数的效果

六、SMO算法

1、SMO算法的推导过程

（1）基本知识

（2）SMO算法的目标条件

（3）SMO算法结果公式

（4）例题

七、SVM回归算法的理解

1、SVM回归算法SVR

2、SVR的不等式约束

（1）未加松弛因子

（2）加松弛因子

3、KKT条件的朗日函数

4、SVR的LOSS函数

八、SVM API 使用

1、线性的SVM（LinearSVC、LinearSVR）

2、带有核函数的SVM（SVC，SVR）

（1）SVC、SVR

（2）支持向量机用于使用libsvm

（3）选取异常样本SVM

你可能感兴趣的:(AI_机器学习,机器学习)

（5）KKT条件转换等式拉格朗日函数的步骤