机器学习【西瓜书/南瓜书】--- 第1章绪论+第二章模型选择和评估（学习笔记+公式推导）

【西瓜书+南瓜书】task01: 第1、2章（2天）

第一章绪论

主要符号表

下述这些符号在本书中将频繁的使用，务必牢记于心各个特殊符号所具有的的含义

对上述部分定义做一下解释：

向量有维度，其中的元素是有序的
变量集是集合，集合中的元素是无序的

空间可以简单的理解为集合，假设空间是一个超集（全集）
全集的一部分被称为假设集，可以认为假设集是假设空间的一个子集

逗号分割：行向量
分号分割：列向量

1.1 引言

**
你会判断一个西瓜是否是一颗好瓜么？
如果你不知道，那么我告诉你一个好瓜的判断条件：色泽青绿、根蒂蜷缩、敲声浊响的瓜就是一颗好瓜，这不是我信口开河，这是我们在生活中所总结出的经验；再比如我们通过往常的学习经验可以知道：如果你刻苦学习，弄清概念，做好作业就可以取得好成绩

不难看出，我们能做出有效的判断，是因为我们积累的经验。

机器学习就是如此一门学科，它致力于通过计算的手段，利用经验来改善系统自身的性能。
计算机有经验么？有的！对于计算机而言，经验就是数据

根据上述两点可以知道：机器学习就是通过数据，产生模型(model) 的算法，所谓模型泛指从数据中心学得的结果；产生模型的算法，即学习算法。有了学习算法，我们只需要给它数据经验，它可以基于这些数据产生模型，在以后面对一个新的西瓜，可以判断出它是好瓜还是坏瓜。

1.2 基本术语

枯燥且重要的知识来了：

我们给出几组关于西瓜的记录：

（色泽 = 青绿；根蒂 = 蜷缩；敲声 = 浊响）
（色泽 = 乌黑；根蒂 = 稍蜷；敲声 = 沉闷）
（色泽 = 浅白；根蒂 = 硬挺；敲声 = 清脆）
数据集（data set）：上述记录的集合称为数据集，数据集亦被称为一个“样本”
示例（instance）：每条记录称为一个示例
属性（attribute）/ 特征（feature）：如色泽，根蒂，敲声
属性值（attribute value）：如青绿蜷缩浊响
属性空间（attribute space）/ 样本空间（sample space）/ 输入空间（input space）：属性所张成的空间
特征向量（feature vector）：我们把上述属性：色泽，根蒂，敲声作为坐标轴，就可以构建出一个三维空间，每个西瓜在这个空间中都可以找到自己的坐标位置，由于该空间中的每个点都对应一个坐标向量，故我们也把一个示例称为：特征向量
一般地，令 D = {x1，x2，…，xm}【行向量】表示含有 m 个示例的数据集，比如上述例子中就是含有3个示例的数据集，其中每个示例都是由 d 个属性所描述，比如上述例子中每个西瓜都有3个属性：色泽，根蒂，敲声，故对于每个示例我们可以表达为：xi = {xi1；xi2；…；xid}【列向量】，其中 d 称为样本 xi 的维数（dimensionality）

学习（learning）/ 训练（training）：从数据中获得模型
训练数据（training data）：训练过程中使用的数据
训练样本（training sample）：每个样本都被称为训练样本
训练集（training set）：训练样本组成的集合
假设（hypothesis）：学得模型对应了关于数据的某种潜在规律，故亦被称为假设
真相 / 真实（ground-truth）：指这种潜在的规律的自身
学习器（leaner）：就是模型，可看作学习算法在给定数据和参数空间上的实例化
假设就是模型，映射就是模型
假设要逼近真相
我们使用我们的数据集去构造一个假设并且我们希望这个假设是逼近真相的
假设并不唯一，比如我从北京到上海：我可以开车，高铁，飞机，步行；我们的目的是在一系列假设之中，按照相关的要求去选择一个“好”的假设

还记得我们的 “初心” 么？判断一个瓜是否为好瓜，显然我们光有示例数据是远远不够的，我们还需要训练样本的结果信息来建立关于预测（prediction）的模型，例如：（（色泽 = 青绿；根蒂 = 蜷缩；敲声 = 浊响），好瓜），在这里关于示例结果的信息：好瓜，被称为标记（label）拥有了标记信息的示例，则被称为样例（example）

示例 + 标记 = 样例

一般地，用(xi，yi）表示第 i 个样例，其中 yi ∈ 是示例 xi 的标记，是所有标记的集合，亦被称为标记空间（label space）/ 输出空间（output space）

(xi, yi)：（向量，标量）

分类（classification）：预测离散值如：好瓜坏瓜的学习任务
回归（regression）：预测连续值如：西瓜的成熟度 0.95、0.37 的学习任务
yi是离散：分类
yi是连续：回归

对于只涉及两个类别的二分类（binary classification）任务，称其中的一个类为正类（positive class），另一个类为反类（negative class），亦被称为反类

所谓二分类：就是判断是和不是：是否为好瓜，是否为三好学生
在定义“正类”和“反类”（负类）时，我们既可以把好瓜定义为“正类”也可以把好瓜定义为“反类”（负类），这里的正反仅仅是用来起到区分的作用，并不涉及好坏之差

涉及多个类别时，被称为多分类（multi-class classification）

预测任务是希望通过对训练集{(x1，y1)，(x2，y2)，…，(xm，ym)} 进行学习，建立一个从输入空间到输出空间的映射 f ： → ，对于二分类的任务，我们通常令： = {-1， +1} 或 {0， 1}；对于多分类任务 | | > 2；对于回归任务， = R，R为实数集

测试（clustering）：学得模型之后，使用其进行预测的过程
测试样本（testing sample）：被预测的样本
例如，在学得 f 后，对测试例 x，可得到测试标记 y = f(x)

❗️ 注意：并不是所有的数据都有标签：yi 的，对于没有 yi 的数据，我们就不能对其进行探索了么？非也：我们可以对数据做“聚类”

聚类（clustering）：将训练集中的西瓜分组
簇（cluster）：分成的组，每组被称为一个簇
这些自动形成的簇可能对应一些潜在的概念划分，例如：“浅色瓜”，“深色瓜”；甚至“本地瓜”，“外地瓜”。这样的学习过程有助于我们了解数据的内在规律。在聚类学习中，“浅色瓜”，“深色瓜” 这样的概念是我们事先不知道的，而且在学习过程中使用的训练样本通常是不拥有标记信息的

根据训练数据是否拥有标记信息可分为：

监督学习（supervised learning）
无监督学习（unsupervised learning）
分类和回归是监督学习的代表
聚类是无监督学习的代表

⭐️机器学习的目标是使学得的模型能很好地适用于新样本，而不仅仅是在训练样本上工作的更好

泛化（generalization）能力：学得模型适用于新样本的能力
具有强泛化能力的模型能很好地适用于整个样本空间，于是，尽管训练集通常只是样本空间的一个很小的采样，我们仍希望它能够很好地反映出样本空间的特征。

通常假设样本空间中全体样本服从一个未知分布（distribution）
我们获得的每个样本都是独立地从这个分布上采样获得的，即独立同分布（independent and identically distributed，简称 i.i.d.）
一般来说，训练样本越多，我们得到的关于的信息越多，这样就越有可能通过学习获得具有强泛化能力的模型.

1.3 假设空间

科学推理的两大基本手段：归纳（induction），演绎（deduction）

所谓归纳，就是由特殊到一般的泛化（generalization）过程
所谓演绎，就是由一般到特殊的特化（inductive learning）过程

归纳学习：
广义：从样例中学习
狭义：从训练数据中学得概念（concept），因此亦被称为概念学习或概念形成

现实常用的技术大多是产生黑箱模型

概念学习中最基本的是布尔概念学习，即是，不是这样的可表示 0/1 布尔值的目标概念的学习

我们可以把学习过程看作是一个在所有假设组成的空间中进行搜索的过程，搜索目标则是找到与训练集匹配（fit）的假设；假设的表示一旦确定，假设空间及规模大小就确定了

可以有很多的策略对假设空间进行搜索，例如：自顶向下、从一般到特殊、自底向上、从特殊到一般，搜索过程中可以不断删除与正例不一致的假设、和（或）与反例一致的假设，最终将会获得与训练集一致（即堆所有训练样本能够进行正确判断）的假设。

1.4 归纳偏好

机器学习算法在学习过程中对某种类型假设的偏好，称为归纳偏好（inductive bias），或简称为：偏好
任何一个有效的机器学习算法必有其归纳偏好，否则它将被假设空间中看似在训练集上“等效”的假设所迷惑，而无法产生确定的学习结果

还是拿西瓜举例子，判断一个好瓜，到底是根蒂重视还是对敲声更重视，这是对属性进行选择，被称为特征选择（feature selection），机器学习中的特征选择仍是基于对训练样本的分析进行的，这里对某种属性的信赖可视为基于某种领域知识而产生的归纳偏好

归纳偏好可看作学习算法自身在一个可能很庞大的假设空间中对假设进行选择的启发式或价值观

重点来喽：
奥卡姆剃刀（Ocam’s razor）是一种常用的、自然科学研究中最基本的原则，即：如有多个假设与观察一直，则选最简单的那个。

然而，奥卡姆剃刀并非唯一可行的原则，奥卡姆剃刀本身存在不同的诠释，使用奥卡姆剃刀原则并不平凡，或者你可以理解为：在如何判断简单这个问题上，并不简单。

归纳偏好对应了学习算法本身做出的关于“什么样的模型更好”的假设，这个假设是否成立，即算法的归纳偏好是否与问题本身匹配，大多数时候直接决定了算法是否能取得好的性能。

对于下图而言：
1.4 归纳偏好
机器学习算法在学习过程中对某种类型假设的偏好，称为归纳偏好（inductive bias），或简称为：偏好
任何一个有效的机器学习算法必有其归纳偏好，否则它将被假设空间中看似在训练集上“等效”的假设所迷惑，而无法产生确定的学习结果

归纳偏好可看作学习算法自身在一个可能很庞大的假设空间中对假设进行选择的启发式或价值观

重点来喽：
奥卡姆剃刀（Ocam’s razor）是一种常用的、自然科学研究中最基本的原则，即：如有多个假设与观察一直，则选最简单的那个。

对于下图而言：

对于两股曲线，你可以想当然的认为曲线A是更平滑的，即更简单的，我们期待 a 比 b 更好，确实，图（a）显示出，与 B 相比，A 与训练集外的样本更一致；换言之，A 的泛化能力比 B 强。

But !，对于图（b）而言，我们又可以直观的感受到 b 比 a 更好

换言之，对于一个学习算法 a，若它在某些问题上比 b 好，则必然存在另一些问题，在那里 b 比 a 好，我们接下来去证明它：

我们设样本空间，假设空间都是离散的，令 P(h|X, a) 代表算法 a 基于训练数据 X 产生假设 h 的概率，再令 f 代表我们希望学习的真实目标函数 . a 的“训练集外误差”，即 a 在训练集之外的所有样本上的误差为：

公式说明，首先两个求和符号的解释：我们最终的结果是产生 h 的所有情况的和，并且我们的训练集外的样本空间为： - X，要考虑所有情况故也需要求和，P(h|X, a) 是基于训练数据产生假设 h 的概率，即对于每一个 h 都对应一个概率 P(h|X, a) ，从训练集外所有的样本中挑选的概率为： P() ，这时我们已经挑选了一个，我们需要把分别带入到 h() 和 f() 中，去比较实际值和估计值是否相等，不相等运算结果为 P() * 1 * P(h|X, a) ，相等运算结果为 P() * 0 * P(h|X, a) ，最终按照前述求和即可。
接下来我们来考虑二分类问题：且真实目标函数可以是任何函数 → {0,1}，函数空间为{0,1}||，对所有可能的 f 按均匀分布对误差求和，有：

公式说明：从公式的第一行到公式的第二行，就是把第一个公式进行带入的结果，然后从第二行到第三行，则是类似量词辖域收缩扩张公式的推导，从公式第三行到第四行，我们进行举例讲解：
首先我们需要知道此时假设 f 是任何能将样本映射到 {0，1}的函数，存在不止一个 f 时， f 服从均匀分布，即对于每个 f 出现的概率都是相等的，假设我们的样本空间只有两个样本时， = {x1，x2}，| | = 2，那么所有可能的真实目标函数 f 如下：

f1 ： f1(x1) = 0，f1(x2) = 0；
f2 ： f2(x1) = 0，f2(x2) = 1；
f3 ： f3(x1) = 1，f3(x2) = 0；
f4 ： f4(x1) = 1，f4(x2) = 1；
一共有 2|| = 22 = 4 个可能的真实目标函数，所以此时通过算法 a 学习出来的模型 h(x) 对于每个样本无论预测值是 0 或是 1，都必然有且只有一半的 f 与它的预测值相等，
从最终得到的式子中我们可以发现：总误差与学习算法无关，训练集外误差仅和数据集本身，数据集取得集外数据xi的概率相关，和算法La无关 → 训练集外的误差和算法所构建的模型没有关系，故我们对于任意的两个学习算法 a 和 b，我们都有：

也就是说，无论学习算法 a 多么的聪明， b 多么的笨拙，它们的期望值是始终相同的，这就是 “没有免费的午餐”定理（No Free Lunch Theorem），简称 NFL定理

❗️ NFL 定理有一个重要的前提：所有问题出现的机会相同或所有问题同等重要，即我们假设了f 服从均匀分布，但是实际生活中并不是这样，很多时候，我们只关注自己正在试图解决的问题（例如某个具体应用任务），希望为它找到一个解决方案，至于这个解决方案在别的问题，甚至在相似的问题上是否为好方案，我们并不关心。就拿推导过程中的 f1 f2 f3 f4 举例，通常我们只认为能高度拟合已有样本数据的函数才是真实目标函数，例如，现在已有的样本数据为{(x1，0)，(x2，1)}，那么此时只有 f2 才是我们认为的真实目标函数，由于没有收集到或者根本不存在 {(x1，0)，(x2，0)}，{(x1，1)，(x2，0)}，{(x1，1)，(x2，1)} 这类样本，所以 f1 f3 f4 都不算是真实的目标函数。
所以，NFL 定理最重要的寓意，是让我们认识到：脱离具体问题，空泛地谈论“什么学习算法更好”毫无意义，因为若考虑所有潜在的问题，则所有学习算法都一样好，要谈论算法的相对优劣，必须针对具体的学习问题，在某些问题上表现好的学习算法，在另一些问题上却可能不尽如人意，学习算法自身的归纳偏好与问题是否匹配，往往会起到决定性作用。

1.5 发展历程（机器学习）

    推理期
        连接主义（1950s）
        符号主义（1960s）

    知识期（1970s）
    机器学习（1980s）：符号主义
    ｜ 机械学习、示教学习+类比学习、归纳学习（监督or无监督）
        决策树
        BP算法

    统计学习（1990s）
        SVM

    深度学习（2000s）：连接主义
        神经网络

第二章模型评估与选择

2.1 经验误差与过拟合

经验误差与过拟合
经验误差（训练误差）：学习器在训练集上的误差
泛化误差：在新样本上的误差
欠拟合：模型没有很好地捕捉到数据特征，不能够很好地拟合数据
过拟合：将数据学习得太彻底，把噪声数据的特征也学习了，不能很好地识别数据

2.2评估方法

2.2.1留出法
2.2.2 交叉验证法**

特例: 留一法leave-one-out (LOO) 往往比较准确，但未必永远最准确（NFL定理）

2.2.3自助法 bootstrapping

    ｜ 用于 ：小数据集，难以划分训练、测试集上

2.2.4调参

        训练集划分为：训练集+验证集，基于验证集的性能调参
        实数范围内取值，对每个参数选定范围和步长

2.3 性能度量

有效可行的实验估计方法，衡量模型泛化能力的评价标准

混淆矩阵

二分类

        P选尽可能对的，R选尽可能全的。P与R是矛盾的。P高则R低，P低则R高。
        平衡点Break-Event Point (BEP) : P=R.  
        学习器C的BEP是0.64， B的是0.72，A是0.80，学习器A最优

将BEP优化一下，可以得到F1

多分类：
宏查准、宏查全、宏F1
｜分成N个二分类后分别计算P\R\F1 然后求均值
微查准、微查全、微F1
｜分成N个二分类后分别求均值然后算P\R\F1

2.3.3 ROC \ AUC

ROC : 直观的反应模型性能，但是难以比较不同模型的差异。

         横轴（TPR）真正例率
             TPR=TP/(TP+FN)
         纵轴（FPR）假正例率
             FPR=FP/(TN+FP)

AUC :ROC曲线的下方的面积求和而得，考虑样本预测的排序质量，与排序误差有紧密联系。（南瓜书公式2.20）公式2.21

华为全屋智能vs小米智能家居，谁适合全屋智能？「已注销」华为物联网 iot
颠覆浪潮正推动我们的日常生活方式改变。当中，物联网及人工智能相关的创新科技，为我们改造成可以持续自立运作、畅顺无缝的家居，如果想打造全屋智能的话，可以从这几个方面来做个对比：1.智慧生态支持：首先，小米是米家生态链品牌支持，华为是Hilink生态链支持。华为全屋智能以第三方的合作伙伴接入设备为主，比如海尔、美的、格力等头部家电品牌，符合HiLink技术标准的电器就可以接入到华为全屋智能的系统中，由
自然语言处理系列四十五》Elasticsearch搜索引擎》Elasticsearch入门及技术原理陈敬雷-充电了么-CEO兼CTO 搜索引擎自然语言处理 elasticsearch ai chatgpt gpt 人工智能
注：此文章内容均节选自充电了么创始人，CEO兼CTO陈敬雷老师的新书《自然语言处理原理与实战》（人工智能科学与技术丛书）【陈敬雷编著】【清华大学出版社】文章目录自然语言处理系列四十五Elasticsearch搜索引擎》Elasticsearch入门及技术原理Elasticsearch安装部署和使用总结自然语言处理系列四十五Elasticsearch搜索引擎》Elasticsearch入门及技术原理
自然语言处理系列四十二》新词发现与短语提取》新词发现》代码实战陈敬雷-充电了么-CEO兼CTO 自然语言处理人工智能 nlp ai chatgpt gpt java
注：此文章内容均节选自充电了么创始人，CEO兼CTO陈敬雷老师的新书《自然语言处理原理与实战》（人工智能科学与技术丛书）【陈敬雷编著】【清华大学出版社】文章目录自然语言处理系列四十二新词发现》代码实战短语提取算法原理总结自然语言处理系列四十二新词发现》代码实战新词发现是NLP的基础任务之一，通过对已有语料进行挖掘，从中识别出新词。上一篇文章已经对新词发现做了详细介绍，下面展示代码，HanLP工具提
可定制化内容具体识别事物，多方位同时监管的智慧快消开源了。 ai产品老杨 vue.js 人工智能前端 javascript 音视频
智慧快消视频监控平台是一款功能强大且简单易用的实时算法视频监控系统。它的愿景是最底层打通各大芯片厂商相互间的壁垒，省去繁琐重复的适配流程，实现芯片、算法、应用的全流程组合，从而大大减少企业级应用约95%的开发成本。国产化人工智能“产学研用”一体化创新模式在行业的建立，将大大提升当地政府人工智能形象。用户只需在界面上进行简单的操作，就可以实现全视频的接入及布控。项目搭建地址基础项目搭建地址：yihe
写着简单和跑得快是一回事，SQL 为什么不可能跑得快？ LuckJudy 数据计算 sql 数据库 SPL 大数据性能优化
我们讨论过代码编写的难和繁的原理问题，现在关注性能问题，运行速度当然是非常重要的事情。我们知道，软件不能改变硬件的性能，CPU和硬盘该多快就多快。不过，我们可以设计出低复杂度的算法，也就是计算量更小的算法，计算机执行的动作变少，自然也就会快了。本来要做1亿次运算，如果有个好算法能把计算量降低到100万次，那快出100倍就不奇怪了。但是，光想出算法还不够，还要把这个算法实实在在地用某种程序语言写出来
1.人工智能原理 luckyflyyy 人工智能基础学习人工智能 python 机器学习深度学习
一元一次函数感知器–如何描述直觉MCCulloch-Pitts神经元模型MCCulloch-Pitts神经元模型（McCulloch-PittsNeuronModel）是一种简化的人工神经元模型，由美国心理学家沃伦·麦卡洛克（WarrenMcCulloch）和逻辑学家沃尔特·皮茨（WalterPitts）于1943年提出。这个模型是神经网络和计算神经科学领域的一个重要里程碑，为后来的神经网络研究奠
编程小白如何成为大神？大学新生的最佳入门大神级攻略一禅（OneZen）随笔经验分享其他笔记 python java
编程语言选择1.选择一种编程语言入门：Python：Python是初学者的绝佳选择。它语法简单、易读易写、用途广泛，广泛应用于数据科学、机器学习、Web开发、自动化测试等领域。JavaScript：对于对Web开发感兴趣的学生，JavaScript是必学的。它在前端开发中占据主导地位，并且与HTML和CSS结合使用，构建动态网页。Java：Java是一种面向对象的编程语言，广泛应用于企业级应用和A
线性二次调节器（LQR）和模型预测控制（MPC）算法对比介绍 LQS2020 算法
本文对线性二次调节器（LQR）和模型预测控制（MPC）算法的详细介绍，包括图文示例，以帮助更好地理解这些控制策略。1.线性二次调节器(LQR)1.1概述LQR是一种经典的控制策略，用于设计线性系统的最优反馈控制器。其目标是通过最小化一个二次型成本函数来实现系统的最佳控制。1.2数学模型线性系统模型：[\dot{x}(t)=Ax(t)+Bu(t)][y(t)=Cx(t)+Du(t)]其中：(x(t)
白话时间复杂度与空间复杂度 s1991721
时间复杂度用于表示，算法解决规模为n的问题所消耗的时间。理解：用同一代码块段执行的次数衡量sum=n*(n+1)/2;//顺序执行时，此代码块只会运行一次因此时间复杂度为O(1)for(inti=0;i
github源码指引：共享内存、数据结构与算法：作为基础的数组初级代码游戏 github源码指引共享内存数据结构与算法 github 共享内存数据结构算法可扩展数组
初级代码游戏的专栏介绍与文章目录-CSDN博客我的github：codetoys，所有代码都将会位于ctfc库中。已经放入库中我会指出在库中的位置。这些代码大部分以Linux为目标但部分代码是纯C++的，可以在任何平台上使用。相关专题：共享内存、数据结构与算法_初级代码游戏的博客-CSDN博客源码位置：shmfc基础：github源码指引：源码结构、编译、运行_github编译-CSDN博客目录一
程序猿成长之路之数据挖掘篇——Kmeans聚类算法 zygswo 数据挖掘数据挖掘算法 kmeans
Kmeans是一种可以将一个数据集按照距离（相似度）划分成不同类别的算法，它无需借助外部标记，因此也是一种无监督学习算法。什么是聚类用官方的话说聚类就是将物理或抽象对象的集合分成由类似的对象组成的多个类的过程。用自己的话说聚类是根据不同样本数据间的相似度进行种类划分的算法。这种划分可以基于我们的业务需求或建模需求来完成，也可以单纯地帮助我们探索数据的自然结构和分布。什么是K-means聚类用官方的
PCL 点云ISS关键点提取算法自动驾驶探索站 C++点云处理基础教程 PCL 特征提取关键点提取
目录一、概述二、代码示例三、运行结果结果预览接上篇Python点云ISS关键点提取算法一、概述点云ISS关键点（IntrinsicShapeSignatures）:利用点云中每个点的局部邻域的协方差矩阵来分析局部几何结构。协方差矩阵的特征值可以揭示局部几何形状的显著性。通过筛选出特征值之间具有显著差异的点，ISS算法能够识别出关键点。参考文献：《IntrinsicShapeSignatures:A
Python配置管理工具库之hydra使用详解 Rocky006 python 人工智能开发语言
概要在开发复杂的Python应用程序时，配置管理往往是一个重要但容易被忽视的部分。Hydra是一个强大的配置管理工具，它旨在简化配置文件的管理和使用，尤其是在涉及多个配置文件和参数组合的场景下。Hydra提供了一种优雅的方式来组织和访问配置数据，并支持动态生成和组合配置。这对于机器学习、数据科学和大型Python应用程序开发来说尤其有用。本文将详细介绍Hydra库，包括其安装方法、主要特性、基本和
代码随想录算法训练营第1天 | 题目704、题目27 Further0356 算法
代码随想录算法训练营第1天|题目704、题目27文章来源：代码随想录视频来源：视频题目名称：704.二分查找给定一个n个元素有序的（升序）整型数组nums和一个目标值target，写一个函数搜索nums中的target，如果目标值存在返回下标，否则返回-1。示例1:输入:nums=[-1,0,3,5,9,12],target=9输出:4解释:9出现在nums中并且下标为4示例2:输入:nums=[
代码随想录训练营day29|贪心算法part3 aNgler_hdu 贪心算法算法
加油站力扣题目链接classSolution{public:intcanCompleteCircuit(vector&gas,vector&cost){intpre=0;intcur;intresult=0;intsumGas=0;for(inti=0;i0){result=i;pre=0;}pre=pre+gas[i]-cost[i];}//能跑完全程return(sumGas>=0)?resu
代码随想录算法训练营第二十九天 | 贪心算法 part03 sagen aller 算法贪心算法
134.加油站贪心策略：1.如果每个加油站的剩余油量总和小于0，说明不存在可以绕一圈的情况2.在遍历加油站的过程中，当剩余油量和小于0时，说明此时的初始位置油量不能支持，因此更新初始位置到下一个加油站。classSolution{public:intcanCompleteCircuit(vector&gas,vector&cost){intrestSum=0;intstart=0;intcurSu
Python实现分水岭图像分割算法闲人编程图像处理 python 算法开发语言图像分割分水岭
目录Python实现分水岭图像分割算法的详细博客一、引言二、分水岭算法的原理三、Python实现分水岭算法四、算法步骤解析1.图像预处理2.计算梯度图像3.阈值分割4.距离变换与标记操作5.分水岭变换五、应用场景：细胞图像分割1.读取细胞图像2.应用高斯模糊去除噪声3.计算梯度图像4.阈值分割5.距离变换与标记操作6.分水岭变换六、分水岭算法的挑战与优化七、结论八、运行结果Python实现分水岭图
嵌入式面经篇十一——操作系统须尽欢~~ 嵌入式软件面经 linux 嵌入式软件
文章目录前言一、操作系统1、Linux系统的组成部分？2、Linux内核的组成部分？3、内存管理MMU的作用？4、常见的操作系统进程调度策略有哪些？5、满足短作业优先又不会发生饥饿现象的调度算法是？6、I/O子系统层次结构7、逻辑地址、线性地址、物理地址、总线地址、虚拟地址的区别？8、操作系统的内存分配一般有哪几种方式，各有什么优缺点？9、用户空间与内核空间有哪些通信方式？10、用户进程调用rea
视频图像处理基础--运动目标检测与识别小豆包的小朋友0217 音视频图像处理目标检测
系列文章目录文章目录系列文章目录前言一、视频图像处理二、运动目标检测与识别--帧差法2.1帧差法2.2算法原理2.3利用帧差法进行目标检测的方法2.4相邻帧帧间差分法的优势和不足2.5改进的帧间差分法三、运动目标检测与识别--背景减法3.1背景减法3.2算法原理3.3背景建模方法3.4背景模型更新三、运动目标检测与识别--光流场分析法3.1光流场分析3.2光流和光流场的概念3.3光流场分析法原理3
多元分类预测 | Matlab麻雀算法(SSA)优化核极限学习机(KELM)的分类预测，多特征输入模型。SSA-KELM分类预测模型前程算法屋优化核极限学习机 SSA-KELM分类预测模型 SSA-KELM
文章目录效果一览文章概述部分源码参考资料效果一览文章概述多元分类预测|Matlab麻雀算法(SSA)优化核极限学习机(KELM)的分类预测，多特征输入模型。SSA-KELM分类预测模型多特征输入单输出的二分类及多分类模型。程序内注释详细，直接替换数据就可以用。程序语言为matlab，程序可出分类效果图，迭代优化图，混淆矩阵图。部分源码%--------------
智能优化特征选择|基于鹦鹉优化（2024年新出优化算法）的特征选择（分类器选用的是SVM）研究Matlab程序【优化算法可以替换成其他优化方法】机器不会学习CL 智能优化算法智能优化特征选择算法支持向量机 matlab
智能优化特征选择|基于鹦鹉优化（2024年新出优化算法）的特征选择（分类器选用的是SVM）研究Matlab程序【优化算法可以替换成其他优化方法】文章目录一、PO基本原理基本原理基本流程示例应用二、实验结果三、核心代码四、代码获取五、总结智能优化特征选择|基于鹦鹉优化（2024年新出优化算法）的特征选择（分类器选用的是SVM）研究Matlab程序【优化算法可以替换成其他优化方法】一、PO基本原理鹦鹉
【KELM回归预测】基于麻雀算法优化核极限学习SSA-KELM-Adaboost实现风电回归预测附matlab代码天天酷科研粉丝福利算法回归学习 SSA-KELM-Ada
以下是使用麻雀算法优化核极限学习机（SSA-KELM）和Adaboost算法实现风电回归预测的MATLAB代码示例：matlab复制%导入风电数据load(‘wind_data.mat’);%假设数据存储在wind_data.mat文件中X=wind_data(:,1:end-1);%输入特征Y=wind_data(:,end);%输出标签%数据归一化X=normalize(X,‘range’);
MATLAB 计算三角形的外接圆心和半径（84）点云学徒 MATLAB点云处理学习 matlab 外界圆半径圆心三角点云
MATLAB计算三角形的外接圆心和半径（84）一、算法介绍二、算法实现1.代码一、算法介绍计算三角形的外接圆心和半径，可视化显示结果二、算法实现1.代码%设置三个点的坐标A=[1,1];B=[4,
贪心算法以及动态规划法小白bady pycharm python 数据结构
'''#贪心算法贪心算法（贪婪算法）是指，在对问题求解时，总是做出在当前看来是最好的选择，也就是说，不从整体最优上加以考虑，他所做的是某种意义上的局部最优解贪心算法并不保证会得到最优解，但是在某些问题上贪心算法的解就是最优解要会判断一个问题能否用贪心算法来计算''''''找零问题，假设商店老板需要找零n元钱，钱币的面额有：100元50元20元5元1元如何找零使得所需钱币的数量最少从最大钱币开始找'
1253. 重构 2 行二进制矩阵-贪心算法 Mr Gao c++与c语言力扣刷题贪心算法重构矩阵
1253.重构2行二进制矩阵给你一个2行n列的二进制数组：矩阵是一个二进制矩阵，这意味着矩阵中的每个元素不是0就是1。第0行的元素之和为upper。第1行的元素之和为lower。第i列（从0开始编号）的元素之和为colsum[i]，colsum是一个长度为n的整数数组。你需要利用upper，lower和colsum来重构这个矩阵，并以二维整数数组的形式返回它。如果有多个不同的答案，那么任意一个都可
树数据结构（Tree Data Structures）的全面指南：深度解析、算法实战与应用案例 Chauvin912 数据结构科普数据结构算法
树数据结构（TreeDataStructures）的全面指南：深度解析、算法实战与应用案例引言树数据结构（TreeDataStructures）作为计算机科学中的基石之一，以其独特的层次结构和分支特性，在众多领域发挥着关键作用。从文件系统的组织到数据库的索引，从编译原理的语法分析到人工智能的决策制定，树数据结构无处不在。本文将深入探讨树数据结构的基本概念、类型、遍历方式及其在实际应用中的广泛案例。
贪心算法---根据身高重建队列小鱼在乎数据结构与算法贪心算法算法数据结构
题目：假设有打乱顺序的一群人站成一个队列，数组people表示队列中一些人的属性（不一定按顺序）。每个people[i]=[hi,ki]表示第i个人的身高为hi，前面正好有ki个身高大于或等于hi的人。请你重新构造并返回输入数组people所表示的队列。返回的队列应该格式化为数组queue，其中queue[j]=[hj,kj]是队列中第j个人的属性（queue[0]是排在队列前面的人）。思路：先考
探索贪心算法：解决优化问题的高效策略快乐非自愿贪心算法算法
贪心算法是一种在每一步选择中都采取当前最佳选择的算法，以期在整体上达到最优解。它广泛应用于各种优化问题，如最短路径、最小生成树、活动选择等。本文将介绍贪心算法的基本概念、特点、应用场景及其局限性。贪心算法的基本概念贪心算法的核心思想是局部最优策略，即在每一步选择中都选择当前看起来最优的选项，希望通过一系列的局部最优选择达到全局最优。贪心算法的特点局部最优选择：每一步都选择当前状态下最优的操作。无需
考研系列-数据结构冲刺课复习笔记（上） Nelson_hehe #数据结构笔记数据结构考研408 知识点总结冲刺课
写在前面：这篇文章是对王道考研冲刺课的高度总结，可以当做最后复习的提纲和知识点复习参考注意所有数据结构的结构体定义、算法的时间空间复杂度一、线性表1.顺序表创建（静态、动态）、销毁、增删改查2.链表(1)单链表分为带头结点的和不带头结点的情况头插法、尾插法建立；插入操作；删除操作；使用头插法逆置链表，常用来解决实际问题(2)双链表相关代码自己整理一下，可以参考：双向链表相关代码-CSDN博客文章浏
基于yolov8的8种人脸表情检测系统python源码+onnx模型+评估指标曲线+精美GUI界面 FL1623863129 深度学习 YOLO python 开发语言
【算法介绍】基于YOLOv8的人脸表情检测系统是一个结合了先进目标检测算法（YOLOv8）与深度学习技术的项目，旨在实时或离线地识别并分类人脸表情（如快乐、悲伤、愤怒、惊讶、恐惧、厌恶、中立等）。以下是一个简短的介绍，概述了该系统Python源码的核心要点：该系统直接利用YOLOv8模型进行人脸表情识别。YOLOv8以其高效的速度和准确性著称，非常适合实时应用。Python源码实现通常包括以下几个
HQL之投影查询归来朝歌 HQL Hibernate 查询语句投影查询
在HQL查询中，常常面临这样一个场景，对于多表查询，是要将一个表的对象查出来还是要只需要每个表中的几个字段，最后放在一起显示？针对上面的场景，如果需要将一个对象查出来： HQL语句写“from 对象”即可 Session session = HibernateUtil.openSession();
Spring整合redis bylijinnan redis
pom.xml <dependencies>  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redi
org.hibernate.NonUniqueResultException: query did not return a unique result: 2 0624chenhong Hibernate
参考：http://blog.csdn.net/qingfeilee/article/details/7052736 org.hibernate.NonUniqueResultException: query did not return a unique result: 2 在项目中出现了org.hiber
android动画效果不懂事的小屁孩 android动画
前几天弄alertdialog和popupwindow的时候，用到了android的动画效果，今天专门研究了一下关于android的动画效果，列出来，方便以后使用。 Android 平台提供了两类动画。一类是Tween动画，就是对场景里的对象不断的进行图像变化来产生动画效果（旋转、平移、放缩和渐变）。第二类就是 Frame动画，即顺序的播放事先做好的图像，与gif图片原理类似。
js delete 删除机理以及它的内存泄露问题的解决方案换个号韩国红果果 JavaScript
delete删除属性时只是解除了属性与对象的绑定，故当属性值为一个对象时，删除时会造成内存泄露（其实还未删除）举例： var person={name:{firstname:'bob'}} var p=person.name delete person.name p.firstname -->'bob' // 依然可以访问p.firstname，存在内存泄露
Oracle将零干预分析加入网络即服务计划蓝儿唯美 oracle
由Oracle通信技术部门主导的演示项目并没有在本月较早前法国南斯举行的行业集团TM论坛大会中获得嘉奖。但是，Oracle通信官员解雇致力于打造一个支持零干预分配和编制功能的网络即服务（NaaS）平台，帮助企业以更灵活和更适合云的方式实现通信服务提供商（CSP）的连接产品。这个Oracle主导的项目属于TM Forum Live!活动上展示的Catalyst计划的19个项目之一。Catalyst计
spring学习——springmvc（二） a-john springMVC
Spring MVC提供了非常方便的文件上传功能。 1，配置Spring支持文件上传： DispatcherServlet本身并不知道如何处理multipart的表单数据，需要一个multipart解析器把POST请求的multipart数据中抽取出来，这样DispatcherServlet就能将其传递给我们的控制器了。为了在Spring中注册multipart解析器，需要声明一个实现了Mul
POJ-2828-Buy Tickets aijuans ACM_POJ
POJ-2828-Buy Tickets http://poj.org/problem?id=2828 线段树，逆序插入 #include<iostream>#include<cstdio>#include<cstring>#include<cstdlib>using namespace std;#define N 200010struct
Java Ant build.xml详解 asia007 build.xml
1,什么是antant是构建工具2,什么是构建概念到处可查到，形象来说，你要把代码从某个地方拿来，编译，再拷贝到某个地方去等等操作，当然不仅与此，但是主要用来干这个3,ant的好处跨平台 --因为ant是使用java实现的，所以它跨平台使用简单--与ant的兄弟make比起来语法清晰--同样是和make相比功能强大--ant能做的事情很多，可能你用了很久，你仍然不知道它能有
android按钮监听器的四种技术百合不是茶 android xml配置监听器实现接口
android开发中经常会用到各种各样的监听器,android监听器的写法与java又有不同的地方; 1,activity中使用内部类实现接口 ,创建内部类实例使用add方法与java类似创建监听器的实例 myLis lis = new myLis(); 使用add方法给按钮添加监听器
软件架构师不等同于资深程序员 bijian1013 程序员架构师架构设计
本文的作者Armel Nene是ETAPIX Global公司的首席架构师，他居住在伦敦，他参与过的开源项目包括 Apache Lucene,，Apache Nutch， Liferay 和 Pentaho等。如今很多的公司
TeamForge Wiki Syntax & CollabNet User Information Center sunjing TeamForge How do Attachement Anchor Wiki Syntax
the CollabNet user information center http://help.collab.net/ How do I create a new Wiki page? A CollabNet TeamForge project can have any number of Wiki pages. All Wiki pages are linked, and
【Redis四】Redis数据类型 bit1129 redis
概述 Redis是一个高性能的数据结构服务器，称之为数据结构服务器的原因是，它提供了丰富的数据类型以满足不同的应用场景，本文对Redis的数据类型以及对这些类型可能的操作进行总结。 Redis常用的数据类型包括string、set、list、hash以及sorted set.Redis本身是K/V系统，这里的数据类型指的是value的类型，而不是key的类型，key的类型只有一种即string
SSH2整合-附源码白糖_ eclipse spring tomcat Hibernate Google
今天用eclipse终于整合出了struts2+hibernate+spring框架。我创建的是tomcat项目，需要有tomcat插件。导入项目以后，鼠标右键选择属性，然后再找到“tomcat”项，勾选一下“Is a tomcat project”即可。具体方法见源码里的jsp图片，sql也在源码里。补充1：项目中部分jar包不是最新版的，可能导
[转]开源项目代码的学习方法 braveCS 学习方法
转自： http://blog.sina.com.cn/s/blog_693458530100lk5m.html http://www.cnblogs.com/west-link/archive/2011/06/07/2074466.html 1）阅读features。以此来搞清楚该项目有哪些特性2）思考。想想如果自己来做有这些features的项目该如何构架3）下载并安装d
编程之美-子数组的最大和（二维） bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; import java.util.Random; public class MaxSubArraySum2 { /** * 编程之美子数组之和的最大值（二维） */ private static final int ROW = 5; private stat
读书笔记-3 chengxuyuancsdn jquery笔记 resultMap配置 ibatis一对多配置
1、resultMap配置 2、ibatis一对多配置 3、jquery笔记 1、resultMap配置当<select resultMap="topic_data"> <resultMap id="topic_data">必须一一对应。 (1)<resultMap class="tblTopic&q
[物理与天文]物理学新进展 comsci
如果我们必须获得某种地球上没有的矿石,才能够进行某些能量输出装置的设计和建造,而要获得这种矿石,又必须首先进行深空探测,而要进行深空探测,又必须获得这种能量输出装置,这个矛盾的循环,会导致地球联盟在与宇宙文明建立关系的时候,陷入困境怎么办呢?
Oracle 11g新特性:Automatic Diagnostic Repository daizj oracle ADR
Oracle Database 11g的FDI（Fault Diagnosability Infrastructure）是自动化诊断方面的又一增强。 FDI的一个关键组件是自动诊断库（Automatic Diagnostic Repository-ADR）。在oracle 11g中，alert文件的信息是以xml的文件格式存在的，另外提供了普通文本格式的alert文件。这两份log文
简单排序:选择排序 dieslrae 选择排序
public void selectSort(int[] array){ int select; for(int i=0;i<array.length;i++){ select = i; for(int k=i+1;k<array.leng
C语言学习六指针的经典程序，互换两个数字 dcj3sjt126com c
示例程序，swap_1和swap_2都是错误的，推理从1开始推到2，2没完成，推到3就完成了 # include <stdio.h> void swap_1(int, int); void swap_2(int *, int *); void swap_3(int *, int *); int main(void) { int a = 3; int b =
php 5.4中php-fpm 的重启、终止操作命令 dcj3sjt126com PHP
php 5.4中php-fpm 的重启、终止操作命令: 查看php运行目录命令：which php/usr/bin/php 查看php-fpm进程数：ps aux | grep -c php-fpm 查看运行内存/usr/bin/php -i|grep mem 重启php-fpm/etc/init.d/php-fpm restart 在phpinfo()输出内容可以看到php
线程同步工具类 shuizhaosi888 同步工具类
同步工具类包括信号量（Semaphore）、栅栏（barrier）、闭锁（CountDownLatch）闭锁（CountDownLatch） public class RunMain { public long timeTasks(int nThreads, final Runnable task) throws InterruptedException { fin
bleeding edge是什么意思 haojinghua DI
不止一次，看到很多讲技术的文章里面出现过这个词语。今天终于弄懂了——通过朋友给的浏览软件，上了wiki。我再一次感到，没有辞典能像WiKi一样，给出这样体贴人心、一清二楚的解释了。为了表达我对WiKi的喜爱，只好在此一一中英对照，给大家上次课。 In computer science, bleeding edge is a term that
c中实现utf8和gbk的互转 jimmee c iconv utf8&gbk编码
#include <iconv.h> #include <stdlib.h> #include <stdio.h> #include <unistd.h> #include <fcntl.h> #include <string.h> #include <sys/stat.h> int code_c
大型分布式网站架构设计与实践 lilin530 应用服务器搜索引擎
1.大型网站软件系统的特点？ a.高并发，大流量。 b.高可用。 c.海量数据。 d.用户分布广泛，网络情况复杂。 e.安全环境恶劣。 f.需求快速变更，发布频繁。 g.渐进式发展。 2.大型网站架构演化发展历程？ a.初始阶段的网站架构。应用程序，数据库，文件等所有的资源都在一台服务器上。 b.应用服务器和数据服务器分离。 c.使用缓存改善网站性能。 d.使用应用
在代码中获取Android theme中的attr属性值 OliveExcel android theme
Android的Theme是由各种attr组合而成, 每个attr对应了这个属性的一个引用, 这个引用又可以是各种东西. 在某些情况下, 我们需要获取非自定义的主题下某个属性的内容 (比如拿到系统默认的配色colorAccent), 操作方式举例一则: int defaultColor = 0xFF000000; int[] attrsArray = { andorid.r.
基于Zookeeper的分布式共享锁 roadrunners zookeeper 分布式共享锁
首先，说说我们的场景，订单服务是做成集群的，当两个以上结点同时收到一个相同订单的创建指令，这时并发就产生了，系统就会重复创建订单。等等......场景。这时，分布式共享锁就闪亮登场了。共享锁在同一个进程中是很容易实现的，但在跨进程或者在不同Server之间就不好实现了。Zookeeper就很容易实现。具体的实现原理官网和其它网站也有翻译，这里就不在赘述了。官
两个容易被忽略的MySQL知识 tomcat_oracle mysql
1、varchar(5)可以存储多少个汉字，多少个字母数字？　　相信有好多人应该跟我一样，对这个已经很熟悉了，根据经验我们能很快的做出决定，比如说用varchar(200)去存储url等等，但是，即使你用了很多次也很熟悉了，也有可能对上面的问题做出错误的回答。　　这个问题我查了好多资料，有的人说是可以存储5个字符，2.5个汉字（每个汉字占用两个字节的话），有的人说这个要区分版本，5.0
zoj 3827 Information Entropy(水题) 阿尔萨斯 format
题目链接：zoj 3827 Information Entropy 题目大意：三种底，计算和。解题思路：调用库函数就可以直接算了，不过要注意Pi = 0的时候，不过它题目里居然也讲了。。。limp→0+plogb(p)=0，因为p是logp的高阶。 #include <cstdio> #include <cstring> #include <cmath&