湫喃

【机器学习】吃瓜教程 | 西瓜书 + 南瓜书（1）

文章目录

一、绪论
- 1、什么是机器学习？
- 2、基本术语
- 3、假设空间
- 4、归纳偏好
- 5、发展历程
二、模型评估与选择
- A、一种训练集一种算法
- - 2.1 经验误差与过拟合
  - 2.2 评估方法
  - - a) 留出法
    - b) 交叉验证法
    - c) 自助法
    - d) 调参与最终模型
  - 2.3 性能度量
  - - a) 错误率与精度
    - b) 查准率、查全率与F1
  - 2.4比较检验
  - - a) 假设检验
    - b) 交叉验证 t 检验
    - c) McNemar 检验
    - d) Friedman 检验与 nenyl 后续检验
- B、一种训练集多种算法
- - - a) ROC与AUC
- C、多种训练集一种算法
- - - a) 代价敏感错误率与代价曲线
    - b) 偏差和方差

一、绪论

1、什么是机器学习？

机器学习 是研究 如何通过计算手段，利用经验（数据）产生模型算法（学习算法），并用模型算法对新的情况（数据）作出相应的判断。

初学者容易混淆的概念：
人工智能:让机器变得像人一样拥有智能的学科。
机器学习:让计算机像人一样能从数据中学习出规律的一类算法
深度学习:神经网络类的机器学习算法。
因此，范围来说人工智能 > 机器学习 > 深度学习

2、基本术语

数据集：数据的集合，其中每条记录是关于一个事件或对象(这里是一个西瓜)的描述，称为一个"示例" (instance）或"样本" (sample).
训练集：用于学习的数据
属性(特征)：数据的单个特征属性，如瓜的色泽，反映事件或对象在某方面的表现或性质的事项。
属性值：属性的具体取值，如瓜的色泽是"青绿" ，还是"乌黑"。
属性空间(样本空间、输入空间) ：对于每一条属性，都在坐标轴上用一个方向表示，并由次张成的空间。
特征向量：一个示例在属性空间内的坐标向量。
维数：一个样本的特征数
“学习”或“训练”：从数据中学的模型的过程，这个过程是通过执行某个学习算法来完成的。

通过“学习”或“训练”，找到数据之间的某种潜在关系，称为“假设”。“假设”可以不断逼近“真相”。

标记：算法学习过程中对训练数据作出的判断.
样例：拥有建立模型时需获得训练样本的“结果”信息（”标记“）的事例
输出空间 的范围，分为二分类任务、多分类任务和回归任务。其中二分类和多分类任务的预测值为离散值，而回归任务的预测值为连续值。
在算法通过“学习”训练集后得到了模型，为了检验模型的有效性（算法的学习效果），在 ”测试样本”（已知真实结果的数据集）上进行测试，
将被学习的事物分为许多“簇”（自动形成），簇之间可能存在潜在的一些关系，称为“聚类”。
根据训练数据是否拥有标记信息分为：监督学习（以分类和回归为代表），半监督学习和无监督学习（以聚类为代表）。

分类：预测值是整数，分为二分类和多分类。例如，二分类：吃不吃瓜？多分类：吃什么瓜？
回归：预测值是实数，如，西瓜什么时候最低价？
聚类的分类，由机器自行分类，我们并不知道具体分几类。

明确机器学习的目标 是为了优化后的模型在对新样本进行预测的时候误差更小（“泛化”），而不仅是在训练样本上表现的更加优异。

这两点有较大的差异。为了实现强泛化能力，因此希望每个样本是独立地从分布上采取的，也就是“独立同分布”。

3、假设空间

归纳和演绎是科学推理的两大基本手段。
a) 演绎是是从一般到特殊的"特化"的过程，即从 基础原理 推演出具体状况。
b) 归纳是特殊到一般的 "泛化"过程，即从 具体的事实 归结出 一般性规律 。

归纳学习有狭义与广义之分。
广义的归纳学习大体相当于从样例中学习
狭义的归纳学习则要求从训练数据中学得概念(concept) ，因此亦称为 “概念学习"或"概念形成” （目前的研究、应用比较少，太难了）

从样例中学习是一个归纳过程，因此称为“归纳学习”。

概念学习，最基本的是布尔概念学习，即对“是”“不是”的目标概念。
a) 学习的过程是一个在所有假设组成的空间中进行 搜索 的过程，搜索目标 是找到与训练集匹配的假设（即能够将训练集中样本判断正确的假设）。
b) 搜索过程可以不断删除与正确不一致的假设和与错误一致的假设（在搜索时的选择不同删除的假设不同，搜索可以通过自顶向下，从一般到特殊，自底向上，从特殊到一般）,这就是我们学习的结果。

现实问题中假设空间很大，但学习过程是基于有限的样本训练集上进行的，因此可能会多个假设与训练集一致，即存在一个与训练集一致的“假设集合”，称之为 “版本空间” 。

c) 假设的表示一旦确定，假设空间及其规模大小酒确定了。如西瓜问题。

4、归纳偏好

归纳偏好 ： .机器学习算法在学习过程中对某种类型假设的偏好。

任何一个有效的机器学习算法必有其归纳偏好，否则它将被假设空间中看似在训练集上"等效"的假设所迷惑，而无法产生确定的学习结果。一个没有算法偏好的模型，其判断结果是没有意义的。
同一个数据集能够训练出不同的模型。

偏好原则：奥卡姆剃刀：如选择最简单的那个，或者按照其他需求。
若考虑所有潜在的问题，则所有学习算法都一样好，要谈论算法的相对优劣，必须要针对具体的学习问题。
NFL定理

5、发展历程

推理期（逻辑推理能力）——知识期（人总结知识交给计算机）——知识期（机器自己学习知识）——学习期

机器学习：机械学习（死记硬背），示教学习（从指令中学习），类比学习（通过观察和发现学习），归纳学习（从样例中学习）。

机器学习是一种程序，具有自我改善的能力，人为干预越少越好。

二、模型评估与选择

A、一种训练集一种算法

2.1 经验误差与过拟合

错误率（error rate） ：分类错误的样本数占样本总数的比例。即如果在 m 个样本中有 a 个样本分类错误，则错误率
$E=\frac{a}{m}$
精度（accuracy）：精度 = 1 - 错误率，精度常写为百分比形式(1-E)×100%

评判一个学习器训练得好不好的指标主要是错误率和精度。

误差期望 / 误差（error） ：学习器的实际预测输出与样本的真实输出之间的差异。一般用“误差”代指。
训练误差（training error）/经验误差（empirical error）：学习器在训练集上的误差
泛化误差（generaliazation error）：学习器在新样本上的误差。
在多种误差中，，我们希望得到泛化误差小的学习器。然而，我们事先并不知道新样本是什么样，实际能做的是努力使经验误差最小化。在很多情况下，我们可以学得一个经验误差很小、在训练集上表现很好的学习器。
为了达到这个目的，应该从训练样本中尽可能学出适用于所有样本的“普遍规律”，这样在遇到新的样本时，才能做出准确的判断。
过拟合 ：学习器把训练样本学得"太好"，导致把训练样本自身的一些特点当作了所有潜在样本都会具有的一般性质，导致泛化性能下降的现象。
欠拟合：与过拟合相对的现象。

导致过/欠拟合的原因：学习能力过于强大，将训练样本不太一般的特性都学习到了；而欠拟合是因为学习能力较差造成的。
解决过/欠拟合的方法：欠拟合比较容易克服，可能增加学习轮数，或者扩大决策树的分支等；而过拟合则很麻烦，是机器学习面临的关键障碍，各类算法都必然带有一些针对过拟合的措施，但无法彻底避免，我们能做到的只是“缓解”

2.2 评估方法

在训练学习模型时，我们可通过实验测试 (测试集) 来学习器的泛化误差进行评估并进而做出选择。
现实任务中，我们有很多的学习算法可以选择，泛化误差不可事先预估，而训练误差又由于过拟合的存在而不适合作为评估标准，那么到底如何进行模型的评估与选择呢？

通常使用 测试集（testing set）来测试学习器对新样本的判别能力（假设测试样本也是从真实分布中独立同分布采样而得），同时需要尽可能使测试集与训练集互斥。一般将样本分为测试集T和训练集S，常见的划分方法如下：

a) 留出法

留出法(hold-out)：直接将数据集 D分为两个互斥的集合，其中一个集合作为训练集S,另一个作为测试集T,即D=S ∪T, S ∩ T= Ø 。在 S 上训练出模型后，用 T 来评估其测试误差，作为对泛化误差的估计。

常见划分方法：
1、简答的三七分、二八分，但注意训练集与测试机同分布
2、进行多次随机划分，训练多个模型，最后取平均值。

b) 交叉验证法

原理：k折交叉验证。

将数据分为个大小相似的互斥子集， D = D₁ ∪ D₂∪… ∪ D_k, D~ i~ ∩ D_j = ø (í 每个子集尽可保持数据分布的一致性，即从通过分层采样得到。每次用 k-1 个子集的并集作为训练集?余的那个子集作测试集;这样就可获得组训练试集，从而可进行次训练和测试，最终返回的是测试结果的均值。

缺点：数据较大时，对算力要求高

与留出法相似，“10次 10 折交叉验证法”与“100次留出法”都是进行了 100 次训练/测试。

c) 自助法

原理：

适用场所：数据集较小，难以划分的时候，能从初始数据集中产生多个不同的训练集。
缺点：改变初始数据集分布，会引入估计偏差

d) 调参与最终模型

验证集
数据进入后每层神经网络有多少个神经元，每层大小的参数，多数是人为规定的，比较难调参。

调3个参数，每个参数5个候选值，则一个数据集就会有 3⁵ 个模型需要考察。
因此，为了调参，会选择加入一个数据集，验证集。
训练集训练，验证集看结果，调参，再看验证集结果参数调完，最后再测试集上看结果。

2.3 性能度量

        对学习器的泛化性能进行评估，除了实验评估的方法，还需要有衡量模型泛化能力的评价标准，这就是性能度量（performance measure）
        性能度量反映了任务需求，在对比不同模型的能力时，使用不同的性能度量往往会导致不同的评判结果；模型的“好坏”是相对的，不仅取决于算法和数据，还决定与任务需求。
        在预测任务中?给定样例集 = {(x₁ , y₁) , (x₂, y₂)， . . . , (x_m, y_m)} 其中y₁ 是示例 x_i 的真实标记.要评估学习器的性能，就要把学习器预测结果 f(x)与真实标记进行比较。

回归任务最常用的性能度量是均方误差（mean squared error）。
分类错误率定义：
精度定义：

4.，对于数据分布 D 和概率密度函数 p(.) 错误率与精度可分别描述为：

ps，Ⅱ(.)是指示函数，括号内为真取1，否则取0。

性能度量指标较多，但是一般常用的只有错误率、精度、查准率、查全率、F1、ROC 和 AUC。

a) 错误率与精度

错误率（error rate） ：分类错误的样本数占样本总数的比例。即如果在 m 个样本中有 a 个样本分类错误，则错误率
$E=\frac{a}{m}$
精度（accuracy）：精度 = 1 - 错误率，精度常写为百分比形式(1-E)×100%

评判一个学习器训练得好不好的指标主要是错误率和精度。

错误率与精度适用于二分类/多分类任务，是分类任务中最常用的两种性能度量。

b) 查准率、查全率与F1

查准率（precision）：被学习器预测为正例的样例中有多大比例是真正例。如，挑出的西瓜中有多少比例是好瓜
查全率（recall）：所有正例当中有多大比例被学习器预测为正例，所有好瓜中有多少比例被挑了出来。
分类结果混淆矩阵

查准率P=TP/（TP+FP）；查全率R=TP/（TP+FN），
查准率与查全率是一对矛盾的度量。

以查准率为纵轴、查全率为横轴作图，得到一个曲线称为 P-R曲线 。若一个学习器的P-R曲线，完全包住另一个学习器P-R曲线，则前者优于后者；若两者有交叉，则以平衡点的大小来进行对比。（平衡点（break-event point，简称BER）：查准率=查全率时的取值）

但，BEF 太过于简化，因此多用 F1（基于查准率与查全率的调和平均）
F1 = 2×P×R /（P+R） = 2×TP（样本总数+TP-TN）

P-R反向关系原理

我们定的分类阈值也会对最终的预测结果产生影响。假设评分高为正类，评分低为负类。阈值设置的比较低的时候，假正类少，假负类多。阈值设置的高时，假正类多，假负类比较少。对于下图判断是否为5的结果中：

如果对预测比较严格，如阈值为 5 ，此时，4 个 5 被预测出来，查准率为 80%，查全率为 67%。

如果对预测特别严格，如阈值为 3 ，此时，3 个 5 被预测出来，查准率为 100% ，查全率为 50%。

如果对预测比较宽松，如阈值为 8，此时，6 个 5 被预测出来，查准率为 75% ，所有的 5 都被查出来，查全率为 100% 。

总结：把门的规则严，则准确率高；反之，则低。

那么阈值应该怎么确定？
确定最优阈值的方法主要有：

使用平衡点 BEP（Break-Even-Point )

R = P 时， B 与 P 的值

F1度量
Fbeta

为了能够综合考察查准率和查全率，总是希望在 n 个二分类混淆矩阵，即，n个二分类实现的多分类问题

先分别计算，再求平均值。

先在各混淆矩阵上分别计算出查准率和查全率，记为 (P₁， R₁) ，…，(P_n, R_n) 再计算平均值，从而得到"宏查准率" (macro-P) “宏查全率” (macro-R) ，以及相应的"宏F1" (macro-F1)

先求平均值，再分别计算准确率和查全率。

2.4比较检验

a) 假设检验

b) 交叉验证 t 检验

c) McNemar 检验

d) Friedman 检验与 nenyl 后续检验

B、一种训练集多种算法

P-R 曲线
a)

b) 比较 ABC 三个模型的好坏
可以看见 B 与 A 都优于 C，但 AB 存在交叉，无法判断谁更优
则对于AB有
- 法一：比较AB面积大小，其在一定程度上表征了模型的优劣性，但这个值不容易被估算。
- 法二：F1
- 法三：Fbeta；

a) ROC与AUC

ROC（Receiver Operating Characteristic，接受者操作特性曲线），是指在特定条件下，以在不同判断标准下所得的「预判错误率」为横坐标，以「预判正确率」为纵坐标，得到的多个点的连线，就是ROC曲线。
ROC曲线由两个变量TPR和FPR组成，这个组合以FPR对TPR，即是以代价(costs)对收益(benefits)。

横坐标为「FPR」,在所有的负样本中，分类器预测错误的比例。FPR=负样本判为正的数量/（负样本判为正的数量+负样本判为负的数量）。
$\frac{FP}{FP + TN }$
纵坐标为「TPR」在所有的正样本中，分类器预测正确的比例（等于Recall）。TPR=正样本判为正的数量/（正样本判为正的数量+正样本判断为负数量）。
$\frac{TP}{TP + FN }$

AUC（Area Under Curve） 被定义为ROC曲线下与坐标轴围成的面积，在1*1坐标系中，AUC的取值范围在0.5和1之间。AUC越接近1.0，预测效果越好；等于0.5时，真实性最低，无应用价值。
AUC的物理意义正样本的预测结果大于负样本的预测结果的概率。所以AUC反应的是分类器对样本的排序能力。

排序损失
给定 m⁺ 个正例和 m^- 个反例令 D⁺ 和 D^- 分别表示正、反例集合则排序“损失”(loss)定义为

C、多种训练集一种算法

a) 代价敏感错误率与代价曲线

b) 偏差和方差

java23种设计模式-命令模式千里码！设计模式后端技术 #Java 设计模式命令模式
命令模式（CommandPattern）学习笔记1.模式定义行为型设计模式，将请求封装为对象，使请求的发送者与接收者解耦。支持请求的排队、记录、撤销/重做等操作。2.适用场景✅需要将操作参数化✅需要支持事务操作（撤销/重做）✅需要实现任务队列/线程池✅需要记录操作历史✅需要支持宏命令（命令组合）3.模式结构knowsexecutescreatescreates«interface»Command+
笔记工具--MD-Markdown的语法技巧忆源笔记
MD格式，全称为Markdown格式，是一种轻量级标记语言文件，主要用于创建格式化文本。以下是对MD格式的详细解释：一、定义与特点定义：MD文件是一种纯文本格式的文件，使用简单的符号或语法来标记标题、列表、链接、图片等元素，从而实现对文本的格式化。特点：易读易写：MD文件的语法简洁明了，使得作者能够快速上手并编写出结构清晰的文档。兼容性强：MD文件可以在不同的平台和设备上打开和编辑，如文本编辑器、
深入解析 Python 的 __str__() 方法重写 web安全工具库 python microsoft 开发语言
各类资料学习下载合集https://pan.quark.cn/s/8c91ccb5a474在Python中，__str__()是一个特殊的方法，用于定义对象的“非正式”字符串表示。重写__str__()方法可以让我们定制类的实例在打印或转换成字符串时的表现。本文将详细讲解__str__()方法的作用、如何重写它，以及具体的代码示例和运行结果。一、什么是__str__()方法__str__()方法是
设计模式-建造者模式老菜鸟的每一天设计模式设计模式建造者模式
解释生活中有着很多的Builder的例子，个人觉得大学生活就是一个Builder模式的最好体验：要完成大学教育，一般将大学教育过程分成4个学期进行，因此没有学习可以看作是构建完整大学教育的一个部分构建过程，每个人经过这4年的（4个阶段）构建过程得到的最后的结果不一样，因为可能在四个阶段的构建中引入了很多的参数（每个人的机会和际遇不完全相同）。Builder模式要解决的也正是这样的问题：当我们要创建
Kafka 基础教程 — 可靠的数据传递码炫课堂-码哥 kafka专题 kafka 消息队列
作者简介：大家好，我是码炫码哥，前中兴通讯、美团架构师，现任某互联网公司CTO，兼职码炫课堂主讲源码系列专题代表作：《jdk源码&多线程&高并发》，《深入tomcat源码解析》，《深入netty源码解析》，《深入dubbo源码解析》，《深入springboot源码解析》，《深入spring源码解析》，《深入redis源码解析》等联系qq：184480602，加我进群，大家一起学习，一起进步，一起对
数据库的 DDL、DML、DQL、DCL 分别是什么？下面谈谈这四者的概念。雪碧聊技术 MySQL 数据库四种操作语句 MySQL SQL
欢迎来到“雪碧聊技术”CSDN博客！在这里，您将踏入一个专注于Java开发技术的知识殿堂。无论您是Java编程的初学者，还是具有一定经验的开发者，相信我的博客都能为您提供宝贵的学习资源和实用技巧。作为您的技术向导，我将不断探索Java的深邃世界，分享最新的技术动态、实战经验以及项目心得。让我们一同在Java的广阔天地中遨游，携手提升技术能力，共创美好未来！感谢您的关注与支持，期待在“雪碧聊技术”与
MySQL知识点思维导图 Java小白白又白各种技术思维导图合集 mysql
MySQL知识点思维导图，文章里是PNG格式，可能不是很清晰，文末附上PDF和xmind工程文件链接，需要的小伙伴自取，都只需要1个币（设置成0个币还需要啥下载码）。如有错误的地方欢迎大家批评指正。MySQL知识点思维导图PDFMySQL知识点思维导图PDF-MySQL文档类资源-CSDN下载MySQL知识点思维导图PDF更多下载资源、学习资料请访问CSDN下载频道.https://downloa
深度学习-133-LangGraph之应用实例(二)使用面向过程和面向对象的两种编程方式构建带记忆的聊天机器人皮皮冰燃深度学习深度学习人工智能 LangGraph
文章目录1通用配置1.1大语言模型ChatOllama1.2函数trim_messages1.2.1函数概述1.2.2函数参数1.2.3测试应用2面向过程编程2.1不裁剪历史信息2.1.1创建图2.1.2调用图2.2裁剪历史信息2.2.1创建图2.2.2调用图3面向对象编程3.1定义类MyState3.2定义类AIChat3.3应用4附录4.1问题及解决tokenizer4.2参考附录1通用配置L
软件工程应试复习（考试折磨版）愚戏师软件工程
针对学校软件工程考试，参考教材《软件工程导论（第6版）》1-8章学习的艺术：不断地尝试，我一定会找到高效用的方法，让学习变成一门艺术，从应试备考中解救出我的时间同胞们。好嘞！既然时间紧迫，咱们就用「闪电战」学习法，把知识点当零食一样快速吞下（但记得消化哦）！上攻略三步速成秘籍(测试版）：应试求生指南！1.开挂第一步：「抓大放小」狙击战！锁定BOSS级考点：翻开目录，用荧光笔把老师敲黑板的内容（PP
数据挖掘中特征发现与特征提取的数学原理调皮的芋头数据挖掘人工智能 AIGC 计算机视觉
好的，我将深入研究数据挖掘中特征发现与特征提取的数学原理，涵盖统计学基础、特征工程的数学方法、以及在机器学习和深度学习中的应用。我会整理相关数学公式和理论，包括主成分分析（PCA）、独立成分分析（ICA）、线性判别分析（LDA）、信息增益、互信息、方差分析等统计方法，并结合金融量化交易的实际应用，确保内容既有理论深度，又能落地实践。完成后，我会通知您！1.统计学基础：描述性统计、方差分析、相关性与
深入探索Spark MLlib：大数据时代的机器学习利器 concisedistinct 人工智能 mllib spark-ml Spark MLlib 大数据机器学习
随着大数据技术的迅猛发展，机器学习在各行各业的应用日益广泛。ApacheSpark作为大数据处理的利器，其内置的机器学习库MLlib（MachineLearningLibrary）提供了一套高效、易用的工具，用于处理和分析海量数据。本文将深入探讨SparkMLlib，介绍其核心功能和应用场景，并通过实例展示如何在实际项目中应用这些工具。一、SparkMLlib概述1.什么是SparkMLlib？S
【TVM教程】为 NVIDIA GPU 自动调度神经网络 HyperAI超神经 TVM 神经网络人工智能深度学习 TVM GPU NVIDIA 语言模型
ApacheTVM是一个深度的深度学习编译框架，适用于CPU、GPU和各种机器学习加速芯片。更多TVM中文文档可访问→https://tvm.hyper.ai/作者：LianminZheng针对特定设备和工作负载的自动调优对于获得最佳性能至关重要。本文介绍如何使用auto-scheduler为NVIDIAGPU调优整个神经网络。为自动调优神经网络，需要将网络划分为小的子图并独立调优。每个子图被视为
AI人工智能机器学习之监督线性模型 rockfeng0 人工智能机器学习 sklearn
1、概要本篇学习AI人工智能机器监督学习框架下的线性模型，以LinearRegression线性回归和LogisticRegression逻辑回归为示例，从代码层面测试和讲述监督学习中的线性模型。2、监督学习之线性模型-简介监督学习和线性模型是的两个重要概念。监督学习是一种机器学习任务，其中模型在已标记的数据集上进行训练。线性模型是一类通过线性组合输入特征来进行预测的模型。线性模型的基本形式可
The Rust Programming Language 学习
说明关于参考的教程TheRustProgrammingLanguage是英文版本的由于本人英语水平相当的有限,所以我们这里直接去看翻译好的版本Rust程序设计语言.下面我们将两个地址全部都贴出来.TheRustProgrammingLanguageRust程序设计语言Rust官方文档中文教程教程中提到的一些前置翻译已参照最新的Rust1.58.0版及开发版进行调整，这是目前网上最新的中文版本，最后
大数据模型：技术赋能，引领未来大模型教程人工智能 AI大模型大模型语言模型
随着互联网、物联网、人工智能等技术的飞速发展，我们正身处一个数据爆炸的时代。数据，已经成为这个时代最为宝贵的资源之一。而如何挖掘和利用这些海量数据，为企业和社会创造价值，正是大数据模型所追求的目标。本文将从以下几个方面对大数据模型进行探讨：概述、技术原理、应用场景、挑战与发展趋势。一、概述大数据模型是一种基于数据挖掘和机器学习技术的分析方法，通过对海量数据进行处理和分析，挖掘出有价值的信息和知识，
Selenium入门，最近看到的都师一些小白想学测试，今天就分享入门吧~ 程序员-小枫 selenium 自动化测试 Python selenium python 软件测试
Selenium入门（自动右键保存图片到本机上）前言入职测开一段时间，基本就是熟悉需求，熟悉业务，熟悉这熟悉那，再跟着需求做各种各样的测试和联调，趁着业余时间，也是学习了一下Selenium，在之前Selenium是我作为爬虫的工具，不过之后就用来做写一些自动化测试脚本啦~~（这里使用Python中的Selenium库进行Coding~~1、什么是SeleniumSelenium是一个用于Web应
rabbitmq 同步策略_数据同步解决方案-canal与rabbitmq weixin_39996739 rabbitmq 同步策略
学习目标能够完成canal环境的搭建与数据监控微服务的开发能够完成首页广告缓存更新的功能，掌握OkHttpClient的基本使用方法能够完成商品上架索引库导入数据功能，能够画出流程图和说出实现思路能够完成商品下架索引库删除数据功能，能够画出流程图和说出实现思路该工程使用lua+nginx+rabbitmq+redis等技术的第一个主要目的是实现轮播图的读取，具体图解：其中nginx的作用包括了从数
【深度学习】PYTORCH框架中采用训练数据“CIFAR-10”实现RESNET50 别出BUG求求了深度学习深度学习 pytorch cifar-10 resnet50 神经网络
一、ResNet网络结构二、基本块三、RESNET50代码实现resnet50.pyimporttorchimporttorch.nnasnnfromtorch.nnimportfunctionalasFclassResNet50BasicBlock(nn.Module):def__init__(self,in_channel,outs,kernerl_size,stride,padding):s
人工智能深度学习系列—深入探索KL散度：度量概率分布差异的关键工具学步_技术自动驾驶人工智能人工智能深度学习自动驾驶机器学习
人工智能深度学习系列—深度解析：交叉熵损失（Cross-EntropyLoss）在分类问题中的应用人工智能深度学习系列—深入解析：均方误差损失（MSELoss）在深度学习中的应用与实践人工智能深度学习系列—深入探索KL散度：度量概率分布差异的关键工具人工智能深度学习系列—探索余弦相似度损失：深度学习中的相似性度量神器人工智能深度学习系列—深度学习中的边界框回归新贵：GHM（GeneralizedH
Qt——Qt控件之输入窗口-QTextEdit文本编辑框控件的使用总结（例程：文本编辑输入） Winter_world QT开发实战 qt 开发语言 QTextEdit控件 Qt文本编辑控件的使用
【系列专栏】：博主结合工作实践输出的，解决实际问题的专栏，朋友们看过来！《项目案例分享》《极客DIY开源分享》《嵌入式通用开发实战》《C++语言开发基础总结》《从0到1学习嵌入式Linux开发》《QT开发实战》《Android开发实战》《实用硬件方案设计》《结构建模设计》《数据库开发总结》《JAVA入门基础》《JavaWeb开发实战》长期持续带来更多案例与技术文章分享；欢迎商业项目咨询，10年+软
数据采集技术：selenium/正则匹配/xpath/beautifulsoup爬虫实例写代码的中青年 3天入门机器学习 selenium beautifulsoup 爬虫 python xpath 正则表达式
专栏介绍1.专栏面向零基础或基础较差的机器学习入门的读者朋友，旨在利用实际代码案例和通俗化文字说明，使读者朋友快速上手机器学习及其相关知识体系。2.专栏内容上包括数据采集、数据读写、数据预处理、分类\回归\聚类算法、可视化等技术。3.需要强调的是，专栏仅介绍主流、初阶知识，每一技术模块都是AI研究的细分领域，同更多技术有所交叠，此处不进行讨论和分享。数据采集技术：selenium/正则匹配/xpa
BCPD++(非刚性配准) 算法原理详解点云SLAM 点云数据处理技术算法 BCPD++非刚性拼接点云数据处理贝叶斯模型
BCPD++算法原理详解一、算法概述BCPD++（BayesianCoherentPointDrift++）是BCPD（BayesianCoherentPointDrift）的增强版本，专为非刚性点云配准设计。它基于贝叶斯概率框架，结合变分推断与高效优化策略，显著提升了配准精度、鲁棒性与计算效率。BCPD++的核心创新在于：分层贝叶斯模型：自适应学习超参数，减少人工调参需求。变分贝叶斯推断：替代传
点云配准（点云拼接）论文综述点云SLAM 点云数据处理技术点云数据处理点云配准 DeepICP ICP 深度学习配准方法特征匹配
点云配准（点云拼接）论文综述1.引言点云配准（PointCloudRegistration）是三维计算机视觉与机器人感知领域的核心任务，其目标是通过几何变换将多个点云对齐至统一坐标系，形成完整的场景表示。该技术广泛应用于自动驾驶、增强现实、工业检测、医学影像等领域。随着传感器技术（如LiDAR、RGB-D相机）的进步与深度学习的发展，点云配准方法经历了从传统优化算法到数据驱动模型的演变。本文系统综
java题库app有什么,Java面试题库 m0_74824091 面试学习路线阿里巴巴 java 面试开发语言
Java面试题库是一个学习刷题类软件，主要针对Java从业者设计，整合了众多基础的题目资源，涵盖面试中可能会遇到的各种出题内容；软件使用功能非常简单，上面就设置了题库和搜索等中心，打开软件就能看到其中各种不同的题目划分栏目，马上就能从推荐栏目找到需要练习的题目并打开练习学习，里面每个题目都提供相应的详细解释和对应的知识点击内容，让用户能高效的掌握该问题考察的考点信息；这里的题库资源丰富，还按照多种
详细介绍人工智能学习框架日记成书反正看不懂系列人工智能
人工智能学习框架是开发者用于构建、训练和部署机器学习模型的核心工具。以下从框架分类、核心框架介绍、学习方法三个维度展开详解：一、主流人工智能框架全景图（一）基础框架层TensorFlow（Google）核心优势：工业级部署能力，支持移动端（TFLite）、浏览器（TF.js）、服务器（TFServing）特色功能：SavedModel格式跨平台兼容，XLA编译器优化计算图适用场景：生产环境部署、大
二叉树-左叶子之和 Hasno. 深度优先算法
代码随想录-刷题笔记404.左叶子之和-力扣（LeetCode）内容：该题仅作为搜索，但是其中的规则让人摸不着头脑，看起来似乎很头疼但是仔细一思考，能发现左叶子无非是这样的定义当发现一个节点的左孩子不为null,并且左孩子的左右孩子都为null(叶子结点)那么可以知道，找到了左叶子OK，接下来就是常规的搜索,只要搜索到满足这样的节点，直接加到一个全局变量就OK了/***Definitionfora
青少年Python趣学编程：用代码开启无限可能【文末好书推荐】一键难忘好书推荐 python pygame 开发语言
文章目录青少年Python趣学编程：用代码开启无限可能1.为什么选择Python？2.从小游戏开始：让编程变得有趣3.学习编程的关键步骤4.提供项目和挑战：激发创造力《青少年Python趣学编程（微课视频版）》【好书推荐】购书链接本书特色✨内容亮点配套资源适用人群青少年Python趣学编程：用代码开启无限可能在当今数字化的时代，编程已成为一种基础技能，尤其对于青少年来说，学习编程不仅能帮助他们理解
从零开始玩转TensorFlow：小明的机器学习故事 4 山海青风机器学习 tensorflow 人工智能
探索深度学习1场景故事：小明的灵感前不久，小明一直在用传统的机器学习方法（如线性回归、逻辑回归）来预测学校篮球比赛的胜负。虽然在朋友们看来已经很不错了，但小明发现一个问题：当比赛数据越来越多、球队的特征越来越复杂时，模型的准确率提升得很慢。有一天，小明在学校图书馆翻看杂志时，看到这样一句话：“就像人的大脑有上百亿神经元，神经网络能够学习复杂的信息映射，从而取得卓越的表现。”他瞬间来了灵感：“或许我
【深度学习】Transformer入门：通俗易懂的介绍知识靠谱深度学习深度学习 transformer 人工智能
【深度学习】Transformer入门：通俗易懂的介绍一、引言二、从前的“读句子”方式三、Transformer的“超级阅读能力”四、Transformer是怎么做到的？五、Transformer的“多视角”能力六、Transformer的“位置记忆”七、Transformer的“翻译流程”八、Transformer为什么这么厉害？九、Transformer的应用十、总结一、引言在自然语言处理（N
二叉树-二叉树的所有路径 Hasno. 深度优先算法
代码随想录-刷题笔记257.二叉树的所有路径-力扣（LeetCode）内容：本题是一道递归+回溯的问题,其实递归和回溯是一个意思，但是这道题一定要明显的进行一次回溯。毕竟每一条路径都不太一样，收集完一次结果之后，需要把上一次探的节点给撤销.这一步就是很明显回溯回溯部分在回溯篇章再去详细写一篇笔记,因此本文只做介绍,至于路径问题,真可谓是回溯的常客了.哦，对每次都想吐槽一下Java的神奇的字符串,必
312个免费高速HTTP代理IP（能隐藏自己真实IP地址） yangshangchuan 高速免费 superword HTTP代理
124.88.67.20:843 190.36.223.93:8080 117.147.221.38:8123 122.228.92.103:3128 183.247.211.159:8123 124.88.67.35:81 112.18.51.167:8123 218.28.96.39:3128 49.94.160.198:3128 183.20
pull解析和json编码百合不是茶 android pull解析 json
n.json文件: [{name:java,lan:c++,age:17},{name:android,lan:java,age:8}] pull.xml文件 <?xml version="1.0" encoding="utf-8"?> <stu> <name>java
[能源与矿产]石油与地球生态系统 comsci 能源
按照苏联的科学界的说法,石油并非是远古的生物残骸的演变产物,而是一种可以由某些特殊地质结构和物理条件生产出来的东西,也就是说,石油是可以自增长的.... 那么我们做一个猜想: 石油好像是地球的体液,我们地球具有自动产生石油的某种机制,只要我们不过量开采石油,并保护好
类与对象浅谈沐刃青蛟 java 基础
类，字面理解，便是同一种事物的总称，比如人类，是对世界上所有人的一个总称。而对象，便是类的具体化，实例化，是一个具体事物，比如张飞这个人，就是人类的一个对象。但要注意的是：张飞这个人是对象，而不是张飞，张飞只是他这个人的名字，是他的属性而已。而一个类中包含了属性和方法这两兄弟，他们分别用来描述对象的行为和性质（感觉应该是
新站开始被收录后，我们应该做什么？ IT独行者 PHP seo
新站开始被收录后，我们应该做什么？百度终于开始收录自己的网站了，作为站长，你是不是觉得那一刻很有成就感呢，同时，你是不是又很茫然，不知道下一步该做什么了？至少我当初就是这样，在这里和大家一份分享一下新站收录后，我们要做哪些工作。至于如何让百度快速收录自己的网站，可以参考我之前的帖子《新站让百
oracle 连接碰到的问题文强chu oracle
Unable to find a java Virtual Machine－－安装64位版Oracle11gR2后无法启动SQLDeveloper的解决方案作者：草根IT网来源：未知人气：813标签：导读：安装64位版Oracle11gR2后发现启动SQLDeveloper时弹出配置java.exe的路径，找到Oracle自带java.exe后产生的路径“C:\app\用户名\prod
Swing中按ctrl键同时移动鼠标拖动组件（类中多借口共享同一数据）小桔子 java 继承 swing 接口监听
都知道java中类只能单继承，但可以实现多个接口，但我发现实现多个接口之后，多个接口却不能共享同一个数据，应用开发中想实现：当用户按着ctrl键时，可以用鼠标点击拖动组件，比如说文本框。编写一个监听实现KeyListener,NouseListener,MouseMotionListener三个接口，重写方法。定义一个全局变量boolea
linux常用的命令 aichenglong linux 常用命令
1 startx切换到图形化界面 2 man命令:查看帮助信息 man 需要查看的命令,man命令提供了大量的帮助信息,一般可以分成4个部分 name:对命令的简单说明 synopsis:命令的使用格式说明 description:命令的详细说明信息 options:命令的各项说明 3 date:显示时间语法：date [OPTION]... [+FORMAT]
eclipse内存优化 AILIKES java eclipse jvm jdk
一基本说明在JVM中，总体上分2块内存区,默认空余堆内存小于 40%时，JVM就会增大堆直到-Xmx的最大限制；空余堆内存大于70%时，JVM会减少堆直到-Xms的最小限制。 1)堆内存(Heap memory):堆是运行时数据区域，所有类实例和数组的内存均从此处分配,是Java代码可及的内存，是留给开发人
关键字的使用探讨百合不是茶关键字
//关键字的使用探讨/*访问关键词private 只能在本类中访问public 只能在本工程中访问protected 只能在包中和子类中访问默认的只能在包中访问*//*final 类方法变量 final 类不能被继承 final 方法不能被子类覆盖，但可以继承 final 变量只能有一次赋值，赋值后不能改变 final 不能用来修饰构造方法*///this()
JS中定义对象的几种方式 bijian1013 js
1. 基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)： <html> <head> <title>基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)</title> </head> <script> var obj = new Object();
表驱动法实例 bijian1013 java 表驱动法 TDD
获得月的天数是典型的直接访问驱动表方式的实例，下面我们来展示一下： MonthDaysTest.java package com.study.test; import org.junit.Assert; import org.junit.Test; import com.study.MonthDays; public class MonthDaysTest { @T
LInux启停重启常用服务器的脚本 bit1129 linux
启动，停止和重启常用服务器的Bash脚本，对于每个服务器，需要根据实际的安装路径做相应的修改 #! /bin/bash Servers=(Apache2, Nginx, Resin, Tomcat, Couchbase, SVN, ActiveMQ, Mongo); Ops=(Start, Stop, Restart); currentDir=$(pwd); echo
【HBase六】REST操作HBase bit1129 hbase
HBase提供了REST风格的服务方便查看HBase集群的信息，以及执行增删改查操作 1. 启动和停止HBase REST 服务 1.1 启动REST服务前台启动（默认端口号8080） [hadoop@hadoop bin]$ ./hbase rest start 后台启动 hbase-daemon.sh start rest 启动时指定
大话zabbix 3.0设计假设 ronin47
What’s new in Zabbix 2.0? 去年开始使用Zabbix的时候，是1.8.X的版本，今年Zabbix已经跨入了2.0的时代。看了2.0的release notes，和performance相关的有下面几个： :: Performance improvements::Trigger related da
http错误码大全 byalias http协议 javaweb
响应码由三位十进制数字组成，它们出现在由HTTP服务器发送的响应的第一行。响应码分五种类型，由它们的第一位数字表示： 1）1xx：信息，请求收到，继续处理 2）2xx：成功，行为被成功地接受、理解和采纳 3）3xx：重定向，为了完成请求，必须进一步执行的动作 4）4xx：客户端错误，请求包含语法错误或者请求无法实现 5）5xx：服务器错误，服务器不能实现一种明显无效的请求
J2EE设计模式-Intercepting Filter bylijinnan java 设计模式数据结构
Intercepting Filter类似于职责链模式有两种实现其中一种是Filter之间没有联系，全部Filter都存放在FilterChain中，由FilterChain来有序或无序地把把所有Filter调用一遍。没有用到链表这种数据结构。示例如下： package com.ljn.filter.custom; import java.util.ArrayList;
修改jboss端口 chicony jboss
修改jboss端口 %JBOSS_HOME%\server\{服务实例名}\conf\bindingservice.beans\META-INF\bindings-jboss-beans.xml 中找到 <!-- The ports-default bindings are obtained by taking the base bindin
c++ 用类模版实现数组类 CrazyMizzz C++
最近c++学到数组类，写了代码将他实现，基本具有vector类的功能 #include<iostream> #include<string> #include<cassert> using namespace std; template<class T> class Array { public: //构造函数
hadoop dfs.datanode.du.reserved 预留空间配置方法 daizj hadoop 预留空间
对于datanode配置预留空间的方法为：在hdfs-site.xml添加如下配置 <property> <name>dfs.datanode.du.reserved</name> <value>10737418240</value>
mysql远程访问的设置 dcj3sjt126com mysql 防火墙
第一步: 激活网络设置你需要编辑mysql配置文件my.cnf. 通常状况，my.cnf放置于在以下目录： /etc/mysql/my.cnf (Debian linux) /etc/my.cnf （Red Hat Linux/Fedora Linux) /var/db/mysql/my.cnf (FreeBSD) 然后用vi编辑my.cnf，修改内容从以下行： [mysqld] 你所需要: 1
ios 使用特定的popToViewController返回到相应的Controller dcj3sjt126com controller
1、取navigationCtroller中的Controllers NSArray * ctrlArray = self.navigationController.viewControllers; 2、取出后，执行， [self.navigationController popToViewController:[ctrlArray objectAtIndex:0] animated:YES
Linux正则表达式和通配符的区别 eksliang 正则表达式通配符和正则表达式的区别通配符
转载请出自出处：http://eksliang.iteye.com/blog/1976579 首先得明白二者是截然不同的通配符只能用在shell命令中,用来处理字符串的的匹配。判断一个命令是否为bash shell(linux 默认的shell)的内置命令 type -t commad 返回结果含义 file 表示为外部命令 alias 表示该
Ubuntu Mysql Install and CONF gengzg Install
http://www.navicat.com.cn/download/navicat-for-mysql Step1: 下载Navicat ，网址：http://www.navicat.com/en/download/download.html Step2：进入下载目录，解压压缩包：tar -zxvf navicat11_mysql_en.tar.gz
批处理，删除文件bat huqiji windows dos
@echo off ::演示：删除指定路径下指定天数之前（以文件名中包含的日期字符串为准）的文件。 ::如果演示结果无误，把del前面的echo去掉，即可实现真正删除。 ::本例假设文件名中包含的日期字符串（比如：bak-2009-12-25.log） rem 指定待删除文件的存放路径 set SrcDir=C:/Test/BatHome rem 指定天数 set DaysAgo=1
跨浏览器兼容的HTML5视频音频播放器天梯梦 html5
HTML5的video和audio标签是用来在网页中加入视频和音频的标签，在支持html5的浏览器中不需要预先加载Adobe Flash浏览器插件就能轻松快速的播放视频和音频文件。而html5media.js可以在不支持html5的浏览器上使video和audio标签生效。 How to enable <video> and <audio> tags in
Bundle自定义数据传递 hm4123660 android Serializable 自定义数据传递 Bundle Parcelable
我们都知道Bundle可能过put****()方法添加各种基本类型的数据，Intent也可以通过putExtras(Bundle)将数据添加进去，然后通过startActivity()跳到下一下Activity的时候就把数据也传到下一个Activity了。如传递一个字符串到下一个Activity 把数据放到Intent
C＃：异步编程和线程的使用（.NET 4.5 ） powertoolsteam .net 线程 C#异步编程
异步编程和线程处理是并发或并行编程非常重要的功能特征。为了实现异步编程，可使用线程也可以不用。将异步与线程同时讲，将有助于我们更好的理解它们的特征。本文中涉及关键知识点 1. 异步编程 2. 线程的使用 3. 基于任务的异步模式 4. 并行编程 5. 总结异步编程什么是异步操作？异步操作是指某些操作能够独立运行，不依赖主流程或主其他处理流程。通常情况下，C＃程序
spark 查看 job history 日志 Stark_Summer 日志 spark history job
SPARK_HOME/conf 下: spark-defaults.conf 增加如下内容 spark.eventLog.enabled true spark.eventLog.dir hdfs://master:8020/var/log/spark spark.eventLog.compress true spark-env.sh 增加如下内容 export SP
SSH框架搭建 wangxiukai2015eye spring Hibernate struts
MyEclipse搭建SSH框架 Struts Spring Hibernate 1、new一个web project。 2、右键项目，为项目添加Struts支持。选择Struts2 Core Libraries -<MyEclipes-Library> 点击Finish。src目录下多了struts

【机器学习】吃瓜教程 | 西瓜书 + 南瓜书 （1）