studyeboy

机器学习与应用—学习笔记

文章目录

机器学习简介
数学知识

微积分和线性代数

导数
向量与矩阵
偏导数与梯度
雅克比矩阵
Hessian矩阵
行列式
特征值和特征向量
二次型
向量与矩阵求导

最优化方法

梯度下降法
牛顿法
坐标下降法
拉格朗日乘数法
凸优化
拉格朗日对偶
KKT条件

概率论

随机事件与概率
条件概率
随机变量
数学期望与方差
随机向量
最大似然估计

机器学习基本概念

算法分类
模型评价指标

准确率
精准率
召回率
真正（阳）率假正（阳）率
ROC 曲线
混淆矩阵
交叉验证

模型选择

过拟合与欠拟合
偏差与方差分解
正则化

贝叶斯分类器
决策树
K近邻算法
参考资料

机器学习简介

机器学习的训练过程是通过训练样本寻找分类函数或模型的过程。有监督（聚类和数据降维没有训练过程）的机器学习的一般流程如下图所示，机器学习算法与其它算法的一个显著的区别是需要样本数据，是一种数据驱动的方法。

机器学习（Machine Learning）是人工智能的分支和一种实现方法，根据样本数据学习模型，用模型对数据进行预测与决策，也称为推理（inference）。机器学习是让计算机算法具有类似人的学习能力，像人一样能够从实例中学习到经验和知识，从而具备判断和预测的能力。机器学习的本质是模型的选择以及模型参数的确定。机器学习与之前基于人工规则的模型（逻辑推理、知识库、专家系统）相比，无需人工给出规则，而让程序自动从大量的样本中抽象、归纳出知识与规则。因此，它具有更好的通用性，采用这种统一的处理框架，可以将机器学习算法用于各种不同的领域。

数学知识

微积分和线性代数

导数

导数定义为函数的自变量变化值趋向于0时，函数值的变化量与自变量的变化量比值的极限，即：

如果上面的极限存在，则称函数在该点处可导。导数的几何意义是函数在某一点处的切线的斜率，典型的物理意义是瞬时速度。

导数和函数的单调性密切相关。导数大于0时函数单调增，导数小于0时函数单调减，在极值处导数必为0。导数为0的点称为函数的驻点。
二阶导数决定函数的凹凸性。如果二阶导数大于0，则函数为凸函数；如果二阶导数小于0，则为凹函数。二阶导数等于0的点称为函数的拐点。
根据一阶导数和二阶导数，可以得到一元函数的极值判别法：在驻点处，如果二阶导数大于0，则为函数的极小值点，如果二阶导数小于0，则为极大值点。如果二阶导数等于0，则情况不定。

向量与矩阵

向量是有大小和方向的量，由多个数构成一维数组，每个数称为它的分量。分量的数量称为向量的维数。物理中的力，速度是典型的向量。

如果两个向量的内积为0，则称它们正交，这是几何中垂直这个概念在高维空间的推广。

偏导数与梯度

梯度和函数的单调性、极值有关根据Fermat 定理，可导函数在某一点处取得极值的必要条件是梯度为 0，梯度为0 的点称为函数的驻点。需要注意的是，梯度为0 只是函数取极值的必要条件而不是充分条件。

雅克比矩阵

雅克比矩阵可以简化多元复合函数求导的公式。

Hessian矩阵

其中，o表示高阶无穷小。H是Hessian矩阵。它和一元函数的泰勒展开在形式上是统一的。

行列式

特征值和特征向量

二次型

向量与矩阵求导

最优化方法

最优化即寻找函数极值点的数值方法。将最优化问题统一表述为求解函数的极小值问题（极大值问题通过目标函数加负号的方式转换为极小值问题）。对优化变量有约束（等式约束和不等式约束），定义了优化变量的可行域，即满足约束条件的点构成的集合。

梯度下降法

梯度下降法沿梯度向量的反方向进行迭代以达到函数的极值点。

牛顿法

坐标下降法

坐标下降法每次迭代时在当前点处沿一个坐标轴方向进行一维搜索，固定其他的坐标方向，找到一个一元函数的极小值。在整个过程中依次循环使用不同的坐标方向进行迭代，一个周期的一维搜索迭代过程相当于一个梯度迭代。

拉格朗日乘数法

凸优化

求解一般函数的全局极小值是非常困难的，如果目标函数限制为凸函数、优化变量的可行域限定为凸集，同时满足这两个限定条件的最优化问题称为凸优化问题。

拉格朗日对偶

对偶是求解最优化问题的一种手段，它将一个最优化问题转化为另外一个更容易求解的问题。这两个问题是等价的。

KKT条件

概率论

随机事件与概率

条件概率

随机变量

数学期望与方差

随机向量

随机向量是一个向量，它的每个分量都是随机变量。随机向量也有离散型和连续型两种情况。

最大似然估计

已知样本服从的分布，要估计分布函数的参数，确定这些参数常用的一种方法是最大似然估计。
最大似然估计（Maximum Likelihood Estimate，MLE）构造一个似然函数，通过让似然函数最大化，求解出参数。最大似然估计的直观解释是。寻求一组参数，使得给定的样本集出现的概率最大。这样做的依据是这组样本数据已经发生了，因此，应该最大化它们发生的概率，即似然函数。

机器学习基本概念

算法分类

机器学习算法

有监督学习

标签值类型

求解的方法

分类问题

决策函数

线性函数

线性支持向量机

logistic回归

非线性函数

非线性核的支持向量机

人工神经网络

决策树

二分类

多分类

精度与召回率

混淆矩阵

常用指标

准确率

回归问题

评价指标

回归误差

生成模型

根据标签值生成随机的样本数据

贝叶斯分类器

高斯混合模型

隐马尔科夫模型

受限玻尔兹曼机

生成对抗网络

判别模型

根据样本特征向量值判断它的标签值

KNN算法

支持向量机

Adaboost算法

泛化能力

过拟合

欠拟合

无监督学习

聚类

表示学习

自动编码器

降维

半监督学习

无标签样本和标签样本混合

强化学习

根据输入的环境数据确定要执行的动作

模型评价指标

准确率

准确率的定义是预测正确的结果占总样本的百分比，其公式如下：
$准确率 = (T P + T N) / (T P + T N + F P + F N)$

虽然准确率可以判断总的正确率，但是在样本不平衡的情况下，并不能作为很好的指标来衡量结果。举个简单的例子，比如在一个总样本中，正样本占90%，负样本占10%，样本是严重不平衡的。对于这种情况，我们只需要将全部样本预测为正样本即可得到90%的高准确率。由于样本不平衡的问题，导致了得到的高准确率结果含有很大的水分。即如果样本不平衡，准确率就会失效。

精准率

精准率（Precision） 又叫查准率，它是针对预测结果而言的，它的含义是在所有被预测为正的样本中实际为正的样本的概率，意思就是在预测为正样本的结果中，我们有多少把握可以预测正确，其公式如下：
$精准率 = T P / (T P + F P)$

精准率和准确率看上去有些类似，但是完全不同的两个概念。精准率代表对正样本结果中的预测准确程度，而准确率则代表整体的预测准确程度，既包括正样本，也包括负样本。

召回率

召回率（Recall）又叫查全率，它是针对原样本而言的，它的含义是在实际为正的样本中被预测为正样本的概率，其公式如下：
$精准率 = T P / (T P + F N)$

真正（阳）率假正（阳）率

$真正率（ T P R ） = T P / (T P + F N)$

$假正率（ F P R ） = F P / (F P + T N)$

真正率的公式和召回率的公式相同。
真正率和假正率分别在实际的正样本和负样本中来观察相关概率问题。正因为如此，所以无论样本是否平衡，都不会被影响。例如总样本中，90%是正样本，10%是负样本。用准确率是有水分的，但是用TPR和FPR不一样。TPR只关注90%正样本中有多少是被真正覆盖的，而与那10%毫无关系，同理，FPR只关注10%负样本中有多少是被错误覆盖的，也与那90%毫无关系，所以可以看出：如果从实际表现的各个结果角度出发，就可以避免样本不平衡的问题了。

ROC 曲线

ROC曲线中的主要两个指标就是真正率和假正率，其中横坐标为假正率（FPR），纵坐标为真正率（TPR），下面就是一个标准的ROC曲线图。

混淆矩阵

交叉验证

对于精度指标的计算，最简单的做法是选择一部分样本作为训练集，用另一部分样本作为测试集来统计算法的准确率。交叉验证（Cross Validation）是一种更复杂的统计准确率的技术。k折交叉验证将样本随机、均匀的分成k份，轮流用其中的k-1份训练模型，1份用于测试模型的准确率，用k个准确率的均值作为最终的准确率。

模型选择

过拟合与欠拟合

欠拟合（Under-Fitting）也称欠学习，其直观表现是训练得到的模型在训练集上表现查，没有学到数据的规律。引起欠拟合的原因有：

模型本身过于简单，例如，数据本身是非线性的但是使用了线性模型；
特征数太少无法正确建立映射关系。
过拟合（Over-Fitting）也称过学习，它的直观表现是在训练集上表现好，在测试集上表现不好，推广泛化性能差。过拟合的根本原因是训练数据包含抽样误差，在训练时模型将抽样误差进行了拟合。抽样误差是指抽样得到的样本集和整体数据集之间的偏差。引起过拟合的可能原因有：
模型本身过于复杂，拟合了训练样本集中的噪声。此时需要选用更简单的模型，或者对模型进行裁剪。
训练样本太少或者缺乏代表性。此时需要增加样本数，或者增加样本的多样性。
训练样本噪声的干扰，导致模型拟合了这些噪声，这时需要剔除噪声数据或者改用对噪声不敏感的模型。

偏差与方差分解

模型的泛化误差可以分解成偏差和方差。偏差是模型本身导致的误差，即错误的模型假设所导致的误差，它是模型的预测值的数学期望和真实值之间的差距。高偏差意味这模型本身的输出值与期望值差距很大，因此会导致欠拟合问题。
方差是由于对训练样本集的小波动敏感而导致的误差。可以理解为模型预测值的变化范围，即模预测值的波动程度。高方差意味着算法对训练样本集中的随机噪声进行建模，从而出现过拟合问题。
模型的总体误差可以分解为偏差的平方与方差之和。如果模型过于简单，一般会有大的偏差和小的方差；反之，如果模型复杂则会有大的方差但偏差很小。这是一对矛盾，因此，需要在偏差和方差之间做一个折中。

正则化

有监督机器学习算法训练的目标是最小化误差函数。在预测函数的类型选定之后，人们能控制的只有函数的参数。为了防止过拟合，可以在损失函数加上一个惩罚项，对复杂的模型进行惩罚，强制让模型的参数值尽可能小以使得模型更简单，加入的惩罚项称为正则项。

贝叶斯分类器

贝叶斯分类器是一种概率模型，它用贝叶斯公式解决分类问题。如果样本的特征向量服从某种概率分布，则可以计算特征向量属于一个类的条件概率，条件概率最大的类为分类结果。如果假设特征向量各个分量之间相互独立，则为朴素贝叶斯分类器；如果假设特征向量服从多维正态分布，则为正态贝叶斯分类器。

决策树

决策树是一种基于规则的方法，它用一组嵌套的规则进行预测。在树的每个决策结点处，根据判断结果进入一个分支，反复执行这种操作直到到达叶子节点，得到预测结果。这些规则是通过训练得到的，而不是人工制定的。

K近邻算法

k近邻算法（KNN算法）的核心思想是：要确定一个样本的类别，可以计算它与所有训练样本的距离，然后找出和该样本最接近的k个样本，统计这些样本的类别进行投票，投票最多的那个类就是分类结果。因为直接比较待预测样本和训练样本的距离，KNN算法也称为基于实例的算法。

参考资料

【机器学习笔记】：一文让你彻底理解准确率，精准率，召回率，真正率，假正率，ROC/AUC

Python编程电子书：从基础到实践王奥雷
本文还有配套的精品资源，点击获取简介：Python电子书汇集了基础语法、面向对象编程、标准及第三方库使用、文件操作、网络编程、并发编程、单元测试与调试、Python2与Python3的区别等核心知识点。通过实例和项目案例，帮助读者在Web开发、数据分析、人工智能等应用领域提升编程技能，跟上Python的技术进步。1.Python基础语法介绍Python作为一种高级编程语言，其易读性和简洁的语法使其
掌握Kotlin中的文件操作与序列化处理新职语 Kotlin 文件操作序列化文本文件处理
背景简介在进行数据持久化处理时，文件操作和对象序列化是两个关键的概念。本文将基于提供的章节内容，深入探讨在Kotlin语言中如何处理文本文件的读写以及如何进行对象的序列化和反序列化操作。文本文件处理在Kotlin中，处理文本文件通常涉及到文件读写操作。通过FileInputStream和BufferedReader等类，可以实现对文本文件的逐行读取。例如，在提供的章节中，定义了一个ReadFile
Flutter 稳定版支持 Windows，开发者还学的动吗？
以下文章来源于code小生，关注每日干货及时送达整理|郭露责编|张红月出品|CSDN(ID:CSDNnews)Flutter是由谷歌开发的开源移动UI框架，可快速在不同平台上构建高质量原生用户界面。Flutter支持现有的所有代码，在世界各地受到越来越多开发者的追捧。到目前为止，全球已发布了近50万个使用Flutter的应用程序，其中包括来自字节跳动等大型公司的应用程序，以及谷歌三十个团队的应用程
kotlin 读取json文件_Kotlin入门(31)JSON字符串的解析 weixin_39727743 kotlin 读取json文件
json是App进行网络通信最常见的数据交互格式，Android也自带了json格式的处理工具包org.json，该工具包主要提供了JSONObject(json对象)与JSONArray(json数组)的解析处理。下面分别介绍这两个工具类的用法：1、JSONObjectJSONObject的常用方法如下所示：构造函数:从指定字符串构造出一个JSONObject对象。getJSONObject:获
设计模式笔记_创建型_工厂模式
1.工厂模式简介工厂模式是一种创建型设计模式，主要用于创建对象实例。它通过定义一个接口或抽象类来创建对象，而不是直接实例化具体类，从而将对象的创建过程与使用过程分离。工厂模式通常分为两种类型：简单工厂模式（SimpleFactory）：这种模式并不是GoF设计模式之一，但在实际应用中非常常见。简单工厂模式通过一个工厂类来负责创建对象，根据传入的参数的不同，返回不同类型的实例。工厂方法模式（Fact
基于MQTT的温湿度采集服务 aiprtem 嵌入式Linux MQTT AM335x linux 物联网 c语言
基于MQTT的温湿度采集服务1.项目概述thdetect是一个基于RS485的温湿度采集服务程序，通过Modbus-RTU协议读取传感器数据，并将数据通过MQTT协议发布到消息代理服务器。该服务可以作为后台守护进程运行，为上层应用提供实时的温湿度数据。2.开发环境处理器：AM3354显示屏：支持触摸功能的LCD屏幕操作系统：Linux3.2LVGL版本：v8.3构建工具：CMake3.16+交叉编
C++函数重载每一天都要努力^ C++入门 c++开发语言
目录函数重载概念函数默认参数基本规则违反规则的示例优点与缺点优点：缺点：函数重载注意：出现二义性的原因解决办法函数重载概念在同一个作用域下，函数名相同，参数列表不同(参数的类型、数量不同)。对参数列表相同返回值不同的函数不行。返回值并未要求（可以相同，可以不同），仅按照返回类型区别，不能构成函数重载。函数C++中允许函数的参数列表指定默认值，而且这个默认值必须从右向左依次指定不能间断，一般在函数的
Android第一行代码——快速入门 Kotlin 编程（4.5 最常用和最难用的控件：ListView）
目录4.5最常用和最难用的控件：ListView4.5.1ListView的简单用法4.5.2定制ListView的界面4.5.3提升ListView的运行效率4.5.4listView的点击事件4.5最常用和最难用的控件：ListViewListView在过去绝对可以称得上是Andoid中最常用的控件之一，几乎所有的应用程序都会用到它。由于手机屏幕空间比较有限，能够一次性在屏幕上显示的内容并不多
基于Flutter的web登录设计 aiprtem Flutter web 嵌入式Linux flutter 前端
基于Flutter的web登录设计1.概述本文档详细介绍了基于FlutterWeb的智能家居系统登录模块的设计与实现。登录模块作为系统的入口，不仅提供了用户身份验证功能，还包括注册新用户的能力，确保系统安全性的同时提供良好的用户体验。本文档中的前端代码示例摘录自项目中的smarthomefe目录，后端服务代码摘录自fcgiServer目录。这些代码共同构成了完整的登录系统实现。项目源码：https
Redis——Redis性能优化与技术选型原理庄小焱缓存域 redis
摘要redis的拥有众多优点，但是的技术有利有弊，所以只有在redis最擅长的场景中才能让redis的作用发挥到最大的作用。同样的redis一样存在很多优化和改进的点。一、Redis的性能测试技术选型，比如测试Memcached和Redis；对比单机Redis和集群Redis的吞吐量；评估不同类型的存储性能，例如集合和有序集合；对比开启持久化和关闭持久化的吞吐量；对比调优和未调优的吞吐量；对比不同
TMC4361A 使用（未验证） m0_55576290 嵌入式工作一二三单片机嵌入式硬件嵌入式
prompt我用STM32F103C8T6来控制TMC4361A运动控制芯片，我配置STM32F103C8T6的SPI1与TMC4361A进行通信，配置PA4作为片选线，配置PA8作为RCC_MCO输入时钟输入到TMC4361A,并将其连接到TMC4361A的CLK_EXT引脚。我想控制TMC4361A,你要认真仔细阅读TMC4361A的手册，然后帮我实现控制。主要功能：硬件配置：SPI1配置（P
振动分析常用的频谱类型 m0_55576290 工作一二三信号与系统振动分析
文章目录振动分析常用的频谱类型1.幅值谱（AmplitudeSpectrum）-最常用2.功率谱密度（PSD）-用于随机信号3.自功率谱（AutoPowerSpectrum）振动分析中的选择原则.振动分析中的频谱选择建议故障诊断→幅值谱模态分析→自功率谱随机振动→功率谱密度宽动态范围→对数坐标实际应用中的处理方法总结振动分析常用的频谱类型1.幅值谱（AmplitudeSpectrum）-最常用%幅
VMware克隆CentOS虚拟机后网卡无法启动并无法获取到IP地址 TechABC centos tcp/ip php 服务器
在使用VMware虚拟化软件进行虚拟机克隆时，有时会遇到克隆后的CentOS虚拟机无法启动网卡并无法获取到IP地址的问题。这可能是由于克隆操作导致虚拟机的网卡配置与网络环境不匹配所致。在本文中，我们将探讨如何解决这个问题。解决这个问题的一种常见方法是更新虚拟机的网卡配置，并重新配置网络设置。以下是一些步骤，可供参考：步骤1:检查网卡设备首先，我们需要确认虚拟机中的网卡设备是否正确识别。在终端中执行
Python爬虫实战：研究chardet库相关技术 ylfhpy 爬虫项目实战 python 爬虫开发语言 chardet
1.引言1.1研究背景与意义在互联网信息爆炸的时代，网络数据采集技术已成为信息获取、数据分析和知识发现的重要手段。Python作为一种高效的编程语言，凭借其丰富的第三方库和简洁的语法，成为爬虫开发的首选语言之一。然而，在网络数据采集中，文本编码的多样性和不确定性一直是困扰开发者的主要问题之一。不同网站可能采用不同的编码方式（如UTF-8、GBK、GB2312等），甚至同一网站的不同页面也可能使用不
学生上机管理系统设计与实现 AR新视野
本文还有配套的精品资源，点击获取简介：《学生上机管理系统》是一款专门用于教育领域的管理软件，通过VB开发实现学生和教师的信息化管理。系统包括学生管理模块和教师管理模块，提供详细的学生信息录入、查询、修改功能，成绩统计与展示，以及课程安排、监控和上机预约等功能。此外，系统支持作业提交和批改，以及基于角色的用户权限管理，确保信息安全性。该系统利用数据库技术和人机交互界面，旨在提高教学质量和管理效率。1
C#开发的人力资源管理系统实现指南 AR新视野
本文还有配套的精品资源，点击获取简介：在信息化时代，人力资源管理系统对企业运营至关重要。本文详解了基于C#语言的人力资源管理系统，解析其核心功能、设计思路及关键技术。系统包括员工信息、考勤、薪酬、招聘培训和绩效评估等模块，展示了如何利用C#和相关技术实现高效稳定的企业级应用。文章还探讨了提升系统性能和安全性的技术手段，如异步编程和权限控制。1.人力资源管理系统核心功能概述人力资源管理系统（HRMS
驱动程序与源代码解析 AR新视野
本文还有配套的精品资源，点击获取简介：驱动程序和源代码是软件开发的核心，它们负责操作系统与硬件设备之间的通信，并构成软件的可执行基础。本主题涵盖驱动程序的分类、特定类型的驱动（如字符设备和网络驱动）、性能优化技术、内核源代码剖析、开源驱动的特点与贡献、驱动程序开发流程、安装与更新方法以及调试技术。同时，提供了学习资源，如代码示例和教程文档，以加深对驱动程序和源代码开发的理解。1.驱动程序分类与作用
从技术支持到UX设计大师：Adam Schilling的成长之路 AR新视野用户体验设计职业转型持续学习视觉传达技术支持
背景简介本篇博文基于AdamSchilling的访谈记录，他是一位从技术支持成功转型为用户体验（UX）设计师的专业人士。通过Adam的故事，我们将探讨如何在技术领域内发展设计思维，并成功转型为UX设计师。AdamSchilling的设计之路早期学习与兴趣培养Adam的旅程始于南澳大利亚大学的视觉传达课程，虽然没有完成，但他从中学习到了平面设计原则和插画技能。在闲暇时间，他为朋友免费进行网页设计和开
8、区块链技术在物联网安全中的应用 May Wei 区块链物联网安全
区块链技术在物联网安全中的应用1.引言随着物联网（IoT）技术的迅猛发展，越来越多的设备接入互联网，实现了万物互联。然而࿰
2、探索区块链技术在物联网安全中的应用 May Wei 区块链物联网安全性
探索区块链技术在物联网安全中的应用1.引言物联网（IoT）作为现代科技的重要组成部分，正在迅速扩展到各个领域，如农业、交通、医疗保健
Neo4j 的向量搜索（Neo4jVector）和常见的向量数据库（比如 Milvus、Qdrant）之间的区别与联系
先说联系（共同点）点内容✅都支持向量检索都可以基于embedding（向量）做相似度搜索，比如给一段文本、找出最相似的若干条记录。✅都用于语义检索你可以把它们用在RAG（检索增强生成）、ChatwithDocs、智能问答、推荐系统等应用里。✅都支持批量插入、查询都可以批量向数据库中插入文本+向量，然后用向量做top-k检索（如search(k=8)）。✅都和LangChain集成它们都可以通过la
区块链技术核心组件及应用架构的全面解析
区块链技术是一套融合密码学、分布式系统与经济激励的复合型技术体系，以下是其核心组件及应用架构的全面解析：一、区块链核心技术栈1.分布式账本技术（DLT）核心原理：多节点共同维护不可篡改的数据链数据结构：哈希指针哈希指针区块N区块N+1区块N+2关键创新：默克尔树（MerkleTree）实现高效数据验证2.密码学保障技术算法示例应用场景非对称加密ECC/secp256k1,RSA数字签名（设备身份认
大前端日志分析的AI应用：从海量日志中提取有价值的运维信息欧阳天羲大前端与 AI 的深度融合 #AI 在大前端安全与运维篇前端人工智能运维
在大前端技术快速发展的今天，前端应用的复杂度呈指数级增长，涵盖Web、移动端H5、小程序、快应用等多端形态。随之而来的是海量日志数据的爆发式增长——从浏览器控制台输出到移动端性能埋点，从用户行为轨迹到API调用异常，这些日志分散在不同终端、格式异构，传统的人工分析或规则引擎已难以应对。本文将系统阐述AI技术如何赋能大前端日志分析，从日志采集到智能诊断的全流程解决方案，结合实际案例展示如何利用机器学
开源模型应用落地-OpenAI Agents SDK-集成MCP与Qwen3-8B模型的创新应用探索（七）开源技术探险家开源模型-实际应用落地开源 python ai 人工智能
一、前言在人工智能技术飞速发展的今天，如何将先进的模型和技术无缝结合，成为推动行业变革的关键。OpenAIAgents通过集成模型上下文协议（MCP）和阿里巴巴推出的Qwen3-8B模型，正开启一场智能应用的革命。这种创新的结合不仅提升了AI代理与外部工具之间的通信能力，还在多模态任务处理、个性化服务等领域展现出巨大潜力。本文将深入探讨这一技术组合的实际应用场景，揭示其在改善客户体验和提升运营效率
开源模型应用落地-OpenAI Agents SDK-集成Qwen3-8B-探索output_guardrail的创意应用（六）开源技术探险家开源模型-实际应用落地开源 python ai 人工智能
一、前言随着人工智能技术的迅猛发展，大语言模型（LLM）在各行各业的应用日益广泛。然而，模型生成的内容是否安全、合规、符合用户预期，成为开发者和企业不可忽视的问题。为此，OutputGuardrail应运而生，作为一种关键的安全机制，它在模型生成结果之后进行内容审核与过滤，确保输出不偏离道德、法律和业务规范。通过检测不当的内容，不仅提升了AI系统的可信度，也为构建更加稳健和负责任的人工智能应用提供
《中国电信运营商骨干网：历史、现状与未来演进》系列第一篇：中国骨干网全景图：一级运营商与专用网络的演进老马爱知通信网络 #电信运营商网络骨干网电信运营商网络架构数字基础设施互联网科普
一、引言：骨干网——国家“信息大动脉”在当今数字经济蓬勃发展的时代，信息网络已成为国家基础设施的核心组成部分。而在这张错综复杂的信息大网中，骨干网(BackboneNetwork)扮演着“
容器基础5-Helm 与 K8s 的关系旗浩QH Android系统虚拟化 kubernetes 容器云原生
一、Helm是什么？为什么需要它？K8s是强大的容器编排平台，但部署复杂应用时（如包含Web服务、数据库、缓存等多个组件的系统），需要编写大量YAML文件，管理成本高。Helm就是为简化K8s应用部署而生的工具，它被称为“K8s的包管理器”，类似Ubuntu的apt或Mac的brew。二、Helm如何工作？核心概念解析Chart（图表）Helm的基本单位，是一组YAML文件的集合，描述了一个或多个
LangGraph是为了解决哪些问题？为了解决这些问题，LangGraph采用哪些方法？LangGraph适用于什么场景？LangGraph有什么局限性？杰瑞学AI AI/AGI NLP/LLMs langchain 人工智能自然语言处理深度学习神经网络
LangGraph旨在解决的问题LangGraph是LangChain生态系统中的一个高级库，它专注于解决构建复杂、有状态、多步LLM应用程序的挑战。它扩展了LangChain的链和代理概念，尤其针对以下问题：多步决策和循环工作流：传统的链通常是线性的或简单的分支，难以处理复杂的决策路径、条件跳转以及需要循环迭代才能达到最终结果的任务。状态管理：在复杂的、多轮的LLM应用中，需要维护和管理应用的状
WPF之URI的使用要记得喝水 wpf c#visual studio windows
pack://application:,pack://application:,是一个在WPF(WindowsPresentationFoundation)应用程序中用于指定资源位置的URI(统一资源标识符)方案的特定格式。这个格式用于访问嵌入在应用程序程序集（assemblies）中的资源，如图像、XAML文件、样式等。解析这个URI的各个部分：**pack://：**这是URI方案的开始，表示
Activity各类控件学习小结：实现简单的用户界面 giaoho 安卓开发学习学习 ui windows
Activity各类控件学习小结：实现简单的用户界面目标：实现不同用户的图片的选择与显示对应图片的demo（1）默认添加10个照片文件到app中，p1到p10（2）主要控件和逻辑：一个ImageView，显示用户头像；一个下拉框，显示用户的姓名列表信息，默认两个用户，下拉选择后更新用户头像，并显示年龄和身高在头像下面；三个输入框，输入姓名、年龄，身高；一个添加按钮，点击添加按钮后，把新增的用户添加
PHP如何实现二维数组排序？ IT独行者二维数组 PHP 排序　
二维数组在PHP开发中经常遇到，但是他的排序就不如一维数组那样用内置函数来的方便了，（一维数组排序可以参考本站另一篇文章【PHP中数组排序函数详解汇总】）。二维数组的排序需要我们自己写函数处理了，这里UncleToo给大家分享一个PHP二维数组排序的函数：代码： functionarray_sort($arr,$keys,$type='asc'){ $keysvalue= $new_arr
【Hadoop十七】HDFS HA配置 bit1129 hadoop
基于Zookeeper的HDFS HA配置主要涉及两个文件,core-site和hdfs-site.xml。测试环境有三台 hadoop.master hadoop.slave1 hadoop.slave2 hadoop.master包含的组件NameNode, JournalNode, Zookeeper，DFSZKFailoverController
由wsdl生成的java vo类不适合做普通java vo darrenzhu VO wsdl webservice rpc
开发java webservice项目时，如果我们通过SOAP协议来输入输出，我们会利用工具从wsdl文件生成webservice的client端类，但是这里面生成的java data model类却不适合做为项目中的普通java vo类来使用，当然有一中情况例外，如果这个自动生成的类里面的properties都是基本数据类型，就没问题，但是如果有集合类，就不行。原因如下： 1)使用了集合如Li
JAVA海量数据处理之二（BitMap）周凡杨 java 算法 bitmap bitset 数据
路漫漫其修远兮，吾将上下而求索。想要更快，就要深入挖掘 JAVA 基础的数据结构，从来分析出所编写的 JAVA 代码为什么把内存耗尽，思考有什么办法可以节省内存呢？啊哈！算法。这里采用了 BitMap 思想。首先来看一个实验：指定 VM 参数大小： -Xms256m -Xmx540m
java类型与数据库类型 g21121 java
很多时候我们用hibernate的时候往往并不是十分关心数据库类型和java类型的对应关心，因为大多数hbm文件是自动生成的，但有些时候诸如：数据库设计、没有生成工具、使用原始JDBC、使用mybatis(ibatIS)等等情况，就会手动的去对应数据库与java的数据类型关心，当然比较简单的数据类型即使配置错了也会很快发现问题，但有些数据类型却并不是十分常见，这就给程序员带来了很多麻烦。 &nb
Linux命令 510888780 linux命令
系统信息 arch 显示机器的处理器架构(1) uname -m 显示机器的处理器架构(2) uname -r 显示正在使用的内核版本 dmidecode -q 显示硬件系统部件 - (SMBIOS / DMI) hdparm -i /dev/hda 罗列一个磁盘的架构特性 hdparm -tT /dev/sda 在磁盘上执行测试性读取操作 cat /proc/cpuinfo 显示C
java常用JVM参数墙头上一根草 java jvm参数
-Xms：初始堆大小，默认为物理内存的1/64(<1GB)；默认(MinHeapFreeRatio参数可以调整)空余堆内存小于40%时，JVM就会增大堆直到-Xmx的最大限制 -Xmx：最大堆大小，默认(MaxHeapFreeRatio参数可以调整)空余堆内存大于70%时，JVM会减少堆直到 -Xms的最小限制 -Xmn：新生代的内存空间大小，注意：此处的大小是（eden+ 2
我的spring学习笔记9-Spring使用工厂方法实例化Bean的注意点 aijuans Spring 3
方法一： <bean id="musicBox" class="onlyfun.caterpillar.factory.MusicBoxFactory" factory-method="createMusicBoxStatic"></bean> 方法二：
mysql查询性能优化之二 annan211 UNION mysql 查询优化索引优化
1 union的限制有时mysql无法将限制条件从外层下推到内层，这使得原本能够限制部分返回结果的条件无法应用到内层查询的优化上。如果希望union的各个子句能够根据limit只取部分结果集，或者希望能够先排好序在合并结果集的话，就需要在union的各个子句中分别使用这些子句。例如想将两个子查询结果联合起来，然后再取前20条记录，那么mys
数据的备份与恢复百合不是茶 oracle sql 数据恢复数据备份
数据的备份与恢复的方式有: 表,方案 ,数据库; 数据的备份: 导出到的常见命令; 参数说明 USERID 确定执行导出实用程序的用户名和口令 BUFFER 确定导出数据时所使用的缓冲区大小，其大小用字节表示 FILE 指定导出的二进制文
线程组 bijian1013 java 多线程 thread java多线程线程组
有些程序包含了相当数量的线程。这时，如果按照线程的功能将他们分成不同的类别将很有用。线程组可以用来同时对一组线程进行操作。创建线程组：ThreadGroup g = new ThreadGroup(groupName); &nbs
top命令找到占用CPU最高的java线程 bijian1013 java linux top
上次分析系统中占用CPU高的问题，得到一些使用Java自身调试工具的经验，与大家分享。 (1)使用top命令找出占用cpu最高的JAVA进程PID:28174 (2)如下命令找出占用cpu最高的线程 top -Hp 28174 -d 1 -n 1 32694 root 20 0 3249m 2.0g 11m S 2 6.4 3:31.12 java
【持久化框架MyBatis3四】MyBatis3一对一关联查询 bit1129 Mybatis3
当两个实体具有1对1的对应关系时，可以使用One-To-One的进行映射关联查询 One-To-One示例数据以学生表Student和地址信息表为例，每个学生都有都有1个唯一的地址(现实中，这种对应关系是不合适的，因为人和地址是多对一的关系)，这里只是演示目的学生表 CREATE TABLE STUDENTS (
C/C++图片或文件的读写 bitcarter 写图片
先看代码： /*strTmpResult是文件或图片字符串 * filePath文件需要写入的地址或路径 */ int writeFile(std::string &strTmpResult,std::string &filePath) { int i,len = strTmpResult.length(); unsigned cha
nginx自定义指定加载配置 ronin47
进入 /usr/local/nginx/conf/include 目录，创建 nginx.node.conf 文件，在里面输入如下代码： upstream nodejs { server 127.0.0.1:3000; #server 127.0.0.1:3001; keepalive 64; } server { liste
java-71-数值的整数次方.实现函数double Power(double base, int exponent)，求base的exponent次方 bylijinnan double
public class Power { /** *Q71-数值的整数次方 *实现函数double Power(double base, int exponent)，求base的exponent次方。不需要考虑溢出。 */ private static boolean InvalidInput=false; public static void main(
Android四大组件的理解 Cb123456 android 四大组件的理解
分享一下，今天在Android开发文档-开发者指南中看到的: App components are the essential building blocks of an Android
[宇宙与计算]涡旋场计算与拓扑分析 comsci 计算
怎么阐述我这个理论呢？。。。。。。。。。首先：宇宙是一个非线性的拓扑结构与涡旋轨道时空的统一体。。。。我们要在宇宙中寻找到一个适合人类居住的行星，时间非常重要，早一个刻度和晚一个刻度，这颗行星的
同一个Tomcat不同Web应用之间共享会话Session cwqcwqmax9 session
实现两个WEB之间通过session 共享数据查看tomcat 关于 HTTP Connector 中有个emptySessionPath 其解释如下： If set to true, all paths for session cookies will be set to /. This can be useful for portlet specification impleme
springmvc Spring3 MVC，ajax，乱码 dashuaifu spring jquery mvc Ajax
springmvc Spring3 MVC @ResponseBody返回，jquery ajax调用中文乱码问题解决 Spring3.0 MVC @ResponseBody 的作用是把返回值直接写到HTTP response body里。具体实现AnnotationMethodHandlerAdapter类handleResponseBody方法，具体实
搭建WAMP环境 dcj3sjt126com wamp
这里先解释一下WAMP是什么意思。W:windows，A：Apache，M：MYSQL，P：PHP。也就是说本文说明的是在windows系统下搭建以apache做服务器、MYSQL为数据库的PHP开发环境。工欲善其事，必须先利其器。因为笔者的系统是WinXP，所以下文指的系统均为此系统。笔者所使用的Apache版本为apache_2.2.11-
yii2 使用raw http request dcj3sjt126com http
Parses a raw HTTP request using yii\helpers\Json::decode() To enable parsing for JSON requests you can configure yii\web\Request::$parsers using this class: 'request' =&g
Quartz-1.8.6 理论部分 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2207691 一.概述基于Quartz-1.8.6进行学习，因为Quartz2.0以后的API发生的非常大的变化，统一采用了build模式进行构建；什么是quartz? 答：简单的说他是一个开源的java作业调度框架，为在 Java 应用程序中进行作业调度提供了简单却强大的机制。并且还能和Sp
什么是POJO？ gupeng_ie java POJO 框架 Hibernate
POJO--Plain Old Java Objects(简单的java对象) POJO是一个简单的、正规Java对象，它不包含业务逻辑处理或持久化逻辑等，也不是JavaBean、EntityBean等，不具有任何特殊角色和不继承或不实现任何其它Java框架的类或接口。 POJO对象有时也被称为Data对象，大量应用于表现现实中的对象。如果项目中使用了Hiber
jQuery网站顶部定时折叠广告 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/4.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>网页顶部定时收起广告jQuery特效 - HoverTree<
Spring boot内嵌的tomcat启动失败 kane_xie spring boot
根据这篇guide创建了一个简单的spring boot应用，能运行且成功的访问。但移植到现有项目（基于hbase）中的时候，却报出以下错误： SEVERE: A child container failed during start java.util.concurrent.ExecutionException: org.apache.catalina.Lif
leetcode: sort list michelle_0916 Algorithm linked list sort
Sort a linked list in O(n log n) time using constant space complexity. ====analysis======= mergeSort for singly-linked list ====code======= /** * Definition for sin
nginx的安装与配置,中途遇到问题的解决 qifeifei nginx
我使用的是ubuntu13.04系统，在安装nginx的时候遇到如下几个问题，然后找思路解决的，nginx 的下载与安装 wget http://nginx.org/download/nginx-1.0.11.tar.gz tar zxvf nginx-1.0.11.tar.gz ./configure make make install 安装的时候出现
用枚举来处理java自定义异常 tcrct java enum exception
在系统开发过程中，总少不免要自己处理一些异常信息，然后将异常信息变成友好的提示返回到客户端的这样一个过程，之前都是new一个自定义的异常，当然这个所谓的自定义异常也是继承RuntimeException的，但这样往往会造成异常信息说明不一致的情况，所以就想到了用枚举来解决的办法。 1，先创建一个接口，里面有两个方法，一个是getCode, 一个是getMessage public
erlang supervisor分析 wudixiaotie erlang
当我们给supervisor指定需要创建的子进程的时候，会指定M,F,A,如果是simple_one_for_one的策略的话，启动子进程的方式是supervisor:start_child(SupName, OtherArgs),这种方式可以根据调用者的需求传不同的参数给需要启动的子进程的方法。和最初的参数合并成一个数组，A ++ OtherArgs。那么这个时候就有个问题了，既然参数不一致，那

机器学习与应用—学习笔记

文章目录

机器学习简介

数学知识

微积分和线性代数

导数

向量与矩阵

偏导数与梯度

雅克比矩阵

Hessian矩阵

行列式

特征值和特征向量

二次型

向量与矩阵求导

最优化方法

梯度下降法

牛顿法

坐标下降法

拉格朗日乘数法

凸优化

拉格朗日对偶

KKT条件

概率论

随机事件与概率

条件概率

随机变量

数学期望与方差

随机向量

最大似然估计

机器学习基本概念

算法分类

模型评价指标

准确率

精准率

召回率

真正（阳）率 假正（阳）率

ROC 曲线

混淆矩阵

交叉验证

模型选择

过拟合与欠拟合

偏差与方差分解

正则化

贝叶斯分类器

决策树

K近邻算法

参考资料

你可能感兴趣的:(机器学习与应用—学习笔记)

真正（阳）率假正（阳）率