SJY_ZY

机器学习——基本原理

一、芒果的例子

在我们第一次买芒果的时候，并不知道什么样的芒果甜，什么样的芒果口感好，但是对于一个天天吃芒果的人，他肯定知道什么品牌，颜色，大小，品种的芒果好吃，天天吃芒果的人通过每天买的芒果，根据芒果的特征逐渐找到对应的规律，在下一次买芒果的时候就可以通过自己总结出来的归路来判断芒果是否甜，计算机的学习过程也是如此，只有通过获得大量的数据，找到最合适的函数，然而计算机本身不会找规律（函数），我们需要假设一些函数，让计算机一个一个去尝试，最后找到一个最接近真实规律的函数。这些假设的函数合集被称为假设空间，而前面用于计算机找规律的数据被称为训练集，大部分时候还需要一部分数据用来测试函数的准确性，这部分数据被称为测试集，测试集和训练集统称为数据集

二、三大要素

1.模型

模型就是计算机通过不停的比较从假设空间里面找到最能反映真实客观规律的函数或者条件概率分布。

2.学习准则

学习准则是在计算机找到模型的过程中，应该遵循的准则。我们通过计算期望风险（期望错误）、经验风险、结构风险来判断模型的好坏。

1）期望风险：

越好的模型必然越接近于真实客观规律，期望风险通过损失函数来量化模型与真实规律之间的差异，在计算机中我们需要的得到的是一个能够大体描述特征与结果关系的函数，用我们高中最常用的线性函数来表示y=ax+b我们需要的函数，确定函数本质上是确定函数参数，a和b，但是我们肯定是没有办法找到一个函数完全满足所有特征值，我们只能让每个函数最后求出来的值与实际的值最小，于是通过损失函数来数据化函数值和真实值之间的差异。
损失函数：
0-1损失函数：如果模型和规律相同返回0，不相同返回1，虽然很直接的比较了两者之间的差异，但是结果不连续导致导数为0，难以优化，可用连续可微的损失函数替代。
平方损失函数：损失函数等于（真实函数-模型海曙）² /2

平方损失函数一般不用于分类问题
交叉熵损失函数 、Hinge损失函数等

损失函数	优劣
0-1	数学性不好不适合优化
平方	不适合用于分类问题，经常用于回归问题
交叉熵（负对数似然）	可用于二分类和多分类
log对数（逻辑回归）	适合用于多分类，健壮性不强相对于Hinge对噪声更敏感
Hinge	适合用于二分类问题

2）经验风险

在训练一个未知规律的训练集的时候，我们无法通过模型和实际规律比较的方法来计算期望风险，但是我们可以通过给定的训练集就散经验风险，经验风险本质上是模型的训练集上的平均损失。

3）结构风险

根据大数定理可知，训练集越大经验风险越接近期望风险，但是我们并没有办法获得一个无限的训练集，而对于训练数据少和噪声以及模型能力强的训练集，根据经验风险最小准则，可能导致过拟合。
过拟合是指对训练集里面的模型正确率很高，但是对于未知数据模型的错误率很高。
为了解决过拟合的问题，在经验风险最小化的基础上引入参数的正则化，使其不要过度的经验风险最小化。未完待续……

3.优化算法

梯度下降

前面讲到过损失函数的目的是为了数据化预测值和真实值之间的差异，可以看出想要得到损失函数的最小值，其实本质上就是确定函数中的参数（因为特诊变量都是数据给出的）当对应的模型参数让损失函数达到最小值的时候，就能确定最优的模型函数。
比如线性函数中的a和b，以平方损失函数为例，损失函数的值就是真实值和预测值之间的距离，距离越小说明预测的越准确，把所有点的差距加起来求最小值就一定能找到一个最优的参数a和b，这个过程被称为优化算法。
想要求这个损失函数的最小值，最暴力的方法就是将参数从负无穷遍历到正无穷，这样我们找到最小值就可以了，但是这样做的效率会非常低
常见的优化算法主要是梯度下降法，高中的时候我们就学过如何求最小值，第一步是求导，第二部是找导函数等于0的点，第三部是比较导函数等于0的点，找到最小值，梯度下降就是用的这个思想，我们对当前点参数求偏导，偏导值表示这个参数在此参数维度上的偏移值（梯度，导数，斜率），根据偏移值我们就能确定最小值在当前点的左边还是右边，那么我们就顺着这个偏移值移动一点，这一过程就被称为一次梯度下降（就像下楼梯一样），重复上面的操作，每次梯度下降都会靠近最小值一点点，经过n次梯度下降，直到参数对应偏移值接近于0的时候，那么我们就能找到最小值，但是这里的最小值有可能是局部最优解（极值）而不是我们的全局最优解（实际最小值），如果损失函数是线性函数，那么就不会有太大的问题

在做梯度下降的速度是根据偏导数的大小来的，需要在偏导前面设置一个参数来控制，这个参数我们成为学习速率，下降的速度，如果参数过小下降速度会非常的慢，每次梯度下降就走一点点，如果参数设置的过大就会出现直接越过最小值，在下一次梯度下降的时候就会出现方向，然后又因为步伐过大，反复在最小值左右横跳

学习速率优化

1）最简单的优化算法是根据迭代次数来组件减小学习速率，每迭代一次就更靠近最小值，学习速率也会越低
2）Adagrad：

优化算法	优劣
批量梯度下降法	最常用的优化算法
随机梯度下降法	解决批量梯度开销大的问题
小批梯度下降法	解决随机梯度无法充分利用并行计算能力
提前停止	解决批量梯度下降法过拟合的问题

三、线性回归实例

1.参数学习方法

给定一个训练集，我们希望能够得到最优的线性回归的模型参数，介绍4种参数估计方法：
1）经验风险最小化：
由于线性回归标签和模型都是连续的实数，所以很适合选用平方损失函数，根据经验风险计算公式，求出经验风险后，通过最小二乘法求得最佳参数，在最小二乘法的计算过程中存在XX^T求逆矩阵的过程，也就是说XX^T必须存在逆矩阵，所以XX^T必须为满秩矩阵，如果XX^T不是满秩矩阵则有两个解决方法
（1）先使用组成分析的方法来预处理数据，消除不同特征之间的相关性，然后用最小二乘法
（2）通过使用梯度下降法来估计参数，这种方法也称为最小均方法

2）结构风险最小化
最小二乘法的基本要求是各个特征值之间要相互独立，保证XX^T 可逆，但是即使XX^T可逆，特征之间有较大的多重共线性，也会使得XX^T在数值上无法准确计算，使得最小二乘法变的不稳定，为了解决这个问题提出了岭回归对XX^T的对角线元素都加上一个常数a，使得XX^T+aI满秩，I 为单位矩阵，然后在进行最小二乘法。

3）最大似然估计
机器学习的任务分为两类，一类是模型为x对应y的函数，另一类是条件概率服从某个位置分布，最小二乘法只能求出第一类模型，通过最大似然估计法求出最小参数

4）最大似然估计的一个缺点是当训练数据比较小的时候回发生过拟合，为了避免过拟合我们可以给参数加上一些先验知识。未完待续……

2.偏差—方差分解

一般来说多项式越是复杂那么那么包含的可能就越多，但是常常会出现过拟合的现象，过拟合是指在训练集中每个点都训练的很好，但是在测试集中却效果很糟糕，过拟合就表示方差过大，方差过大的解决方法其中简单一点的就是提供训练集更多的数据，但是大部分时候都没有这么多数据，可以手动的通过翻转图片，变声等改变数据的一些基本形式的方法去创造出新的数据，这种方法的优势就是在于不会影响我们的偏差，在减小方差的过程中不会伤害我们的偏差。
还有一种方法就是regularization这种方法主要是在函数后面加一个平滑参数，这个参数可以让函数相对平滑一点，原本参数的权重就会没有那么大，但是这种方法有个问题，他可能会影响我们的偏差
还有一种情况叫做欠拟合，欠拟合表示偏差过大，这种情况一般是函数无法模拟出我们想要的样子，一般来说就是增加函数的复杂度，比如升幂（一次函数变两次函数）的方法去解决，但是升幂就有可能出现过拟合的问题，所以选择一个好的函数是至关重要的。
因为我们的数据集是有限的，所以很有可能你选择的函数在自己的测试集上跑的很好，但是投入使用了之后发现效果不见得是最好的，但是我们又没有更多的数据去选择函数，这时候我们可以将训练集切分一下，将训练集切分成几分，比如下图将训练集切分成3份，选择其中两份训练，一份测试，这样就有三种结果，这样其实可以很有效的在选择函数最后确定了函数之后再在这个训练集上训练一遍最后再在测试集上训练，为什么不最开始就在测试集上测试呢？原因在于如果直接在测试接上测试，最后我们在选择函数的时候有可能会被测试集的偏差影响，最后选出来的函数在实际使用中可能就会小伙不好。

四、机器学习的算法类型

1.监督学习

监督学习是指，目标模型是求出x和y之间的对应函数，并且训练集中给出了对应的目标标签y，这样的学习方式成为监督学习。监督学习可以分为以下三类
1）归回
问题中的标签y是连续值，模型的输出也是连续值。
2）分类
问题中的标签是离散的类别，在分类问题中学习到的模型也被成为分类器，分类问题根据分类的数量，分为二分类或者多分类
3）结构化学习
结构化学习是一种特别的分类学习，标签y不是离散的一个数，而是一类结构化对象，比如序列，图，树等

2.无监督学习

是指不包含目标标签y，自己通过学习获得有价值的数据，典型的无监督学习有聚类，密度估计，特征学习，降维等

3.强化学习

强化学习是通过交互来学习的机器学习算法，智能体通过行为动作，得到反馈奖励，在不断的交互中不算调整策略，逐渐趋向于奖励多的动作。

五、数据的特征表示

图像特征，通过像素点表示，文字的真通过词袋中的词表表示

1.表示学习

如果直接通过原始数据来进行学习，对学习模型的能力要求比较高，所以一般学习的特征需要通过一些原则进行一些改变。
（1）特征比较单一需要通过组合才能发挥作用
（2）特征之间冗余比较高
（3）并不是所有特征对结果都有用
（4）很多特征通常是易变的
（5）特征中往往有噪声

2.传统的特诊学习

1）特征选择

子集搜索，搜索每个特征子集，选出最优子集，一般不直接搜索整个子集，通过前向搜索（每轮找出最优特征保留下来）和反向搜索（每轮找出最差的特诊删除），一般有两个搜索方法
（1）过滤式方法：不依赖机器学习模型特征选择方法
（2）包裹式方法：使用后续机器学习模型的准确率来评价自己好坏。
还可以使用L1正则化实现特征选择。

2）特征抽取

特征抽取是指构造一个新的特征空间，并将原始特诊投影在新的空间中得到新的表示，特征抽取可以分为无监督和监督方法。
监督学习法是找出对目标影响最大的特征（比如芒果的颜色直接关系到甜度）通常使用线性判别法。
无监督学习法通常是减少冗余信息和噪声，主要用主成分分析和自编码器。

3.深度学习方法

传统的特征抽取和预测模型是分离的，会先进行特征抽取再进行训练模型，如果把特征抽取和训练模型统一到一个模型中，构建一个端到端的学习方法，可以有效的避免训练和特征不一致的问题，这样的表示学习方法被称为深度学习，深度学习的难点是如何解决不同特征对模型贡献度的问题，也就是贡献度分配问题目前比较有效的模型是神经网络。

六、评价指标

1.准确率

特征准确性的平均值

2.错误率

特征错误的平均值

3.精确率和召回率

对于类别c来说，模型在测试集上的结果可以分为以下4种情况
（1）真正例（TP）一个样本的真实类别为c，并且模拟模型正确的预测为类别c
（2）假负例（FN）一个样本真实类别为c，但是模型错误的预测为其他类
（3）假正例（FP）一个样本真实类别为其他类，模型错误的预测为c类
（4）真负类（TN）一个样本为其他类模型预测也为其他类，对于c类在说这一项不重要。

1）精确率(差准率，精度)

精确率是预测为类别c，其中真正类别也为c的比例，也就是TP/TP+FP

2）召回率（查全率）

召回率是查真实类别为c，其中预测类别也为c的比例，也就是TP/TP+FN

3）F值

F值是一个综合指标，为精确率和召回率调和平均[(1+B²)x精确率x召回率] / B²x精确率+召回率
B一般为1，B为1的F值称为F1值

4)宏平均

七、资源链接

数据集：UCI

Chapter 4-16. Troubleshooting Congestion in Fibre Channel Fabrics mounter625 Linux kernel 服务器运维 linux kernel
ShowFCSIeExample4-17showstheNX-OScommandshowfcsieonCiscoMDSswitches.例4-17显示了CiscoMDS交换机上的NX-OS命令showfcsie。Example4-17NX-OScommandshowfcsieonCiscoMDSswitchesMDS9706-C#showfcsieIEListforVSAN:20---------
agent实现：通过prompt方式实现agent自定义使用 loong_XL 深度学习大模型AI prompt agent 打磨下大模型
参看：https://github.com/TommyZihao/openvino_tonypihttps://github.com/QwenLM/Qwen/blob/main/examples/react_prompt.md（思想类似react）通过prompt形式，基本任何llm模型都可以使用来自定义agent，不用只能那些支持functioncall的大模型的，更灵活自由prompt案例：比
linux find 命令超全完整指南疑犯 linux 服务器 find命令
linuxfind命令超全完整指南一、基础语法与工作逻辑find[起始路径][表达式][操作]起始路径：指定搜索根目录，默认为当前目录.。支持多路径（如find/etc/var）表达式：定义搜索条件（如文件名、类型、时间等）。操作：对匹配文件执行命令（如删除、压缩等）。二、核心查找条件详解1.按名称查找精确匹配：-name"文件名"find/home-name"example.txt"#精确查找文
docker-compose install nginx(解决fastgpt跨区域) CIAS deepseek docker deepseek fastgpt
CORS前言CORS（Cross-OriginResourceSharing，跨源资源共享）是一种安全措施，它允许或拒绝来自不同源（协议、域名、端口任一不同即为不同源）的网页访问另一源中的资源。它的主要作用如下：同源策略限制：Web浏览器的同源策略限制了从一个源加载的文档或脚本如何与另一个源的资源进行交互。这意味着默认情况下，浏览器会阻止一个源（例如，http://example.com）的网页向
理解并使用基于n-gram重叠的示例选择器 shuoac easyui 前端 javascript python
在AI及自然语言处理任务中，选择与输入最相似的示例可以显著提升生成的质量和上下文相关性。本文将介绍如何使用NGramOverlapExampleSelector工具，通过n-gram重叠来筛选和排序示例，从而帮助实现这一目标。技术背景介绍n-gram重叠技术通过比较输入文本与示例文本在字符或词组上的相似度，计算一个介于0到1之间的分数来表示相似度。这个分数越高，表示文本间的重叠越大。NGramOv
决策树算法全解析：从零基础到Titanic实战，一文搞定机器学习经典模型吴师兄大模型 0基础实现机器学习入门到精通算法机器学习决策树人工智能深度学习编程开发语言
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
Spring Boot自动配置原理深度解析：揭开@SpringBootApplication的魔法面纱 Sendingab Spring boot 从入门到精通 spring boot 后端 java 前端 spring
SpringBoot自动配置原理深度解析：揭开@SpringBootApplication的魔法面纱https://example.com/spring-boot-auto-config前言SpringBoot的**"约定大于配置"理念极大简化了开发流程，其核心秘密在于自动配置（Auto-Configuration）**机制。本文将深入剖析自动配置的实现原理，手把手教你自定义Starter，彻底掌
图像处理篇---图像预处理 Ronin-Lotus 图像处理篇深度学习篇程序代码篇图像处理人工智能 opencv python 深度学习计算机视觉
文章目录前言一、通用目的1.1数据标准化目的实现1.2噪声抑制目的实现高斯滤波中值滤波双边滤波1.3尺寸统一化目的实现1.4数据增强目的实现1.5特征增强目的实现：边缘检测直方图均衡化锐化二、分领域预处理2.1传统机器学习（如SVM、随机森林）2.1.1特点2.1.2预处理重点灰度化二值化形态学操作特征工程2.2深度学习（如CNN、Transformer）2.2.1特点2.2.2预处理重点通道顺序
目前市场上主流的机器视觉的框架有哪些？他们的特点及优劣 yuanpan 机器学习计算机视觉
目前市场上主流的机器视觉框架和工具可以分为商业软件、开源工具和深度学习框架三大类。以下是它们的总结及特点对比：1.商业软件(1)Halcon(MVTec)特点：专注于工业机器视觉，提供高精度、高效率的算法。支持复杂的工业应用，如缺陷检测、3D视觉、深度学习等。提供图形化开发工具HDevelop和多种编程接口。优势：算法优化好，适合实时工业应用。硬件兼容性强，支持多种工业相机和设备。劣势：商业软件，
1.1PaddleTS_环境配置：一个易用的深度时序建模的Python库 pythonQA python paddlepaddle
PaddleTS是一个易用的深度时序建模的Python库，它基于飞桨深度学习框架PaddlePaddle，专注业界领先的深度模型，旨在为领域专家和行业用户提供可扩展的时序建模能力和便捷易用的用户体验。PaddleTS的主要特性包括：设计统一数据结构，实现对多样化时序数据的表达，支持单目标与多目标变量，支持多类型协变量封装基础模型功能，如数据加载、回调设置、损失函数、训练过程控制等公共方法，帮助开发
【大模型科普】AIGC技术发展与应用实践（一文读懂AIGC）人工智能
【专栏介绍】⌈⌈⌈人工智能与大模型应用⌋⌋⌋人工智能（AI）通过算法模拟人类智能，利用机器学习、深度学习等技术驱动医疗、金融等领域的智能化。大模型是千亿参数的深度神经网络（如ChatGPT），经海量数据训练后能完成文本生成、图像创作等复杂任务，显著提升效率，但面临算力消耗、数据偏见等挑战。当前正加速与教育、科研融合，未来需平衡技术创新与伦理风险，推动可持续发展。文章目录一、AIGC概述（一）什么是
代码逐行解析 | 教你在C++中使用深度学习提取特征点 3Ｄ视觉工坊 3D视觉从入门到精通 c++深度学习开发语言人工智能
点击下方卡片，关注「3D视觉工坊」公众号选择星标，干货第一时间送达扫描下方二维码，加入3D视觉技术星球，星球内汇集了众多3D视觉实战问题，以及各个模块的学习资料：最新顶会论文、书籍、源码、视频（近20门系统课程[星球成员可免费学习]）等。想要入门3D视觉、做项目、搞科研，就加入我们吧。作者：泡椒味的口香糖|来源：3DCV添加微信：dddvision
【产品小白】什么是AI产品经理百事不可口y 产品经理的一步一步人工智能产品经理学习产品运营内容运营用户运营
一、AI产品经理的定义与角色定位AI产品经理是人工智能技术与商业应用之间的核心桥梁，负责将复杂的AI技术转化为满足市场需求的产品。需同时具备技术理解力、商业洞察力和用户思维，既要参与算法选型与数据建模，又要定义产品功能与市场策略，是贯穿产品全生命周期的关键角色。与传统互联网产品经理相比，AI产品经理的独特之处在于：技术深度参与：需理解机器学习、自然语言处理（NLP）、计算机视觉等技术原理，并参与数
深度学习-130-RAG技术之基于Anything LLM搭建本地私人知识库的应用策略问题总结(一) 皮皮冰燃深度学习深度学习人工智能 RAG
文章目录1AnythingLLM的本地知识库1.1本地知识库应用场景1.2效果对比及思考1.3本地体现在哪些方面1.3.1知识在本地1.3.2分割后的文档在本地1.3.3大模型部署运行在本地2问错问题带来的问题2.1常见的问题2.2原因分析3为什么LLM不使用我的文件？3.1LLM不是万能的【omnipotent】3.2LLM不会自省【introspect】3.3AnythingLLM是如何工作的
3DMAX点云算法：实现毫米级BIM模型偏差检测（附完整代码）夏末之花人工智能
摘要本文基于激光雷达点云数据与BIM模型的高精度对齐技术，提出一种融合动态体素化与多模态特征匹配的偏差检测方法。通过点云预处理、语义分割、模型配准及差异分析，最终实现建筑构件毫米级偏差的可视化检测。文中提供关键代码实现，涵盖点云处理、特征提取与深度学习模型搭建。一、核心算法流程点云预处理与特征增强去噪与下采样：采用统计滤波与体素网格下采样，去除离群点并降低数据量。语义分割：基于PointNet++
数据增强：扩充数据集提升模型泛化能力 AI天才研究院计算 AI大模型企业级应用开发实战 ChatGPT 计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍1.1.数据增强的重要性在机器学习领域，模型的泛化能力至关重要。一个泛化能力强的模型能够在未见数据上表现良好，而过拟合的模型则会在训练数据上表现出色，但在新数据上表现糟糕。数据增强是一种有效提升模型泛化能力的技术，它通过对现有数据进行各种变换，人为地扩充数据集，从而增加训练数据的数量和多样性。1.2.数据增强的应用场景数据增强广泛应用于各种机器学习任务中，包括：图像识别:对图像进行旋转
数据增强：扩充数据集，提升模型的鲁棒性 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 LLM大模型落地实战指南计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
数据增强：扩充数据集，提升模型的鲁棒性1.背景介绍1.1数据集的重要性在机器学习和深度学习领域中,数据集是训练模型的基础。高质量的数据集对于构建准确、鲁棒的模型至关重要。然而,在现实世界中,获取大量高质量的数据通常是一个巨大的挑战。数据采集过程耗时耗力,而且成本高昂。此外,某些领域的数据存在隐私和安全问题,难以获取。1.2数据集不足的挑战当数据集规模有限时,模型很容易过拟合,无法很好地推广到新的、
【FPGA教程案例31】通信案例1——基于FPGA的ASK调制信号产生 fpga和matlab ★教程2:fpga入门100例 fpga开发 FPGA教程 ASK调制 verilog
FPGA教程目录MATLAB教程目录---------------------------------------------------------------------------------------目录1.软件版本2.ASK调制原理3.ASK调制过程的FPGA实现4.操作步骤与仿真结论5.参考文献1.软件版本vivado2019.22.ASK调制原理幅度键控（Amplitude-Shi
Docker打包深度学习项目 FLY_LTL docker 深度学习容器
文章目录Docker打包深度学习项目1.Docker和NVIDIAContainerToolkit的安装1.Docker2.NVIDIAContainerToolkit3.添加国内镜像源2.使用Dockerfile打包并保存镜像1.Dockerfile2.通过Dockerfile生成镜像3.保存镜像和加载4.运行Docker并测试参考Docker打包深度学习项目本文来源于个人实践总结，供各位同学参
使用TensorFlow、OpenCV和Pygame实现图像处理与游戏开发 UwoiGit tensorflow opencv pygame
在本篇文章中，我们将介绍如何结合使用TensorFlow、OpenCV和Pygame来进行图像处理和游戏开发。这三个工具在机器学习、计算机视觉和游戏开发领域都非常流行，并且它们的结合可以提供强大的功能和无限的创造力。我们将逐步介绍如何安装和配置这些工具，并提供相关的源代码示例。安装TensorFlowTensorFlow是一个基于数据流图的开源机器学习框架，提供了丰富的工具和库来构建和训练各种深度
机器学习之KMeans算法知舟不叙机器学习算法 kmeans
文章目录引言1.KMeans算法简介2.KMeans算法的数学原理3.KMeans算法的步骤3.1初始化簇中心3.2分配数据点3.3更新簇中心3.4停止条件4.KMeans算法的优缺点4.1优点4.2缺点5.KMeans算法的应用场景5.1图像分割5.2市场细分5.3文档聚类5.4异常检测6.Python实现KMeans算法7.总结引言KMeans算法是机器学习中最经典的无监督学习算法之一，广泛应
机器学习流程—数据预处理清洗不二人生机器学习机器学习人工智能数据预处理
文章目录机器学习流程—数据预处理清洗定义问题数据预处理数据加载与展示重复数据处理数据类型空值处理无关特征删除数据分布删除异常值生成标签和特征数据分割机器学习流程—数据预处理清洗数据处理是将数据从给定形式转换为更可用和更理想的形式的任务，即使其更有意义、信息更丰富。使用机器学习算法、数学建模和统计知识，整个过程可以自动化。这个完整过程的输出可以是任何所需的形式，如图形、视频、图表、表格、图像等等，具
深入学习 DNS 域名解析 dns解析
一、前言在平时工作中相信大家都离不开DNS解析，因为DNS解析是互联网访问的第一步，无论是使用笔记本浏览器访问网络还是打开手机APP的时候，访问网络资源的第一步必然要经过DNS解析流程。二、DNS是什么DNS（域名系统DomainNameSystem），它是一个记录域名和Ip地址相互映射的一个系统，是互联网的“电话簿”，负责将人类可读的域名（如example.com）转换为机器可识别的IP地址（如
深度革命：ResNet 如何用 “残差连接“ 颠覆深度学习安意诚Matrix 机器学习笔记深度学习人工智能
一文快速了解ResNet创新点在深度学习的历史长河中，2015年或许是最具突破性的一年。这一年，微软亚洲研究院的何恺明团队带着名为ResNet（残差网络）的模型横空出世，在ImageNet图像分类竞赛中以3.57%的错误率夺冠，将人类视觉的识别误差（约5.1%）远远甩在身后。更令人震撼的是，ResNet将神经网络的深度推至152层，彻底打破了"深层网络无法训练"的魔咒。这场革命的核心，正是一个简单
智能形状匹配技术全解析：从经典算法到深度学习与神经形态计算【超级详细版】 AI筑梦师计算机视觉算法深度学习人工智能机器学习计算机视觉 python
智能形状匹配技术全解析：从经典算法到深度学习与神经形态计算1.引言1.1研究背景在计算机视觉、模式识别、医学影像分析和自动驾驶等领域，形状匹配是核心任务之一。然而，现实世界的形状往往存在可变性（Variability），主要体现在以下几个方面：形变（Deformation）：物体可能由于柔性材料、外力作用或生物运动发生非刚性形变。尺度变化（ScaleVariation）：目标形状在不同场景下可能大
Python 模拟鼠标轨迹算法 a485240 鼠标轨迹计算机外设
一.鼠标轨迹模拟简介传统的鼠标轨迹模拟依赖于简单的数学模型，如直线或曲线路径。然而，这种方法难以捕捉到人类操作的复杂性和多样性。AI大模型的出现，使得能够通过深度学习技术，学习并模拟更自然的鼠标移动行为。二.鼠标轨迹算法实现AI大模型通过学习大量的人类鼠标操作数据，能够识别和模拟出自然且具有个体差异的鼠标轨迹。以下是实现这一技术的关键步骤：数据收集：收集不同玩家在各种游戏环境中的鼠标操作数据，包括
Apache Storm：实时数据处理的闪电战 Aaron_945 Java apache storm 大数据
文章目录ApacheStorm原理拓扑结构数据流处理容错机制官网链接基础使用安装与配置编写拓扑提交与运行高级使用状态管理窗口操作多语言支持优点高吞吐量低延迟可扩展性容错性总结ApacheStorm是一个开源的分布式实时计算系统，它允许你以极高的吞吐量处理无界数据流。Storm被广泛用于实时分析、在线机器学习、连续计算等多种场景。本文将深入探讨ApacheStorm的原理、基础使用、高级特性及其优点
【AI大模型前沿】浙大携手阿里推出HealthGPT：医学视觉语言大模型助力智能医疗新突破寻道AI小兵 AI大模型前沿技术追踪人工智能语言模型 AIGC
系列篇章No.文章1【AI大模型前沿】深度剖析瑞智病理大模型RuiPath：如何革新癌症病理诊断技术2【AI大模型前沿】清华大学CLAMP-3：多模态技术引领音乐检索新潮流3【AI大模型前沿】浙大携手阿里推出HealthGPT：医学视觉语言大模型助力智能医疗新突破目录系列篇章前言一、项目概述二、技术原理（一）异构低秩适应（H-LoRA）（二）分层视觉感知（HVP）（三）三阶段学习策略（TLS）三、
【论文精读】SCINet-基于降采样和交互学习的时序卷积模型打酱油的葫芦娃时序预测算法时序预测 SCINet TCN
《SCINet:TimeSeriesModelingandForecastingwithSampleConvolutionandInteraction》的作者团队来自香港中文大学，发表在NeurIPS2022会议上。动机该论文的出发点是观察到时间序列数据具有独特的属性：即使在将时间序列下采样成两个子序列后，时间关系（例如数据的趋势和季节性成分）也基本上得以保留。这个观察启发了作者去设计一种新型的神
什么是机器视觉3D引导大模型视觉人机器视觉机器视觉3D 3d 数码相机机器人人工智能大数据
机器视觉3D引导大模型是结合深度学习、多模态数据融合与三维感知技术的智能化解决方案，旨在提升工业自动化、医疗、物流等领域的操作精度与效率。以下从技术架构、行业应用、挑战与未来趋势等方面综合分析：一、技术架构与核心原理多模态数据融合与深度学习3D视觉引导大模型通常整合RGB图像、点云数据、深度信息等多模态输入，通过深度学习算法（如卷积神经网络、Transformer）进行特征提取与融合。例如，油田机
jQuery 键盘事件keydown ,keypress ,keyup介绍 107x js jquery keydown keypress keyup
本文章总结了下些关于jQuery 键盘事件keydown ,keypress ,keyup介绍，有需要了解的朋友可参考。一、首先需要知道的是： 1、keydown() keydown事件会在键盘按下时触发. 2、keyup() 代码如下复制代码 $('input').keyup(funciton(){
AngularJS中的Promise bijian1013 JavaScript AngularJS Promise
一.Promise Promise是一个接口，它用来处理的对象具有这样的特点：在未来某一时刻（主要是异步调用）会从服务端返回或者被填充属性。其核心是，promise是一个带有then()函数的对象。为了展示它的优点，下面来看一个例子，其中需要获取用户当前的配置文件： var cu
c++ 用数组实现栈类 CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T, int SIZE = 50> class Stack{ private: T list[SIZE];//数组存放栈的元素 int top;//栈顶位置 public: Stack(
java和c语言的雷同麦田的设计者 java 递归 scaner
软件启动时的初始化代码，加载用户信息2015年5月27号从头学java二 1、语言的三种基本结构：顺序、选择、循环。废话不多说，需要指出一下几点： a、return语句的功能除了作为函数返回值以外，还起到结束本函数的功能，return后的语句不会再继续执行。 b、for循环相比于whi
LINUX环境并发服务器的三种实现模型被触发 linux
服务器设计技术有很多，按使用的协议来分有TCP服务器和UDP服务器。按处理方式来分有循环服务器和并发服务器。 1 循环服务器与并发服务器模型在网络程序里面，一般来说都是许多客户对应一个服务器，为了处理客户的请求，对服务端的程序就提出了特殊的要求。目前最常用的服务器模型有： ·循环服务器：服务器在同一时刻只能响应一个客户端的请求 ·并发服务器：服
Oracle数据库查询指令肆无忌惮_ oracle数据库
20140920 单表查询 -- 查询************************************************************************************************************ -- 使用scott用户登录 -- 查看emp表 desc emp
ext右下角浮动窗口知了ing JavaScript ext
第一种 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/
浅谈REDIS数据库的键值设计矮蛋蛋 redis
http://www.cnblogs.com/aidandan/ 原文地址：http://www.hoterran.info/redis_kv_design 丰富的数据结构使得redis的设计非常的有趣。不像关系型数据库那样，DEV和DBA需要深度沟通，review每行sql语句，也不像memcached那样，不需要DBA的参与。redis的DBA需要熟悉数据结构，并能了解使用场景。
maven编译可执行jar包 alleni123 maven
http://stackoverflow.com/questions/574594/how-can-i-create-an-executable-jar-with-dependencies-using-maven <build> <plugins> <plugin> <artifactId>maven-asse
人力资源在现代企业中的作用百合不是茶 HR 企业管理
//人力资源在在企业中的作用人力资源为什么会存在，人力资源究竟是干什么的人力资源管理是对管理模式一次大的创新，人力资源兴起的原因有以下点：工业时代的国际化竞争，现代市场的风险管控等等。所以人力资源在现代经济竞争中的优势明显的存在，人力资源在集团类公司中存在着明显的优势(鸿海集团)，有一次笔者亲自去体验过红海集团的招聘，只知道人力资源是管理企业招聘的当时我被招聘上了，当时给我们培训的人
Linux自启动设置详解 bijian1013 linux
linux有自己一套完整的启动体系，抓住了linux启动的脉络，linux的启动过程将不再神秘。阅读之前建议先看一下附图。本文中假设inittab中设置的init tree为： /etc/rc.d/rc0.d /etc/rc.d/rc1.d /etc/rc.d/rc2.d /etc/rc.d/rc3.d /etc/rc.d/rc4.d /etc/rc.d/rc5.d /etc
Spring Aop Schema实现 bijian1013 java spring AOP
本例使用的是Spring2.5 1.Aop配置文件spring-aop.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmln
【Gson七】Gson预定义类型适配器 bit1129 gson
Gson提供了丰富的预定义类型适配器，在对象和JSON串之间进行序列化和反序列化时，指定对象和字符串之间的转换方式， DateTypeAdapter public final class DateTypeAdapter extends TypeAdapter<Date> { public static final TypeAdapterFacto
【Spark八十八】Spark Streaming累加器操作（updateStateByKey) bit1129 update
在实时计算的实际应用中，有时除了需要关心一个时间间隔内的数据，有时还可能会对整个实时计算的所有时间间隔内产生的相关数据进行统计。比如：对Nginx的access.log实时监控请求404时，有时除了需要统计某个时间间隔内出现的次数，有时还需要统计一整天出现了多少次404，也就是说404监控横跨多个时间间隔。 Spark Streaming的解决方案是累加器，工作原理是，定义
linux系统下通过shell脚本快速找到哪个进程在写文件 ronin47
一个文件正在被进程写我想查看这个进程文件一直在增大找不到谁在写使用lsof也没找到这个问题挺有普遍性的，解决方法应该很多，这里我给大家提个比较直观的方法。 linux下每个文件都会在某个块设备上存放，当然也都有相应的inode, 那么透过vfs.write我们就可以知道谁在不停的写入特定的设备上的inode。幸运的是systemtap的安装包里带了inodewatch.stp，位
java-两种方法求第一个最长的可重复子串 bylijinnan java 算法
import java.util.Arrays; import java.util.Collections; import java.util.List; public class MaxPrefix { public static void main(String[] args) { String str="abbdabcdabcx";
Netty源码学习-ServerBootstrap启动及事件处理过程 bylijinnan java netty
Netty是采用了Reactor模式的多线程版本，建议先看下面这篇文章了解一下Reactor模式： http://bylijinnan.iteye.com/blog/1992325 Netty的启动及事件处理的流程，基本上是按照上面这篇文章来走的文章里面提到的操作，每一步都能在Netty里面找到对应的代码其中Reactor里面的Acceptor就对应Netty的ServerBo
servelt filter listener 的生命周期 cngolon filter listener servelt 生命周期
1. servlet 当第一次请求一个servlet资源时，servlet容器创建这个servlet实例，并调用他的 init(ServletConfig config)做一些初始化的工作，然后调用它的service方法处理请求。当第二次请求这个servlet资源时，servlet容器就不在创建实例，而是直接调用它的service方法处理请求，也就是说
jmpopups获取input元素值 ctrain JavaScript
jmpopups 获取弹出层form表单首先，我有一个div，里面包含了一个表单，默认是隐藏的，使用jmpopups时，会弹出这个隐藏的div，其实jmpopups是将我们的代码生成一份拷贝。当我直接获取这个form表单中的文本框时，使用方法：$('#form input[name=test1]').val()；这样是获取不到的。我们必须到jmpopups生成的代码中去查找这个值，$(
vi查找替换命令详解 daizj linux 正则表达式替换查找 vim
一、查找查找命令 /pattern<Enter> ：向下查找pattern匹配字符串 ?pattern<Enter>：向上查找pattern匹配字符串使用了查找命令之后，使用如下两个键快速查找： n：按照同一方向继续查找 N：按照反方向查找字符串匹配 pattern是需要匹配的字符串，例如： 1: /abc<En
对网站中的js,css文件进行打包 dcj3sjt126com PHP 打包
一，为什么要用smarty进行打包 apache中也有给js,css这样的静态文件进行打包压缩的模块，但是本文所说的不是以这种方式进行的打包，而是和smarty结合的方式来把网站中的js,css文件进行打包。为什么要进行打包呢，主要目的是为了合理的管理自己的代码。现在有好多网站，你查看一下网站的源码的话，你会发现网站的头部有大量的JS文件和CSS文件，网站的尾部也有可能有大量的J
php Yii: 出现undefined offset 或者 undefined index解决方案 dcj3sjt126com undefined
在开发Yii 时，在程序中定义了如下方式： if($this->menuoption[2] === 'test')，那么在运行程序时会报：undefined offset:2，这样的错误主要是由于php.ini 里的错误等级太高了，在windows下错误等级
linux 文件格式（1） sed工具 eksliang linux linux sed工具 sed工具 linux sed详解
转载请出自出处： http://eksliang.iteye.com/blog/2106082 简介 sed 是一种在线编辑器，它一次处理一行内容。处理时，把当前处理的行存储在临时缓冲区中，称为“模式空间”（pattern space），接着用sed命令处理缓冲区中的内容，处理完成后，把缓冲区的内容送往屏幕。接着处理下一行，这样不断重复，直到文件末尾
Android应用程序获取系统权限 gqdy365 android
引用如何使Android应用程序获取系统权限第一个方法简单点，不过需要在Android系统源码的环境下用make来编译： 1. 在应用程序的AndroidManifest.xml中的manifest节点
HoverTree开发日志之验证码 hvt .net C#asp.net hovertree webform
HoverTree是一个ASP.NET的开源CMS，目前包含文章系统，图库和留言板功能。代码完全开放，文章内容页生成了静态的HTM页面，留言板提供留言审核功能，文章可以发布HTML源代码，图片上传同时生成高品质缩略图。推出之后得到许多网友的支持，再此表示感谢！留言板不断收到许多有益留言，但同时也有不少广告，因此决定在提交留言页面增加验证码功能。ASP.NET验证码在网上找，如果不是很多，就是特别多
JSON API：用 JSON 构建 API 的标准指南中文版 justjavac json
译文地址：https://github.com/justjavac/json-api-zh_CN 如果你和你的团队曾经争论过使用什么方式构建合理 JSON 响应格式，那么 JSON API 就是你的 anti-bikeshedding 武器。通过遵循共同的约定，可以提高开发效率，利用更普遍的工具，可以是你更加专注于开发重点：你的程序。基于 JSON API 的客户端还能够充分利用缓存，
数据结构随记_2 lx.asymmetric 数据结构笔记
第三章栈与队列一．简答题 1. 在一个循环队列中，队首指针指向队首元素的前一个位置。 2.在具有n个单元的循环队列中，队满时共有 n-1 个元素。 3. 向栈中压入元素的操作是先移动栈顶指针&n
Linux下的监控工具dstat 网络接口 linux
1) 工具说明dstat是一个用来替换 vmstat,iostat netstat,nfsstat和ifstat这些命令的工具, 是一个全能系统信息统计工具. 与sysstat相比, dstat拥有一个彩色的界面, 在手动观察性能状况时, 数据比较显眼容易观察; 而且dstat支持即时刷新, 譬如输入dstat 3, 即每三秒收集一次, 但最新的数据都会每秒刷新显示. 和sysstat相同的是,
C 语言初级入门--二维数组和指针 1140566087 二维数组 c/c++指针
/* 二维数组的定义和二维数组元素的引用二维数组的定义：当数组中的每个元素带有两个下标时，称这样的数组为二维数组； (逻辑上把数组看成一个具有行和列的表格或一个矩阵); 语法：类型名数组名[常量表达式1][常量表达式2] 二维数组的引用：引用二维数组元素时必须带有两个下标，引用形式如下：例如： int a[3][4]; 引用：
10点睛Spring4.1-Application Event wiselyman application
10.1 Application Event Spring使用Application Event给bean之间的消息通讯提供了手段应按照如下部分实现bean之间的消息通讯继承ApplicationEvent类实现自己的事件实现继承ApplicationListener接口实现监听事件使用ApplicationContext发布消息