Kingsleyandher

常见监督学习、聚类、集成、降维、推荐算法汇总（一）：监督学习

前言

监督学习最简单的理解就是给数据打上标签后让机器进行学习的模式。

支持向量机（SVM）

硬间隔最大化支持向量机

目的： 寻找能达到最优分类的超平面，并且使其具有最优的鲁棒性，即最好的泛化能力。
感知机： 以误分类最小为策略（解）
支持向量机： 以间隔最大化为策略（存在最优解）

函数间隔和几何间隔的差别？
答：一般来说一个点距离超平面的远近可以衡量预测的确信程度。函数间隔可以表示分类预测的正确性以及准确度，但是成比例的改变超平面的参数，在超平面不变的情况下，函数间隔也会增加。为了解决这个问题就将超平面的参数做归一化调整，这样就得到了几何间隔。几何间隔是可以描述一个点被预测结果的确信程度。

支持向量和间隔边界？
答：不严谨的来说，支持向量机其实只用了几个样例来确定超平面，这些影响超平面的点就叫做支持向量。在硬间隔最大化情况下，过支持向量与超平面平行的就叫做间隔边界。
分离超平面的确定只和支持向量有关，去除掉除支持向量的样例后，解也不会发生改变。支持向量的个数通常很少，一般都由少量重要的样例构成。

拉格朗日对偶算法中的KKT条件有什么用？
答：保证原问题和对偶问题存在最优解。

线性支持向量机与软间隔最大化

软间隔最大化最重要的改变是，在硬间隔最大化约束条件的基础上，引入了松弛变量来解决线性不可分问题。
（线性不可分意味着某些样本点不能满足函数间隔大于等于1的约束条件）
软间隔的支持向量除了在间隔边界上的，还会有在间隔边界内和间隔边界外的。一搬后者都是线性不可分形况下被误分类的点。

合页损失函数

线性支持向量机还有另一种解释，就是最小化以下的目标函数：
$\min_{\omega,b}\sum_{i=1}^N[1-y_i(\omega*x_i+b)]_++\lambda||\omega||^2$
合页损失函数等价于原优化问题。

可以看出，合页损失函数不仅要求分类正确，而且确信度足够高时损失才是0.也就是说，合页损失函数对学习有更高的要求，这也是为什么工业界比较流行的算法。

面试问题

简单概括一下SVM
SVM是一种二分类模型，它的基本思想是在空间内寻找间隔最大的分离超平面使得数据能够高效的二分类，具体来讲有三种情况。

训练样本线性可分的时候通过硬间隔最大化学习一个线性分类器，即线性可分支持向量机。
训练数据近似线性可分时，引入松弛变量，通过软间隔最大化，学习一个线性分类器，即线性支持向量机。
当训练数据不可分时，通过使用核技巧以及软间隔最大化，学习非线性支持向量机。

SVM为什么采用间隔最大化？
答：寻找最优解，对未知实例的泛化能力最强。

为什么SVM对缺失数据敏感？
答：这里说的缺失数据是指缺失某些特征数据，向量数据不完整。SVM 没有处理缺失值的策略。而 SVM 希望样本在特征空间中线性可分，所以特征空间的好坏对SVM的性能很重要。缺失特征数据将影响训练结果的好坏。

为什么要将求解SVM的原始问题转换为其对偶问题？
是对偶问题往往更易求解,（当我们寻找约束存在时的最优点的时候，约束的存在虽然减小了需要搜寻的范围，但是却使问题变得更加复杂。为了使问题变得易于处理，我们的方法是把目标函数和约束全部融入一个新的函数，即拉格朗日函数，再通过这个函数来寻找最优点。）
(a)目前处理的模型严重依赖于数据集的维度d，如果维度d太高就会严重提升运算时间；
(b)对偶问题把SVM从依赖d个维度转变到依赖N个数据点，最后计算时只有支持向量有意义，所以计算量比N小很多。

样本失衡会对SVM的结果产生影响吗？
答：会，超平面会靠近样本少的类别。因为使用的是软间隔分类，而如果对所有类别都是使用同样的惩罚系数，则由于优化目标里面有最小化惩罚量，所以靠近少数样本时，其惩罚量会少一些。比如：假设理想的分隔超平面是大样本中有很多数据到该超平面的函数距离是小于1的，而小样本中是只有少数样本的函数距离小于1的。但是由于惩罚系数相同，实际算法得到的超平面会往小样本数据靠近。
参考博客提供的解法
1)、对多数类和和少数类采用不同的惩罚因子，对正例和负例赋予不同的C值，例如正例远少于负例，则正例的C值取得较大，这种方法的缺点是可能会偏离原始数据的概率分布；
2)、对训练集的数据进行预处理即对数量少的样本以某种策略进行采样，增加其数量或者减少数量多的样本，典型的方法如：随机插入法，缺点是可能出现 overfitting，较好的是：Synthetic Minority Over-sampling TEchnique(SMOTE)，其缺点是只能应用在具体的特征空间中，不适合处理那些无法用特征向量表示的问题，当然增加样本也意味着训练时间可能增加；
3)、基于核函数的不平衡数据处理。

SVM的优缺点？
优点：

SVM是一个凸优化问题，所以求得的解一定是全局最优而不是局部最优。
同时适用于线性问题和非线性问题
拥有高维样本空间的数据也能用SVM，这是因为数据集的复杂度只取决于支持向量而不是数据集的维度，这在某种意义上避免了“维数灾难”。
理论基础完善

缺点：

二次规划问题求解将涉及m阶矩阵的计算(m为样本的个数), 因此SVM不适用于超大数据集。(SMO算法可以缓解这个问题)
只适用于二分类问题。(SVM的推广SVR也适用于回归问题；可以通过多个SVM的组合来解决多分类问题)

逻辑回归（LR）

一句话概括逻辑回归：逻辑回归假设数据服从伯努利分布（0-1分布）,通过极大化似然函数的方法，运用梯度下降来求解参数，来达到将数据二分类的目的。

逻辑回归的假设

假设数据服从0-1分布
假设模型的输出值是样本为正例的概率

逻辑回归的损失函数

是它的极大似然函数

逻辑回归的求解方法

由于极大似然函数无法直接求解，我们一般通过对该函数进行梯度下降来不断逼近最优解。
随机梯度下降，批梯度下降，small batch 梯度下降的优劣？

批梯度下降会获得全局最优解，缺点是在更新每个参数的时候需要遍历所有的数据，计算量会很大
随机梯度下降是以高方差频繁更新，优点是使得sgd会跳到新的和潜在更好的局部最优解，缺点是使得收敛到局部最优解的过程更加的复杂。
小批量梯度下降结合了sgd和batch gd的优点，每次更新的时候使用n个样本。减少了参数更新的次数，可以达到更加稳定收敛结果，一般在深度学习当中我们采用这种方法。

逻辑回归的目的

该函数的目的便是将数据二分类，提高准确率。

逻辑回归如何分类

逻辑回归作为一个回归(也就是y值是连续的)，如何应用到分类上去呢。y值确实是一个连续的变量。逻辑回归的做法是划定一个阈值，y值大于这个阈值的是一类，y值小于这个阈值的是另外一类。阈值具体如何调整根据实际情况选择。一般会选择0.5做为阈值来划分。

逻辑回归的损失函数为什么要使用极大似然函数作为损失函数？
将极大似然函数取对数以后等同于对数损失函数。在逻辑回归这个模型下，对数损失函数的训练求解参数的速度是比较快的。而且参数更新的速度和sigmod的梯度是无关的，这样救能保证了训练的速度。而若是选用平方损失函数的话，由于sigmod定义域内的梯度都不大于0.25，就会使得训练变的很慢。

逻辑回归的优缺点
优点：

形式简单，可解释性好。
模型效果不错。
训练速度较快，只和特征数目相关。
资源占用小。
方便结果调整，输出的概率很容易划分阈值。

缺点：

准确率不高，因为形式非常简单。
很难处理数据不平衡的问题。
处理非线性问题或者多分类问题比较麻烦
无法筛选特征，一般会用gbdt先筛选特征，然后再LR。

为什么用sigmod函数？

如果选择单位阶跃函数的话，它是不连续的不可微。而如果选择sigmoid函数，它是连续的
sigmoid能够将z转化为一个接近0或1的值。

感觉所有的算法的损失函数的选取都是取决于梯度下降的速度。

决策树（DT）

请概括一下决策树
答：简单来说，决策树是一种不断引入特征使得原本随机变量的不确定性降低的学习算法。
信息增益和信息增益率？
答：首先必须要提到熵的概念，熵是用来度量随机变量的不确定性。若随机变量的分类越多或分布更均匀，则这个随机变量的熵越大。在熵的概念之后又要提到条件熵，即为原本的随机变量引入条件（即特征），在引入条件的基础上重新计算条件熵。而条件熵和原本的经验熵之差就定义为信息增益。
信息增益能够度量一个特征对于响应随机变量不确定性减少的程度，但也存在一定的缺点，比如更倾向于选择分类更多的特征。
在此基础上，引入了信息增益率来避免这个问题。信息增益率在原本计算信息增益的基础上除以分裂信息熵，相当于做了一个标准化一样。

决策树出现过拟合的原因及其解决办法？
对训练数据预测效果很好，但是测试数据预测效果较差的现象称为过拟合。原因可能是：没有进行合理的剪枝，样本中有一部分噪声数据等。只需要加入剪枝的操作就可以，一般在损失函数后面加入正则化项即可，减少特征，交叉验证选择最好效果的模型也是解决方法之一。

决策树的优缺点

优点：

计算简单、速度快；
可解释性强；
比较适合处理有缺失属性的样本。

缺点：

容易发生过拟合（随机森林可以很大程度上减少过拟合）；
忽略了数据之间的相关性；
对于那些各类别样本数量不一致的数据，在决策树当中,信息增益的结果偏向于那些具有更多数值的特征

决策树和逻辑回归的区别

决策树可以处理含有缺失值的数据，而逻辑回归不可以
决策树更关注局部特征，而逻辑会馆更关注全局特征
逻辑回归擅长线性关系的分析，决策树不然
决策树的结果相较于逻辑回归更加粗糙

朴素贝叶斯（NB）

朴素贝叶斯的假设：特征之间相互独立
朴素贝叶斯与LR的区别？
朴素贝叶斯是基于很强的条件独立假设（在已知分类Y的条件下，各个特征变量取值是相互独立的），而LR则对此没有要求；
朴素贝叶斯适用于数据集少的情景，而LR适用于大规模数据集。
在估计条件概率P(X|Y)时出现概率为0的情况怎么办？
答：简单来说：引入λ，当λ=1时称为拉普拉斯平滑。

朴素贝叶斯的优缺点
优点：对小规模的数据表现很好，适合多分类任务，适合增量式训练。
缺点：对输入数据的表达形式很敏感（离散、连续，值极大极小之类的）。

为什么属性独立性假设在实际情况中很难成立，但朴素贝叶斯仍能取得较好的效果?
1)对于分类任务来说，只要各类别的条件概率排序正确、无需精准概率值即可导致正确分类；
2)如果属性间依赖对所有类别影响相同，或依赖关系的影响能相互抵消，则属性条件独立性假设在降低计算开销的同时不会对性能产生负面影响。

K近邻（KNN）

KNN总结

对异常数据不敏感。
可以用来做分类也可以用来做回归
可用于非线性分类
使用懒散学习方法，基本上不学习，导致预测时速度比起逻辑回归之类的算法慢。
计算量大，尤其是特征数非常多的时候
样本不平衡的时候，对稀有类别的预测准确率低
KD树，球树之类的模型建立需要大量的内存
相比决策树模型，KNN模型可解释性不强

神经网络（NN）

太多了…

景联文科技数据处理平台：支持高质量图像标注服务景联文科技人工智能科技计算机视觉
图像标注是计算机视觉领域中不可或缺的一环，它通过为图像添加标签来帮助机器学习算法理解图像内容。这一过程对于创建高质量的训练数据集至关重要，使得AI模型能够准确地识别和分类现实世界中的物体。常见的图像标注类型：边界框标注：这是最常用的标注方式之一，通常用于物体检测任务。通过绘制矩形框来确定图像中目标物体的位置，可以是二维或三维形式。分割标注：包括语义分割（同一类别的所有实例被视为整体）和实例分割（每
景联文科技：以全面数据处理服务推动AI创新与产业智能化转型景联文科技人工智能
数据标注公司在人工智能领域扮演着重要角色，通过提供高质量的数据标注服务，帮助企业和组织训练和优化机器学习模型。从需求分析到数据交付，每一个步骤都需要严格把控，确保数据的质量和安全性。景联文科技是一家专业的数据采集与标注公司，致力于为客户提供高质量的数据处理服务，助力企业在人工智能（AI）领域的创新与发展。数据标注的四项基本流程：数据采集、数据清洗、数据标注、数据质检。数据采集数据采集是数据处理的第
OPPO 2025届校招补招正式开启 weixin_53585422 算法求职招聘前端硬件工程大数据
OPPO2025届校招补招正式开启（秋招投过的同学也可投递！）面向对象：2025届全球应届本科生与硕士研究生招聘岗位：AI/算法类、标准研究类、软件类、硬件类、产品类、设计类、工程技术类、销售服务类、品牌策划类、采购类、综合职能类（每人最多可投递2个岗位）工作城市：东莞、深圳、成都、上海、北京、西安、南京、重庆薪酬福利：极具竞争力的薪资+制化培养体系+多样化发展机制内推链接：https://sou
Spark 性能优化（四）：Cache LevenBigData spark 性能调优 spark 性能优化大数据
在Spark中，缓存是一种将计算结果存储在内存中的方式，目的是加速后续操作。当你执行迭代算法或查询时，如果多次重复使用相同的数据集，缓存可以避免每次都重新计算相同的转换操作。通过缓存，Spark可以将数据存储在内存中，这样在后续的处理阶段就能更快地访问。1.Spark缓存的关键点：缓存基本概念：通过调用.cache()对DataFrame或RDD进行缓存。默认情况下，数据会存储在内存中（RAM），
阿里云RDS到亚马逊云RDS的实时数据同步方案详解 ivwdcwso 运维阿里云云计算 aws kda 数据同步
1.需求背景在当今的多云环境中,企业经常需要在不同云平台之间同步数据。本文将详细介绍如何实现从阿里云RDSMySQL数据库到亚马逊云RDSMySQL数据库的实时数据同步。这种同步对于数据备份、跨区域数据访问、数据分析等场景都非常有用。2.方案概述我们将使用AWSKinesisDataAnalytics(KDA)作为核心组件来实现这个实时同步方案。KDA基于ApacheFlink,支持使用SQL或J
《深入浅出多模态》（五）：多模态经典模型ALBEF GoAI 深入浅出多模态多模态大模型 LLM 深度学习人工智能
AI学习星球推荐：GoAI的学习社区知识星球是一个致力于提供《机器学习|深度学习|CV|NLP|大模型|多模态|AIGC》各个最新AI方向综述、论文等成体系的学习资料，配有全面而有深度的专栏内容，包括不限于前沿论文解读、资料共享、行业最新动态以、实践教程、求职相关（简历撰写技巧、面经资料与心得）多方面综合学习平台，强烈推荐AI小白及AI爱好者学习，性价比非常高！加入星球➡️点击链接✨专栏介绍：</
字符串相似度算法 S Y H java工具类算法 java 开发语言
publicstaticvoidmain(String[]args){Stringaddress1="济南市历下区经十路69号12号楼1单元401号";Stringaddress2="济南市历下区经十路69号顺元街道12号楼1单元401号";intdistance=levenshteinDistance(address1,address2);System.out.println("Levensht
高效高并发调度架构之群害马架构
以下是从架构层面为你提供的适合多核CPU、多GPU环境下API客户端、服务端高级调度，以实现高效并发大规模与用户交互的技术栈：通信协议gRPC：基于HTTP/2协议，具有高性能、低延迟的特点，支持二进制序列化（通常搭配Protobuf），非常适合高并发场景。它提供了流式通信和多路复用功能，可有效减少网络开销。常用于微服务之间的通信，例如机器学习模型服务与前端应用之间的交互。RSocket：是一种基
Anaconda3 介绍和安装 gorgor在码农 #python入门基础 python conda
介绍Anaconda是一个开源的Python和R语言发行版，专注于数据科学、机器学习和科学计算，主要面向数据科学和机器学习领域。它集成了大量常用的科学计算库（如NumPy、Pandas、Matplotlib、Scikit-learn等），并提供了强大的包管理工具Conda和环境管理功能，适合快速部署和管理复杂的开发环境。特点：预装丰富库：包含250+常用的数据科学工具包，无需手动安装。跨平台支持：
C++优选算法五位运算 gkdpjj 优选算法算法 c++开发语言
一、位运算位运算（BitwiseOperations）是直接在整数的二进制表示上进行的操作。这些操作包括位与（AND）、位或（OR）、位非（NOT）、位异或（XOR）、左移（LeftShift）和右移（RightShift）等。位运算在处理低级别数据、优化性能、实现加密算法等方面非常有用。以下是这些操作的详细介绍：位与（BitwiseAND,&）：对应位都为1时，结果位才为1，否则为0。示例：5&
读算法简史：从美索不达米亚到人工智能时代15读后总结与感想兼导读躺柒人工智能算法导读总结 AI
1.基本信息算法简史：从美索不达米亚到人工智能时代克里斯·布利克利著中信出版集团股份有限公司,2024年9月出版1.1.读薄率书籍总字数18.6万字，笔记总字数51653字。读薄率51653÷186000≈27.77%1.2.读厚方向当我点击时，算法在想什么？算法霸权极简算法史：从数学到机器的故事算法的陷阱：超级平台、算法垄断与场景欺骗天才与算法：人脑与AI的数学思维算法图解1.3.笔记--章节对
【机器学习】无监督学习算法之：K均值聚类 Carl_奕然机器学习算法学习
K均值聚类1、引言2、K均值聚类2.1定义2.2原理2.3实现方式2.4算法公式2.4.1距离计算公式2.4.1中心点计算公式2.5代码示例3、总结1、引言小屌丝：鱼哥，K均值聚类我不懂，能不能给我讲一讲？小鱼：行，可以小屌丝：额…今天咋直接就答应了？小鱼：不然呢？小屌丝：有啥条件，直接说，小鱼：没有小屌丝：这咋的了，不提条件，我可不踏实小鱼：你看看你，我不提条件，你还不踏实，那你这是非让我提条件
spiking neural network概念学习 Zaгathustra 科研工作深度学习神经网络机器学习
我们认为，SNNs最大的优势在于其能够充分利用基于时空事件的信息。今天，我们有相当成熟的神经形态传感器，来记录环境实时的动态改变。这些动态感官数据可以与SNNs的时间处理能力相结合，以实现超低能耗的计算。在此类传感器中使用SNNs主要受限于缺乏适当的训练算法，从而可以有效地利用尖峰神经元的时间信息。实际上就精度而言，在大多数学习任务中SNNs的效果仍落后于第二代的深度学习。很明显，尖峰神经元可以实
C++学习指南月眠老师 c++java 算法
一、引言C++是一种功能强大的高级编程语言，它融合了面向过程编程和面向对象编程的特性。由于其效率高、可移植性强等优点，广泛应用于系统开发、游戏编程、嵌入式系统等诸多领域。对于想要深入学习C++的人来说，需要全面掌握其语法、编程范式、数据结构、算法以及相关的开发工具等多方面的知识。二、C++基础语法（一）基本数据类型整型（Integer）在C++中有多种整型类型，如int（通常为32位有符号整数）、
第二章：13.1 机器学习的迭代发展望云山190 机器学习人工智能
目录机器学习模型开发流程构建电子邮件垃圾邮件分类器示例总结垃圾邮件分类示例构建垃圾邮件分类器机器学习模型开发流程确定系统架构：首先，需要决定机器学习系统的总体架构，这包括选择合适的模型、确定使用的数据集、可能还包括选择超参数等。实现和训练模型：根据上述决定，实现并训练一个模型。通常，第一次训练的模型不会立即达到预期的效果。诊断和调整：对模型进行诊断，查看算法的偏差、方差或进行错误分析。根据诊断结果
蓝桥杯备考：贪心算法简介无敌大饺子 1 贪心算法算法
贪心算法就是企图用局部最优的策略找出全局最优步骤就是1，把解决问题的过程分成若干步。2，每一步都选择当前看起来最优的解法。3，希望得到全局最优的结果比较经典的例题一个就是找零问题钞票种类[20,10,5,1]用最小的张数找零46的时候，先把最大的20的找完，然后找10的，再找5的，最后再找1的直到不能再找，过程就是46：找零20---》26：找零20-----》6：找零5-----》1：找零1--
备战蓝桥杯：贪心算法之货仓选址无敌大饺子 1 贪心算法算法
当我们货仓选址在最中间的时候，货仓到每家商店的距离最短#include#include#includetypedeflonglongLL;usingnamespacestd;intn;constintN=1e5+10;LLa[N];intmain(){cin>>n;for(inti=1;i>a[i];sort(a+1,a+1+n);LLret=0;for(inti=1;i=|a-b|我们的代码也可
Python 爬虫实战：在东方财富网抓取股票行情数据，辅助投资决策西攻城狮北 python 爬虫实战案例东方财富网
目录一、引言二、准备工作1.环境搭建2.获取目标网址三、分析网页结构1.查看HTML结构2.分析请求方式四、编写爬虫代码1.导入必要的库2.设置请求头3.获取股票行情数据4.保存数据到CSV文件5.主函数五、数据分析与可视化1.加载数据2.数据清洗3.数据分析4.数据可视化六、总结一、引言在金融投资领域，股票行情数据是投资者做出决策的重要依据。东方财富网作为国内领先的金融信息平台，提供了丰富的股票
深度学习（1)-简单神经网络示例 yyc_audio 深度学习人工智能
我们来看一个神经网络的具体实例：使用Python的Keras库来学习手写数字分类。在这个例子中，我们要解决的问题是，将手写数字的灰度图像（28像素×28像素）划分到10个类别中（从0到9）。我们将使用MNIST数据集，图2-1给出了MNIST数据集的一些样本。在机器学习中，分类问题中的某个类别叫作类（class），数据点叫作样本（sample），与某个样本对应的类叫作标签（label）。你不需要现
简化版奇异值分解（SVD）方法详解 DuHz 数理统计学知识机器学习人工智能算法信息与通信信号处理
简化版奇异值分解（SVD）方法详解奇异值分解（SVD）是一个强大的矩阵分解工具，广泛应用于数据降维、图像压缩、机器学习等领域。然而，对于大规模数据或高维矩阵，计算和存储的开销非常大，因此提出了多种简化版的SVD方法。这些简化版方法在保证解的精度的同时，能够显著减少计算量和内存占用。本文将详细介绍几种简化版SVD方法，包括经济型SVD、随机化SVD、增量SVD、分块SVD和偏最小二乘法（PLS），并
Python爬虫——网站基本信息 IT·小灰灰 python 爬虫开发语言网络
在智能时代，数据是新的石油。Python爬虫技术赋予了我们成为数据猎人的能力，让我们能够在网络的广袤土地上狩猎，为机器学习和人工智能的发展提供燃料目录一、介绍——Python二、介绍——Python爬虫1.请求库2.解析库3.数据存储4.多线程/多进程5.异步编程6.代理和反爬虫7.爬虫框架8.爬虫的法律和道德问题9.异常处理10.日志记录三、爬虫示例代码一、介绍——PythonPython是一种
Python：第三方库衍生星球 python 第三方库
1.第三方Python库库名用途pip安装指令NumPy矩阵运算pipinstallnumpyMatplotlib产品级2D图形绘制pipinstallmatplotlibPIL图像处理pipinstallpillowsklearn机器学习和数据挖掘pipinstallsklearnRequestsHTTP协议访问pipinstallrequestsJieba中文分词pipinstalljieba
python如何将数据生成excel_Python如何将数据导出excel的技巧分享 weixin_39528697
本篇文章主要介绍了python技能之导出excel的实例代码，小编觉得挺不错的，现在分享给大家，也给大家做个参考。一起跟随小编过来看看吧本文介绍了python技能之导出excel的实例代码，正好能用到，写出来分享给大家作为一个数据分析师，下面的需求是经常会遇到的。从数据库或者现有的文本文件中提取符合要求的数据，做一个二次处理，处理完成后的数据最终存储到excel表格中供其他部门的人继续二次分析。在
Java 实现拖拽列表更新排序架构师成长进阶空间 Java spring cloud spring boot java 后端
拖拽列表更新排序，接口提供给前端这个功能主要是需要的算法逻辑很多图解：如在前端页面上想把id=5拖拽到id=3上拖拽之后的效果：解析图例：代码示例：DevToCoding｜Java面试指南、学习笔记/***拖拽数据更新排序*@paramcurrentId当前数据id*@paramtargetId目标数据id*@return*/@RequestMapping("/sort/{currentId}/{
【C++】STL之string类源码剖析 AllinTome c++STL 数据结构类与对象 string
目录概述源码MyString.htest.cpp概述string是字符串类，出现早于STL，不过string完全符合STL标准库的语法规则，故将string类也归于STL中string类实现的功能有字符串元素的随机访问、迭代器遍历、字符串追加/删减/查找、字符串随机插入、字符串扩容与修改长度、重载输入/输出运算符算法设计：利用构造临时对象、自定义swap函数，完成string对象的拷贝、赋值构造，
10.3字符串manacher算法赵鑫亿 c++数据结构与算法算法 c++
字符串manacher算法Manacher算法是用于在O(n)时间复杂度内查找字符串中最长回文子串的高效算法。以下是详细的技术解析：一、算法核心思想中心扩展优化：利用回文的对称性避免重复计算奇偶统一处理：通过插入特殊字符将奇偶长度回文统一处理动态维护边界：记录当前已知最右回文边界及其对应的中心二、关键数据结构vectorradius;//存储每个位置的回文半径intcenter=0;//当前中心点
自动驾驶---Motion Planning之参考线Path平滑智能汽车人自动驾驶人工智能
1背景有了由lane_segment插值得到的粗糙参考线，这种参考线是无法输出给下游使用的，需要进一步的处理使得参考线更加平滑，才能供下游控制模块使用。Apollo中共有三种参考线平滑算法，分别为：1.QpSplineSmoother2.SpiralReferenceLineSmoother3.DiscretePointsSmoother目前Apollo中默认配置为最后一种，基于离散点的平滑。这种
仿生机器人核心技术与大小脑天机️灵韵人工智能具身智能硬件设备机器人人工智能具身智能
以下是针对仿生机器人核心技术的结构化总结，涵盖通用核心技术与**“大脑-小脑”专用架构**两大方向：一、机器人通用核心技术这些技术是仿生机器人实现功能的基础，与生物体的“身体能力”对应：1.感知与交互技术多模态传感器融合视觉：3D视觉（如RGB-D相机）、动态目标跟踪（如光流算法）。触觉：柔性电子皮肤、分布式压力传感器（模仿人类皮肤）。听觉：声源定位、噪声抑制（如麦克风阵列）。环境感知：激光雷达（
”人货场”模型搞懂没？数据分析大部分场景都能用！接地气的陈老师人工智能数据分析大数据机器学习推荐系统
做数据分析的同学，很多都听过：人、货、场的分析模型。然而，这东西又是个只闻其名，不见真身的东西。到底该怎么结合实际分析？今天我们系统讲解下。问题场景：某生鲜电商，用户复购率较低，60%的用户在30天内无二次购买行为，运营领导非常着急，要求通过数据分析提升复购率，请问你作为数据分析师该怎么做？建立人工智能精准推荐算法（40%概率用协同过滤，60%用关联分析）把过往6个月月初复购率做成折线图，然后写下
3 ＞数据结构与算法栈与队列 irisart 数据结构与算法（C语言考研期末复习版）c语言数据结构
概览本节总结了栈和队列的基本概念和用法，另外附上栈与队列的基本操作代码（C语言版）。本节适合有C语言基础的初学者、期末复习、考研等方面的用途。栈只允许在一端插入和删除操作的线性表。代码如下特点：先进后出模式（LIFO），只能在栈顶操作。什么是卡特兰数：有n个元素进栈（顺序可以不同），出栈元素不同的排列个数为1n+1C2nn\frac{1}{n+1}C^n_{2n}n+11C2nn。共享栈：两个栈共
桌面上有多个球在同时运动，怎么实现球之间不交叉，即碰撞？换个号韩国红果果 html 小球碰撞
稍微想了一下，然后解决了很多bug，最后终于把它实现了。其实原理很简单。在每改变一个小球的x y坐标后，遍历整个在dom树中的其他小球，看一下它们与当前小球的距离是否小于球半径的两倍？若小于说明下一次绘制该小球（设为a）前要把他的方向变为原来相反方向（与a要碰撞的小球设为b），即假如当前小球的距离小于球半径的两倍的话，马上改变当前小球方向。那么下一次绘制也是先绘制b，再绘制a，由于a的方向已经改变
《高性能HTML5》读后整理的Web性能优化内容白糖_ html5
读后感先说说《高性能HTML5》这本书的读后感吧，个人觉得这本书前两章跟书的标题完全搭不上关系，或者说只能算是讲解了“高性能”这三个字，HTML5完全不见踪影。个人觉得作者应该首先把HTML5的大菜拿出来讲一讲，再去分析性能优化的内容，这样才会有吸引力。因为只是在线试读，没有机会看后面的内容，所以不胡乱评价了。
[JShop]Spring MVC的RequestContextHolder使用误区 dinguangx jeeshop 商城系统 jshop 电商系统
在spring mvc中，为了随时都能取到当前请求的request对象，可以通过RequestContextHolder的静态方法getRequestAttributes()获取Request相关的变量，如request, response等。在jshop中，对RequestContextHolder的
算法之时间复杂度周凡杨 java 算法时间复杂度效率
在计算机科学中，算法的时间复杂度是一个函数，它定量描述了该算法的运行时间。这是一个关于代表算法输入值的字符串的长度的函数。时间复杂度常用大O符号表述，不包括这个函数的低阶项和首项系数。使用这种方式时，时间复杂度可被称为是渐近的，它考察当输入值大小趋近无穷时的情况。这样用大写O()来体现算法时间复杂度的记法，
Java事务处理 g21121 java
一、什么是Java事务通常的观念认为，事务仅与数据库相关。事务必须服从ISO/IEC所制定的ACID原则。ACID是原子性（atomicity）、一致性（consistency）、隔离性（isolation）和持久性（durability）的缩写。事务的原子性表示事务执行过程中的任何失败都将导致事务所做的任何修改失效。一致性表示当事务执行失败时，所有被该事务影响的数据都应该恢复到事务执行前的状
Linux awk命令详解 510888780 linux
一. AWK 说明 awk是一种编程语言，用于在linux/unix下对文本和数据进行处理。数据可以来自标准输入、一个或多个文件，或其它命令的输出。它支持用户自定义函数和动态正则表达式等先进功能，是linux/unix下的一个强大编程工具。它在命令行中使用，但更多是作为脚本来使用。 awk的处理文本和数据的方式：它逐行扫描文件，从第一行到
android permission 布衣凌宇 Permission
<uses-permission android:name="android.permission.ACCESS_CHECKIN_PROPERTIES" ></uses-permission>允许读写访问"properties"表在checkin数据库中，改值可以修改上传 <uses-permission android:na
Oracle和谷歌Java Android官司将推迟 aijuans java oracle
北京时间 10 月 7 日，据国外媒体报道，Oracle 和谷歌之间一场等待已久的官司可能会推迟至 10 月 17 日以后进行，这场官司的内容是 Android 操作系统所谓的 Java 专利权之争。本案法官 William Alsup 称根据专利权专家 Florian Mueller 的预测，谷歌 Oracle 案很可能会被推迟。　　该案中的第二波辩护被安排在 10 月 17 日出庭，从目前看来
linux shell 常用命令 antlove linux shell command
grep [options] [regex] [files] /var/root # grep -n "o" * hello.c:1:/* This C source can be compiled with:
Java解析XML配置数据库连接(DOM技术连接 SAX技术连接) 百合不是茶 sax技术 Java解析xml文档 dom技术 XML配置数据库连接
XML配置数据库文件的连接其实是个很简单的问题,为什么到现在才写出来主要是昨天在网上看了别人写的,然后一直陷入其中,最后发现不能自拔所以今天决定自己完成 ,,,,现将代码与思路贴出来供大家一起学习 XML配置数据库的连接主要技术点的博客; JDBC编程 : JDBC连接数据库 DOM解析XML: DOM解析XML文件 SA
underscore.js 学习（二） bijian1013 JavaScript underscore
Array Functions 所有数组函数对参数对象一样适用。1.first _.first(array, [n]) 别名: head, take 返回array的第一个元素，设置了参数n，就
plSql介绍 bijian1013 oracle 数据库 plsql
/* * PL/SQL 程序设计学习笔记 * 学习plSql介绍.pdf * 时间：2010-10-05 */ --创建DEPT表 create table DEPT ( DEPTNO NUMBER(10), DNAME NVARCHAR2(255), LOC NVARCHAR2(255) ) delete dept; select
【Nginx一】Nginx安装与总体介绍 bit1129 nginx
启动、停止、重新加载Nginx nginx 启动Nginx服务器，不需要任何参数u nginx -s stop 快速(强制)关系Nginx服务器 nginx -s quit 优雅的关闭Nginx服务器 nginx -s reload 重新加载Nginx服务器的配置文件 nginx -s reopen 重新打开Nginx日志文件
spring mvc开发中浏览器兼容的奇怪问题 bitray jquery Ajax springMVC 浏览器上传文件
最近个人开发一个小的OA项目,属于复习阶段.使用的技术主要是spring mvc作为前端框架,mybatis作为数据库持久化技术.前台使用jquery和一些jquery的插件. 在开发到中间阶段时候发现自己好像忽略了一个小问题,整个项目一直在firefox下测试,没有在IE下测试,不确定是否会出现兼容问题.由于jquer
Lua的io库函数列表 ronin47 lua io
1、io表调用方式：使用io表，io.open将返回指定文件的描述，并且所有的操作将围绕这个文件描述　　io表同样提供三种预定义的文件描述io.stdin,io.stdout,io.stderr 　　2、文件句柄直接调用方式,即使用file:XXX()函数方式进行操作,其中file为io.open()返回的文件句柄　　多数I/O函数调用失败时返回nil加错误信息,有些函数成功时返回nil
java-26-左旋转字符串 bylijinnan java
public class LeftRotateString { /** * Q 26 左旋转字符串 * 题目：定义字符串的左旋转操作：把字符串前面的若干个字符移动到字符串的尾部。 * 如把字符串abcdef左旋转2位得到字符串cdefab。 * 请实现字符串左旋转的函数。要求时间对长度为n的字符串操作的复杂度为O(n)，辅助内存为O(1)。 */ pu
《vi中的替换艺术》-linux命令五分钟系列之十一 cfyme linux命令
vi方面的内容不知道分类到哪里好，就放到《Linux命令五分钟系列》里吧！今天编程，关于栈的一个小例子，其间我需要把”S.”替换为”S->”(替换不包括双引号)。其实这个不难，不过我觉得应该总结一下vi里的替换技术了，以备以后查阅。 1 所有替换方案都要在冒号“:”状态下书写。 2 如果想将abc替换为xyz，那么就这样 :s/abc/xyz/ 不过要特别
[轨道与计算]新的并行计算架构 comsci 并行计算
我在进行流程引擎循环反馈试验的过程中，发现一个有趣的事情。。。如果我们在流程图的每个节点中嵌入一个双向循环代码段，而整个流程中又充满着很多并行路由，每个并行路由中又包含着一些并行节点，那么当整个流程图开始循环反馈过程的时候，这个流程图的运行过程是否变成一个并行计算的架构呢？
重复执行某段代码 dai_lm android
用handler就可以了 private Handler handler = new Handler(); private Runnable runnable = new Runnable() { public void run() { update(); handler.postDelayed(this, 5000); } }; 开始计时 h
Java实现堆栈（list实现） datageek 数据结构——堆栈
public interface IStack<T> { //元素出栈，并返回出栈元素 public T pop(); //元素入栈 public void push(T element); //获取栈顶元素 public T peek(); //判断栈是否为空 public boolean isEmpty
四大备份MySql数据库方法及可能遇到的问题 dcj3sjt126com DB backup
一：通过备份王等软件进行备份前台进不去？用备份王等软件进行备份是大多老站长的选择，这种方法方便快捷，只要上传备份软件到空间一步步操作就可以，但是许多刚接触备份王软件的客用户来说还原后会出现一个问题：因为新老空间数据库用户名和密码不统一，网站文件打包过来后因没有修改连接文件，还原数据库是好了，可是前台会提示数据库连接错误，网站从而出现打不开的情况。解决方法：学会修改网站配置文件，大多是由co
github做webhooks：[1]钩子触发是否成功测试 dcj3sjt126com github git webhook
转自: http://jingyan.baidu.com/article/5d6edee228c88899ebdeec47.html github和svn一样有钩子的功能，而且更加强大。例如我做的是最常见的push操作触发的钩子操作，则每次更新之后的钩子操作记录都会在github的控制板可以看到！工具/原料 github 方法/步骤
">的作用" target="_blank">JSP中的作用蕃薯耀
JSP中<base href="<%=basePath%>">的作用 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
linux下SAMBA服务安装与配置 hanqunfeng linux
局域网使用的文件共享服务。一.安装包： rpm -qa | grep samba samba-3.6.9-151.el6.x86_64 samba-common-3.6.9-151.el6.x86_64 samba-winbind-3.6.9-151.el6.x86_64 samba-client-3.6.9-151.el6.x86_64 samba-winbind-clients
guava cache IXHONG cache
缓存，在我们日常开发中是必不可少的一种解决性能问题的方法。简单的说，cache 就是为了提升系统性能而开辟的一块内存空间。　　缓存的主要作用是暂时在内存中保存业务系统的数据处理结果，并且等待下次访问使用。在日常开发的很多场合，由于受限于硬盘IO的性能或者我们自身业务系统的数据处理和获取可能非常费时，当我们发现我们的系统这个数据请求量很大的时候，频繁的IO和频繁的逻辑处理会导致硬盘和CPU资源的
Query的开始--全局变量,noconflict和兼容各种js的初始化方法 kvhur JavaScript jquery css
这个是整个jQuery代码的开始，里面包含了对不同环境的js进行的处理，例如普通环境，Nodejs，和requiredJs的处理方法。还有jQuery生成$, jQuery全局变量的代码和noConflict代码详解完整资源： http://www.gbtags.com/gb/share/5640.htm jQuery 源码： (
美国人的福利和中国人的储蓄 nannan408
今天看了篇文章，震动很大，说的是美国的福利。美国医院的无偿入院真的是个好措施。小小的改善，对于社会是大大的信心。小孩，税费等，政府不收反补，真的体现了人文主义。美国这么高的社会保障会不会使人变懒？答案是否定的。正因为政府解决了后顾之忧，人们才得以倾尽精力去做一些有创造力，更造福社会的事情，这竟成了美国社会思想、人
N阶行列式计算(JAVA) qiuwanchi N阶行列式计算
package gaodai; import java.util.List; /** * N阶行列式计算 * @author 邱万迟 * */ public class DeterminantCalculation { public DeterminantCalculation(List<List<Double>> determina
C语言算法之打渔晒网问题 qiufeihu c 算法
如果一个渔夫从2011年1月1日开始每三天打一次渔，两天晒一次网，编程实现当输入2011年1月1日以后任意一天，输出该渔夫是在打渔还是在晒网。代码如下： #include <stdio.h> int leap(int a) /*自定义函数leap()用来指定输入的年份是否为闰年*/ { if((a%4 == 0 && a%100 != 0
XML中DOCTYPE字段的解析 wyzuomumu xml
DTD声明始终以!DOCTYPE开头,空一格后跟着文档根元素的名称,如果是内部DTD,则再空一格出现[],在中括号中是文档类型定义的内容. 而对于外部DTD,则又分为私有DTD与公共DTD,私有DTD使用SYSTEM表示,接着是外部DTD的URL. 而公共DTD则使用PUBLIC,接着是DTD公共名称,接着是DTD的URL. 私有DTD <!DOCTYPErootSYST