35仍未老

二、数据挖掘应用的分类

前言：

由于数据挖掘能分析出数据中的有用信息，给企业带来显著的经济效益，这使得数据挖掘技术越来越普及。例如在销售数据中发掘客户的消费习惯，并从交易记录中找出顾客偏好的产品组合，其他包括找出流失顾客的特征与突出新产品的时机点等都是零售业常见的实例；利用数据挖掘分析顾客群的消费行为与交易记录，结合基本数据，并依据对品牌价值等级的高低来区隔客户，进而达到差异化营销的目的；制造业对数据挖掘的需求多运用在品质管控方面，从制造过程中找出影响产品品质最重要的因素，已期提高作业流程的效率。

近几年、电话公司、信用卡公司、保险公司以及股票交易上对欺诈行为的侦测都很有兴趣，这些行业每年因为欺诈行为遭受的损失都非常巨大，数据挖掘可以从一些信用不良的客户数中发现相似特征并预测可能的欺诈交易，达到减少损失的目的。金融业可以利用数挖掘来分析市场动向，并预测个别公司的营运及股价走向。数据挖掘的另一个独特的用法实在医疗业，用来预测手术、用药、诊断或是流程控制的效率。

归纳起来，数据挖掘技术的基本任务主要体现在分类与回归、聚类、关联规则、时序模式、偏差检测五个方面。下图是典型的数据挖掘应用场景：

2.1 分类与回归

我们经常会碰到这样的问题：

如何将信用卡申请人分为低、中、高风险群？
如何预测那些顾客会在未来半年内取消该公司服务，那些电话用户会申请增值服务？
如何预测银行可以安全地带给贷款人的贷款量？
哪些使用2G通信网络的手机用户有可能转换到3G通信网络？
如何有效预测房地产开发中存在的风险？

除此之外，市场经理需要进行数据分析，以便帮助他预测具有某些特征的顾客会购买一台新的计算机；医学研究者希望分析乳腺癌数据，预测病人应当接受三种具体治疗方案的哪一种；这些都是分类与回归的例子。

2.1.2 分类与回归建模原理

分类（classification):指将数据映射到预先定义好的群组或类。

因为在分析测试数据前，类别就已经确定了，所以分类通常被称为有监督学习。分类算法要求基于数据属性值来定义类别，通常通过已知所属类别的数据的特征来描述类别。

分类就是一个构造函数（分类模型），把具有某些特征的数据项映射到给定的类别上。该过程由两步构成。

模型创建：通过对训练数据集的学习来建立分类模型。

模型实用：使用分类模型对测试数据和新数据进行分类。

其中的训练数据集是带有类标号的，也就是说在分类之前，要划分的类别是已经确定的。通常分类模型是以分类规则、决策树或数学表达式的形式给出。

回归（Regression):用属性的历史数据预测未来趋势。

回归首先假设一些已知类型的函数（例如线性函数、Logistic 函数等）可以你和目标数据，然后利用某种误差来分析确定一个与目标数据拟合程度最好的函数。

回归模式的函数定义与分类模式相似，主要差别在于分类采用离散预测值（例如类标号），而回归模式采用连续的预测值。在这种观点下，分类和回归都是预测问题。但数据挖掘界普遍认为：用预测法预测类标号为分类，预测连续值（例如实用回归方法）为预测。许多问题可以实用线性回归解决，许多非线性问题可以通过对变量进行变化，从而转化为线性问题来解决。

2.1.2 分类与回归算法

分类与回归常用算法

分类与回归常用算法
算法名称
BP（Back Propagation,反向传播）	一种按误差逆传播算法训练的多层前馈网络，是目前应用最广泛的神经网络模型之一
LM（Levenberg-Marquardt)	基于梯度下降法和牛顿法结合的优化算法，特点是迭代次数少，收敛速度快，精度高。
FNN（Fuzzy Neural Network，模糊神经网路）	具有模糊权系数或者输信号是模糊量的神经网络，是模糊系统和神经网络结合的产物，汇聚了神经网络与模糊系统的优点
RBF（Radial Basis Function,径向基函数）	具有单隐层的三层前馈网络。是一种局部逼近网络，能够以任意精度逼近任意连续函数，特别适合于解决分类问题。
ANFIS（Adaptive Neural Fuzzy Inference System,自适应模糊推理系统）	功能上与上一阶T-S模糊推理系统等价的自适应网络，是将神经网络的学习机制引入模糊系统，构成一个带有人类感觉和认知成分的自适应系统。
WNN（Wavelet Neural Network，小波神经网络）	基于小波变换而构成的神经网络模型，即用非线性小波基取代通常的神经元非线性激活函数（如Sigmod函数)，把小波变换与神经网络有机结合，充分继承了两者的有点。
SVM（Support Vector Machine,支持向量机）	V.Vapnik等人在研究统计学习理论的基础上发展起来的一种新的机器学习算法，在解决小样本、非线性及高维模式识别问题中表现出许多特有的优势。支持向量机根据有限的样本信息在模型的复杂性和学习能力之间寻求最佳折衷，以获得最好的推广能力。
CART（classification and Regression Tree,分类与回归树）	一种非常有效的非参数分类与回归方法，通过构建树、修剪树、评估树来构建一个二叉树。

2.2 聚类

我们经常会遇到这样的问题：

如何通过一些特定的症状归纳某类特定的疾病？
谁是银行信用卡的黄金用户？
谁喜欢打国际长途，在什么时间，打到哪里？
对住宅区进行聚类，确定自动提款机ATM的安放位置。
如何对用户WAP上网行为进行分析，通过客户分群进行精确营销？

除此之外，促销应该针对哪一类用户，这类客户具有哪些特征？这类问题往往是促销前首要解决的问题，对整个客户座分群，将客户分组在各自的群组里，然后对每个不同的群组，采取不同的营销策略。这些都是聚类分析的例子。

2.2.1 聚类分析建模原理

聚类（Clustering）分析：是在没有给定划分类的情况下，根据信息相似度进行信息聚类的一种方法，因此聚类又称为无指导的学习。

与分类不同，分类需要先定义类别和训练样本，是有指导的学习。聚类就是将数据划分或分割成相交或不相交的群组的过程，通过数据之间预先指定的属性上的相似性，就可以完成聚类任务。

聚类的输入是一组未被标记的数据，根据数据自身的距离或相似度进行划分。划分的原则是保持组内最大的组内相似性和最小的组间相似性，也就是使不同聚类中的数据尽可能地不同，而同一聚类中的数据尽可能地相似。比如股票价格波动的情况，可以将股票分成不同的类，总共可以分成几类，各类包含哪些股票，每一类的特征是什么，这对投资者，尤其对投资基金的人来说，可能是很重要的信息。当然，聚类除了将样本分类外，还可以完成孤立点挖掘，如将其应用于网络入侵检测或金融风险欺诈探测中。

2.2.2 聚类方法

主要聚类算法分类
类别	主要算法
划分（分裂）方法	K-means （K-平均值）
	K-MEDOIDS（K-中心点）
	CLARANS （基于选择的算法）
层次方法	BIRCH （平衡迭代规约和聚类）
	CURE（代表点聚类）
	CHAMELEON（动态模型）
基于密度的方法	DBSCAN（基于高密度连接区域）
	DENCLUE（密度分布函数）
	OPTICS（对象排序识别）
基于网格的方法	STING（统计信息网络）
	CLIOUE（聚类高维空间）
	WAVE-CLUSTER（小波变换）
基于模型的方法	统计学方法
基于模型的方法	神经网络方法

2.3 关联规则

我们经常会碰到这样的问题：

商业销售上，如何通过交叉销售得到更大的收入？
保险方面，如何分析索赔要求发现潜在的欺诈行为？
银行方面，如何分析顾客消费行业，以便有针对性的向其推荐感兴趣的服务？
哪些制造零件和设备设置与故障时间关联？
那些病人和药物属性与结果关联？
哪些商品是已经购买商品A的人最有可能购买的？

除此之外，人们希望从大量的商业交易记录中发现有价值的关联知识，以帮助其商品目录的设计、交叉营销或其他有关的商业决策。在商业销售上，关联规则可用于交叉销售，以得到更大的收入；在保险方面，如果出现了不常见的索赔要求组合，则可能为欺诈行为，需要进一步调查；在医疗方面，可找出可能的治疗组合；在银行方面，对顾客进行分析，可推荐感兴趣的服务等；这些都属于关联规则挖掘问题，关联规则挖掘的目的是在一个数据集中找出各项之间的关系，从大量数据中挖掘出有价值的描述数据项之间相互联系的有关知识。随着收集和存储在数据库中的数据规模越来越大，人们对从这些数据中挖掘相应的关联知识越来越感兴趣。

2.3.1 什么是关联规则

关联规则（Association）：揭示数据之间的相互关系，而这种关系没有在数据中直接表示出来。

关联分析的任务就是发现事物间的关联规则或称相程度。关联规则的一半形式是：

如果A发生，则B有百分之C的可能发生。C称为关联规则的置信度（Confidence）。

利用关联分析能寻找数据库中大量数据的相关联系，常用的两种技术为：

关联规则：用于发现一个事物与其他事物间的相互关联性或相互依赖性。

序列模式分析：将重点放在分析数据之间的前因后果关系上。

2.3.2 关联规则算法

算法名称	算法描述
Apriori	一种最有影响的挖掘布尔关联规则频繁项集的算法，其核心是基于两阶段频集思想的地推算法。
FB-Tree	针对Ariori算法的固有缺陷，J.Han等提出了不产生候选挖掘频项集的方法：FB-树频集算法
灰色关联法	以分析和确定各因素之间的影响程度或若干个子因素（子序列）对主因素（母序列）的贡献程度而进行的一种分析方法。
HotSpot	挖掘得到通过树状结构显示的感兴趣的目标最大化/最小化的一套规则，最大化/最小化利益目标变量/值。

2.4 时序模式

我们经常会碰到这样的问题：

下个月商品销售量、销售额和库存量是多少？
明天广州市的最高用电负荷是多少？

2.4.1 什么是时序模式

时序模式：描述基于时间或其他序列的经常发生的规律或趋势，并对其建模。

与回归一样，他也用已知的数据预测未来的值，但这些数据的区别是变量所处时间的不同。序列模式将关联模式和时间序列模式结合起来，重点考虑数据在时间维度上的关联性。时序模式包含时间序列分析和序列发现。

时间序列分析：用已有的数据序列预测未来。在时间序列分析中，数据的属性值是随着时间不断变化的。回归不强调数据间的先后顺序，而时间序列要考虑时间特性，尤其要考虑时间周期的层次，如天、周、月、年等，有时还要考虑日历的影响，如节假日等。

序列发现：用于确定数据之间与时间相关的序列模式。这些与数据（或者事件）中发现的相关的关联规则很相似，只是这些序列是与时间相关的。

2.4.2 时间序列的组合成分

时间序列的变化主要受到长期趋势、季节变动、周期变动和不规则变动这四个因素的影响。

长期趋势因素（T）：反映了经济现象在一个较长时间内的发展方向，它可以在一个相当长的时间内表现为一种近似直线的持续向上或持续向下或平稳的趋势。
季节变动因素（S）：是经济现象受季节变动所形成的一种长度和幅度固定的周期波动。
周期变动因素（C）：也称循环变动因素，它是受各种经济因素影响所形成的上下起伏不定的波动。
不规则变动因素（I）：不规则变动又称随机变动，它是受各种偶然因素影响所形成的不规则变动。

2.4.3 时间序列的组合模型

时间序列y可以表示为四个因素的函数，即。时间序列分解方法有很多，较常用的模型有加法模型和乘法模型。

加法模型：假定时间序列是基于4种成分相加而成的。长期趋势并不影响季节变动。若以y表示时间序列，则加法模型为：

$y_{t}=T_{t}+ S_{t}+C_{t}+I_{t}$

乘法模型：假定时间序列是基于4中成分相乘而成的。假定季节变动与循环变动为长期趋势的函数。该模型的方程式为： $y_{t} = T_{t}\times S_{t}\times C_{t} \times I_{t}$

乘法分解模型的基本步骤是：

运用移动平均法剔除长期趋势和周期变化，得到时许TC。然后再用按月（季）平均法求出季节指数S。
做散点图，选择适合的曲线模型拟合序列的长期趋势，得到长期趋势T。
计算周期因数C。用序列TC除以T即可得到周期变动因数C。
将时间序列的T，S，C分解出来后，剩余的即为不规则变动，即 $I=\frac{Y}{TSC}$

2.4.4 时序算法

方法	时间范围	适用情况
一元线性回归预测法	短、中期	自变量与因变量之间存在线性关系
多元线性回归预测法	短、中期	因变量与两个或两个以上自变量之间存在线性关系
非线性回归预测法	短、中期	因变量与一个自变量或多个其他自变量之间存在某种非线性关系
趋势外推法	中、长期	当被预测项目的有关变量用时间表示时，用非线性回归
移动平均法	短期	不带季节变动的反复预测
指数平滑法	短期	具有或不具有季节变动的反复预测
平稳时间序列预测法	短期	适用于任何序列的发展型态的一种高级预测方法
灰色预测发	短、中期	适用于时间序列的发展呈指数型趋势

2.5 偏差检测

偏差：是对差异和极端特例的表述，如分类中反常的实例、聚类外的离群值、不满足规则的特例等。

偏差检测：用来发现与正常情况不同的异常和变化，并进一步分析这种变化是有意的欺诈行为，还是正常的变化。如果是一场行为，则需要提示采取防御措施，尽早防范。

注：大部分数据挖掘方法都是将这种差异信息视为噪声而丢弃，然而在一些应用中，罕见的数据可能比正常的数据更有用。

Dufs开源Web文件服务器爱辉弟啦 linux运维 linux 运维服务器 Web文件服务器开源软件
介绍：Dufs是一个独特的实用文件服务器，支持静态服务，上传，搜索，访问控制，webdav…GitHub-sigoden/dufs:Afileserverthatsupportsstaticserving,uploading,searching,accessingcontrol,webdav…功能列表提供静态文件下载文件夹为zip文件上传文件和文件夹(拖放)创建/编辑/搜索文件可恢复的部分上传/下
python打开一个软件并进行操作_模拟试卷 B weixin_39551611
原标题：模拟试卷B一、单项选择题1.关于算法的描述，以下选项中错误的是算法是指解题方案的准确而完整的描述算法具有可行性、确定性、有穷性的基本特征算法的复杂度主要包括时间复杂度和数据复杂度算法的基本要素包括数据对象的运算和操作及算法的控制结构2.关于数据结构的描述，以下选项中正确的是数据结构指相互有关联的数据元素的集合数据的存储结构是指反映数据元素之间逻辑关系的数据结构数据的逻辑结构有顺序、链接、索
为什么算法很难掌握浅墨cgz 算法
算法之所以难以掌握，主要是因为以下几个原因：1.抽象性算法是对问题的抽象解决方案，通常不依赖于具体的编程语言或实现细节。初学者可能难以将抽象的逻辑转化为具体的代码。例如，动态规划（DP）的核心思想是将问题分解为子问题并存储中间结果，但这种抽象思维需要大量练习才能掌握。2.数学基础要求许多算法依赖于数学知识，例如：时间复杂度分析：需要理解大O表示法、递归关系等。图论算法：需要了解图的基本概念（如节点
【AI论文】迈向大型推理模型：大型语言模型增强推理综述东临碣石82 人工智能语言模型自然语言处理
摘要：语言长久以来被视为人类推理不可或缺的工具。大型语言模型（LLM）的突破激发了利用这些模型解决复杂推理任务的浓厚研究兴趣。研究人员已经超越了简单的自回归词元生成，引入了“思维”的概念——即代表推理过程中间步骤的词元序列。这一创新范式使LLM能够模仿复杂的人类推理过程，如树搜索和反思性思维。近期，一种新兴的学习推理趋势采用强化学习（RL）来训练LLM掌握推理过程。这种方法通过试错搜索算法自动生成
通过python代码实现向钉钉群内自动推送消息，详细步骤及代码，超实用教学！！！盲敲代码的阿豪 python实用知识点 python 钉钉自动化发消息
文章目录前言一、创建钉钉群机器人二、以文本格式发送信息三、以MarkDown格式发送信息四、以Link格式发送信息前言我们在使用钉钉时，通常会创建或加入多个群聊，身为群聊的管理者，当我们需要及时、并按时的向这些群聊推送一些固定信息，若通过人力来解决肯定非常耗时、耗力，这时我们就可以考虑开发一个自动化脚本来实现这个功能，本篇文章我将教会大家，如何使用python开发程序，实现向钉钉群内自动发送消息。
如何通过可视化管理工具提升团队效率？4 个实用技巧可视化
一、可视化管理工具的概念与来源可视化管理工具是指通过图形化、图表化、仪表盘等形式，将复杂的数据、流程、任务等信息以直观的方式呈现出来，帮助管理者更高效地进行决策和管理的工具。其核心理念是通过视觉化的方式，将抽象的信息转化为易于理解和操作的形式，从而提升工作效率和管理效果。可视化管理工具的概念最早可以追溯到20世纪80年代，随着计算机技术的发展，企业开始尝试将数据可视化应用于管理领域。早期的可视化管
数据驱动销售预测的未来：ScriptEcho赋能高效决策前端
在瞬息万变的商业环境中，准确的销售预测是企业制定有效销售策略、实现业绩增长的基石。传统的销售预测方法往往依赖于人工分析和复杂的电子表格，效率低下，难以应对市场变化的快速冲击。然而，随着大数据的兴起和人工智能技术的飞速发展，数据驱动决策正成为现代企业提升竞争力的关键。本文将探讨销售预测面临的挑战与机遇，并重点介绍ScriptEcho如何通过AI赋能，提升销售预测的准确性和效率，助力企业实现数据驱动增
【C++算法笔记】最基础篇------高精度算法孙小健的资料站算法学习笔记 c++算法笔记
个人笔记：只提供学习代码和其步骤思路，仅供参考学习，已提前在相关编译器中提前运行并保证代码运行。为什么要用高精度算法：longlong的存储大小为9*10^19,即超过20位的数字将无法使用基本数据类型存储和计算，所以我们要使用其他方法存储设计。涉及基础知识：基本输入输出，字符串及数组的基本运用基础步骤：1.对字符串s1,s2进行承接2.将a1与a2相加的和存入a33.从左向右进位并出现逆序#in
如何优化亚马逊广告以提高ROI？前端后端数据挖掘运维api
在竞争激烈的亚马逊市场中，优化广告以提高投资回报率（ROI）是卖家的关键任务。以下是一些实用的策略：一、精准的关键词研究与选择深入了解产品特性和目标受众详细分析产品的功能、用途、优势和适用人群。例如，如果你销售一款专业的摄影三脚架，其特点可能包括高度可调节、稳定性强、适合不同类型相机等。目标受众可能是摄影爱好者、专业摄影师等。根据这些特点和受众需求来挖掘关键词。对于摄影三脚架，可以包括“专业摄影三
AI赋能：2024年，如何用AI提升效率，我的15个实用技巧及2025年展望前端
2024年，人工智能技术突飞猛进，深刻地改变了我们的工作方式。作为一名科技领域的作者，我亲身体验了AI带来的效率提升。过去一年，我探索了各种AI工具，并将其应用于我的日常工作中，显著缩短了工作流程，节省了大量时间。本文将分享我在2024年使用AI提升生产力的15个实用技巧，并展望2025年AI可能带来的更多可能性。AI赋能下的高效创作：从代码到图像，全方位提升首先，AI极大地辅助了我的编程工作。对
AscendC从入门到精通系列（一）初步感知AscendC 人工智能深度学习
1什么是AscendCAscendC是CANN针对算子开发场景推出的编程语言，原生支持C和C++标准规范，兼具开发效率和运行性能。基于AscendC编写的算子程序，通过编译器编译和运行时调度，运行在昇腾AI处理器上。使用AscendC，开发者可以基于昇腾AI硬件，高效的实现自定义的创新算法。算子开发学习地图：2从helloworld出发感受AscendC2.1使用AscendC写核函数包含核函数的
ATB是什么？人工智能深度学习
1ATB介绍AscendTransformerBoost加速库（下文简称为ATB加速库）是一款高效、可靠的加速库，基于华为AscendAI处理器，专门为Transformer类模型的训练和推理而设计。ATB加速库采用了一系列优化策略，包括算法优化、硬件优化和软件优化，能够显著提升Transformer模型的训练和推理速度，同时降低能耗和成本。具体来说，ATB加速库通过优化矩阵乘法等核心算子和注意力
服务稳定性保障的五大误解运维sre
在线服务的稳定性保障一直是运维和技术部门的核心工作之一。但时至今日，这个方向实际仍然有很多基本的概念都没有对齐。今天这篇文章就罗列下那些混淆不清的概念，期望有一天大家沟通时不是鸡同鸭讲，各说各话。误解一：服务可用性听过很多技术分享，看过很多平台的承诺，上来都是讲我们的服务稳定性99.9xx%，但似乎都“忘记”了提供这个稳定性的具体算法和解读。如果没有明确的定义，这个数值其实毫无意义。服务稳定性目标
Azure Synapse Dedicated SQL Pool实用命令语句 weixin_30777913 数据库 sql
一、数据管理相关命令1.数据加载COPY命令：用于从外部存储（如AzureBlob存储）加载数据到DedicatedSQLPool中。COPYINTO[dbo].[target_table]FROM'https://.blob.core.windows.net//'WITH(FILE_TYPE='CSV',FIELDTERMINATOR=',',ROWTERMINATOR='\n',CREDENT
架构验证的时间张友邦架构与设计架构设计 soa 文档
架构设计的各种方法论是为把事情变得更简单易懂而准备的，它们帮我们梳理复杂应用的逻辑头绪，把我们不能一下子掌握的事情通过一种有条不紊的途径消化掉。可以说，把事情变得更简单是架构设计的远景和目标。但这种简单是有条件的，实用就是它的条件。所谓实用就是要满足各种各样外部环境并尽可能的提供更多的指标，这些指标包括可伸缩性、可维护性、学习曲线、稳定性等。所谓的尽可能就意味着需要有一个平衡点，我们需要通过各种努
一个简单的麻将算法长心了么算法 python windows
这个算法主要是帮助计算胡的什么牌跟给一些策略，给出几个测试样例自己体会一下就好了，能够比较快的计算出怎么胡牌，如何快速胡牌，无聊写着玩的。#使用1-9表示筒子，11-19表示条子，21-29表示万子，31表示红中，32表示发财，33表示白板，41-44表示东南西北#样例1:hand=[6,6,7,7,7,8,8,8]#样例2:hand=[6,7,7,7,8,8,8,2]#样例3:hand=[2,3
线性回归：从基础到进阶的全面解析 tester Jeffky 大模型线性回归机器学习算法
线性回归：从基础到进阶的全面解析线性回归是机器学习中最基本的算法之一，广泛应用于预测和分析。本文将详细介绍线性回归的基本概念、数学原理、实现方法以及在实际应用中的注意事项。我们将通过丰富的代码示例来展示如何从头开始构建一个简单的线性回归模型，并逐步深入到更复杂的场景。1.线性回归的基本概念1.1什么是线性回归？线性回归是一种用于建模两个或多个变量之间关系的统计方法。它假设因变量（目标变量）与一个或
架构验证的时间 (转) hyzhx 架构设计 soa 文档
架构设计的各种方法论是为把事情变得更简单易懂而准备的，它们帮我们梳理复杂应用的逻辑头绪，把我们不能一下子掌握的事情通过一种有条不紊的途径消化掉。可以说，把事情变得更简单是架构设计的远景和目标。但这种简单是有条件的，实用就是它的条件。所谓实用就是要满足各种各样外部环境并尽可能的提供更多的指标，这些指标包括可伸缩性、可维护性、学习曲线、稳定性等。所谓的尽可能就意味着需要有一个平衡点，我们需要通过各种努
华为OD机试E卷 --跳马--24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 华为od java javascript python c语言
文章目录题目描述输入描述输出描述用例题目解析JS算法源码Java算法源码python算法源码c算法源码c++算法源码题目描述马是象棋（包括中国象棋和国际象棋）中的棋子，走法是每步直一格再斜一格，即先横着或者直者走一格，然后再斜着走一个对角线，可进可退，可越过河界，俗称"马走日"字。给定m行n列的棋盘（网格图），棋盘上只有棋子象棋中的棋子“马”，并且每个棋子有等级之分，等级为k的马可以跳1~k步（走
电脑软件：推荐六款高效实用的PDF阅读器工具 IT技术分享社区电脑技巧 pdf 电脑软件微软技术办公软件
目录1.AdobeAcrobatReaderDC2.福昕阅读器（FoxitReader）3.SumatraPDF4.NitroPDFReader5.SlimPDFReader6.极速pdf阅读器总结在数字化办公日益普及的今天，PDF文件凭借其跨平台、格式稳定且易于分享的特点，成为了众多用户首选的文档格式。对于Windows用户而言，选择一款功能强大且操作便捷的PDF阅读器至关重要。本文将为您盘点并
Python实用小工具（3）——实现PDF合并和拆分功能（附源码+exe文件） MatpyMaster 实用小工具 pdf 测试工具
在日常工作和学习中，我们常常会遇到需要处理PDF文件的情况，例如合并多个PDF文档，拆分成单页或指定页数的PDF等。为了更方便地处理这些任务，今天我们将利用Python和Tkinter库，创建一个简易的PDF工具。这个工具包括PDF合并和PDF拆分两个功能，操作简单，界面友好。功能介绍①PDF合并工具新增一个PDF：点击该按钮可进行PDF的选择，需要注意的是依次选择的顺序就是进行合并的顺序，选择结
基于YOLOv5、YOLOv8和YOLOv10的自助售货机商品检测：深度学习实践与应用 2025年数学建模美赛 YOLO 深度学习人工智能目标跟踪目标检测
引言自助售货机已经成为现代零售和自动化销售领域的重要组成部分。在自助售货机中，商品的检测与管理至关重要。通过精准的商品检测技术，售货机可以在商品售出后自动更新库存，并提供准确的商品信息反馈。然而，在复杂的环境下进行商品检测是一个具有挑战性的问题，尤其是在商品种类繁多、摆放方式多样以及光照条件变化较大的情况下。近年来，基于深度学习的目标检测算法，特别是YOLO（YouOnlyLookOnce）系列模
SpringBoot使用令牌桶算法+拦截器+自定义注解+自定义异常实现简单的限流 Java精选算法 spring boot 前端后端 java
令牌桶在高并发的情况下，限流是后端常用的手段之一，可以对系统限流、接口限流、用户限流等，本文就使用令牌桶算法+拦截器+自定义注解+自定义异常实现限流的demo。令牌桶思想大小固定的令牌桶可自行以恒定的速率源源不断地产生令牌。如果令牌不被消耗，或者被消耗的速度小于产生的速度，令牌就会不断地增多，直到把桶填满。后面再产生的令牌就会从桶中溢出。最后桶中可以保存的最大令牌数永远不会超过桶的大小。然后每个访
免费PDF处理工具大揭秘：合并、分割、压缩一键搞定 IT技术视界 #PC实用工具 #IT技术视界 pdf 软件工具
PDF是一种广泛使用的文件格式，然而，PDF文件的处理并不是那么容易，很多时候，我们需要对PDF文件进行「合并、分割、压缩、转换、编辑」等操作，但是，我们不想「付费」购买软件。那么，有没有一些「免费的客户端工具」，可以帮助我们快速地处理PDF文件呢？答案是有的，今天，我就为您介绍三款实用的PDF客户端工具「软件获取方式在文章的最后」PDF24工具箱：免费且功能丰富PDF24工具箱客户端是一个提供了
【论文投稿】探秘计算机视觉算法：开启智能视觉新时代小周不想卷艾思科蓝学术会议投稿计算机视觉
目录引言一、计算机视觉算法基石：图像基础与预处理二、特征提取：视觉信息的精华萃取三、目标检测：从图像中精准定位目标四、图像分类：识别图像所属类别五、语义分割：理解图像的像素级语义六、计算机视觉算法前沿趋势与挑战引言在当今数字化浪潮中，计算机视觉宛如一颗璀璨的明珠，正深刻地改变着我们与世界的交互方式。从安防监控中的精准识别，到自动驾驶汽车的智能导航；从医疗影像的辅助诊断，到工业生产中的缺陷检测，计算
deepin-如何在 ArchLinux 发行版上安装 DDE 桌面环境 deepin
ArchLinux是一个独立开发的x86-64通用GNU/Linux发行版，其用途广泛，足以适应任何角色。开发侧重于简单、极简主义和代码优雅。Arch是作为一个最小的基础系统安装的，由用户配置，通过仅安装其独特目的所需或所需的东西来组装他们自己的理想环境。官方没有提供GUI配置实用程序，大多数系统配置是通过编辑简单的文本文件从shell执行的。Arch努力保持领先，通常提供大多数软件的最新稳定版本
递归算法实践--到仓合单助力京东物流提效增收程序员
作者：京东物流李硕#一、背景京东物流到仓业务「对商家」为了减少商家按照京东采购单分货备货过程，对齐行业直接按照流向交接，提升商家满意度；「对京东」揽收操作APP提效；到仓合单功能应运而生；二、问题一次批量采购单（一次50或者100个采购单）需要根据不同的规则合并成多个订单；每一个采购单可以是不同的来源类型（自营和非自营）、不同的收货类型，每一个采购单会有多个SKU，同一个SKU只有一个等级，一批采
Axios封装一款前端项目网络请求实用插件 smart_ljh 前端 vue.js vuejs axios 网络
前端项目开发非常经典的插件axios大家都很熟悉，它是一个Promise网络请求库，可以用于浏览器和node.js支持的项目中。像一直以来比较火的Vue.js开发的几乎所有项目网络请求用的都是axios。那么我们在实际的项目中，有时候为了便于维护、请求头信息统一处理、统一拦截器设置以及响应数据统一处理，需要在项目中针对axios封装一个网络请求插件。接下来就介绍一下针对以上这些输出具体的解决方案和
逆袭之路（11）——python网络爬虫：原理、应用、风险与应对策略凋零的蓝色玫瑰逆袭之路 php 开发语言 python
困厄铸剑心，逆袭展锋芒。寒苦凝壮志，腾跃绘华章。我要逆袭。目录一、引言二、网络爬虫的基本原理（一）网络请求与响应（二）网页解析（三）爬行策略三、网络爬虫的应用领域（一）搜索引擎（二）数据挖掘与分析（三）金融领域（四）学术研究（五）社交媒体监测四、网络爬虫带来的风险（一）法律风险（二）隐私风险（三）安全风险五、网络爬虫风险的应对策略（一）遵守法律法规（二）加强技术防护（三）提高道德意识六、结论一、引
AI大模型如何赋能电商行业，引领变革虞书欣的C 人工智能开发语言
•个性化推荐：利用机器学习算法分析用户的历史购买记录、浏览行为和喜好，生成个性化的产品推荐列表，提升用户的购买意愿和满意度。•优化用户体验：•智能搜索引擎：运用自然语言处理技术，优化搜索引擎，让用户能够通过自然语言进行搜索。•虚拟客服：通过聊天机器人和语音助手，提供24/7的客户支持，快速解答用户咨询。•图像识别：利用计算机视觉技术，用户可以通过拍照识别商品，快速找到相似商品或进行排版搭配推荐。•
深入浅出Java Annotation(元注解和自定义注解） Josh_Persistence Java Annotation 元注解自定义注解
一、基本概述　　 Annontation是Java5开始引入的新特征。中文名称一般叫注解。它提供了一种安全的类似注释的机制，用来将任何的信息或元数据（metadata）与程序元素（类、方法、成员变量等）进行关联。　　更通俗的意思是为程序的元素（类、方法、成员变量）加上更直观更明了的说明，这些说明信息是与程序的业务逻辑无关，并且是供指定的工具或
mysql优化特定类型的查询 annan211 java 工作 mysql
本节所介绍的查询优化的技巧都是和特定版本相关的，所以对于未来mysql的版本未必适用。 1 优化count查询对于count这个函数的网上的大部分资料都是错误的或者是理解的都是一知半解的。在做优化之前我们先来看看真正的count()函数的作用到底是什么。 count()是一个特殊的函数，有两种非常不同的作用，他可以统计某个列值的数量，也可以统计行数。在统
MAC下安装多版本JDK和切换几种方式棋子chessman jdk
环境： MAC AIR,OS X 10.10,64位历史：过去 Mac 上的 Java 都是由 Apple 自己提供，只支持到 Java 6，并且OS X 10.7 开始系统并不自带（而是可选安装）（原自带的是1.6）。后来 Apple 加入 OpenJDK 继续支持 Java 6，而 Java 7 将由 Oracle 负责提供。在终端中输入jav
javaScript （1） Array_06 JavaScript java 浏览器
JavaScript 1、运算符　　运算符就是完成操作的一系列符号，它有七类：　　赋值运算符（=,+=,-=,*=,/=,%=,<<=,>>=,|=,&=）、算术运算符(+,-,*,/,++,--,%)、比较运算符(>,<,<=,>=,==,===,!=,!==)、逻辑运算符(||,&&,!)、条件运算(?:)、位
国内顶级代码分享网站袁潇含 java jdk oracle .net PHP
现在国内很多开源网站感觉都是为了利益而做的当然利益是肯定的,否则谁也不会免费的去做网站 &
Elasticsearch、MongoDB和Hadoop比较随意而生 mongodb hadoop 搜索引擎
IT界在过去几年中出现了一个有趣的现象。很多新的技术出现并立即拥抱了“大数据”。稍微老一点的技术也会将大数据添进自己的特性，避免落大部队太远，我们看到了不同技术之间的边际的模糊化。假如你有诸如Elasticsearch或者Solr这样的搜索引擎，它们存储着JSON文档，MongoDB存着JSON文档，或者一堆JSON文档存放在一个Hadoop集群的HDFS中。你可以使用这三种配
mac os 系统科研软件总结张亚雄 mac os
1.1 Microsoft Office for Mac 2011 大客户版，自行搜索。 1.2 Latex （MacTex）: 系统环境：https://tug.org/mactex/ &nb
Maven实战（四）生命周期 AdyZhang maven
1. 三套生命周期 Maven拥有三套相互独立的生命周期，它们分别为clean，default和site。每个生命周期包含一些阶段，这些阶段是有顺序的，并且后面的阶段依赖于前面的阶段，用户和Maven最直接的交互方式就是调用这些生命周期阶段。以clean生命周期为例，它包含的阶段有pre-clean, clean 和 post
Linux下Jenkins迁移 aijuans Jenkins
1. 将Jenkins程序目录copy过去源程序在/export/data/tomcatRoot/ofctest-jenkins.jd.com下面 tar -cvzf jenkins.tar.gz ofctest-jenkins.jd.com &
request.getInputStream()只能获取一次的问题 ayaoxinchao request Inputstream
问题：在使用HTTP协议实现应用间接口通信时，服务端读取客户端请求过来的数据，会用到request.getInputStream()，第一次读取的时候可以读取到数据，但是接下来的读取操作都读取不到数据原因： 1. 一个InputStream对象在被读取完成后，将无法被再次读取，始终返回-1； 2. InputStream并没有实现reset方法（可以重
数据库SQL优化大总结之百万级数据库优化方案 BigBird2012 SQL优化
网上关于SQL优化的教程很多，但是比较杂乱。近日有空整理了一下，写出来跟大家分享一下，其中有错误和不足的地方，还请大家纠正补充。这篇文章我花费了大量的时间查找资料、修改、排版，希望大家阅读之后，感觉好的话推荐给更多的人，让更多的人看到、纠正以及补充。 1.对查询进行优化，要尽量避免全表扫描，首先应考虑在 where 及 order by 涉及的列上建立索引。 2.应尽量避免在 where
jsonObject的使用 bijian1013 java json
在项目中难免会用java处理json格式的数据，因此封装了一个JSONUtil工具类。 JSONUtil.java package com.bijian.json.study; import java.util.ArrayList; import java.util.Date; import java.util.HashMap;
[Zookeeper学习笔记之六]Zookeeper源代码分析之Zookeeper.WatchRegistration bit1129 zookeeper
Zookeeper类是Zookeeper提供给用户访问Zookeeper service的主要API，它包含了如下几个内部类首先分析它的内部类，从WatchRegistration开始，为指定的znode path注册一个Watcher， /** * Register a watcher for a particular p
【Scala十三】Scala核心七：部分应用函数 bit1129 scala
何为部分应用函数？ Partially applied function: A function that’s used in an expression and that misses some of its arguments.For instance, if function f has type Int => Int => Int, then f and f(1) are p
Tomcat Error listenerStart 终极大法 ronin47 tomcat
Tomcat报的错太含糊了，什么错都没报出来，只提示了Error listenerStart。为了调试，我们要获得更详细的日志。可以在WEB-INF/classes目录下新建一个文件叫logging.properties，内容如下 Java代码 handlers = org.apache.juli.FileHandler, java.util.logging.ConsoleHa
不用加减符号实现加减法 BrokenDreams 实现
今天有群友发了一个问题，要求不用加减符号(包括负号)来实现加减法。分析一下，先看最简单的情况，假设1+1，按二进制算的话结果是10，可以看到从右往左的第一位变为0，第二位由于进位变为1。
读《研磨设计模式》-代码笔记-状态模式-State bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 当一个对象的内在状态改变时允许改变其行为，这个对象看起来像是改变了其类状态模式主要解决的是当控制一个对象状态的条件表达式过于复杂时的情况把状态的判断逻辑转移到表示不同状态的一系列类中，可以把复杂的判断逻辑简化如果在
CUDA程序block和thread超出硬件允许值时的异常 cherishLC CUDA
调用CUDA的核函数时指定block 和 thread大小，该大小可以是dim3类型的（三维数组），只用一维时可以是usigned int型的。以下程序验证了当block或thread大小超出硬件允许值时会产生异常！！！GPU根本不会执行运算！！！所以验证结果的正确性很重要！！！在VS中创建CUDA项目会有一个模板，里面有更详细的状态验证。以下程序在K5000GPU上跑的。
诡异的超长时间GC问题定位 chenchao051 jvm cms GC hbase swap
HBase的GC策略采用PawNew+CMS, 这是大众化的配置，ParNew经常会出现停顿时间特别长的情况，有时候甚至长到令人发指的地步，例如请看如下日志： 2012-10-17T05:54:54.293+0800: 739594.224: [GC 739606.508: [ParNew: 996800K->110720K(996800K), 178.8826900 secs] 3700
maven环境快速搭建 daizj 安装 mavne 环境配置
一下载maven 安装maven之前，要先安装jdk及配置JAVA_HOME环境变量。这个安装和配置java环境不用多说。 maven下载地址：http://maven.apache.org/download.html，目前最新的是这个apache-maven-3.2.5-bin.zip，然后解压在任意位置，最好地址中不要带中文字符，这个做java 的都知道，地址中出现中文会出现很多
PHP网站安全，避免PHP网站受到攻击的方法 dcj3sjt126com PHP
对于PHP网站安全主要存在这样几种攻击方式:1、命令注入(Command Injection)2、eval注入(Eval Injection)3、客户端脚本攻击(Script Insertion)4、跨网站脚本攻击(Cross Site Scripting, XSS)5、SQL注入攻击(SQL injection)6、跨网站请求伪造攻击(Cross Site Request Forgerie
yii中给CGridView设置默认的排序根据时间倒序的方法 dcj3sjt126com GridView
public function searchWithRelated() { $criteria = new CDbCriteria; $criteria->together = true; //without th
Java集合对象和数组对象的转换 dyy_gusi java集合
在开发中，我们经常需要将集合对象（List，Set）转换为数组对象，或者将数组对象转换为集合对象。Java提供了相互转换的工具，但是我们使用的时候需要注意，不能乱用滥用。 1、数组对象转换为集合对象最暴力的方式是new一个集合对象，然后遍历数组，依次将数组中的元素放入到新的集合中，但是这样做显然过
nginx同一主机部署多个应用 geeksun nginx
近日有一需求，需要在一台主机上用nginx部署2个php应用，分别是wordpress和wiki，探索了半天，终于部署好了，下面把过程记录下来。 1. 在nginx下创建vhosts目录，用以放置vhost文件。 mkdir vhosts 2. 修改nginx.conf的配置，在http节点增加下面内容设置，用来包含vhosts里的配置文件 #
ubuntu添加admin权限的用户账号 hongtoushizi ubuntu useradd
ubuntu创建账号的方式通常用到两种：useradd 和adduser . 本人尝试了useradd方法，步骤如下： 1:useradd 使用useradd时，如果后面不加任何参数的话，如：sudo useradd sysadm 创建出来的用户将是默认的三无用户：无home directory ,无密码,无系统shell。顾应该如下操作：
第五章常用Lua开发库2-JSON库、编码转换、字符串处理 jinnianshilongnian nginx lua
JSON库在进行数据传输时JSON格式目前应用广泛，因此从Lua对象与JSON字符串之间相互转换是一个非常常见的功能；目前Lua也有几个JSON库，本人用过cjson、dkjson。其中cjson的语法严格（比如unicode \u0020\u7eaf），要求符合规范否则会解析失败（如\u002），而dkjson相对宽松，当然也可以通过修改cjson的源码来完成
Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解 yaerfeng1989 timer quartz 定时器
原创整理不易，转载请注明出处：Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解代码下载地址：http://www.zuidaima.com/share/1772648445103104.htm 有两种流行Spring定时器配置：Java的Timer类和OpenSymphony的Quartz。 1.Java Timer定时首先继承jav
Linux下df与du两个命令的差别？ pda158 linux
　一、df显示文件系统的使用情况，与du比較，就是更全盘化。　　最经常使用的就是 df -T，显示文件系统的使用情况并显示文件系统的类型。　　举比例如以下：　　[root@localhost ~]# df -T 　　Filesystem Type &n
[转]SQLite的工具类 ---- 通过反射把Cursor封装到VO对象 ctfzh VO android sqlite 反射 Cursor
在写DAO层时，觉得从Cursor里一个一个的取出字段值再装到VO(值对象)里太麻烦了，就写了一个工具类，用到了反射，可以把查询记录的值装到对应的VO里，也可以生成该VO的List。使用时需要注意：考虑到Android的性能问题，VO没有使用Setter和Getter，而是直接用public的属性。表中的字段名需要和VO的属性名一样，要是不一样就得在查询的SQL中
该学习笔记用到的Employee表 vipbooks oracle sql 工作
这是我在学习Oracle是用到的Employee表，在该笔记中用到的就是这张表，大家可以用它来学习和练习。 drop table Employee; -- 员工信息表 create table Employee( -- 员工编号 EmpNo number(3) primary key, -- 姓

二、数据挖掘应用的分类

前言：

2.1 分类与回归

2.2 聚类

2.3 关联规则

2.4 时序模式

2.5 偏差检测

你可能感兴趣的:(数据挖掘_实用案例分析,数据挖掘,聚类,算法,大数据)