帅气的弟八哥

8大策略让你对抗机器学习数据集里的不均衡数据

本文转自：http://www.36dsj.com/archives/35137

http://blog.csdn.net/heyongluoyao8/article/details/49408131

英文版本：http://machinelearningmastery.com/tactics-to-combat-imbalanced-classes-in-your-machine-learning-dataset/

你是不是也经历过这样的事？

当你正在处理你的数据集的时候，你建立了一个分类模型并且它的精确度达到了90%，这时，你一定会想：这个结果太棒了！但是当你继续更深地挖掘数据时你会发现这个90%的精确度只是一类数据的精确度，见鬼了！

以上是一个不均衡数据集的例子，这样的不均衡数据集有时会引起这样糟糕的结果。在这篇文章中你将可以领略一系列对抗上述例子的方法，在机器学习过程中，这些方法可以帮助你在挖掘或者训练不均衡数据集时获得一个比较好的结果。

在你的机器学习中发现一些平衡点

我们开始着手处理不均衡数据

我总是收到关于不均衡数据问题的邮件，例如：

“在我的训练样本里有一个二项分类问题，其中有一个数据集是比例为60:1的数据集，于是我对它运用了逻辑回归的训练方法，但是得到的结果是忽略这一个比率为60:1的数据集的训练结果。

再例如：

“现在我正在运行一个分类模型。在我的数据集里面一共有3类数据，这里我们称它们分别为A，B和C，但是在我的训练数据集里面A，B和C三类数据分别占了70%，25%和5%。在大多数情况下，结果都过度拟合A类数据。你能给我一些建议来解决这个问题吗？

我尝试写了很多方法并且试图找出最好的方式去解决这个问题。最终我采用了我一个学生的建议：

也许你即将推出的某一篇博客文章可以解决在训练模型中表现出高度不平衡的数据的问题，并且概述其方法和期望。

挫败感!

在运行模型时，不均衡数据会引起很多偏差和误导。

当你发现你的研究里包含了不平衡类并且导致你所谓的好的结果成为了泡沫，你会感到非常沮丧。

当你在书籍，文章和博客里找不到你想要的可以解决不均衡数据的建议或方法时，打击会再一次降临。

放轻松点吧，这里有很多点子和方法可以解决这类不均衡数据的问题，你可以针对不均衡数据建立一个预测模型。

什么是不均衡数据？

不均衡数据通常是发生在分类数据不均衡的分类问题中。

打个比方说，现在有一个包含了100行数据的二项分类问题（两类数据）。其中有80行数据代表的是数据类型一，其余20行代表的是数据类型二。

这就是一个不均衡数据（不平衡类数据），它的一类数据和二类数据比是80:20或者说4:1.

你的不平衡类问题可能发生在二项分类问题或者多项分类问题中。大多数方法都可以运用在这两种问题上。

因此，接下来的我们主要是针对二项分类问题进行分析讨论，因为这样比较容易去理解和描述。

不平衡现象是一种常见现象

大多数分类数据集是不会拥有完全相等的分类数据集，但小的差异往往是没有影响的。

在这些问题中有些不平衡问题不仅仅是常见，而是人们可以预想到的。例如，在欺诈交易数据集分类问题中数据集是不平衡。该交易的绝大部分是属于“不是诈骗”类，只有极少数会在“欺诈”级。

另一个例子是客户流失的数据集，其中客户绝大多数保持服务（“无流失”级）只有一小部分的顾客取消其认购（“流失”级）。

在上诉的例子中，如果有一种分类不平衡率达到4:1那么这个不平衡可能会导致结果出现误差。

精度悖论

在这篇文章的介绍当中，精度悖论是一些特定情况的名称。

这个准确性指标的例子告诉我们，有优异的精度（如90％）但是这个准确性只是反映基本的类分布。

这是很常见的，因为在评估分类问题的模型时，分类精度通常是我们第一个采用的措施方法。

偏向一类数据!

当我们训练的不均衡数据时，我们的模型怎么了？

正如你设想的一样，在数据不均衡的情况下，我们得到90％的准确率（比如包含90％的数据类型一的实例）是因为我们的模型观察数据并且智能地总是根据数据类型一的数据进行预测，并且尽量达到最高精度。

当我们规则基于这个方法进行的时候似乎得到的是最好的答案。但是如果你在最后的模型中仔细考察这个规则，你会发现似乎这个方法是忽略其他数据在对一类数据进行预测。

八大战术，对抗不平衡类数据

现在，我们已经了解了什么是不均衡数据以及为什么他会引起分类精度的误差。

所以我们的应对解决方法是什么呢？

1) 可以扩大数据样本吗？

你可能会认为这样做很愚蠢，但扩大样本数据总是容易被忽视。

你能收集更多的数据吗？花一秒钟，想想你是否能够收集更多和问题相关的数据。

在集合中，一个更大的数据集，就有可能挖掘出不同的或许更平衡的方面。

之后当我们寻找重复采集的数据样本时，一些小样本类数据的例子可能是有帮助的。

2) 试着改变你的绩效标准

精度是一个不适用于不平衡的数据集的绩效指标。正如我们已经看到的，这是一种误导。

在处理不平衡类时，有些更加理想的指标可以给你更加具有说服力的结果。

在我的文章中，我给更多的建议和措施去选择不同的绩效标准：“Classification Accuracy is Not Enough: More Performance Measures You Can Use”。

在这篇文章里我主要着重于讲述如何对乳腺癌患者复发这个不均衡数据集进行分类。

这篇文章中我推荐了以下几个绩效标准，相比于传统的精确度，这些绩效标准可以更加深入地洞察模型的准确率：

混淆矩阵：将要预测的数据分到表里来显示正确的预测（对角线），并了解其不正确的预测的类型（哪些类被分配了不正确的预测）；
精度：一种分类准确性的处理方法；
召回率：一种分类完整性的处理方法；
F1分数（或F-分）：精度和召回率的加权平均。

同时，我还推荐你关注一下以下几点：

Kappa（或者Cohen’s kappa）：根据数据中集合数据的不平衡点来标准化分类精度；
ROC曲线：类似于精度和召回率，准确性被分为敏感性和特异性，并且可以基于这些值的平衡阈值来选择模型。

在我们的文章“Assessing and Comparing Classifier Performance with ROC Curves”中你可以学到更多关于运用ROC曲线来比较分类准确度的方法。

你是不是仍然无法确定呢？试着运用Kappa，他会告诉你一些究竟如何处理分类准确度的建议和方法。

3)尝试对你的数据重新抽样

你可以改变将要用来建立预测模型的数据集来获得更加平衡的数据集。

这种变化被称为抽样数据集，您主要可以运用以下两种方法来使数据分类更加均衡：

1.您可以从代表性不足的类（又称为过抽样或者更加正式的抽样来代替）添加实例的副本，或者

2.您可以从过度代表类里删除实例，称为抽样不足。

这些方法往往很容易实现，而且运行速度也很快。因此我认为他们都是不错的出发点。

事实上，我会建议你最好尝试以上提到的两种不平衡数据集的处理方法，这样便于你比较一下基于你的首选准确度处理方法上，另一种方法是否效果更好，或者是否有所促进作用。

你可以通过维基百科题为“Oversampling and undersampling in data analysis”的文章了解更多相关咨询。

一些经验的规则

当你的数据量很大时可以考虑测试抽样不足（一万或者十万条记录或更多）
当你没有大量的数据时可以考虑测试抽样过度（一万条记录或更少）
考虑测试随机和非随机的抽样方案（如分层）。
考虑用不同的重抽样率进行测试（例如，在一个二元分类问题中，您不必一定要针对1：1的比例，可以尝试其他比例）

4) 尝试生成人工样本

一种简单生成人工样本的方法是从在少数类的实例中随机抽样属性。

在数据集中，你可以根据经验对它抽样或者你可以使用类似于朴素贝叶斯这种可以在反向运行时，对每个属性进行独立抽样的模型。你将有更多的不同的数据，但可能不会保留其属性之间的非线性关系。

这里有一些系统方法可以用来生成人工演变。其中最流行的算法被称为SMOTE或Synthetic Minority Over-sampling技术。

正如其名，SMOTE是过度抽样的方法。它的工作原理是从小类的数据中生成人工样本，而不是创建副本。该算法选择两个或更多个类似的例子（使用距离度量），然后随机干扰一个实例中的一个属性，比较其差异。

想要了解更多关于SMOTE方法，请搜索2002年名为“SMOTE: Synthetic Minority Over-sampling Technique”的原文章。

现在有很多的SMOTE算法的实现方法，例如：

在Python，一起来看看在“UnbalancedDataset”模块。它提供了许多SMOTE实现方法，以及各种其他再抽样技术，你都可以尝试；
在R中，DMwR 包提供SMOTE的实现方法；
在Weka中，你可以使用SMOTE supervised filter。

5) Try Different Algorithms

通常来说，我会强烈建议你对于所有问题不要总是使用自己最喜欢的模型。对于所给的问题你至少应该用不同类型的算法对其进行抽查。

欲了解更多关于抽查的方法，请参阅我的文章“Why you should be Spot-Checking Algorithms on your Machine Learning Problems”。

话虽这么说，决策树往往在处理不平衡类数据集表现不错。在创建树的过程中使用类变量的分裂规则，可以强制地将两个类很好的进行处理。

如果有疑问，请尝试一些流行的决策树算法，如C4.5，C5.0，CART和随机森林。

对于使用决策树的一些R代码，请参阅我的文章，标题为“Non-Linear Classification in R with Decision Trees”。

例如，对于Python和scikit-learn中使用CART的一个例子，请参考我的文篇，名为“Get Your Hands Dirty With Scikit-Learn Now”的文章。

6) 尝试名义变量模型

您可以使用相同的算法，但是在不同问题中他们可能会给出不同的观点。

因为在训练过程中，对于小类数据会产生分类错误，因此名义变量分类会产生额外费用。这些名义变量会使模型偏向于更加注重少数类数据。

通常来说掌握一类名义变量或者权重是为了学习方法。例如一些方法的名义变量penalized-SVM和penalized-LDA。

另外，对于名义变量模型也具有通用框架。例如，Weka中有一个CostSensitiveClassifier，它可以封装任何分类和自定义分类应用中错过的名义变量矩阵。

如果你锁定到一个特定的算法并且无法重新取样或是你得到的结果不好时，使用名义变量是可取的。它提供了另一种方法来“平衡”类。建立名义变量矩阵是很复杂的，也许您将不得不尝试各种设置名义变量的方法，看看什么方法是最适合用来解决你的问题。

7) 尝试从不同的观点进行思考

对于研究不平衡数据集的邻域。他们有自己的算法，措施和术语。

从这些观点处罚，纵观和思考你的问题，有时一些想法会有所改变。

两个你可能想要考虑的是异常检测和变化检测。

异常检测是罕见事件的检测。这可能是根据一系列的系统调用，通过它的振动或一个由程序指示的恶意活动而产生的机器故障。这样的事件相比正常操作是罕见的。

这种思维的转变在于考虑以小类作为异常值类，它可以帮助你获得一种新方法来分离和分类的样本。

除了变化检测是找寻找它的变化而不是差异以外，变化检测类似于异常检测。这可能是在观察使用模式或银行交易过程中用户的行为变化。

对于分类的问题，这两个转变具有更加实时的角度，它可能会给你一些新的方式去思考你的问题以及让你尝试更多新的技术。

8) 尝试一些新的创意

在你的问题里面挖掘并思考如何把它分解成更小的问题，这些问题更容易处理。

为了寻找灵感，看一看别人对于问题：“In classification, how do you handle an unbalanced training set?”给出的一些有创意的答案。

例如：

分解你的大类变成小类…

…使用一类分类…（比如像将其作为异常检测对待）

…不是将不平衡类训练集重抽样成一组平衡集，而是一些平衡集。在这个集合中，同时运行所有集产生的结果可能比只运行一个集的结果更好。

这些只是一小部分你可以尝试的有趣的和创造性的想法。

对于更多的想法，请搜索reddit 文章——“Classification when 80% of my training set is of one class”的评论。

选择一种方法，然后实际操作它

你没有必要去做一个精通所有方法的奇才或者统计学家建立一个精确并且可靠的不平衡类数据集模型。

以上我们已经讲述了许多可以用在不平衡类数据集模型的技术和方法。

但愿这里有一到两个方法的模型你可以快速地较好地理解并且运用，例如：改变你精确度的指标和重新对你的数据集进行抽样。这两个方法都是比较快速的并且对问题影响会很明显。

那么你想要尝试哪一个方法呢？

总结

记住，我们不可能知道哪一个方法会得出最好的结果。

你可以发散地选择这个方法或者那个方法，但是，在最后我给你的最好的建议是“变成科学家”并且根据经验测试每一个方法，选择结果做好的那一个。

从点点滴滴开始做起，根据自己现有的知识一步一步完善。

还有什么呢？

这里有一些可以参考的相关资料给您提供参考，当然前提是你知道去哪里获取他们。

以下是一些我已经度过并且我认为比较有价值的资料。如果你想要更近一步对这个问题进行研究和探索，你可以点击以下链接。

相关报刊文章

Data Mining for Imbalanced Datasets: An Overview
Learning from Imbalanced Data
Addressing the Curse of Imbalanced Training Sets: One-Sided Selection(PDF)
A Study of the Behavior of Several Methods for Balancing Machine Learning Training Data

原文标题：8 Tactics to Combat Imbalanced Classes in Your Machine Learning Dataset

转行网络安全需要学什么？（非常详细）零基础入门到精通，收藏这一篇就够了网络安全苏柒 web安全计算机网络网络安全运维转业程序员编程
什么是网络安全？网络安全是指保护网络系统的硬件、软件及其系统中的数据，破坏、更改、泄露，使系统连续可靠正常地运行，网络服务不会中断。未来，我国将着重发展数字经济，发展云计算、大数据、物联网、工业互联网、区块链和人工智能等产业，这些产业全部都基于网络互联。网络的安全就是以上这些产业能够良性发展的基础，也是建设制造强国和网络强国的基础保障。什么是网络安全工程师？网络安全工程师是负责保护计算机网络系统，
万字长文，解读大模型技术原理（非常详细）零基础入门到精通，收藏这一篇就够了
大模型是指具有大规模参数和复杂计算结构的机器学习模型。本文从大模型的发展历程出发，对大模型领域的各个技术细节进行详细解读，供大家在了解大模型基本知识的过程中起到一定参考作用。一、大模型的定义大语言模型作为一个被验证可行的方向，其“大”体现在训练数据集广，模型参数和层数大，计算量大，其价值体现在通用性上，并且有更好的泛化能力。这些模型通常由深度神经网络构建而成，拥有数十亿甚至数千亿个参数。大模型的设
今夜，未能入眠墨小凝
如果大地上的每个地方都充满了希望谁还需要梦想谁还会在夜晚凝望寻找遥远的慰藉谁不愿意每天都能吃上可口的饭菜穿上得体的衣裳在布满萤火虫的林间轻舞谁不愿意有一个可以安然入睡的夜晚伴着熏香在莲池中游动谁不喜欢希望谁又敢轻视梦想谁愿意一年一年重复相同的事看着头发一根根变白望着双手一寸寸粗糙谁愿意在夜晚翻转难安伸出冻僵的手摸索早已空空的烟袋大地早已把希望掩盖于是文人炮制出了“努力”可是梦想总是那么害羞害羞的不
转行网络安全需要学什么？（非常详细）从零基础到精通，收藏这篇就够了！～小羊没烦恼～黑客技术黑客网络安全 web安全安全学习运维网络
什么是网络安全？网络安全是指保护网络系统的硬件、软件及其系统中的数据，破坏、更改、泄露，使系统连续可靠正常地运行，网络服务不会中断。未来，我国将着重发展数字经济，发展云计算、大数据、物联网、工业互联网、区块链和人工智能等产业，这些产业全部都基于网络互联。网络的安全就是以上这些产业能够良性发展的基础，也是建设制造强国和网络强国的基础保障。什么是网络安全工程师？网络安全工程师是负责保护计算机网络系统，
阅来悦美手写人生第1⃣️4⃣️3⃣️天阅来悦美
05.24/星期三农历四月初六早安，又是美好的一天…要有赚钱的能力，才有选择的自由，能坚持别人不能坚持的，才能拥有别人不能拥有的。当你选定一条路，另一条路的风景便与你无关。你对生活心平气和，生活才会对你和颜悦色。平时做到待人宽厚、不急不躁，关键时刻也要冷静沉着、从容不迫，好情绪能让你时刻保持好状态。如果你想看到更好的世界，请先让世界看到更好的你。不求所有的日子都泛着光，只愿每一天都承载着，健康、温
USART串口通信
串口基础知识串口介绍串口是指外设和处理器之间通过数据信号线、地线和控制线等，按位进行传输数据的一种通讯方式。尽管传输速度比并行传输低。但串口可以在使用一根线发送数据的同时用另一根线接收数据。这种通信方式使用的数据线少，在远距离通信中可以节约通信成本。串口通信最重要的参数是波特率、数据位、停止位和奇偶校验位，这些参数在两个通信端口之间必须一致。串口通信参数介绍波特率：衡量通信速度的参数，它表示每秒钟
私域流量运营工具：用户资产的核动力引擎
品牌方的三大致命困局1.用户画像的碎片化黑洞某母婴品牌因企微/小程序数据割裂，将防过敏奶粉推给健康婴儿，引发37%客户退群（毕马威2024报告）。标签混乱导致营销ROI跌破1：0.8，千万级用户池沦为数字废墟。2.内容分发的重复劳动炼狱某美妆团队在公众号/企微/抖音重复编辑内容，单条发布耗时53分钟（有赞白皮书）。跨平台数据不通导致爆款复用率不足15%，创作灵感消耗在机械劳作中。3.裂变增长的失控
绩效系统的技术重构：用工程思维解决公平性与效率难题花海如潮淹重构
绩效系统的技术重构：用工程思维解决公平性与效率难题当你的绩效模块成为团队吐槽的“祖传屎山”，背后往往是技术债的集中爆发。本文从开发者视角拆解：如何用系统设计解决评分公平性、数据孤岛与流程低效三大顽疾。一、技术人眼中的绩效痛点graphTDA[绩效系统技术债]-->B[评分公平性]A-->C[数据整合]A-->D[流程效率]B-->B1(“案例：销售精英因黑盒评分离职”)C-->C1(“手动合并40
抖音团购的开通方法是怎么样的？古楼
随着移动互联网和社交媒体的发展，短视频成为了人们日常生活中必不可少的一部分。为了满足用户的需求，抖音推出了团购功能，让用户可以在抖音上方便地进行团购活动。那么，如何在抖音上开通团购功能呢？本文将为您详细介绍抖音团购的开通方法。高省只是一个导购的优惠平台！不卖产品！它对接淘宝天猫，京东，拼多多，唯品会等电商平台，在原传统电商的基础上，加入了分享经济的元素，也就是传说中的自用省钱，分享赚钱。零成本创业
数据结构（C语言实现）呈羲笔记数据结构 c语言开发语言
一、链表1.链表实现以及在头部插入结点先来一段代码....该代码包含创建链表并在头部插入结点，遍历链表并打印结点数据，接下来逐步分析，简单的基础语法不过多记录....#include#includestructNode{intdata;structNode*next;};structNode*head;voidInsert(intx){Node*temp=(Node*)malloc(sizeof(
转行网络安全需要学什么？（非常详细）零基础入门到精通，收藏这一篇就够了网络安全k叔 web安全计算机网络网络安全编程计算机转业信息安全
什么是网络安全？网络安全是指保护网络系统的硬件、软件及其系统中的数据，破坏、更改、泄露，使系统连续可靠正常地运行，网络服务不会中断。未来，我国将着重发展数字经济，发展云计算、大数据、物联网、工业互联网、区块链和人工智能等产业，这些产业全部都基于网络互联。网络的安全就是以上这些产业能够良性发展的基础，也是建设制造强国和网络强国的基础保障。什么是网络安全工程师？网络安全工程师是负责保护计算机网络系统，
全球化短剧平台全栈技术架构白皮书：多区域部署、智能分发与沉浸式体验的完整解决方案 ywyy6798 推客系统短剧小程序海外短剧短剧分销海外短剧系统开发短剧系统开发
一、全球化基础架构深度设计全球网络基础设施构建采用多活数据中心部署模式，在北美（弗吉尼亚）、欧洲（法兰克福）、亚太（新加坡）建立三大核心枢纽节点构建混合CDN网络，整合AWSCloudFront、Akamai、Fastly等主流CDN服务商，同时接入当地优质运营商CDN部署边缘计算节点网络，在全球200+边缘位置部署轻量级计算单元，实现用户请求的就近处理建立智能流量调度系统，基于实时网络状况监测数
随笔清羽忆锦
来到这个世界上谁也不欠谁的，每个人都有自己独立的存在，不管在别人眼里自己是什么样的人，其实都无所谓的，自己有自己的生活圈，何必在乎他人的一些评价，努力活好自己，为自己而活，去遇见那些对的人，忘掉过去的人，不紧不慢，如此甚好！
天王老爸萌萌娃第111章龘龑圣君
第111章小点点喜欢收破烂高海回头看了看周围的设施，说实话，真心不咋地，除了固定的设施建设之外，竟然没有一点像未来的那种站在高台处，一览众山小的设施说实话站在高台处，估计稍微远一点的人根本看不来台上都是谁了……“工体现在多少座次了？”“按照目前的安排只有十一万多一点……”助理不错，一切都胸有成竹。“这么大地方才这么点座位，实在太少了！再一个这舞台也有点不好看啊你们就没有那种立体幻视的那种么？”“什
Python异步编程：深入理解事件循环与协程
引言：从餐厅服务员说起想象你是一家高档餐厅的服务员。传统方式下，你接到顾客A的点餐后，需要一直等在厨房，直到菜品做好才能去服务顾客B。这显然效率很低。聪明的服务员会这样做：接到顾客A的订单后，把单子交给厨房，然后立即去服务顾客B、C、D…当厨房通知某个菜做好了，再去取餐送给相应的顾客。这就是事件循环的工作方式——不傻等，而是充分利用等待时间去做其他事情。一、事件循环：异步编程的心脏1.1什么是事件
一碗“鸡汤” 蓝色海洋123
鸡汤喝多了，已经百毒不浸了，很久没有打动心扉触及灵魂的鸡汤了，今天看到朋友圈的这个鸡汤还是醉了。一个85岁的老人花费人民币17万，历时24天去南极旅行，你会不会觉得这个老人是不是钱多事少闲的发疯？图片发自App一个在银行工作17年的38岁女人，勇敢辞职去西藏9次，南极3次旅行，你会不会怀疑她是不是也发疯。图片发自App如果我说那位85岁的爷爷在探索生命，你肯定会发笑。如果我说那位40岁的女人出了一
睡前故事：你好啊，朋友扫地专业高级研究生
“你好啊，朋友”，小镇上有一个小孩，见到谁都向他问好。一天一个陌生人来到小镇，小孩迎面走来，便过去问好，“你好啊，朋友，我从没见过你，你一定从很远的地方来吧？”，小男孩走过去便拉着他的手，带着他往着小镇走，“你一定很累很渴吧，到我家去喝点水，坐坐吧”，边说边不放手的一个劲的拉着那个人。那人受了拉却是纹丝未动，只站在哪里，看着这小孩。小孩见是强拉也拉不动，也不拉了，放开了手，那人便继续往前走，慢慢的
停电的一天好好和未来相遇
家里这边检修导致一天没有电，没有电就没有网络，没有网络，手机就受到了限制，流量也不好用，进一步导致没有办法正常跟上课程，一级推一级，今天这种状况让我发觉原来我对学习是如此的渴望，但我交不上，测试卷的时候，我如此慌乱不知道该怎么办是好，但我和老师请假今天，不能够正常上课的时候，崩溃极了，因为很害怕今年算成旷课，当我开始不得不被迫屏蔽一切自己安静下来时，突然觉得好像是缺了点什么，其实不难想象现在无论大
007不写就出局毕业感言徐正英
今天是个特别的日子，我在007不写就出局246班七年之约已经一年，告一个段落。下面是我的毕业感言：茫茫人海中，007让我们相遇，春夏秋冬间，坚持让我们相识，朝朝暮暮里，文字让我们相知。我们心中有梦想，我们眼中有光，我们脚下有力量。007让我明白：读书点亮生活！写作改变人生！写下即永恒！我们不一定要成为名人，但一定要做个明白人；我们也不一定要当作家，但可以学会“写作+”。毕业，不是为了离去，离去是为
Flink：处理有界流数据的wordcount 小易学编程 flink 大数据
数据源：helloworldhelloflinkhelloscala有界流：packagechapter02importorg.apache.flink.streaming.api.scala._/***ClassName:BoundedStreamWordCount*Package:chapter02*Description:**@Author小易日拱一卒*@Create2025-06-272:
2025年软考中级科目考试安排，综合建议胡杨学长. 软考项目经理项目管理含金量软考职场 pmp 软考中级 2025年考试安排
2024年软考中级-系统集成项目管理工程师（简称“集成”）改成了1年考1次。2024年上半年软考中级开考资格有：软件设计师（简称“软设”）、网络工程师（简称“网工”）、软件评测师（简称“评测”）、电子商务设计师（简称“电商”）、嵌入式系统设计师（简称“嵌入式”）、数据库系统工程师（简称“数据库”）、信息系统管理工程师（简称“信管”）。2024年下半年软考中级开考资格有：软件设计师、网络工程师、信息
Python开发中，SQLAlchemy 的同步操作和异步操作封装，以及常规CRUD的处理。老少女王烦烦 python oracle 数据库开发语言
在我们使用Python来和数据库打交道中，SQLAlchemy是一个非常不错的ORM工具，通过它我们可以很好的实现多种数据库的统一模型接入，而且它提供了非常多的特性，通过结合不同的数据库驱动，我们可以实现同步或者异步的处理封装。1、SQLAlchemy介绍SQLAlchemy是一个功能强大且灵活的PythonSQL工具包和对象关系映射（ORM）库。它被广泛用于在Python项目中处理关系型数据库的
0406 和婆婆相处的“三不”方针似水无痕_9819
我是婆婆帮我带娃，婆媳相处本来就是个大难题，况且我还摊上个既强势又自恃清高的婆婆。这几年呢，生活中一直小矛盾不断，但是双方奔着共同目标-带好娃，小矛盾之后继续合作带娃。最近，我刷文、看书、上课多了，认知思维也跟着升了级，发现原来很多矛盾换个思维方式，其实就很容易避免。结合自己的实际，我总结出了和婆婆交往的“三不”政策，具体如下：1.不计较婆婆之所以来我这个小家，是因为我们需要她带娃，所以带好娃是她
新一代会员分销返利小程序，聚合cps系统独立部署，对接20多个CPA/CPS资源 +V：ywxs5787 小程序开发 cps分销软件开发小程序 uniapp 微信小程序
技术栈前端：vue3+uniapp后端：PHP数据库：MySQL一、系统介绍PHP部分代码'value1','param2'=>'value2',//添加其他参数];//发送HTTPPOST请求$ch=curl_init();curl_setopt($ch,CURLOPT_URL,$url);curl_setopt($ch,CURLOPT_POST,true);curl_setopt($ch,CU
淘宝商城四面（附架构面试专题）及B2C商城架构项目实战分享！风平浪静如码
一面主要问题如下（主要注重基础，问得很深很广，压力面试）：首先自我介绍数据结构算法的基本问题，如排序算法，二叉树遍历，后序遍历非递归，图的最短路径问题对一个数组进行绝对值排序的算法java中hashmap的底层实现java中垃圾回收机制GC原理等介绍自己的项目，数据库中用到的数据结构数据模型，死锁的概念（问的应该是数据库的死锁），如何避免死锁?乐观锁和悲观锁?一致性hash算法项目中业务对象的关联
Android MVC MVP MVVM richy_
MVCMVCController用户动作映射成模型更新选择响应的视图View获取模型数据模型展示、更新收集用户行为，发送给控制器Model封装应用程序状态响应状态查询通知视图更新这里将Controller、View放在同一级别，主要是为了说明其调用关系，Controller对View是单向调用，Controller和View对Model的调用也是单向的，以实箭头表示。Model将数据传递给Cont
软考热门科目全套学习资料启航挨踢软考资料整理笔记
软考热门科目学习资料免费分享，包括：系统集成项目工程师、数据库系统工程师、软件设计师、信息系统项目管理师、系统架构师等科目的教材、视频教程、历年真题，需要的小伙伴自取。资料来自互联网整理，如有侵权，请联系删除！通过百度网盘分享的文件：（软考中级）信息系统管理工程师链接:https://pan.baidu.com/s/1mCdZSIJHIDcd8g1TY3rAag?pwd=ywxd提取码:ywxd通
2024最新外卖CPS分销微信小程序源码【前端+后台+数据库+分销功能】云深不知处㊣源码专区微信小程序小程序外卖CPS分销微信小程序源码 CPS分销微信小程序源码
内容目录一、详细介绍二、效果展示三、源代码下载地址一、详细介绍外卖侠CPS全套源码是一款为外卖平台提供分销功能的微信小程序。用户可以通过你的链接去领取外卖红包，然后去下单点外卖，既能省钱，又能获得佣金。该小程序带有商城、影票、吃喝玩乐等多个模块，适合不同用户的需求。外卖CPS的势头猛得一塌糊涂，被称为23年最大的红利之一，也被称为2023最佳小白可实操项目。外卖公司的广告预算持续增加，因为比传统广
etcdctl常用命令会飞的胖达喵 etcd etcd
获取所有键值对：etcdctlget--prefix/或etcdctlget--prefix""--keys-only=true这个命令使用了get命令，并且通过设置--prefix参数为空字符串，表示获取所有的key。--keys-only=true参数表示只返回key，不返回与key关联的值。AI生成项目获取单个键的值：etcdctlgetkeyAI生成项目获取key和他们的值：etcdctl
【PostgreSQL】【第1章】入门&安装 cherry5230 数据库专栏 postgresql 数据库
1-PostgreSQL入门&安装1.今日安排核心内容：PostgreSQL简介与适用场景PostgreSQLvsMySQL核心差异Linux环境安装（非Docker）远程连接与日志配置基本操作：用户、数据库、权限管理2.PostgreSQL介绍2.1核心特性开源协议：基于BSD/MIT协议，支持二次封装商业化。版本选择：稳定版：12.x新特性版：14.x社区活跃：版本迭代快（约3个月一次），Bu
ios内付费 374016526 ios 内付费
近年来写了很多IOS的程序，内付费也用到不少，使用IOS的内付费实现起来比较麻烦，这里我写了一个简单的内付费包，希望对大家有帮助。具体使用如下: 这里的sender其实就是调用者，这里主要是为了回调使用。 [KuroStoreApi kuroStoreProductId:@"产品ID" storeSender:self storeFinishCallBa
20 款优秀的 Linux 终端仿真器 brotherlamp linux linux视频 linux资料 linux自学 linux教程
终端仿真器是一款用其它显示架构重现可视终端的计算机程序。换句话说就是终端仿真器能使哑终端看似像一台连接上了服务器的客户机。终端仿真器允许最终用户用文本用户界面和命令行来访问控制台和应用程序。（LCTT 译注：终端仿真器原意指对大型机-哑终端方式的模拟，不过在当今的 Linux 环境中，常指通过远程或本地方式连接的伪终端，俗称“终端”。）你能从开源世界中找到大量的终端仿真器，它们
Solr Deep Paging(solr 深分页) eksliang solr深分页 solr分页性能问题
转载请出自出处：http://eksliang.iteye.com/blog/2148370 作者：eksliang(ickes) blg:http://eksliang.iteye.com/ 概述长期以来，我们一直有一个深分页问题。如果直接跳到很靠后的页数，查询速度会比较慢。这是因为Solr的需要为查询从开始遍历所有数据。直到Solr的4.7这个问题一直没有一个很好的解决方案。直到solr
数据库面试题 18289753290 面试题数据库
1.union ,union all 网络搜索出的最佳答案： union和union all的区别是,union会自动压缩多个结果集合中的重复结果，而union all则将所有的结果全部显示出来，不管是不是重复。 Union：对两个结果集进行并集操作，不包括重复行，同时进行默认规则的排序； Union All：对两个结果集进行并集操作，包括重复行，不进行排序； 2.索引有哪些分类？作用是
Android TV屏幕适配酷的飞上天空 android
先说下现在市面上TV分辨率的大概情况两种分辨率为主 1.720标清，分辨率为1280x720. 屏幕尺寸以32寸为主，部分电视为42寸 2.1080p全高清，分辨率为1920x1080 屏幕尺寸以42寸为主，此分辨率电视屏幕从32寸到50寸都有适配遇到问题，已1080p尺寸为例：分辨率固定不变，屏幕尺寸变化较大。如：效果图尺寸为1920x1080，如果使用d
Timer定时器与ActionListener联合应用永夜-极光 java
功能:在控制台每秒输出一次代码: package Main; import javax.swing.Timer; import java.awt.event.*; public class T { private static int count = 0; public static void main(String[] args){
Ubuntu14.04系统Tab键不能自动补全问题解决随便小屋 Ubuntu 14.04
Unbuntu 14.4安装之后就在终端中使用Tab键不能自动补全，解决办法如下： 1、利用vi编辑器打开/etc/bash.bashrc文件（需要root权限） sudo vi /etc/bash.bashrc 接下来会提示输入密码 2、找到文件中的下列代码 #enable bash completion in interactive shells #if
学会人际关系三招轻松走职场 aijuans 职场
要想成功，仅有专业能力是不够的，处理好与老板、同事及下属的人际关系也是门大学问。如何才能在职场如鱼得水、游刃有余呢？在此，教您简单实用的三个窍门。　　第一，多汇报最近，管理学又提出了一个新名词“追随力”。它告诉我们，做下属最关键的就是要多请示汇报，让上司随时了解你的工作进度，有了新想法也要及时建议。不知不觉，你就有了“追随力”，上司会越来越了解和信任你。　　第二，勤沟通团队的力
《O2O：移动互联网时代的商业革命》读书笔记 aoyouzi 读书笔记
移动互联网的未来：碎片化内容+碎片化渠道=各式精准、互动的新型社会化营销。 O2O：Online to OffLine 线上线下活动 O2O就是在移动互联网时代，生活消费领域通过线上和线下互动的一种新型商业模式。手机二维码本质：O2O商务行为从线下现实世界到线上虚拟世界的入口。线上虚拟世界创造的本意是打破信息鸿沟，让不同地域、不同需求的人
js实现图片随鼠标滚动的效果百合不是茶 JavaScript 滚动属性的获取图片滚动属性获取页面加载
1,获取样式属性值 top 与顶部的距离 left 与左边的距离 right 与右边的距离 bottom 与下边的距离 zIndex 层叠层次例子:获取左边的宽度,当css写在body标签中时 <div id="adver" style="position:absolute;top:50px;left:1000p
ajax同步异步参数async bijian1013 jquery Ajax async
开发项目开发过程中，需要将ajax的返回值赋到全局变量中，然后在该页面其他地方引用，因为ajax异步的原因一直无法成功，需将async:false，使其变成同步的。格式： $.ajax({ type: 'POST', ur
Webx3框架（1） Bill_chen eclipse spring maven 框架 ibatis
Webx是淘宝开发的一套Web开发框架，Webx3是其第三个升级版本；采用Eclipse的开发环境，现在支持java开发；采用turbine原型的MVC框架，扩展了Spring容器，利用Maven进行项目的构建管理，灵活的ibatis持久层支持，总的来说，还是一套很不错的Web框架。 Webx3遵循turbine风格，velocity的模板被分为layout/screen/control三部
【MongoDB学习笔记五】MongoDB概述 bit1129 mongodb
MongoDB是面向文档的NoSQL数据库，尽量业界还对MongoDB存在一些质疑的声音，比如性能尤其是查询性能、数据一致性的支持没有想象的那么好，但是MongoDB用户群确实已经够多。MongoDB的亮点不在于它的性能，而是它处理非结构化数据的能力以及内置对分布式的支持(复制、分片达到的高可用、高可伸缩)，同时它提供的近似于SQL的查询能力，也是在做NoSQL技术选型时，考虑的一个重要因素。Mo
spring/hibernate/struts2常见异常总结白糖_ Hibernate
Spring ①ClassNotFoundException: org.aspectj.weaver.reflect.ReflectionWorld$ReflectionWorldException 缺少aspectjweaver.jar，该jar包常用于spring aop中 ②java.lang.ClassNotFoundException: org.sprin
jquery easyui表单重置(reset)扩展思路 bozch form jquery easyui reset
在jquery easyui表单中尚未提供表单重置的功能，这就需要自己对其进行扩展。扩展的时候要考虑的控件有： combo,combobox,combogrid,combotree,datebox,datetimebox 需要对其添加reset方法，reset方法就是把初始化的值赋值给当前的组件，这就需要在组件的初始化时将值保存下来。在所有的reset方法添加完毕之后，就需要对fo
编程之美-烙饼排序 bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; /* *《编程之美》的思路是：搜索+剪枝。有点像是写下棋程序：当前情况下，把所有可能的下一步都做一遍；在这每一遍操作里面，计算出如果按这一步走的话，能不能赢（得出最优结果）。 *《编程之美》上代码有很多错误，且每个变量的含义令人费解。因此我按我的理解写了以下代码： */
Struts1.X 源码分析之ActionForm赋值原理 chenbowen00 struts
struts1在处理请求参数之前，首先会根据配置文件action节点的name属性创建对应的ActionForm。如果配置了name属性，却找不到对应的ActionForm类也不会报错，只是不会处理本次请求的请求参数。如果找到了对应的ActionForm类，则先判断是否已经存在ActionForm的实例，如果不存在则创建实例，并将其存放在对应的作用域中。作用域由配置文件action节点的s
[空天防御与经济]在获得充足的外部资源之前,太空投资需有限度 comsci 资源
这里有一个常识性的问题: 地球的资源,人类的资金是有限的,而太空是无限的..... 就算全人类联合起来,要在太空中修建大型空间站,也不一定能够成功,因为资源和资金,技术有客观的限制.... &
ORACLE临时表—ON COMMIT PRESERVE ROWS daizj oracle 临时表
ORACLE临时表转临时表：像普通表一样，有结构，但是对数据的管理上不一样，临时表存储事务或会话的中间结果集，临时表中保存的数据只对当前会话可见，所有会话都看不到其他会话的数据，即使其他会话提交了，也看不到。临时表不存在并发行为，因为他们对于当前会话都是独立的。创建临时表时，ORACLE只创建了表的结构（在数据字典中定义），并没有初始化内存空间，当某一会话使用临时表时，ORALCE会
基于Nginx XSendfile+SpringMVC进行文件下载 denger 应用服务器 Web nginx 网络应用 lighttpd
在平常我们实现文件下载通常是通过普通 read-write方式，如下代码所示。 @RequestMapping("/courseware/{id}") public void download(@PathVariable("id") String courseID, HttpServletResp
scanf接受char类型的字符 dcj3sjt126com c
/* 2013年3月11日22:35:54 目的：学习char只接受一个字符 */ # include <stdio.h> int main(void) { int i; char ch; scanf("%d", &i); printf("i = %d\n", i); scanf("%
学编程的价值 dcj3sjt126com 编程
发一个人会编程, 想想以后可以教儿女, 是多么美好的事啊, 不管儿女将来从事什么样的职业, 教一教, 对他思维的开拓大有帮助像这位朋友学习: http://blog.sina.com.cn/s/articlelist_2584320772_0_1.html VirtualGS教程 (By @林泰前): 几十年的老程序员，资深的
二维数组（矩阵）对角线输出飞天奔月二维数组
今天在BBS里面看到这样的面试题目, 1，二维数组（N*N），沿对角线方向，从右上角打印到左下角如N=4： 4*4二维数组 { 1 2 3 4 } { 5 6 7 8 } { 9 10 11 12 } {13 14 15 16 } 打印顺序 4 3 8 2 7 12 1 6 11 16 5 10 15 9 14 13 要
Ehcache（08）——可阻塞的Cache——BlockingCache 234390216 并发 ehcache BlockingCache 阻塞
可阻塞的Cache—BlockingCache 在上一节我们提到了显示使用Ehcache锁的问题，其实我们还可以隐式的来使用Ehcache的锁，那就是通过BlockingCache。BlockingCache是Ehcache的一个封装类，可以让我们对Ehcache进行并发操作。其内部的锁机制是使用的net.
mysqldiff对数据库间进行差异比较 jackyrong mysqld
mysqldiff该工具是官方mysql-utilities工具集的一个脚本，可以用来对比不同数据库之间的表结构，或者同个数据库间的表结构如果在windows下，直接下载mysql-utilities安装就可以了，然后运行后，会跑到命令行下： 1）基本用法 mysqldiff --server1=admin:12345
spring data jpa 方法中可用的关键字 lawrence.li java spring
spring data jpa 支持以方法名进行查询/删除/统计。查询的关键字为find 删除的关键字为delete/remove (>=1.7.x) 统计的关键字为count (>=1.7.x) 修改需要使用@Modifying注解 @Modifying @Query("update User u set u.firstna
Spring的ModelAndView类 nicegege spring
项目中controller的方法跳转的到ModelAndView类，一直很好奇spring怎么实现的？ /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version 2.0 (the "License"); * yo
搭建 CentOS 6 服务器(13) - rsync、Amanda rensanning centos
（一）rsync Server端 # yum install rsync # vi /etc/xinetd.d/rsync service rsync { disable = no flags = IPv6 socket_type = stream wait
Learn Nodejs 02 toknowme nodejs
（1）npm是什么 npm is the package manager for node 官方网站：https://www.npmjs.com/ npm上有很多优秀的nodejs包，来解决常见的一些问题，比如用node-mysql，就可以方便通过nodejs链接到mysql，进行数据库的操作在开发过程往往会需要用到其他的包，使用npm就可以下载这些包来供程序调用 &nb
Spring MVC 拦截器 xp9802 spring mvc
Controller层的拦截器继承于HandlerInterceptorAdapter HandlerInterceptorAdapter.java 1 public abstract class HandlerInterceptorAdapter implements HandlerIntercep