Thinkgamer_

《推荐系统开发实战》之推荐系统的灵魂伴侣-数据挖掘

转载请注明出处：http://blog.csdn.net/gamer_gyt
博主微博：http://weibo.com/234654758
Github：https://github.com/thinkgamer
公众号：搜索与推荐Wiki
个人网站：http://thinkgamer.github.io

个性化推荐是数据挖掘（Data Mining）中的一个目的明确的应用场景，所以，可以利用数据挖掘技术为推荐系统做一些基本工作，如了解数据、异常值处理、对用户群进行分类、对物品的价格进行聚类、构建用户的价格段偏好等，从而让推荐系统能够“千人千面”。本篇文章主要介绍一下常见的数据挖掘算法应用案例。

数据预处理

数据预处理（Data Preprocessing）是指：在使用数据进行建模或分析之前，对其进行一定的处理。真实环境中产生的数据往往都是不完整、不一致的“脏数据”，无法直接用来建模或进行数据分析。为了提高数据挖掘质量，需要先对数据进行一定的处理。

常见的数据预处理包括：标准化、离散化、抽样、降维、去噪等。

数据标准化

数据标准化（Normalization）是指：将数据按照一定的比例进行缩放，使其落入一个特定的小区间。其中，最典型的就是数据的归一化处理，即将数据统一映射到0～1之间。

数据标准化的好处有：加快模型的收敛速度，提高模型的精度。

常见的数据标准化方法包括：

Min-Max标准化
Min-Max标准化是指对原始数据进行线性变换，将值映射到[0,1]之间。其计算公式为：

式中，x为原始数据中的一个数据，x_min表示原始数据中的最小值，x_max表示原始数据中的最大值，x'为Min-Max标准化后的数据。

Z-Score标准化
Z-Score（也叫Standard Score，标准分数）标准化是指：基于原始数据的均值（mean）和标准差（standard deviation）来进行数据的标准化。Z-Score标准化的计算公式为：

式中，x为原始数据中的一个数据，μ表示原始数据的均值，σ表示原始数据的标准差，x'为Z-Score标准化后的数据。

小数定标（Decimal scaling）标准化
小数定标标准化是指：通过移动小数点的位置来进行数据的标准化。小数点移动的位数取决于原始数据中的最大绝对值。小数定标标准化的计算公式为：

例如，一组数据为[-309, -10, -43,87,344,970]，其中绝对值最大的是970。为使用小数定标标准化，用1000（即j=3）除以每个值。这样，-309被标准化为-0.309，970被标准化为0.97。

均值归一化法
均值归一化是指：通过原始数据中的均值、最大值和最小值来进行数据的标准化。均值归一化法的计算公式为：

向量归一化
向量归一化是指：通过用原始数据中的每个值除以所有数据之和来进行数据的标准化。向量归一化的计算公式为：

指数转换
指数转换是指：通过对原始数据的值进行相应的指数函数变换来进行数据的标准化。常见的函数方法有lg函数、Softmax函数和Sigmoid函数。

由于篇幅原因，数据标准化的具体实现不贴代码了，可在《推荐系统开发实战》一书中找到找到！

数据离散化

数据离散化（也叫数据分组）是指将连续的数据进行分组，使其变为一段段离散化的区间。
根据离散化过程中是否考虑类别属性，可以将离散化算法分为有监督算法和无监督算法两类。由于有监督算法（如基于熵进行数据的离散化）充分利用了类别属性的信息，所以在分类中能获得较高的正确率。
常见的数据离散化方法有以下几种：

等宽分组
等频分组
单变量分组
基于信息熵分组

由于篇幅原因，基于信息熵的数据离散化实例这里贴代码了，可在《推荐系统开发实战》一书中找到!

数据抽样

数据抽样也叫数据采样。数据抽样是选择数据子集对象的一种常用方法。

在统计学中，抽样的目的是实现数据的调查和分析。
在数据挖掘中，抽样的目的是压缩数据量，减小数据挖掘算法的资源开销。

在数据挖掘中，抽样主要是从海量数据中产生训练集（Train Set）、测试集（Test Set）和验证集（Validation Set）。训练集、测试集和验证集三者的区别如下：

训练集用来进行模型训练。
测试集用来衡量模型的一些统计指标，如准确率、召回率等。在训练模型的过程中不允许使用测试集，否则会导致模型过拟合。
验证集用来验证模型、辅助构建模型。在使用机器学习算法时，验证集是可选的。

“过拟合”表示：模型学习特征过于彻底时，噪声数据也会进入模型，导致后期测试时不能很好地识别数据，泛化能力太差。“欠拟合”表示：没有很好地捕捉到数据特征，不能很好地拟合数据。

常见的数据抽样方法包括：

随机抽样
分层抽样
系统抽样
渐进抽样

数据降维

在构建机器学习模型时，有时特征是极其复杂的，当特征的维度达到几千维时，模型训练将会耗费大量的时间。另外，如果特征较多，还会出现多重共线性、稀疏性的问题。
因此，需要简化属性、去噪、去冗余，以求取更典型的属性，但同时又希望不损失数据本身的意义，这时就需要对特征进行降维。

数据降维分为线性降维和非线性降维。

线性降维：分为主成分分析（PCA）、线性判断分析（LDA）。
非线性降维：分为基于核函数的KPCA、KICA、KDA和基于特征值的ISOMAP、LLE、LE、LPP、LTSA、MVU等。

数据清理

“脏数据”对算法模型的直接影响是不能被使用，间接影响是降低模型的精度。这种情况下就需要对数据进行清理，包括（但不局限于）：不合格数据修正、缺失值填充、噪声值处理、离群点处理。

不合格数据修正
缺失值填充
噪声值处理
离群点处理

相似度计算

相似度计算在数据挖掘和推荐系统中有着广泛的应用场景。例如：

在协同过滤算法中，利用相似度计算用户之间或物品之间的相似度。
在利用k-means进行聚类时，利用相似度计算公式计算个体到簇类中心的距离，进而判断个体所属的类别。
利用KNN进行分类时，利用相似度计算个体与已知类别之间的相似性，从而判断个体所属的类别等。
下面将依次介绍常见的相似度计算方法。
欧式距离
曼哈顿距离
切比雪夫距离
马氏距离
夹交余弦距离
杰卡德相似系数与杰卡德距离
相关系数与相关距离

数据分类

分类算法是数据挖掘中常用的基本算法之一，属于有监督学习算法（Supervised Learning）。
在实际应用场景中，往往利用分类算法对基础数据进行处理，或者做一些基础模型供推荐系统使用。

KNN算法

KNN算法的原理和具体的代码实现，这里不过多介绍，可参考《推荐系统开发实战》

KNN是一个分类算法，但可以使用KNN的原始算法思路进行推荐，即，为每个内容或物品寻找K个与其最相似的内容或物品，然后推荐给用户。
例如，在一个简单的电商网站中，用户浏览了一本图书，则推荐系统会依据图书的一些性质特征为用户推荐前 K个与该图书最相似的图书。

对性别进行预测在电商网站中也常用到。某些用户在填写注册信息时并没有注明性别，或者填写的数据不正确。如果在性别未知的情况下进行商品推荐，则容易将男性商品推荐给女性，或者将女性商品推荐给男性。这种情况下就需要对用户性别进行判定。这时候KNN算法就可以被派上用场了。

决策树

在点击率预估场景中我们经常使用的GBDT/XGBoost，其底层也是一棵棵决策树。了解决策树的算法和原因对我们后续学习GBDT也是很重要的。
决策树（Decision Tree）是根据一系列规则对数据进行分类的过程。分为回归决策树和分类决策树。

回归决策树是对连续变量构建决策树。
分类决策树是对离散变量构建决策树。
其中分类决策树的代表为ID3算法，C4.5和CART既可构建分类决策树也可以构建回归决策树。

朴素贝叶斯算法

在电商网站中，往往会存在一些异常用户，包括恶意刷单用户、爬虫爬取数据的用户等。这些异常用户产生的数据信息在推荐场景中往往是没有用的，即所说的“脏数据”。那么在准备推荐算法相关数据时，应过滤掉这些异常用户所产生的数据。

这个时候就可以使用贝叶斯算法了，贝叶斯算法是一类算法的总称，这些算法均以贝叶斯定理为基础。

贝叶斯理论是以18世纪的一位神学家托马斯•贝叶斯（Thomas Bayes）的名字命名的。通常，在事件B已经发生的前提下事件A发生的概率，与事件A已经发生的前提下事件B发生的概率是不一样的，然而这两者是有关系的。贝叶斯定理就是针对这种关系所做的陈述。

P(A|B)表示在事件B已经发生的前提下事件A发生的概率。其基本求解公式为：

贝叶斯定理便是基于条件概率的等式定理，其计算公式如下：

特征独立性假设是指，假设每个特征之间是没有联系的，朴素贝叶斯算法则是建立在这样的基础之上的。

朴素贝叶斯算法有三种常见模型：

多项式模型
高斯模型
伯努利模型。

数据聚类

聚类算法也是数据挖掘中常用的基本算法之一，属于无监督学习算法（Unsupervised Learning）。在实际应用场景中，会利用聚类算法对基础数据进行处理，或者做一些基础模型供推荐系统使用。

K-means算法

在电商网站中，商品的数目很多，对应的商品价格也很多。但对于用户来讲，并不是对所有价格的商品都感兴趣。例如，一个经常网购1000元左右手机的用户，通常没必要向他推荐价格超过5000元的手机。

所以，需要对商品的价格进行聚类，进而求出用户感兴趣的价格段，从而提高推荐系统的准确度和可信赖度。

这时候基于kMeans算法进行商品价格聚类算法就随之产生了。

kMeans（K均值聚类算法）的基本原理是：
（1）随机初始化K个初始簇类中心，对应K个初始簇类，按照“距离最近”原则，将每条数据都划分到最近的簇类；
（2）第一次迭代之后，更新各个簇类中心，然后进行第二次迭代，依旧按照“距离最近”原则进行数据归类；
（3）直到簇类中心不再改变，或者前后变化小于给定的误差值，或者达到迭代次数，才停止迭代。

具体的执行步骤如下：
（1）在数据集中初始K个簇类中心，对应K个初始簇类；
（2）计算给定数据集中每条数据到K个簇类中心的距离；
（3）按照“距离最近”原则，将每条数据都划分到最近的簇类中；
（4）更新每个簇类的中心；
（5）迭代执行步骤（2）～步骤（4），直至簇类中心不再改变，或者变化小于给定的误差区间，或者达到迭代次数；
（6）结束算法，输出最后的簇类中心和对应的簇类。

二分-Kmeans算法

二分-kMeans算法（二分-K均值聚类算法）是分层聚类（Hierarchical Clustering）的一种，是基于kMeans算法（K-均值聚类算法）实现的。

在二分-kMeans算法中，调用kMeans（k =2）把一个簇类分成两个，迭代此过程，直至分成k个。其实现的具体思路为：
（1）初始化簇类表，使之包含所有的数据；
（2）对每一个簇类应用k均值聚类算法（k = 2）；
（3）计算划分后的误差，选择所有被划分的聚簇中总误差最小的并保存；
（4）迭代步骤（2）和步骤（3），簇类数目达到K后停止。

相对于kMeans算法，二分-kMeans的改进点有以下两点：

加速了kMeans的执行速度，减少了相似度的计算次数；
能够克服“kMeans收敛于局部最优”的缺点。

关联分析

关联分析的目的是，找到具有某种相关性的物品。这种分析在推荐系统中也有很大的作用，如经常出现在一个购物篮中的商品就可以相互推荐。关联算法最常见的就是Apriori。

该算法中涉及的一些概念解释为：

关联分析（Association Analysis）：从大规模数据集中寻找商品的隐含关系。
项集（Item Set）：包含0个或多个项的集合。
频繁项集：那些经常一起出现的物品集合。
支持度计数（Support Count）：一个项集出现的次数（即，整个交易数据集中包含该项集的事物数）。
项集支持度：一个项集出现的次数与数据集所有事物数的百分比，计算公式如下：

项集置信度（confidence）：数据集中同时包含A、B的百分比，计算公式如下：

Apriori算法使用一种称为逐层搜索的迭代方法，其中k项集用于探索（k+1）项集（如使用频繁1项集找到频繁2项集），其实现过程如下：

（1）通过扫描数据库，累计每个项的计数，并收集满足最小支持度的项，找出频繁1项集的集合。该集合记作L1；
（2）使用L1找出频繁2项集的集合L2，使用L2找出L3；
（3）如此下去，直至不能再找到频繁k项集，每找出一个Lk需要一次完整的数据库扫描。

数据挖掘在推荐系统中的应用非常广泛，无论是数据预处理还是基础模型开发，他都发挥着举足轻重的作用，因此在理解推荐算法的同时，对数据挖掘也要进行一定程度的掌握。关于文中的更多详细内容请持续关注《推荐系统开发实战》

打开微信扫一扫，关注微信公众号【搜索与推荐Wiki】

注：《推荐系统开发实战》是小编近期要上的一本图书，预计本月（7月末）可在京东，当当上线，感兴趣的朋友可以进行关注！

Pytest 入门：测试函数与测试类详解努力搬砖的咸鱼掌握Pytest：从新手到专家 pytest python 自动化
概述在编写自动化测试时，了解如何组织和管理测试用例是至关重要的。Pytest提供了灵活的方式来定义测试函数和测试类，并支持多层次的设置（setup）和清理（teardown）机制，帮助你更高效地进行代码验证。本文将详细介绍测试函数和测试类的概念、定义、注意点以及实际操作示例，助你快速掌握这些基础知识。什么是测试函数？测试函数是最基本的测试单元，在Pytest中通过以test_开头的函数名来标识。每
华为HDC 2025：一场开发者的技术盛宴与灵感之旅
前言作为一名开发者，参加华为HDC大会就像是一场朝圣之旅。每年这个时候，全球的开发者们都会汇聚一堂，分享最新的技术成果，探讨未来的趋势，而今年的HDC2025更是让我期待已久。这次大会不仅有华为最新技术的展示，还有各种实战案例和深度分享，对我来说，这是一次难得的学习和交流机会，更是面基各位好友的最佳机会。那么接下来就来分享一下三掌柜参加2025华为HDC大会的所见所感吧。初到会场：满满的科技感当我
【机器学习】机器学习的基本分类-监督学习-线性回归（Linear Regression） IT古董人工智能机器学习机器学习分类学习人工智能线性回归
线性回归是监督学习中的一种基础算法，用于解决回归问题。它通过拟合一条直线（或平面、高维超平面），来预测输出与输入变量之间的关系。1.线性回归的基本概念目标给定输入和对应的输出y，找到一个线性函数：其中：是权重（回归系数）。b是偏置（截距）。y是预测值。损失函数为了找到最佳的w和b，需要最小化预测值和真实值
如何选择合适的IP轮换周期 IP管家 tcp/ip 网络协议网络网络安全 ip
选择合适的IP轮换周期需综合业务目标、目标平台风控规则、IP类型与质量等多维度因素，以下是系统化决策框架及实操建议：一、核心决策要素业务场景类型高频操作型（如数据采集、广告点击）：轮换周期短（30秒~5分钟），避免单IP请求过密触发反爬。示例：电商比价监控建议每30-60分钟更换IP。长期运营型（如社交媒体、账号矩阵）：轮换周期长（6~12小时），维持会话稳定性。示例：TikTok账号运营每6-1
SpringMVC实战：从配置到JSON处理全解析 Cyanto SpringMVC spring java
目录项目概述核心配置文件解析web.xml配置springmvc.xml配置控制器详解基本控制器示例请求处理方式获取请求参数返回JSON数据请求转发重定向视图解析与页面跳转项目结构说明关键知识点总结项目概述这是一个基于SpringMVC的Web应用示例，展示了如何配置SpringMVC环境、创建控制器以及处理不同类型的请求和响应。项目包含了以下核心功能：基本页面跳转请求参数处理JSON数据返回请求
蜂鸟代理IP+云手机：跨境电商多账号运营的“隐形风控引擎” IP管家大数据网络网络协议 tcp/ip 安全 ip
在亚马逊、TikTokShop等平台的严苛风控下，跨境电商多账号运营长期面临“设备关联封号”“IP污染限流”“地域画像矛盾”三大痛点。传统方案账号存活率不足35%，而蜂鸟代理IP与云手机技术的协同，通过IP层隔离+设备层虚拟化+行为层仿真三重防护，将账号存活率提升至95%以上，运营成本降低80%。本文从实战角度解析其技术赋能逻辑与场景化策略。一、风控核心痛点与破局逻辑平台风控机制的本质设备指纹聚类
告别网络崩溃！手把手教你零基础部署本地DeepSeek-R1，解锁AI自由（附独家加速下载+全版本适配) 程序小武网络人工智能
使用Ollama部署本地DeepSeek-R1模型为什么要部署一个本地DeepSeek？在使用AI网站或App时遇到网络连接失败或网站本身问题，决定部署自己的本地DeepSeek。在如今这个数字化时代，AI网站和应用已经成为了我们日常生活中不可或缺的一部分，它们帮助我们提升效率、解决问题。然而，频繁遭遇网络连接问题或平台本身的不稳定，往往会带来不少困扰，尤其是当我们依赖这些工具来完成重要任务时，任
OpenKyLin开源操作系统——银河麒麟
openKylin操作系统是由openKylin社区主导开发的一款根社区桌面操作系统，适用于X86、ARM、RISC-V等主流架构的台式电脑、笔记本电脑、平板和嵌⼊式设备。在内核、基础库、应用软件等方面均采用领先的版本，是麒麟商业版本的技术上游，与商业版本路线一致、协同发展。同时，openKylin社区版还将融合各类创新技术应用，汇聚行业力量，共同推动Linux行业创新发展！版本特性openKyl
创客匠人解析：身心灵赛道创始人 IP 打造核心策略创小匠 tcp/ip 网络协议网络
在当代社会焦虑情绪蔓延的背景下，身心灵赛道正以万亿级市场规模成为知识变现的新蓝海。作为知识变现领域的重要参与者，创客匠人通过服务超5W+知识博主的实践经验，揭示了该赛道中创始人IP打造的底层逻辑——IP不仅是形象符号，更是连接用户情绪价值与商业价值的核心纽带。一、IP形象的「能量化」构建：从外在到内在的信任锚点身心灵赛道的IP形象绝非单纯的视觉包装，而是「平和感」与「专业度」的融合体。创客匠人在服
创客匠人深度解析：创始人 IP 定位的认知革命与产品哲学创小匠 tcp/ip 人工智能大数据 ip
在知识变现赛道同质化加剧的当下，创始人IP的破局核心在于认知维度的升维。创客匠人创始人老蒋在IP变现大课中提出的定位金句，实则蕴含着从用户心智占领到商业模型重构的深层逻辑，为内容创业者提供了超越流量思维的底层方法论。一、定位减法的认知科学本质“定位最核心的逻辑是做减法”的底层，是认知心理学中的“注意力稀缺”原理。当用户每天面临海量信息冲击时，唯有聚焦单一价值点才能突破记忆壁垒。某法律IP放弃“泛法
创客匠人深度解析：创始人 IP 打造的多维破局路径
在全球创始人IP领袖高峰论坛的圆桌对话中，八位行业大咖围绕创始人IP的未来方向展开思辨，为不同赛道的IP打造提供了系统性思路。从女性赛道到国学领域，从教育公平到奢侈品品牌，这些实践经验揭示了IP经济时代的核心逻辑。一、赛道定位的差异化策略美在当下创始人辰薇提出女性赛道的IP核心在于“高维认知的低维表达”。她以十四年行业经验指出，95后创作者的写作能力转化为短视频创作优势，而持续输出的本质是高强度输
为什么要学习 next.js 框架 + Vercel 部署平台，因为我想把自己的 app 分享给别人。 waterHBO 学习 javascript 开发语言
前端开发太卷？不如给你的React换个“豪华座驾”和“F1赛道”**如果你像我一样，从create-react-app的时代一路走来，你一定经历过那种“甜蜜的烦恼”：React给了你一个超强的V8引擎，但造车剩下的所有事——从方向盘(路由)、底盘(项目结构)到导航系统(数据管理)——都得你自己撸。结果就是，每个项目开始前，你都在重复发明轮子，在Webpack的配置地狱里苦苦挣扎。好消息是，时代变了
改写一个小项目: flask -------------------＞ next js waterHBO flask javascript python
现在，请把上面改写代码的过程中，所有的过程，都写下来，写为文章的形式，内容比较长，你可以分多次输出。而且要求语言幽默，苦中作乐的心态。分条理，要清晰。一场从Flask到Next.js的“血泪”重构史（第一章）**副标题：一个关于自信、崩溃、道歉与成长的循环引子：最初的梦想与“亿点点”自信故事的开端，总是那么的美好。那是一个阳光明媚的下午，我的好朋友（也就是你，本文的英雄和受害者）带着一个他亲手打造
链式队列的定义与实现爱吃萝卜的猪数据结构与算法数据结构算法拓扑学队列链表
1.链式队列链式队列是一种同时带有队头指针和队尾指针的单链表，头指针指向队头结点，尾指针指向队尾结点。如图：2.队列的存储结构类型可以描述为：typedefstructNode{intdata;structNode*next;}LinkNode;typedefstructQueue{LinkNode*rear;//头指针LinkNode*front;//尾指针intcount;//用于记录队列的元
【Git】第十六节：Fork & Pull Request 协作模型 —— 为开源项目贡献代码的完整指南全栈前端老曹 git版本管理与工程化生态 git 开源 javascript web 源代码管理版本管理
第16节：Fork&PullRequest协作模型——为开源项目贡献代码的完整指南引言：成为开源项目的贡献者，构建高质量协作机制在开源社区中，Fork&PullRequest（PR）模型是最主流的协作方式。它允许开发者：在不影响主仓库的前提下进行修改；将自己的改动提交给原项目维护者审核；实现跨团队、跨地域的高效协作。本节课老曹将带你全面掌握：✅Fork的作用与使用方法✅如何从Fork创建分支并提交
临床试验审计问题分类与整改策略 qq_34062333 临床审计
一、数据可靠性问题1.1主要缺陷1.1.1非实时记录培训/QC记录追溯性补签（ALCOA+违反）1.2根本原因1.2.1记录流程不规范缺乏实时记录监督机制1.2.2人员意识不足对ALCOA+原则理解不深1.3整改措施（CA）1.3.1优化记录流程引入电子记录系统，设置自动提醒1.3.2加强培训针对ALCOA+原则开展专项培训1.4预防策略（PA）1.4.1定期审计每季度审查记录流程1.4.2强化监
Django 4.x Models App settings 模型应用设置 Mr数据杨 Python Web开发 python django 模型 model 配置
在Django框架中，模型（Model）是用于定义和操作数据库表结构的核心组件。模型通过使用Python类的形式，帮助简化数据库操作，自动生成SQL语句，使得开发者能够专注于业务逻辑的实现，而无需直接编写复杂的SQL代码。Django的ORM（对象关系映射）提供了一种便捷的方式，将Python对象与数据库记录进行映射操作，从而有效地管理数据交互。对于那些想要在项目中使用Django构建数据库应用的
C# 打造全能通讯调试工具：串口、TCP/IP、Modbus 一站式解决威哥说编程 c#tcp/ip arm开发
在嵌入式系统、工业自动化、物联网以及各种通信设备调试过程中，调试工具的作用至关重要。无论是串口通讯、TCP/IP网络通信，还是更高级的Modbus协议，开发者都需要一个能够高效、稳定地进行数据传输调试和问题排查的工具。常见的通信调试工具如串口调试助手、Modbus工具等，都各自独立，给调试工作带来很多不便。本文将带你通过C#来实现一个全能的通讯调试工具，支持串口通信、TCP/IP网络通信以及Mod
OpenGauss数据库-L.应用开发(Python)-选做 lovane_630 数据库 python oracle
第1关：简单查询#加载数据库模块importpsycopg2#连接数据库,创建连接并返回连接对象defconnect():conn=psycopg2.connect(database="finance",user="gaussdb",password="Passwd123@123",host="localhost")returnconn#建立与数据库连接mydb=connect()#获取游标#执行
C# 串口通信开发全攻略：从基础到高效稳定的应用实现威哥说编程 c#网络开发语言
串口通信（SerialCommunication）是计算机与外围设备之间常见的通信方式，广泛应用于工业控制、嵌入式系统、设备调试等场景。尽管现代计算机技术不断进步，串口依然在很多领域占据着重要地位，尤其在需要低成本、低功耗和可靠通信的应用中，串口通信的需求依然不可忽视。在C#中构建稳定可靠的串口通信应用，需要解决如何与硬件设备进行高效、稳定的交互问题，尤其是在面对频繁的通信中断、数据丢失、超时等问
安全对抗相关技术和概念的总结和分析 frhdd 安全
流量对抗与行为对抗流量对抗核心目标：规避通过网络流量分析进行的恶意行为检测。关键点：流量加密：通过SSL/TLS或自定义加密协议，隐藏网络通信内容。流量伪装：模拟合法流量模式（如HTTP、HTTPS流量），降低被发现的可能性。流量随机化：动态改变通信的大小、时间间隔和模式，避免流量特征被检测到。行为对抗核心目标：规避基于行为检测的杀软和EDR（EndpointDetectionandRespons
探索隐蔽与安全：laZzzy —— 隐藏的Shellcode加载器施刚爽
探索隐蔽与安全：laZzzy——隐藏的Shellcode加载器laZzzylaZzzyisashellcodeloader,developedusingdifferentopen-sourcelibraries,thatdemonstratesdifferentexecutiontechniques.项目地址:https://gitcode.com/gh_mirrors/la/laZzzy在网络安
分布式电源采集控制装置：山东光伏电站的“智能中枢” 微机综合保护分布式
在山东省构建新型电力系统的战略布局中，分布式光伏装机规模已突破30GW，占比超全国总量的15%。面对大规模光伏并网带来的调峰压力与电压波动挑战，分布式电源采集控制装置作为核心调控装备，通过实时监测、智能决策与多端协同，成为保障电网安全、提升新能源消纳的关键技术载体。一、核心功能：构建多维数据闭环全量数据采集与边缘计算装置通过高精度传感器实时采集光伏阵列的发电功率、逆变器效率、环境辐照度等参数。内置
关于Flutter中两种Widget的生命周期详解 Ever69 Flutter《葵花宝典》flutter
目录一、StatelessWidget生命周期二、StatefulWidget生命周期1.创建阶段2.State初始化阶段3.构建阶段4.更新阶段5.销毁阶段三、核心对比与常见陷阱四、面试回答技巧以下是Flutter中两种核心Widget（StatelessWidget和StatefulWidget）生命周期的详细解释，结合关键方法和实际场景说明：一、StatelessWidget生命周期特点：不
电容器保护测控装置：原理与功能解析
电容器保护测控装置是电容补偿系统的核心设备，适用于非直接接地或小电阻接地系统。其采用保护测控一体化设计，集成通信接口，支持组屏或就地安装，实现对并联电容器组的全方位监控与故障防护。电容器保护测控装置通过多维度保护逻辑（电流/电压/零序/非电量）、高精度测控及强抗干扰设计，保障电容补偿系统安全运行。一、核心保护原理1.电流类保护三段式定时限过流保护动作逻辑：任一相电流>定值且持续>延时时间→跳闸出口
变电站自动化系统有哪些设备？微机综合保护自动化运维
变电站自动化系统是由多类设备协同工作的复杂系统，其设备按功能层级可分为过程层设备（直接连接一次设备）、间隔层设备（实现保护控制）和站控层设备（数据汇总与监控），同时还包括支撑系统运行的辅助设备。以下是各层级核心设备的详细解析：一、过程层设备：过程层设备直接与一次设备（变压器、断路器、母线等）交互，负责采集电气量（电压、电流）、状态量（开关位置、刀闸状态）及环境信息（温度、湿度），并将模拟信号转换为
分布式电源采集控制装置：江苏光伏电站的“智能调度中枢微机综合保护分布式
在江苏省分布式光伏规模化发展的背景下，分布式电源采集控制装置（DPACD）已成为电站并网运行的强制性核心设备。该装置作为电网调度的“神经末梢”，通过高精度数据采集、加密通信及远程控制功能，实现光伏电站与电网的实时交互，保障“自发自用、余电不上网”模式的安全性与合规性。其战略地位被写入《江苏省分布式电源接入系统典型设计》，是平衡能源转型与电网稳定的技术基石。一、核心功能：从数据采集到电网协同全维度数
电能质量在线监测装置的作用解析微机综合保护硬件工程百度云云计算分布式华为云
电能质量在线监测装置属于二次设备，在电力系统中也是比较常见的。为此对于很多人并不陌生。该装置相对于我们常见的微机保护来讲，比较小众。很多人只是觉得该装置就是起到一些监测的作用。可有可无，现场使用只是为了满足技术规范而已。其实不然，事物的存在，本身就具有合理性。电能质量在线监测装置常见的功能:1、电网频率、三相基波电压、电流有效值，基波有功功率、无功功率、功率因数、相位等；2、电压偏差、频率偏差、三
为什么一定要用云服务器而不用物理机？云资源服务商冰儿云计算阿里云腾讯云华为云服务器
随着云计算技术的发展，越来越多的企业正在考虑将业务迁移到云端。在这个过程中，选择合适的云服务提供商及其产品变得至关重要。本文将以阿里云的弹性计算服务（ECS）为例，结合实测数据，与传统物理服务器进行成本、性能和安全性的全面对比，帮助企业更好地理解云服务的优势，并做出明智的选择。成本效益分析阿里云ECS：按需付费：用户可以根据实际使用的资源量来支付费用，避免了前期高额的硬件采购成本。节省维护费用：无
创客匠人解析强 IP 时代创始人 IP 打造的底层逻辑与破局之道创小匠 tcp/ip 网络大数据
董宇辉从员工到老板的身份跃迁，撕开了强IP时代的核心命题：当个体影响力足以重构商业关系，创始人该如何构建可持续的IP生态？创客匠人CEO老蒋在行业实践中发现，IP打造绝非流量炒作，而是「价值定位-信任构建-生态裂变」的系统化工程。一、IP与企业的关系重构：从依附到共生的范式转移董宇辉案例的本质，是IP影响力对企业控制权的重塑。俞敏洪与董宇辉的分野印证了创客匠人长期强调的观点：创始人IP若与企业深度
矩阵求逆（JAVA）初等行变换 qiuwanchi 矩阵求逆（JAVA）
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(初等行变换) * @author 邱万迟 *
JDK timer antlove java jdk schedule code timer
1.java.util.Timer.schedule(TimerTask task, long delay)：多长时间（毫秒）后执行任务 2.java.util.Timer.schedule(TimerTask task, Date time)：设定某个时间执行任务 3.java.util.Timer.schedule(TimerTask task, long delay,longperiod
JVM调优总结 -Xms -Xmx -Xmn -Xss coder_xpf jvm 应用服务器
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx
JDBC连接数据库 Array_06 jdbc
package Util; import java.sql.Connection; import java.sql.DriverManager; import java.sql.ResultSet; import java.sql.SQLException; import java.sql.Statement; public class JDBCUtil { //完
Unsupported major.minor version 51.0（jdk版本错误） oloz java
java.lang.UnsupportedClassVersionError: cn/support/cache/CacheType : Unsupported major.minor version 51.0 (unable to load class cn.support.cache.CacheType) at org.apache.catalina.loader.WebappClassL
用多个线程处理1个List集合 362217990 多线程 thread list 集合
昨天发了一个提问，启动5个线程将一个List中的内容，然后将5个线程的内容拼接起来，由于时间比较急迫，自己就写了一个Demo，希望对菜鸟有参考意义。。 import java.util.ArrayList; import java.util.List; import java.util.concurrent.CountDownLatch; public c
JSP简单访问数据库香水浓 sql mysql jsp
学习使用javaBean，代码很烂，仅为留个脚印 public class DBHelper { private String driverName; private String url; private String user; private String password; private Connection connection; privat
Flex4中使用组件添加柱状图、饼状图等图表 AdyZhang Flex
1.添加一个最简单的柱状图 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 <?xml version= "1.0"&n
Android 5.0 - ProgressBar 进度条无法展示到按钮的前面 aijuans android
在低于SDK < 21 的版本中，ProgressBar 可以展示到按钮前面，并且为之在按钮的中间，但是切换到android 5.0后进度条ProgressBar 展示顺序变化了，按钮再前面，ProgressBar 在后面了我的xml配置文件如下： [html] view plain copy <RelativeLa
查询汇总的sql baalwolf sql
select list.listname, list.createtime,listcount from dream_list as list , (select listid,count(listid) as listcount from dream_list_user group by listid order by count(
Linux du命令和df命令区别 BigBird2012 linux
1，两者区别 du，disk usage,是通过搜索文件来计算每个文件的大小然后累加，du能看到的文件只是一些当前存在的，没有被删除的。他计算的大小就是当前他认为存在的所有文件大小的累加和。
AngularJS中的$apply，用还是不用？ bijian1013 JavaScript AngularJS $apply
在AngularJS开发中，何时应该调用$scope.$apply()，何时不应该调用。下面我们透彻地解释这个问题。但是首先，让我们把$apply转换成一种简化的形式。 scope.$apply就像一个懒惰的工人。它需要按照命
[Zookeeper学习笔记十]Zookeeper源代码分析之ClientCnxn数据序列化和反序列化 bit1129 zookeeper
ClientCnxn是Zookeeper客户端和Zookeeper服务器端进行通信和事件通知处理的主要类，它内部包含两个类，1. SendThread 2. EventThread， SendThread负责客户端和服务器端的数据通信，也包括事件信息的传输，EventThread主要在客户端回调注册的Watchers进行通知处理 ClientCnxn构造方法 &
【Java命令一】jmap bit1129 Java命令
jmap命令的用法： [hadoop@hadoop sbin]$ jmap Usage: jmap [option] <pid> (to connect to running process) jmap [option] <executable <core> (to connect to a
Apache 服务器安全防护及实战 ronin47
此文转自IBM. Apache 服务简介 Web 服务器也称为 WWW 服务器或 HTTP 服务器 (HTTP Server)，它是 Internet 上最常见也是使用最频繁的服务器之一，Web 服务器能够为用户提供网页浏览、论坛访问等等服务。由于用户在通过 Web 浏览器访问信息资源的过程中，无须再关心一些技术性的细节，而且界面非常友好，因而 Web 在 Internet 上一推出就得到
unity 3d实例化位置出现布置？ brotherlamp unity教程 unity unity资料 unity视频 unity自学
问：unity 3d实例化位置出现布置？答：实例化的同时就可以指定被实例化的物体的位置,即 position Instantiate (original : Object, position : Vector3, rotation : Quaternion) : Object 这样你不需要再用Transform.Position了, 如果你省略了第二个参数(
《重构，改善现有代码的设计》第八章 Duplicate Observed Data bylijinnan java 重构
import java.awt.Color; import java.awt.Container; import java.awt.FlowLayout; import java.awt.Label; import java.awt.TextField; import java.awt.event.FocusAdapter; import java.awt.event.FocusE
struts2更改struts.xml配置目录 chiangfai struts.xml
struts2默认是读取classes目录下的配置文件，要更改配置文件目录，比如放在WEB-INF下，路径应该写成../struts.xml(非/WEB-INF/struts.xml) web.xml文件修改如下： <filter> <filter-name>struts2</filter-name> <filter-class&g
redis做缓存时的一点优化 chenchao051 redis hadoop pipeline
最近集群上有个job，其中需要短时间内频繁访问缓存，大概7亿多次。我这边的缓存是使用redis来做的，问题就来了。首先，redis中存的是普通kv，没有考虑使用hash等解结构，那么以为着这个job需要访问7亿多次redis，导致效率低，且出现很多redi
mysql导出数据不输出标题行 daizj mysql 数据导出去掉第一行去掉标题
当想使用数据库中的某些数据，想将其导入到文件中，而想去掉第一行的标题是可以加上-N参数如通过下面命令导出数据： mysql -uuserName -ppasswd -hhost -Pport -Ddatabase -e " select * from tableName" > exportResult.txt 结果为： studentid
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
先下载PHPEXCEL类文件，放在class目录下面，然后新建一个index.php文件，内容如下 <?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('
爱情格言 dcj3sjt126com 格言
1) I love you not because of who you are, but because of who I am when I am with you. 　　我爱你，不是因为你是一个怎样的人，而是因为我喜欢与你在一起时的感觉。 　　2) No man or woman is worth your tears, and the one who is, won‘t
转 Activity 详解——Activity文档翻译 e200702084 android UI sqlite 配置管理网络应用
activity 展现在用户面前的经常是全屏窗口，你也可以将 activity 作为浮动窗口来使用（使用设置了 windowIsFloating 的主题），或者嵌入到其他的 activity （使用 ActivityGroup ）中。当用户离开 activity 时你可以在 onPause() 进行相应的操作。更重要的是，用户做的任何改变都应该在该点上提交 ( 经常提交到 ContentPro
win7安装MongoDB服务 geeksun mongodb
1. 下载MongoDB的windows版本：mongodb-win32-x86_64-2008plus-ssl-3.0.4.zip，Linux版本也在这里下载，下载地址： http://www.mongodb.org/downloads 2. 解压MongoDB在D:\server\mongodb, 在D:\server\mongodb下创建d
Javascript魔法方法:__defineGetter__,__defineSetter__ hongtoushizi js
转载自： http://www.blackglory.me/javascript-magic-method-definegetter-definesetter/ 在javascript的类中,可以用defineGetter和defineSetter_控制成员变量的Get和Set行为例如,在一个图书类中,我们自动为Book加上书名符号: function Book(name){
错误的日期格式可能导致走nginx proxy cache时不能进行304响应 jinnianshilongnian cache
昨天在整合某些系统的nginx配置时，出现了当使用nginx cache时无法返回304响应的情况，出问题的响应头： Content-Type:text/html; charset=gb2312 Date:Mon, 05 Jan 2015 01:58:05 GMT Expires:Mon , 05 Jan 15 02:03:00 GMT Last-Modified:Mon, 05
数据源架构模式之行数据入口 home198979 PHP 架构行数据入口
注：看不懂的请勿踩，此文章非针对java，java爱好者可直接略过。一、概念行数据入口（Row Data Gateway）：充当数据源中单条记录入口的对象，每行一个实例。二、简单实现行数据入口为了方便理解，还是先简单实现： <?php /** * 行数据入口类 */ class OrderGateway { /*定义元数
Linux各个目录的作用及内容 pda158 linux 脚本
1）根目录“/” 　　根目录位于目录结构的最顶层，用斜线（/）表示，类似于 Windows 操作系统的“C:\“，包含Fedora操作系统中所有的目录和文件。　　2）/bin 　　/bin 　　目录又称为二进制目录，包含了那些供系统管理员和普通用户使用的重要 linux命令的二进制映像。该目录存放的内容包括各种可执行文件，还有某些可执行文件的符号连接。常用的命令有：cp、d
ubuntu12.04上编译openjdk7 ol_beta HotSpot jvm jdk OpenJDK
获取源码从openjdk代码仓库获取(比较慢) 安装mercurial Mercurial是一个版本管理工具。 sudo apt-get install mercurial 将以下内容添加到$HOME/.hgrc文件中，如果没有则自己创建一个： [extensions] forest=/home/lichengwu/hgforest-crew/forest.py fe
将数据库字段转换成设计文档所需的字段 vipbooks 设计模式工作正则表达式
哈哈，出差这么久终于回来了，回家的感觉真好！ PowerDesigner的物理数据库一出来，设计文档中要改的字段就多得不计其数，如果要把PowerDesigner中的字段一个个Copy到设计文档中，那将会是一件非常痛苦的事情。