xianjie0318

数据挖掘RapidMiner工具使用----解析客户流失模版CHURN MODELING

背景
    在电信企业面向市场、面向国内外众多的竞争者、努力创造更高价值的同时，客户流失的不断增加，客户平均生命周期的不断缩短严重影响了电信企业的发展。那么，在激烈的市场竞争和不断变化的市场需求面前，如何最大程度的降低客户的流失率呢？常用的方法之一就是利用数据挖掘技术。
   数据挖掘技术是目前数据仓库领域最强大的数据分析手段。它的分析方法是利用已知的数据通过建立数学模型的方法找出隐含的业务规则，在很多行业已经具有成功的应用。在电信行业的应用领域主要有客户关系管理，客户欺诈分析，客户流失分析，客户消费模式分析，市场推广分析等。
   在客户流失分析系统中，如何应用数据挖掘技术？主要方式是根据以前拥有的客户流失数据建立客户属性、服务属性和客户消费数据与客户流失可能性关联的数学模型，找出客户属性、服务属性和客户消费数据与客户流失的最终状态的关系，并给出明确的数学公式。只要知道客户属性、服务属性和客户消费数据，我们就可以计算出客户流失的可能性。市场/销售部门可以根据得到的数模型随时监控客户流失的可能性。如果客户流失的可能性过高，高于事先划定的一个限度，就可以通过多种促销手段提高客户的忠诚度，防止客户流失的发生，从而可以大大降低客户的流失率。基于严格数学计算的数据挖掘技术能够彻底改变以往电信企业在成功获得客户以后无法监控客户的流失，无法实现客户关怀的状况，把基于科学决策的客户关系管理全面引入到电信企业的市场/销售工作中来。
挖掘过程
   通常一个完整的数据挖掘过程由业务问题定义，数据选择，数据清洗和预处理，模型选择与预建立，模型建立与调整，模型的评估与检验，模型解释与应用等多个步骤组成。这里我们以个人客户流失为例说明各个步骤的功能。
1．业务问题的定义
　　业务问题的定义要求非常明确。任何不明确的定义都会严重影响模型的准确和应用时的效果。例如：在客户流失分析系统中，需要明确客户流失的定义。在客户流失分析中，主要有两个核心的变量：1.财务原因/非财务原因；2.主动流失/被动流失。客户的流失类别根据这两个核心变量可以分为四种。其中自愿的、非财务原因的流失客户往往是高价值的、稳定的客户。他们会正常支付自己的服务费用，并对市场活动有所响应。所以这种客户才是我们真正想保持的客户。而真正在分析客户流失的状况时，我们还必须区分公司客户与个人客户，不同服务的贡献率，或者是不同客户消费水平流失标准的不同。举例来说，对于用一种新服务替代原有服务的客户，是否作为流失客户？又或者，平均月消费额为2000元左右的客户，当连续几个月消费额降低到500元以下，我们就可以认为客户发生流失了，而这个流失标准就不能适用于原本平均月消费额就为500元左右的客户。实际上，在国外成熟的电信行业客户流失分析系统中，经常是根据相对指标判别客户流失。市场调查表明，通常大众的个人通信费用约占总收入的1%-3%，当客户的个人通信费用降低到远远低于此比例时，就可以认为客户流失发生。所以，客户流失分析系统必须针对各种不同的种类分别定义业务问题，进而分别进行处理。
2．数据选择
数据选择包括目标变量的选择，输入变量的选择和建模数据的选择等多个方面。
目标变量的选择
　目标变量表示了数据挖掘的目标。在客户流失分析应用目标变量通常为客户流失状态。依据业务问题的定义，我们可以选择一个已知量或多个已知量的明确组合作为目标变量。目标变量的值应该能够直接回答前面定义的业务问题。在客户流失分析系统中，们实际面对的流失形式主要有两种：账户取消发生的流失和账户休眠发生的流失。对于不同的流失形式，我们需要选取不同的目标变量。对于账户取消发生的流失，目标变量直接就可以选取客户的状态：流失或正常。对于账户休眠发生的流失，情况就较为复杂。
通常的定义是持续休眠超过给定时间长度的客户被认为是发生了流失。但是，这个给定时间长度定义为多长合适呢？另外一方面，
每月的通话金额低于多少就可以认为是客户处于休眠状态？或者要综合考虑通话金额，通话时长和通话次数来划定流失标准？实际上，目标变量的选择是和业务问题的定义紧密关联在一起的。选择目标变量所要面对的这些问题，都需要业务人员给予明确的答。
输入变量的选择

　　输入变量用于在建模时作为自变量寻找与目标变量之间的关联。在选择输入变量时，我们通常选择两类数据：静态数据和动态数据。静态数据指的是通常不会经常改变的数据，包括服务合同属性，如服务类型，服务时间，交费类型等等；和客户的基本状态，如性别，年龄，收入，婚姻状况，受教育年限/学历，职业，居住地区等等。动态数据指的是经常或定期改变的数据，如每月费金额，交费纪录，消费特征等等。输入变量的选择应该在业务人员帮助下进行，这样才能选择出真正与客户流失可能性具有潜在关联的输入变量。业务人员经常在实际业务活动中深深感觉到输入变量与目标变量的内在联系，但是却无法以量化表示出来。在这种情况下，数据挖掘的工作往往能够得到良好的回报。在一时无法确定某种数据是否与信用卡流失可能性有关联时，应该选取，在后续步骤考察各变量分布情况和相关性时再决定取舍。

建模数据的选择

　　通常电信行业客户流失的方向有两种。第一种是客户的自然消亡。例如由于客户的身故，破产，迁徙，移民等原因，导致客户不再存在。或者是由于客户的升级，如GSM 升级为CDMA，造成特定服务的目标客户消失。第二种是客户的转移流失。通常指客户转移到竞争对手享受服务。显然第二种流失的客户才是电信企业真正关心的，对企业具有挽留价值的客户。因此，我们在选择建模数据时必须选择第二种流失的客户数据参与建模，才能建立出较精确的模型。
3．数据清洗和预处理
　　数据清洗和预处理是建模前的数据准备工作。数据清洗和预处理的目的一方面保证建模的数据是正确和有效的；另一方面，通过对数据格式和内容的调整，使建立的模型更加准确和有效。数据整理的主要工作包括对数据的转换和整合，抽样，随机化，缺失值的处理等等。数据转换和整合的工作目的就是为了保证数据的质量和可用性。例如，样本数据中客户最终流失的数据比例较低，只占全部数据的8%。用这样的数据建模不容易找出流失了的客户的特征，建立精确的模型。我们可以按比例抽取未流失客户和流失了的客户，把两者合并构成建模的数据源。还有，在建模之前，我们建议把样本数据分为两到三部分。一部分用来建模，其他数据用来对模型进行修正和检验。一个模型在建立以后，需要用大量的数据对它进行检验。只有经过实际数据检验并被证明正确的模型才能得到充分的相信。如果一个未经检验的模型被贸然推广使用，就有可能由于模型的不精确带来应用的损失。所以我们通常会把数据分为两部分：2/3的数据用来建模，1/3的数据用来检验。
4．模型选择与预建立
　　到底哪些变量和客户流失概率有密切关系呢？我们需要利用数据挖掘工具中的相关性比较功能找出每一个输入变量和客户流失概率的相关性。通过这样的比较选择，我们可以删除那些和客户流失概率相关性不大的变量，减少建模变量的数量。这样不仅可以缩短建立模型的时间，减小模型的复杂程度，而且有时还能够使建立的模型更精确。Oracle的数据挖掘工具能够提供包括决策树，神经网络，近邻学习，回归，关联，聚类，贝叶斯判别等多种建模方法。但是哪种方法最适合用于信用卡流失分析呢？我们可以使用多种建模方法，预建立多个模型，再比较这些模型的优劣，从而选择出最适合客户流失分析的建模方法。oracle的数据挖掘工具提供了建模方法选择的功能，它能够预建立决策树，神经网络，近邻学习，回归等多种方法，十个模型供使用者选择。它还能自动判别哪一个是最优的模型，供使用者参考。在预建模之前，使用者还能够改变模型的参数，从而根据实际情况生成更好的模型。
5. 模型建立与调整
　　模型建立与调整是数据挖掘过程中的核心部分。通常这部分工作会由专业的分析专家完成。需要指出的是，不同的商业问题和不同的数据分布与属性，经常会影响到模型建立与调整的策略。而且在建模过程中还会使用多种近似算法来简化模型的优化过程。所有这些处理方法，对模型的预测结果都会产生影响。所以在模型建立与调整过程中，需要业务专家参与制定调整策略，避免不适当的优化导致业务信息的丢失。
6．模型的评估与检验
　　模型的评估应该利用未参与建模的数据进行，这样才能得到准确的结果。如果我们使用建模的数据对模型进行检验，由于模型就是按照这些数据建立的，检验结果自然会很好。但是一旦运用到实际数据中，就会产生很大的偏差。所以我们必须使用未参与建模的数据对模型进行检验。检验的方法是对已知客户状态的数据利用模型进行预测，得到模型的预测值，和实际的客户状态相较。
预测正确值最多的模型就是最优的模型。
7．模型解释与应用
　　得到最优的模型以后，我们需要业务人员针对得到的模型做出一些合理的业务解释。例如：我们可能发现在开户时长与的客户的流失可能性相关度较高。那么，业务人员利用业务知识可以解释为：由于客户在使用一定年限后需要换领新SIM卡，而换领新SIM卡的手续比较繁琐或时间周期过长，客户宁愿去申请新号码，导致流失可能性上升量。通过对模型做出合理的业务解释，我们就有能找出一些以前没有发现，但实实在在存在的潜在的业务规律。找出这些规律后，就可以指导我们的业务行为。另一方面，如果真的能够根据业务知识解释我们得到的数学模型，也说明了这个数学模型在业务上的合理性，我们就更能够大胆应用于业务活动中了。
　　模型的真正应用推广必须谨慎从事。我们可以先选择一个试点单位应用模型，避免由于模型的不精确导致高额的业务损失。试点的时间可以界定在半年到一年，期间必须随时注意模型应用的收益情况。一旦发生异常偏差，应该立即停止，检查偏差是由于模型本身的原因还是由于应用环境发生了重大变化，从而导致模型不再适用。如果是由于模型本身不准确造成的，可以对模型不精确的部分进行修正。如果是由于应用环境发生了重大变化，就应该重新进行建模工作。当试点结束后，这个模型被证明应用良好，就可以考虑大面积的推广。
　　在大面积推广时应该注意的是，由于地区经济差异的原因，模型不能完全照搬。所以可以由总公司建立一个通用的模型，各分公司在此基础上利用本地数据进行进一步修正，得到适用于本地的精确模型。模型在应用一段时期后，或经济环境发生重大变后，有可能模型的偏差会增大，这时候就可以考虑重新建立一个更合适的模型。

RapidMiner下CHURN MODELING案例分析

模型建立步骤
步骤1：加载一个客户数据集并检索数据
包含客户属性：
age:客户的年龄
Technology:技术类型（4G、光纤等）
CustomerSince:客户开始使用时间
AverageBill：去年客户平均使用帐单
SupportCallsLastYear:去年客户支持电话访问次数
Churnindicator：客户流失指标值
如下：

数据挖掘RapidMiner工具使用----解析客户流失模版CHURN MODELING_第1张图片

如果数据为excel或cvs数据文件可以通过ADD data加载数据入口，把excel数据文件加载进来
这里软件已经存储到工具中，通过Data Access下的Retrieve直接进行数据检索

数据挖掘RapidMiner工具使用----解析客户流失模版CHURN MODELING_第2张图片

步骤2：挖掘目标列设定、数据转换并准备数据
标记目标标记列（即流失指示器）并将数值卷列转换为二进制。

首先通过set role组件设置需要挖掘的目标列：客户流失指标，即Churnindicator为标签列

因客户流失指标作为挖掘目标，但是这目标为数值，需要转换为FALSE、TRUE，预估一下范围，预测转换为客户已经流失为true、客户未流失为False

这里把Churnindicator小于0.5的定为客户未流失，Churnindicator大于0.5的为客户已经流失

数据挖掘RapidMiner工具使用----解析客户流失模版CHURN MODELING_第4张图片

步骤3：模型建立

1）模型验证是关键！这种交叉验证将训练数据集进行分裂，然后能够独立的测试。这种分裂是做几次以获得更好的性能估计。

以下配置参数：自动模式：按自动模式使用分层抽样：10层，若不适合分层，就混合采样替代；

数据挖掘RapidMiner工具使用----解析客户流失模版CHURN MODELING_第5张图片

2）模型中---流程图包含：样本、自动参数组合优化（决策树算法、应用模型、二项式统计性能评价）、应用模型、二项式统计性能评价

样本选择

采用‘relative’采样模式，并设置平衡训练数据集：也就是说采用‘相对’样本，即按照设置的比例从总体数据中抽取部分数据作为样本进行学习。样本概率参数由每个类的样本大小、每类的抽样比率所代替。

自动参数组合优化：优化参数（网格）算子，提供最佳参数组合

决策树算子：

rapidminner提供的决策树常用算法属性-：information_gain（信息增益）、gain_ratio（信息增益率）、gini_index（基尼系数）、accuracy（精度），

信息熵表示的是不确定度。均匀分布时，不确定度最大，此时熵就最大；

信息增益可以衡量某个特征对分类结果的影响大小；

基尼指数是另一种数据的不纯度的度量方法；

决策树常用算法：ID3 (信息增益) 、C4.5 (信息增益率)、CART (基尼指数)

决策树参数设置：

criterion-为选择的属性和数值分裂指定使用的标准

maximal depth: 树的最大深度（-1：无边界），树的深度取决于树的大小和性质。此参数用于限制决策树的大小。树生成当树深度等于最大深度时，进程不会继续。如果它值设置为“-1”，最大深度参数不限制树的深度，如果其值设置为“1”，则具有单个节点的树生成.

apply pruning (boolean)：默认情况下选中，剪枝生成决策树。设置此参数为false（即不选中）禁用修剪和修剪树提供了一个
confidence: 用于修剪的封闭式错误计算的置信度等级

apply prepruning (boolean)：默认情况下同时按参数限制生成决策树，设置此参数为false（即不选中）禁用以下参数限制生成决策树。

minimal size for split: 允许分裂的节点的最小尺寸
minimal leaf size: 树叶的最小尺寸
minimal gain: 为了产生一个分裂必须达到的最小增益

number of prepruning alternatives: 当预先修剪将阻止一个分裂时，可选择的节点数
决策树的默认criterion是gain_radio（增益率）

应用模型：预测数据模型的合理性，强制行检测数量、顺序、类型和角色属性的一致性，否则报错

二项式统计性能评价：

分类任务即标签中的分类任务，属性有一个二项式型，也就说该组件同时进行两种不同目标标签挖掘分析任务，自动进行学习分析，

执行结果：

1）以criterion=gain_ratio（信息增益率）来测试，查看输出结果

2）以criterion=information_radio（信息增益）来测试，查看输出结果

3）以criterion=gini_index（基尼系数）来测试，查看输出结果

4）以criterion=accuracy（精度）来测试，查看输出结果

总结：

1、决策树算法是一种逼近离散函数值的方法，它是一种典型的分类方法，首先对数据进行处理，利用归纳算法生成可读的规则和决策树，然后使用决策对新数据进行分析。本质上决策树是通过一系列规则对数据进行分类的过程。
2、决策树算法构造决策树来发现数据中蕴含的分类规则。如何构造精度高、规模小的决策树是决策树算法的核心内容
3、构造决策树
（1）由训练样本数据集来训练生成决策树
（2）决策树的剪枝，决策树的剪枝是对上一阶段生成的决策树进行检验、校正和修正的过程，主要是用测试数据集的数据校验决策树生成过程中产生的初步规则，把那些影响预测准确性的分枝剪除
4、决策树可以处理非数值类型属性

Vue SPA 路由跳转无法回到顶部问题排查与解决浪裡遊 vue.js javascript ecmascript pinia router html
VueSPA路由跳转无法回到顶部问题排查与解决1.问题现象描述在使用Vue3+VueRouter4开发单页应用（SPA）时，遇到如下问题：点击导航栏或页脚的路由跳转后，页面没有自动回到顶部。即使配置了VueRouter的scrollBehavior，页面依然没有回到顶部的效果。有时内容会被导航栏遮住，看起来像"没有回到顶部"。2.常见原因分析内容区没有为导航栏预留空间导航栏是fixed或stick
Uniapp跟原生android插件交互发信息（二）飞露 uni-app android 交互
一、背景在uni-app开发过程中，有时候会遇到uni-app插件或者提供的api对硬件操作不太友好，需要使用原生Android开发对应模块，为了使得双方通信方便，特意封装了一个接口，可实现Android与Uni-app互相通讯。二、内容做完以下第一、第二部分，即可实现Android与uni-app互相通信，当然双方通信有不同方式，具体情况具体分析，我的采用的方案是写Android原生插件,在un
51单片机教程（十一）- 单片机定时器 ITB业生 C 单片机 51单片机
11、单片机定时器项目目标通过定时器/计数器实现流水灯控制。知识要点定时器的结构。TMOD和TCON；定时/计数器工作方式；定时/计数器编程步骤；1、项目分析前面的流水灯的时间控制通过空循环语句来实现，定时不是很精确。本章通过用定时器来控制流水灯任务可以实现精确的时间控制。这就需要了解定时器的使用。定时器和计数器实质功能相同，本章利用LED灯二进制计数任务来掌握计数器的使用。2、技术准备1背景从软
网站策划书通用模板程序员小郑1024 项目策划专区 java 编程语言大数据
网站策划书通用模板一个网站的成功与否与建站前的网站策划有着极为重要的关系。在建立网站前应明确建设网站的目的，确定网站的功能，确定网站规模、投入费用，进行必要的市场分析等。只有详细的策划，才能避免在网站建设中出现的很多问题，使网站建设能顺利进行。网站策划是指在网站建设前对市场进行分析、确定网站的目的和功能，并根据需要对网站建设中的技术、内容、费用、测试、维护等做出策划。网站策划对网站建设起到计划和指
《Python数据分析与挖掘实战》Chapter8中医证型关联规则挖掘笔记茫茫大地真干净机器学习 Python 数据挖掘
最近在学习《Python数据分析与挖掘实战》中的案例，写写自己的心得。代码分为两大部分：1.读取数据并进行聚类分析2.应用Apriori关联规则挖掘规律1.聚类部分函数分析：defprogrammer_1():datafile="C:/Users/longming/Desktop/chapter8/data/data.xls"processedfile="C:/Users/longming/Des
Practical TLA+ 项目中的Dekker算法形式化验证焦习娜Samantha
PracticalTLA+项目中的Dekker算法形式化验证practical-tla-plusSourceCodefor'PracticalTLA+'byHillelWayne项目地址:https://gitcode.com/gh_mirrors/pr/practical-tla-plus概述本文分析PracticalTLA+项目中关于Dekker互斥算法的形式化规范。Dekker算法是解决多线
深入理解reeze/tipi项目中的词法分析与语法分析技术焦习娜Samantha
深入理解reeze/tipi项目中的词法分析与语法分析技术tipiThinkingInPHPInternals,AnopenbookonPHPInternals项目地址:https://gitcode.com/gh_mirrors/ti/tipi引言在编程语言实现领域，词法分析和语法分析是构建编译器或解释器的关键环节。本文将基于reeze/tipi项目中的相关内容，深入浅出地讲解这些核心技术原理。
【机器学习与数据挖掘实战 | 医疗】案例18：基于Apriori算法的中医证型关联规则分析 Francek Chen 机器学习与数据挖掘实战机器学习数据挖掘 Apriori python 关联规则人工智能
【作者主页】FrancekChen【专栏介绍】⌈⌈⌈机器学习与数据挖掘实战⌋⌋⌋机器学习是人工智能的一个分支，专注于让计算机系统通过数据学习和改进。它利用统计和计算方法，使模型能够从数据中自动提取特征并做出预测或决策。数据挖掘则是从大型数据集中发现模式、关联和异常的过程，旨在提取有价值的信息和知识。机器学习为数据挖掘提供了强大的分析工具，而数据挖掘则是机器学习应用的重要领域，两者相辅相成，共同推动
Cursor MySQL MCP 完整操作配置指南 z日火开发分享 mcp cursor mysql
概述本指南帮助您在Windows环境下配置Cursor编辑器的MySQLMCP服务器，实现通过AI助手对数据库进行完整的增删改查操作。功能特性：✅自然语言数据库查询✅智能数据插入和更新✅安全的数据删除操作✅自动数据分析和报告生成快速配置1.环境检查#检查必要组件node--version#Node.js>=16mysql--version#MySQL5.7+cursor--version#Curs
构建四则运算解析器：字符串处理与计算逻辑实战大熊小清新
本文还有配套的精品资源，点击获取简介：四则运算解析器是将包含四则运算符号的字符串表达式转化为可执行计算的程序。它对编程初学者而言是理解编程逻辑和语法分析的基础。通过理解四则运算的优先级规则，实现输入处理、词法分析、语法分析和计算步骤，可以采用递归下降解析或堆栈解析等方法。本解析器的实现涉及字符串处理、数据结构的运用，有助于学习者掌握编程语言的底层工作方式，提升编程技能和问题解决能力。1.四则运算解
提示词编程语言设计艺术探索 AI天才研究院计算 AI人工智能与大数据 AI大模型企业级应用开发实战 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
《提示词编程语言设计艺术探索》关键词：提示词编程语言，设计艺术，编程语言设计，核心算法，实例分析，项目实战摘要：本文旨在深入探讨提示词编程语言的设计艺术，从基础概念到核心算法，再到实际应用和未来趋势，全面解析这一领域的关键技术和设计理念。通过具体的实例分析和项目实战，帮助读者更好地理解和掌握提示词编程语言的设计与实现。引言与概述1.1提示词编程语言的背景和重要性提示词编程语言（Prompt-Bas
linux日志文件详解 MagnumOvO 云计算 linux 5G linux 运维 centos
目录一、日志文件的分类二、日志文件位置三、常见日志文件1.分析日志文件2.内核及系统日志四、日志消息等级五、日志文件分析1.用户日志2.程序日志六、日志分析注意事项一、日志文件的分类日志文件是用于记录Linux系统中各种运行消息的文件,相当于Linux主机的“日记”。不同的日志文件记载了不同类型的信息,如Linux内核消息、用户登录事件、程序错误等·日志文件对于诊断和解决系统中的问题很有帮助,因为
Golang cron 定时任务完全指南：从入门到精通 Golang编程笔记 Golang编程笔记 Golang开发实战 golang wpf 开发语言 ai
Golangcron定时任务完全指南：从入门到精通关键词：Golang、cron、定时任务、任务调度、并发处理、分布式任务、最佳实践摘要：本文将全面介绍Golang中实现cron定时任务的各个方面，从基础概念到高级应用，涵盖标准库使用、第三方库对比、并发处理、分布式任务调度等核心内容。我们将通过详细的代码示例、架构图解和实际应用场景分析，帮助开发者掌握在Golang中构建可靠、高效的定时任务系统的
【C++】命令模式
目录一、模式核心概念与结构二、C++实现示例：遥控器与家电控制三、命令模式的关键特性四、应用场景五、命令模式与其他设计模式的关系六、C++标准库中的命令模式应用七、优缺点分析八、实战案例：数据库事务命令九、实现注意事项如果这篇文章对你有所帮助，渴望获得你的一个点赞！命令模式（CommandPattern）是一种【行为型】设计模式，它将请求封装为对象，从而使你可以用不同的请求对客户端进行参数化，对请
Vue3+ element 实现导入导出青柠97 vue.js javascript 前端
一、导入功能相关代码分析相关变量定义importVisible：这是一个ref类型的响应式变量，用于控制导入对话框的显示与隐藏，初始值为false。当用户点击“导入”按钮时，会尝试将其值设为true来显示导入对话框，若出现异常则提示相应错误信息。file：同样是ref类型的变量，用于存储用户选择要上传的文件对象，后续在文件上传等操作中会以此文件对象作为基础数据进行处理。pre_import：ref
深入了解SIP架构与多媒体通信协议亜恵恵阿由 SIP架构 SDP协议 RTP协议 MGCP协议 RTSP协议
深入了解SIP架构与多媒体通信协议背景简介在现代网络通信中，会话发起协议（SIP）已成为关键的组件，特别是在VoIP和多媒体通信领域。SIP不仅支持音频和视频通信，还通过各种协议和架构实现复杂的通信场景。本文将对SIP相关的关键技术进行分析，探讨它们在实时通信中的作用和意义。会话描述协议（SDP）SDP是一种文本协议，用于在SIP会话初始化时发送必要的多媒体信息。它提供了关于会话名称、活动时间、交
Tiktok App 登录账号、密码、验证码 XOR 加密算法
抖音App登录账号、密码、验证码XOR加密算法%E9n+z,\&R1a4b.^流程分析登录TiktokAPP时，通过抓包发现账号密码是非明文传输的。getUserProfile($userId,$secUid);echo"\n\n视频列表：\n";echo$tiktok->getMixList($userId);//示例：加密后的密码hex字符串$encrypted_hex="7472607771
fish安装node.js环境翻滚吧键盘 openSUSE node.js chrome 前端
为什么强调fishshell，因为fishshell的缘故，不能直接执行node.js官网的命令好的，您遇到了一个非常典型且重要的问题。请仔细阅读我的分析，这能帮您彻底解决问题。问题诊断您看到的所有错误，归根结底有两个核心原因：您正在使用FishShell：从命令行末尾的fish:提示可以看出，您使用的不是Linux默认的bash，而是fish。FishShell的脚本语法与bash不兼容。错误的
LLMs基础学习（八）强化学习专题（7）汤姆和佩琦 NLP 学习 Actor-Critic 算法
LLMs基础学习（八）强化学习专题（7）文章目录LLMs基础学习（八）强化学习专题（7）Actor-Critic算法基础原理算法流程细节算法优缺点分析算法核心总结视频链接：https://www.bilibili.com/video/BV1MQo4YGEmq/?spm_id_from=333.1387.upload.video_card.click&vd_source=57e4865932ea6c
Java基础：流程控制语句：条件、循环和跳转越重天 Java 基础入门教程 Java 宝藏 java 开发语言 java流程控制语句零到一学Java
前言Java中的流程控制语句其实和C、C++一样，在Java中，流程控制会涉及到包括if-else、while、do-while、for、return、break以及选择语句switch。下面以此进行分析。流程控制语句，分为三大类：条件语句，循环语句和跳转语句，如下图所示：1.条件语句条件语句可根据不同的条件执行不同的语句。包括if条件语句与switch多分支语句。1.1if语句if语句
ROS：录制相机、IMU、GNSS等设备数据吃水果不削皮视觉组合导航 ROS VIO
文章目录简介录制数据️准备工作录制相机录制串口设备录制数据项目地址简介在ROS中，录制传感器数据（如相机、IMU等）常使用rosbag工具，它可以将ROS话题消息保存为.bag文件，供后续回放或分析。本文使用jetson-tx2核心板作为录制平台，录制微光相机数据和六轴IMU数据，用于相机标定、IMU标定、相机-IMU联合标定与VIO轨迹分析。相机标定详见：相机-IMU联合标定：相机标定IMU标定
Day 11：Shell工具库：从“刀耕火种“到“工业革命“的效率飞跃 zhysunny Shell编程 linux
目录一、jq：JSON处理的"瑞士军刀"1.基础查询（比grep更精准）2.高级转换技巧3.实战：JSON日志分析二、curl：API调试的"特种部队"1.诊断技巧（看到隐藏细节）2.高级参数技巧3.实战：API健康检查三、parallel：释放多核威力的"核按钮"1.基础并行化2.性能对比实验3.实战：批量图片转换四、效率工具：打造你的"命令行智库"1.自制备忘系统2.终端工作流优化五、调试工具
HarmonyOS高效数据检索方案全解析：从原理到实战代码 harmonyos
摘要在开发鸿蒙（HarmonyOS）应用的过程中，数据检索是一个绕不开的重要环节。无论是小型本地存储的数据，还是大型缓存数据，检索的效率直接影响到用户体验。本文将介绍两种经典的数据检索方法——哈希表和二分查找，结合实际场景进行分析，并提供可以直接运行的示例代码。引言随着鸿蒙系统的发展，越来越多的开发者投身于原生应用开发。但在处理数据尤其是大量数据时，如何高效地定位目标值就显得非常关键。特别是在智能
量化交易编程-持仓天数,SQL学习-ACCESS子查询的技巧专注VB编程开发20年 sql 学习 java ACCESS 数据库
在股票投资中，停牌期间通常不算交易日3。同花顺手机APP中的收益分析持仓天数一般是按照交易日来计算的。具体而言，它会从买入股票的日期开始，到卖出股票的日期为止，只统计证券交易所正常开放交易的日子，周末和法定节假日以及股票停牌日都不会计算在内3。例如，若你持有某股票2年，其中停牌2年，实际交易日只有20天，那么同花顺计算的持仓天数就是20天，而不会算出几百个交易日。其实持仓天数关我屁事是吧?我只考虑
AI助力基因数据分析：用Python玩转生命密码的秘密 Echo_Wish 前沿技术人工智能人工智能数据分析 python
AI助力基因数据分析：用Python玩转生命密码的秘密说到基因数据，听起来是不是感觉有点高大上？其实，基因数据分析正变得越来越“接地气”，而AI正是这条路上的神奇钥匙。今天，咱们就用Python聊聊如何利用AI技术做基因数据分析与建模，帮你破解生命的密码，找到疾病预测、个性化医疗的新路子。一、基因数据为何如此特别？基因组测序技术让我们能够获取人体细胞内数以百万计的DNA序列变异信息。但数据量巨大、
python做生物信息学分析_Python从零开始第五章生物信息学①提取差异基因吴敬欣 python做生物信息学分析
目前来说，做生物信息学的人越来越多，但是我觉得目前而言做生信的主要有三类人：老本行是做实验的，做生信可能是为了辅助研究或者是为了发paper(有非常多的临床生选择趟生信这波水)主要是做生信的，主要涵盖高通量测序数据分析，组学数据分析等等，专门从事生物学数据分析的这群人，其大部分也是本科生物狗作为强大的生力军，以调包写R，python为主。那么这群人就要熟悉看各种包的tutorial以及如何进行常规
【基数排序介绍】 wdwc2 算法设计算法数据结构排序算法
文章目录前言一、基数排序是什么？二、基数排序的步骤（LSD低位优先）1.找出最大数的位数2.对每一位进行排序（从最低位到最高位）三、C++实现1.主函数：基数排序实现四、时间复杂度分析五、基数排序的适用场景六、与其他排序算法对比七、扩展：处理负数的思路总结前言在处理大规模整数排序问题时，比较类排序（如快速排序）可能无法发挥最优性能。本篇博客将详细介绍一种非比较类排序算法：基数排序（RadixSor
用Python实现生信分析——功能预测详解写代码的M教授生信分析 python 开发语言
功能预测是生物信息学中的一项重要任务，通过分析基因或蛋白质序列的特征，推测它们的生物学功能。功能预测通常涉及多种方法，包括序列比对、基序识别、机器学习模型等。这些方法可以帮助科学家推断未知基因的功能，从而加速生物学研究的进展。1.功能预测的主要方法（1）同源性比对：通过将未知基因或蛋白质序列与数据库中的已知序列进行比对，识别出同源序列，并推测它们的功能。常用工具包括BLAST、HMMER等。（2）
用Python实现生信分析——序列搜索和比对工具详解写代码的M教授生信分析 python
1.什么是序列搜索和比对工具？序列搜索和比对工具在生物信息学中用于在大型序列数据库中搜索与查询序列相似的序列，并进行比对分析。这些工具可以帮助研究人员识别与目标序列相关的已知序列，从而推测其功能、结构和进化关系。常见的序列搜索和比对工具包括：BLAST（BasicLocalAlignmentSearchTool）：最常用的序列搜索工具，能够快速找到与查询序列相似的序列。FASTA：另一个常用的序列
数据库设计和功能需求分析------后台设计概述 qq_41490913 java 数据库
功能需求分析和数据库设计不论是Web开发还是Android开发，在设计后台的时候我们都要做的重要的事情不外乎两点：1.需求分析；2.数据库表格的设计。在进行这两项工作的过程中，第一项工作对第二项起着非常重要的作用，我们只有真正的搞清楚了业务需求以及业务逻辑，找到了功能模块之间在后台数据库关联的抽象模型，这样才能确定数据库应该有几张表，每张表有哪些字段，表与表之间该如何联系。需求分析与功能模块设计一
ios内付费 374016526 ios 内付费
近年来写了很多IOS的程序，内付费也用到不少，使用IOS的内付费实现起来比较麻烦，这里我写了一个简单的内付费包，希望对大家有帮助。具体使用如下: 这里的sender其实就是调用者，这里主要是为了回调使用。 [KuroStoreApi kuroStoreProductId:@"产品ID" storeSender:self storeFinishCallBa
20 款优秀的 Linux 终端仿真器 brotherlamp linux linux视频 linux资料 linux自学 linux教程
终端仿真器是一款用其它显示架构重现可视终端的计算机程序。换句话说就是终端仿真器能使哑终端看似像一台连接上了服务器的客户机。终端仿真器允许最终用户用文本用户界面和命令行来访问控制台和应用程序。（LCTT 译注：终端仿真器原意指对大型机-哑终端方式的模拟，不过在当今的 Linux 环境中，常指通过远程或本地方式连接的伪终端，俗称“终端”。）你能从开源世界中找到大量的终端仿真器，它们
Solr Deep Paging(solr 深分页) eksliang solr深分页 solr分页性能问题
转载请出自出处：http://eksliang.iteye.com/blog/2148370 作者：eksliang(ickes) blg:http://eksliang.iteye.com/ 概述长期以来，我们一直有一个深分页问题。如果直接跳到很靠后的页数，查询速度会比较慢。这是因为Solr的需要为查询从开始遍历所有数据。直到Solr的4.7这个问题一直没有一个很好的解决方案。直到solr
数据库面试题 18289753290 面试题数据库
1.union ,union all 网络搜索出的最佳答案： union和union all的区别是,union会自动压缩多个结果集合中的重复结果，而union all则将所有的结果全部显示出来，不管是不是重复。 Union：对两个结果集进行并集操作，不包括重复行，同时进行默认规则的排序； Union All：对两个结果集进行并集操作，包括重复行，不进行排序； 2.索引有哪些分类？作用是
Android TV屏幕适配酷的飞上天空 android
先说下现在市面上TV分辨率的大概情况两种分辨率为主 1.720标清，分辨率为1280x720. 屏幕尺寸以32寸为主，部分电视为42寸 2.1080p全高清，分辨率为1920x1080 屏幕尺寸以42寸为主，此分辨率电视屏幕从32寸到50寸都有适配遇到问题，已1080p尺寸为例：分辨率固定不变，屏幕尺寸变化较大。如：效果图尺寸为1920x1080，如果使用d
Timer定时器与ActionListener联合应用永夜-极光 java
功能:在控制台每秒输出一次代码: package Main; import javax.swing.Timer; import java.awt.event.*; public class T { private static int count = 0; public static void main(String[] args){
Ubuntu14.04系统Tab键不能自动补全问题解决随便小屋 Ubuntu 14.04
Unbuntu 14.4安装之后就在终端中使用Tab键不能自动补全，解决办法如下： 1、利用vi编辑器打开/etc/bash.bashrc文件（需要root权限） sudo vi /etc/bash.bashrc 接下来会提示输入密码 2、找到文件中的下列代码 #enable bash completion in interactive shells #if
学会人际关系三招轻松走职场 aijuans 职场
要想成功，仅有专业能力是不够的，处理好与老板、同事及下属的人际关系也是门大学问。如何才能在职场如鱼得水、游刃有余呢？在此，教您简单实用的三个窍门。　　第一，多汇报最近，管理学又提出了一个新名词“追随力”。它告诉我们，做下属最关键的就是要多请示汇报，让上司随时了解你的工作进度，有了新想法也要及时建议。不知不觉，你就有了“追随力”，上司会越来越了解和信任你。　　第二，勤沟通团队的力
《O2O：移动互联网时代的商业革命》读书笔记 aoyouzi 读书笔记
移动互联网的未来：碎片化内容+碎片化渠道=各式精准、互动的新型社会化营销。 O2O：Online to OffLine 线上线下活动 O2O就是在移动互联网时代，生活消费领域通过线上和线下互动的一种新型商业模式。手机二维码本质：O2O商务行为从线下现实世界到线上虚拟世界的入口。线上虚拟世界创造的本意是打破信息鸿沟，让不同地域、不同需求的人
js实现图片随鼠标滚动的效果百合不是茶 JavaScript 滚动属性的获取图片滚动属性获取页面加载
1,获取样式属性值 top 与顶部的距离 left 与左边的距离 right 与右边的距离 bottom 与下边的距离 zIndex 层叠层次例子:获取左边的宽度,当css写在body标签中时 <div id="adver" style="position:absolute;top:50px;left:1000p
ajax同步异步参数async bijian1013 jquery Ajax async
开发项目开发过程中，需要将ajax的返回值赋到全局变量中，然后在该页面其他地方引用，因为ajax异步的原因一直无法成功，需将async:false，使其变成同步的。格式： $.ajax({ type: 'POST', ur
Webx3框架（1） Bill_chen eclipse spring maven 框架 ibatis
Webx是淘宝开发的一套Web开发框架，Webx3是其第三个升级版本；采用Eclipse的开发环境，现在支持java开发；采用turbine原型的MVC框架，扩展了Spring容器，利用Maven进行项目的构建管理，灵活的ibatis持久层支持，总的来说，还是一套很不错的Web框架。 Webx3遵循turbine风格，velocity的模板被分为layout/screen/control三部
【MongoDB学习笔记五】MongoDB概述 bit1129 mongodb
MongoDB是面向文档的NoSQL数据库，尽量业界还对MongoDB存在一些质疑的声音，比如性能尤其是查询性能、数据一致性的支持没有想象的那么好，但是MongoDB用户群确实已经够多。MongoDB的亮点不在于它的性能，而是它处理非结构化数据的能力以及内置对分布式的支持(复制、分片达到的高可用、高可伸缩)，同时它提供的近似于SQL的查询能力，也是在做NoSQL技术选型时，考虑的一个重要因素。Mo
spring/hibernate/struts2常见异常总结白糖_ Hibernate
Spring ①ClassNotFoundException: org.aspectj.weaver.reflect.ReflectionWorld$ReflectionWorldException 缺少aspectjweaver.jar，该jar包常用于spring aop中 ②java.lang.ClassNotFoundException: org.sprin
jquery easyui表单重置(reset)扩展思路 bozch form jquery easyui reset
在jquery easyui表单中尚未提供表单重置的功能，这就需要自己对其进行扩展。扩展的时候要考虑的控件有： combo,combobox,combogrid,combotree,datebox,datetimebox 需要对其添加reset方法，reset方法就是把初始化的值赋值给当前的组件，这就需要在组件的初始化时将值保存下来。在所有的reset方法添加完毕之后，就需要对fo
编程之美-烙饼排序 bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; /* *《编程之美》的思路是：搜索+剪枝。有点像是写下棋程序：当前情况下，把所有可能的下一步都做一遍；在这每一遍操作里面，计算出如果按这一步走的话，能不能赢（得出最优结果）。 *《编程之美》上代码有很多错误，且每个变量的含义令人费解。因此我按我的理解写了以下代码： */
Struts1.X 源码分析之ActionForm赋值原理 chenbowen00 struts
struts1在处理请求参数之前，首先会根据配置文件action节点的name属性创建对应的ActionForm。如果配置了name属性，却找不到对应的ActionForm类也不会报错，只是不会处理本次请求的请求参数。如果找到了对应的ActionForm类，则先判断是否已经存在ActionForm的实例，如果不存在则创建实例，并将其存放在对应的作用域中。作用域由配置文件action节点的s
[空天防御与经济]在获得充足的外部资源之前,太空投资需有限度 comsci 资源
这里有一个常识性的问题: 地球的资源,人类的资金是有限的,而太空是无限的..... 就算全人类联合起来,要在太空中修建大型空间站,也不一定能够成功,因为资源和资金,技术有客观的限制.... &
ORACLE临时表—ON COMMIT PRESERVE ROWS daizj oracle 临时表
ORACLE临时表转临时表：像普通表一样，有结构，但是对数据的管理上不一样，临时表存储事务或会话的中间结果集，临时表中保存的数据只对当前会话可见，所有会话都看不到其他会话的数据，即使其他会话提交了，也看不到。临时表不存在并发行为，因为他们对于当前会话都是独立的。创建临时表时，ORACLE只创建了表的结构（在数据字典中定义），并没有初始化内存空间，当某一会话使用临时表时，ORALCE会
基于Nginx XSendfile+SpringMVC进行文件下载 denger 应用服务器 Web nginx 网络应用 lighttpd
在平常我们实现文件下载通常是通过普通 read-write方式，如下代码所示。 @RequestMapping("/courseware/{id}") public void download(@PathVariable("id") String courseID, HttpServletResp
scanf接受char类型的字符 dcj3sjt126com c
/* 2013年3月11日22:35:54 目的：学习char只接受一个字符 */ # include <stdio.h> int main(void) { int i; char ch; scanf("%d", &i); printf("i = %d\n", i); scanf("%
学编程的价值 dcj3sjt126com 编程
发一个人会编程, 想想以后可以教儿女, 是多么美好的事啊, 不管儿女将来从事什么样的职业, 教一教, 对他思维的开拓大有帮助像这位朋友学习: http://blog.sina.com.cn/s/articlelist_2584320772_0_1.html VirtualGS教程 (By @林泰前): 几十年的老程序员，资深的
二维数组（矩阵）对角线输出飞天奔月二维数组
今天在BBS里面看到这样的面试题目, 1，二维数组（N*N），沿对角线方向，从右上角打印到左下角如N=4： 4*4二维数组 { 1 2 3 4 } { 5 6 7 8 } { 9 10 11 12 } {13 14 15 16 } 打印顺序 4 3 8 2 7 12 1 6 11 16 5 10 15 9 14 13 要
Ehcache（08）——可阻塞的Cache——BlockingCache 234390216 并发 ehcache BlockingCache 阻塞
可阻塞的Cache—BlockingCache 在上一节我们提到了显示使用Ehcache锁的问题，其实我们还可以隐式的来使用Ehcache的锁，那就是通过BlockingCache。BlockingCache是Ehcache的一个封装类，可以让我们对Ehcache进行并发操作。其内部的锁机制是使用的net.
mysqldiff对数据库间进行差异比较 jackyrong mysqld
mysqldiff该工具是官方mysql-utilities工具集的一个脚本，可以用来对比不同数据库之间的表结构，或者同个数据库间的表结构如果在windows下，直接下载mysql-utilities安装就可以了，然后运行后，会跑到命令行下： 1）基本用法 mysqldiff --server1=admin:12345
spring data jpa 方法中可用的关键字 lawrence.li java spring
spring data jpa 支持以方法名进行查询/删除/统计。查询的关键字为find 删除的关键字为delete/remove (>=1.7.x) 统计的关键字为count (>=1.7.x) 修改需要使用@Modifying注解 @Modifying @Query("update User u set u.firstna
Spring的ModelAndView类 nicegege spring
项目中controller的方法跳转的到ModelAndView类，一直很好奇spring怎么实现的？ /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version 2.0 (the "License"); * yo
搭建 CentOS 6 服务器(13) - rsync、Amanda rensanning centos
（一）rsync Server端 # yum install rsync # vi /etc/xinetd.d/rsync service rsync { disable = no flags = IPv6 socket_type = stream wait
Learn Nodejs 02 toknowme nodejs
（1）npm是什么 npm is the package manager for node 官方网站：https://www.npmjs.com/ npm上有很多优秀的nodejs包，来解决常见的一些问题，比如用node-mysql，就可以方便通过nodejs链接到mysql，进行数据库的操作在开发过程往往会需要用到其他的包，使用npm就可以下载这些包来供程序调用 &nb
Spring MVC 拦截器 xp9802 spring mvc
Controller层的拦截器继承于HandlerInterceptorAdapter HandlerInterceptorAdapter.java 1 public abstract class HandlerInterceptorAdapter implements HandlerIntercep

数据挖掘RapidMiner工具使用----解析客户流失模版CHURN MODELING

你可能感兴趣的:(数据挖掘,数据挖掘分析)