nysyxxg

深入浅出谈数据挖掘zz

http://www.cnblogs.com/end/p/3328388.html

编者的话：本文对数据挖掘概念的产生，数据挖掘与常规数据分析的主要区别，所能解决的几大类问题和所应用的领域都有着非常清晰的论述。作者在此篇文章中认为数据挖掘最重要的要素是分析人员的相关业务知识和思维模式。丰富的业务知识是设计有效的相关变量的必要条件，而分析人员的思维模式从另外一个方面也保障了设计变量的结构化和完整性。所以我们在掌握丰富的业务知识同时，如果能够按照正确的思维模式去思考问题，将会发现解决问题并不是很困难的。

一、数据挖掘的本质

一般来说，比较狭义的观点认为数据挖掘区别于常规数据分析的关键点在于：数据挖掘主要侧重解决四类问题：分类、聚类、关联、预测（关于这四类问题后文会详细阐述），而常规数据分析则侧重于解决除此之外的其他数据分析问题：如描述性统计、交叉报表、假设检验等。

让我们来看一个例子：某移动运营商想了解目前彩铃业务的发展现状如何？解决这个问题的方法就是常规的数据分析，通过描述性统计和交叉报表，可以知道目前彩铃业务的用户数、普及率、收入情况？不同品牌用户间的情况和差异？不同消费水平用户间的情况和差异……。这样的分析主要解决了企业过去发生了什么以及存在什么问题；如果该运营商希望建立一个模型（或者规则），从没有使用彩铃的用户群中找出一部分用户作为彩铃营销活动的目标用户，如通过短信或者外呼的方式告知用户可以免费试用彩铃一个月。解决这个问题则需要使用数据挖掘的方法，如通过决策树方法可以找出使用彩铃业务可能性较高的用户的一系列特征规则，然后根据这些规则去筛选目标用户。当然数据挖掘也并不是解决这个问题唯一办法，因为在没有数据挖据这个概念之前（1990年以前），这样的问题在商业中也是普遍存在的。通过常规的数据分析依然能解决这个问题，例如研究不同品牌、不同消费水平、不同年龄、不同……的用户使用彩铃的情况，也可以总结出一套比较实用的规则来作为筛选彩铃目标用户的规则。当然，这样的方法跟数据挖掘方法相比存在一定的不足，由于篇幅的限制，这个问题留给大家去思考。

个人的观点：数据挖掘很大程度上来说更像是一个框架概念。它所使用的各种方法在这个概念形成之前已经普遍存在，例如统计学中的多元回归、Logistic回归，人工智能中的神经网络等。在上个世纪90年代，由于数据库的高速发展，企业对精确化营销的迫切需求，导致了数据挖掘这个概念和新名词的诞生。当然我们也不能简单的认为数据挖掘就是一个“新瓶装老酒”，毕竟，数据挖掘根据所解决的不同类型的问题，把包含统计学在内的各种方法进行了整合和重新设计，形成了一套新的数据分析方法论和框架，在这个框架内，源源不断的很多人投入进来，这其中主要包含两类人：一类人是在更新设计新的算法；一类人是在不断的探索既有的方法在商业中的各种应用。

二、数据挖掘主要解决的四类问题

数据挖掘非常清晰的界定了它所能解决的几类问题。这是一个高度的归纳，数据挖掘的应用就是把这几类问题演绎的一个过程。下面让我们来看看它所解决的四类问题是如何界定的：

n 分类问题

分类问题属于预测性的问题，但是它跟普通预测问题的区别在于其预测的结果是类别（如A、B、C三类）而不是一个具体的数值（如55、65、75……）。

举个例子，你和朋友在路上走着，迎面走来一个人，你对朋友说：我猜这个人是个上海人，那么这个问题就属于分类问题；如果你对朋友说：我猜这个人的年龄在30岁左右，那么这个问题就属于后面要说到的预测问题。

商业案例中，分类问题可谓是最多的：给你一个客户的相关信息，预测一下他未来一段时间是否会离网？信用度是好/一般/差？是否会使用你的某个产品？将来会成为你的高/中/低价值的客户？是否会响应你的某个促销活动？……。

有一种很特殊的分类问题，那就是“二分”问题，显而易见，“二分”问题意味着预测的分类结果只有两个类：如是/否；好/坏；高/低……。这类问题也称为0/1问题。之所以说它很特殊，主要是因为解决这类问题时，我们只需关注预测属于其中一类的概率即可，因为两个类的概率可以互相推导。如预测X=1的概率为P（X=1），那么X=0的概率P（X=0）=1-P（X=1）。这一点是非常重要的。

可能很多人已经在关心数据挖掘方法是怎么预测P（X=1）这个问题的了，其实并不难。解决这类问题的一个大前提就是通过历史数据的收集，已经明确知道了某些用户的分类结果，如已经收集到了10000个用户的分类结果，其中7000个是属于“1”这类；3000个属于“0”这类。伴随着收集到分类结果的同时，还收集了这10000个用户的若干特征（指标、变量）。这样的数据集一般在数据挖掘中被称为训练集，顾名思义，分类预测的规则就是通过这个数据集训练出来的。训练的大概思路是这样的：对所有已经收集到的特征/变量分别进行分析，寻找与目标0/1变量相关的特征/变量，然后归纳出P（X=1）与筛选出来的相关特征/变量之间的关系（不同方法归纳出来的关系的表达方式是各不相同的，如回归的方法是通过函数关系式，决策树方法是通过规则集）。

如需了解细节，请查阅：决策树、Logistic回归、判别分析、神经网络、Inpurity 、Entropy、Chi-square、Gini、Odds、Odds Ratio……等相关知识。

n 聚类问题

聚类问题不属于预测性的问题，它主要解决的是把一群对象划分成若干个组的问题。划分的依据是聚类问题的核心。所谓“物以类聚，人以群分”，故得名聚类。

聚类问题容易与分类问题混淆，主要是语言表达的原因，因为我们常说这样的话：“根据客户的消费行为，我们把客户分成三个类，第一个类的主要特征是……”，实际上这是一个聚类问题，但是在表达上容易让我们误解为这是个分类问题。分类问题与聚类问题是有本质区别的：分类问题是预测一个未知类别的用户属于哪个类别（相当于做单选题），而聚类问题是根据选定的指标，对一群用户进行划分（相当于做开放式的论述题），它不属于预测问题。

聚类问题在商业案例中也是一个非常常见的，例如需要选择若干个指标（如价值、成本、使用的产品等）对已有的用户群进行划分：特征相似的用户聚为一类，特征不同的用户分属于不同的类。

聚类的方法层出不穷，基于用户间彼此距离的长短来对用户进行聚类划分的方法依然是当前最流行的方法。大致的思路是这样的：首先确定选择哪些指标对用户进行聚类；然后在选择的指标上计算用户彼此间的距离，距离的计算公式很多，最常用的就是直线距离（把选择的指标当作维度、用户在每个指标下都有相应的取值，可以看作多维空间中的一个点，用户彼此间的距离就可理解为两者之间的直线距离。）；最后聚类方法把彼此距离比较短的用户聚为一类，类与类之间的距离相对比较长。

如需了解细节，请查阅：聚类分析、系统聚类、K-means聚类、欧氏距离、闵氏距离、马氏距离等知识。

n 关联问题

说起关联问题，可能要从“啤酒和尿布”说起了。有人说啤酒和尿布是沃尔玛超市的一个经典案例，也有人说，是为了宣传数据挖掘/数据仓库而编造出来的虚构的“托”。不管如何，“啤酒和尿布”给了我们一个启示：世界上的万事万物都有着千丝万缕的联系，我们要善于发现这种关联。

关联分析要解决的主要问题是：一群用户购买了很多产品之后，哪些产品同时购买的几率比较高？买了A产品的同时买哪个产品的几率比较高？可能是由于最初关联分析主要是在超市应用比较广泛，所以又叫“购物篮分析”，英文简称为MBA，当然此MBA非彼MBA,意为Market Basket Analysis。

如果在研究的问题中，一个用户购买的所有产品假定是同时一次性购买的，分析的重点就是所有用户购买的产品之间关联性；如果假定一个用户购买的产品的时间是不同的，而且分析时需要突出时间先后上的关联，如先买了什么，然后后买什么？那么这类问题称之为序列问题，它是关联问题的一种特殊情况。从某种意义上来说，序列问题也可以按照关联问题来操作。

关联分析有三个非常重要的概念，那就是“三度”：支持度、可信度、提升度。假设有10000个人购买了产品，其中购买A产品的人是1000个，购买B产品的人是2000个，AB同时购买的人是800个。支持度指的是关联的产品（假定A产品和B产品关联）同时购买的人数占总人数的比例，即800/10000=8%，有8%的用户同时购买了A和B两个产品；可信度指的是在购买了一个产品之后购买另外一个产品的可能性，例如购买了A产品之后购买B产品的可信度=800/1000=80%，即80%的用户在购买了A产品之后会购买B产品；提升度就是在购买A产品这个条件下购买B产品的可能性与没有这个条件下购买B产品的可能性之比，没有任何条件下购买B产品可能性=2000/10000=20%，那么提升度=80%/20%=4。

如需了解细节，请查阅：关联规则、apriror算法中等相关知识。

n 预测问题

此处说的预测问题指的是狭义的预测，并不包含前面阐述的分类问题，因为分类问题也属于预测。一般来说我们谈预测问题主要指预测变量的取值为连续数值型的情况。

例如天气预报预测明天的气温、国家预测下一年度的GDP增长率、电信运营商预测下一年的收入、用户数等？

预测问题的解决更多的是采用统计学的技术，例如回归分析和时间序列分析。回归分析是一种非常古典而且影响深远的统计方法，最早是由达尔文的表弟高尔顿在研究生物统计中提出来的方法，它的主要目的是研究目标变量与影响它的若干相关变量之间的关系，通过拟和类似Y=aX1+bX2+……的关系式来揭示变量之间的关系。通过这个关系式，在给定一组X1、X2……的取值之后就可以预测未知的Y值。

相对来说，用于预测问题的回归分析在商业中的应用要远远少于在医学、心理学、自然科学中的应用。最主要的原因是后者是更偏向于自然科学的理论研究，需要有理论支持的实证分析，而在商业统计分析中，更多的使用描述性统计和报表去揭示过去发生了什么，或者是应用性更强的分类、聚类问题。

如需了解细节，请查阅：一元线性回归分析、多元线性回归分析、最小二乘法等相关知识。

三、数据挖掘的应用领域

数据挖掘一开始就是面向应用而诞生的，前面说到数据挖掘主要解决四大类的问题，如果把这些问题演绎到不同的行业，我们将看到数据挖掘的应用是非常广泛的。

以我们经常接触的移动通信行业来说，结合前面提到的四大类问题，我们看看数据挖掘在通信行业都有哪些应用。

分类问题：

l 离网预测：预测用户在未来一段时间内离网的风险。

l 信用申请评分：根据用户资料评估用户是否可以授信（如预付费用户可以透支、后付费用户可以延长帐期）。

l 信用行为评分：根据用户过去的消费行为特征评估信用得分高低，便于调整话费透支额度或者付费帐期。

l 定位产品（如彩铃、WAP、增值数据业务等）目标用户：构建模型筛选产品营销的目标用户群。

聚类问题：

l 用户细分：选择若干指标把用户群聚为若干个组，组内特征相似、组间特征差异明显。当然用户细分的方法很多，不一定都是采用聚类方法。聚类的优点是可以综合处理多维变量，缺点是随之带来的不易解释性。一种便于解释的细分方法是结合业务对用户群进行人为的划分，习惯上称为Pre-Define的方法。这种方法的优点是便于解释且应用性强，缺点是对业务要求比较高，划分边界比较难定，对多维变量处理有难度。

关联问题：

l 交叉销售：针对用户已经使用的产品和业务，向其推荐他没有使用的，但可能有兴趣的产品。交叉销售的问题从某种角度上来也可以理解为分类问题，与定位产品目标用户这个问题比较相似。

预测问题：

比较成型的应用不多，一般多为用户数预测、收入预测等。

四、什么是数据挖掘最重要的要素？

回到文章一开始举的那个案例来说，如果某运营商需要建立一个模型来筛选一部分目前还没有用彩铃的用户作为推广彩铃业务的目标用户，那么这样一个任务要取得成功的关键要素是什么呢？是分析人员的思维模式、分析采用的方法、相关业务知识还是分析采用的工具？

从技术的角度来看这个问题，能不能得出精准的答案主要取决于是否寻找到与目标（是否使用彩铃）相关的变量。而影响变量选择的关键并不是选择了不同分析方法，而是是否提供了足够和有效的变量的去供分析方法选择。也就是说不同的分析方法选择相关变量的能力是相差不大的，关键是是否提供了足够的变量供选择。

变量的提供取决于变量的收集和设计，影响它最关键的两个因素是：相关业务知识和分析人员的思维模式。丰富的业务知识是设计有效的相关变量的必要条件。分析人员的思维模式从另外一个方面保障了设计变量的结构化和完整性。麦肯锡公司一个重要的思维模式就是MECE，即不重叠、不遗漏。这是一个非常要命的观点，如果都能按照这个模式去思考问题，你会发现解决问题原来也并不是那么困难。

分析人员的业务知识和思维模式不仅仅简单的影响着变量的设计，还包括整个数据挖掘任务的方案框架设计以及后续的结果应用，在这里以终为始的思维模式又显得尤为重要。

纵观其他要素，分析方法对结果的影响主要体现在结果的解释性和稳定性上：例如在信用评分应用中，Logistic回归的结果就更便于解释和应用；而决策树方法对极值、非线性关系的处理就比其他方法更稳健。

此外，分析工具对结果的影响较小，但是在功能、操作的便利性和效率方面差别也是相当大的。SAS软件相比SPSS、SPLUS等软件来说在效率和功能方面有较大的优势。

------------------------

海量数据处理与分析

近年来搜索引擎营销在网络营销领域越来越火热，无论在欧美发达地区、还是在中国等发展国家，搜索引擎营销都渐渐成为互联网营销的主题。不仅是因为搜索引擎的火热带动了搜索营销的发展，更是因为大家在如何做好搜索引擎营销上各自不一的看法让搜索引擎营销越炒越热。

　　搜索引擎营销很难么？未必。搜索引擎营销是通过关键字广告为主要呈现方式的广告形式，关键字广告最多十来字的标题和近百字的内容描述，能承载多少信息呢？关键字广告无论在媒体甄选、创意制定、物料制作、排期调整等方面要比一个传统的网络图片广告或视频广告容易的多。曾经一个朋友想委托我所在的公司管理他们一个二十几个关键字每天几百元预算的关键字帐户，我给他的建议是：最好的方案是自己管理帐户，管理效果很可能比雇佣一个专业的第三方SEM公司更好，因为企业更加了解自己所推广的产品和业务，更了解自己的目标受众的需求，只要了解了关键字广告的一些基本规则，企业能更加准确达到所预期的搜索引擎营销效果。搜索引擎营销的门槛很低，不需要太多的专业技能和知识，任何一个网络营销人员都可以迅速的掌握。

　　搜索引擎营销很简单么？当然不是，搜索引擎营销是目前我认为所有营销方式中最复杂的一个。由于单一关键字广告的覆盖面微乎其微，关键字的数量及覆盖范围就显得及其的重要，在美国，一个小型的连锁酒店集团大概每天会投放3-4千个关键字，而像一个大型的B2C企业可能拥有上千万关键字的日投放，其中每一个关键字的营销宣传都是一条完整的广告，每天会生成大量的数据——展示量、点击量、单位单击价格、排名位置、质量得分、转化成本与效果等等，加上需要参考他们之间的各个关键比例关系值，一个关键字广告每天都要产生十数个的数据，每个数据都可能直接影响到关键字广告的最终效果。那么一个拥有1000个关键字的搜索引擎广告帐户，每天都会产生十余万的广告数据，单考虑这些数据的管理就已经是一个很让人头疼的事情了。更何况为了追求更好的营销效果，我们必须为每一个关键词后所隐藏的不同类别、不同需求的客户，选择适合的广告语言和产品；必须考虑每天由于竞价体系所造成的价格变化；必须考虑到由于自身和竞争对手的各类营销行为对搜索引擎产生的影响等等。这些动态的因素所产生的问题，不会因为你对关键字广告投放的熟练掌握就可以很好的解决的。

　　通过上面的内容我们可以发现，搜索引擎营销最大的难点就是“量”的问题，由于每一个搜索行为背后所隐藏的目标受众的不同、搜索兴趣与需求的不同，再加上无法准确预测的动态数据，使我们不可能采用通用的法则来处理好每一个投放的关键字广告，而搜索引擎营销的效果又是由大量单体关键字广告的效果累加而成的，我们又不得不进行精细化的管理。按照经验，一个熟练的搜索引擎营销人员，如果做到真正的精细化操作，大概可以管理3-5千个关键字，但是我们很难想象一个成熟的电子商务企业需要几个甚至上百个操作人员来管理这些关键字广告，并随时按照营销策略的不断变化保证他们产出效率的一致性与协调性，因此做好搜索引擎营销由此来看几乎是不可能完成的任务。http://www.dmresearch.net/

　　好在随着计算机数据分析技术的发展，对海量数据的管理与分析变得更加易于掌握，这种计算机分析技术就是数据挖掘。目前我们所接触到的数据挖掘成果体现莫过于电信运营商中电话资费套餐的设定，电信运营商利用数据挖掘技术对数以百万计的电话用户通话行为进行分析，为拥有不同通话需求的用户设计各种类型的资费套餐，在保证用户粘性的同时最大限度的挖掘用户的消费潜力。数据挖掘技术能协助人有效地把海量的、互不相同的数据进行整理和汇总，并按照一定的逻辑规则进行分类提取分析，寻找到当中潜在的联系与规律，进行业务决策。而当这种技术应用于搜索引擎营销的时候，就更能展现其强大功效，只要企业建立起明确的搜索引擎营销策略，对数据趋势有一个大致的把握，就可以借助强大的计算机分析能力对海量的搜索引擎营销数据进行有针对性的分析和汇总，对每一个关键字的营销效果进行有效的监控和调整，再借助一定的营销规则进行调整后，就做到了真正的精细化管理，搜索营销的效果自然就得以保证。

　　从以上的分析我们可以看到，搜索引擎营销“量”的问题是难点，海量数据的管理与分析与管理就是搜索引擎营销的关键，但当我们解决了这个问题的时候，搜索引擎营销就变得不再神秘，其他营销方式所使用的方法上就没有多大的差别了。

分类: 算法

《小满细雨轻湿尘》快乐的人ZZM
图片发自App《小满细雨轻湿尘》文/快乐的人zzm小满细雨轻湿尘石榴花开落纷纷落红不是无情物坠入泥土育养根2018-5-23
从鸡肉高汤到记忆的魔法再到有效提示的艺术步子哥人工智能
还记得小时候那些天马行空的白日梦吗？也许只要按下键盘上的某个神奇组合，电脑就会发出滴滴的声响，一个隐藏的世界突然在你眼前展开，让你获得超凡的能力，摆脱平凡的生活。这听起来像是玩过太多电子游戏的幻想，但实际上，间隔重复系统给人的感觉惊人地相似。在最佳状态下，这些系统就像魔法一样神奇。本文将以一个看似平凡的鸡肉高汤食谱为例，深入浅出地探讨如何编写有效的间隔重复提示，让你像掌握烹饪技巧一样轻松地掌握记忆
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
xilinx vivado PULLMODE 设置思路坚持每天写程序 fpga开发
1.xilinx引脚分类XilinxIO的分类：以XC7A100TFGG484为例，其引脚分类如下：1.UserIO(用户IO)：用户使用的普通IO1.1专用(Dedicated)IO：命名为IO_LXXY_#、IO_XX_#的引脚，有固定的特定用途，多为底层特定功能的直接实现，如差分对信号、关键控制信号等，不能随意变更。1.2多功能(Multi-Function)IO：命名为IO_LXXY_ZZ
深入浅出 -- 系统架构之负载均衡Nginx的性能优化 xiaoli8748_软件开发系统架构系统架构负载均衡 nginx
一、Nginx性能优化到这里文章的篇幅较长了，最后再来聊一下关于Nginx的性能优化，主要就简单说说收益最高的几个优化项，在这块就不再展开叙述了，毕竟影响性能都有多方面原因导致的，比如网络、服务器硬件、操作系统、后端服务、程序自身、数据库服务等，对于性能调优比较感兴趣的可以参考之前《JVM性能调优》中的调优思想。优化一：打开长连接配置通常Nginx作为代理服务，负责分发客户端的请求，那么建议开启H
封侯非吾意但愿海波平修源正本
《韬钤深处》明·戚继光小筑暂高枕，忧时旧有盟。呼樽来揖客，挥麈坐谈兵。云护牙签满，星含宝剑横。封侯非我意，但愿海波平。嘉靖二十五年（1546年），戚继光负责管理登州卫所的屯田事务，当时山东沿海一带，遭受到倭寇的烧杀抢掠，戚继光有心杀贼，于是在一本兵书的空白处，写下了“封侯非我意，但愿海波平”的诗句。“养心莫若寡欲，至乐无如读书”是戚继光又一句名言。从这句话中可以得知戚继光对读书做学问的真知灼见。戚
Python实现关联规则推荐这孩子谁懂哈 Python Machine Learning python 关联规则机器学习
1.什么关联规则关联规则（AssociationRules）是反映一个事物与其他事物之间的相互依存性和关联性，如果两个或多个事物之间存在一定的关联关系，那么，其中一个事物就能通过其他事物预测到。关联规则是数据挖掘的一个重要技术，用于从大量数据中挖掘出有价值的数据项之间的相关关系。关联规则挖掘的最经典的例子就是沃尔玛的啤酒与尿布的故事，通过对超市购物篮数据进行分析，即顾客放入购物篮中不同商品之间的关
《论语》日日谈 34期 wuhuaping9807
《论语》日日谈第34期本章为《论语》：公冶长篇第八章【原文】孟武伯问：“子路仁乎？”子曰：“不知也。”又问。子曰：“由也，千乘之国，可使治其赋也。不知其仁也。”“求也何如？”子曰：“求也，千室之邑，百乘之家，可使为之宰也①，不知其仁也。、赤也何如②？”子曰：“赤也，束带立于朝，可使与宾客言也。不知其仁也。”【注释】①宰：古代县、邑一级的行政长官。卿大夫的家臣也叫宰。②赤：公西赤，字子华，孔子的学生
《乖，摸摸头》精彩桥段摘要第二說
职业是职业，事业是事业，没必要把职业升迁和事业成就混为一谈，也没必要把一份工作当唯一的轴心，别把工作和生活硬搞成对立面，兼顾温饱没有错，可一辈子被一份工作拴死，那也太无趣了。——《大冰.乖，摸摸头》精彩桥段摘要
app推广一手资源在哪里找？盘点2024年必备的八大app拉新渠道 U客直谈APP
在2024年即将来临之际，还是有许多小伙伴表示不知道app推广一手资源在哪里找，又要从哪里去了解各个资源渠道的不同特性。好消息来啦，本篇文章就将带大家盘点24年必备的八大app拉新渠道，全文干货，拆解分析点评一步到位，还不快快收藏起来~1.app推广一手资源来源：U客直谈U客直谈是一个资源对接平台，专注于为推广人员提供海量丰富的app拉新任务。其具有数量丰富且类型多样的app拉新任务，使得U客直谈
谈哲学本仙老四
我是谁？从哪里来？要到哪里去？最近看了些西方哲学类书籍，忽然就有了这些哲学式的思考。世界真的如我们所看到的这样吗？还是只是我们觉得它是这样？或者它根本就不存在。哲学书是引发人思考的好书籍，即使你觉得读起来枯燥无味也要坚持阅读，之后你会发现受益无穷。大家都说哲学起源于西方，文艺复兴时期的哲学对欧洲的发展起到了重要作用。其实早在中国古代就有一批哲人出现，老子、庄子、孟子、孔子……他们的思想各有独到之处
钟汉良日记：自媒体写作要向古代拜师学艺的人取经钟汉良日记
2022年9月8日周四晴朗的天前几天晚上，和实操班的学员谈了很多为什么要写日记的原因。前后两个多小时，推荐了好几本书，隔了一天再回忆竟然不能把所有的书籍都列出来。是自己年龄大了，记忆力衰退了？我觉得不是。而是谈话这种氛围，比起文字写作更容易激发我们的潜能。一些灵光乍现的想法，会在那种特别融洽的时候突然涌现出来。有的想法和总结，你平时就是绞尽脑汁也想不出来，但就是在那种你侃侃而谈的时候，思想会像流水
《姬魔恋战纪》如何跟妹子谈场不分手的恋爱！专业搬砖小能手
今天小编带你来梳理一下，国产galgame手机游戏《姬魔恋战纪》里的撩妹技巧,知己知彼才能百战百胜。刘备在主人公身边一直辅助主人公的女性，对主人公几乎有着无条件的信任。把丧失记忆的主人公当作上天派来的神使看待。对待主人公的态度非常温柔、宽容，但发现主人公偷懒后，会露出严厉的表情加以责备。兴趣是泡茶。在议事厅中泡茶给辛苦工作的主人公是她的一大乐趣之一。是一位温柔、善良的女性。攻略方式：遗迹冒险，多聊
整合孩子大脑，培养幸福能力维娅丫
图片发自App幸福是一种能力，一种解决问题的能力。为人父母，我们要具备足够的能力去培养一个健康、快乐的孩子。在日常生活中，每一个人都会遇到各种各样的问题、困惑、烦恼、挫折，怎样才能化悲伤为开心，化愤怒为力量，坚定的向我们的幸福出发呢？下面，我就谈一下如何帮助孩子整合大脑，培养孩子获得幸福的能力。是什么塑造了我们的大脑呢？———体验。甚至到了老年，体验也仍然在改变着大脑的生理结构。每经历一次体验，一
一篇丧文/廉价的感情不值得穆临渊
其实谁不想遇到真爱，爱的绝对，爱的坦白。--------《越来越不懂爱》正如歌词所言，谁不想遇到真爱，爱的绝对，爱的坦白呢！可是现在的人越来越不懂爱，谈一场恋爱好似吃一顿快餐一般，开始若骤风暴雨，然后潦草收场。进入大学也将近一年了，见过把社团每个女生都骚扰一遍的变态，也见过说着天长地久第三天就分手的小情侣，反正算是知道了尘世广袤无奇不有。昨天参加元旦晚会的排演，在休息时与社团的朋友们聊天打趣，听到
对待工作的态度杨奶茶
今天下午听了教授的一番话，听了很认真，人要学着傻，我就是以为自己很聪明，其实聪明反被聪明误，以前总是眼高手低，总觉得不给好处不做，什么都想谈条件，往往这样我得不到成长而且做事态度也很差，我现在才明白，什么事情先去做，而且认真做好，有一句话是但行好事，莫问前程。首先把事情做好，晚上美美让我做表格，其实我是最头疼表格的，眼睛都看花了，但是我内心里面我是很开心的，我喜欢承担责任，表格不会我可以学，做的慢
致即将逝去的2020年斯丹钰
婚姻生活没有想象中那么完美…有时候特别痛恨小时候受的那些教育为什么要被灌输：结婚就好了结婚根本不是那么一件容易的事情…结婚是一种全新生活方式的开始是每一个人学习的新课程很讨厌传统思想中：女人的价值不就是为了生儿育女的吗！我觉得女人哪怕你不是想走所谓的事业型但是你一定要拥有一技之长无论你身在职场，还是想退隐江湖哪天再回来…至少你能在这个时代和这个社会生存下去那时候再来谈你的精神你要的所有其它的东西不
【这里是新疆】（2）“有效光照理论”下的新疆美好生活…… 拈花老夏
图片发自App【这里是新疆】（2）“有效光照理论”下的新疆人，及新疆人们的生活……（这一篇，最好在读完上一篇后进行！前面谈“有效光照”下的植物与作物，本篇谈人，其实本为一整体，但是太长，发不出来[撇嘴]）老夏每年游学南方各省，经常听人这么说：新疆人个子就是高大，结实……其实人也与一棵植物，一棵庄稼没有根本区别！作为生命个体的代表，决定人生命的，其实一是具有能量的、高质量的食物（国际医学及科学普遍认
又要长大一岁了 A媛媛_e2be
30多岁的我，年龄有些大，还比较宅，作性质又比较特殊，基本接触不到那么多人。就是一个普通的不能再普通的平凡人。唯一觉得还算满意的就是有特别爱我的爸妈，还有一份不错的收入。其实我不知道自己是什么性格的人，有时候特别善谈，有时候又沉默寡言。单身的我经常希望找到一个爱我的男朋友，可是真的有人给我介绍的时候，一想到以后要是有了男朋友就会占用自己很多私人空间，就会拒绝朋友的好心介绍。总是在这样矛盾中生活着…
用了这么多年的PCA可视化竟然是错的！！！生信宝典
本文启发于上周开的单细胞转录组课程，本次课程由资深单细胞算法研究者戴老师主讲，深入浅出，各部分分析原理从理论到应用层面解释透彻，最新流程，最新代码，绝对值得学习。课程尚未结束，我就迫不及待向一位未能安排出时间参加此课程的老友及时安利了视频课。言归正传，介绍培训课程的一张幻灯片：很多PCA可视化结果都是不合适的。PCA或PCoA是常用的降维工具，之前有几篇文章介绍PCA的原理和可视化。一文看懂PCA
CV、NLP、数据控掘推荐、量化海的那边- AI算法自然语言处理人工智能
下面是对CV（计算机视觉）、NLP（自然语言处理）、数据挖掘推荐和量化的简要概述及其应用领域的介绍：1.CV（计算机视觉，ComputerVision）定义：计算机视觉是一门让计算机能够从图像或视频中提取有用信息，并做出决策的学科。它通过模拟人类的视觉系统来识别、处理和理解视觉信息。主要任务：图像分类：识别图像中的物体并分类，比如猫、狗、车等。目标检测：在图像或视频中定位并识别多个对象，如人脸检测
【机器学习与R语言】1-机器学习简介苹果酱0567 面试题汇总与解析 java 中间件开发语言 spring boot 后端
1.基本概念机器学习：发明算法将数据转化为智能行为数据挖掘VS机器学习：前者侧重寻找有价值的信息，后者侧重执行已知的任务。后者是前者的先期准备过程：数据——>抽象化——>一般化。或者：收集数据——推理数据——归纳数据——发现规律抽象化：训练：用一个特定模型来拟合数据集的过程用方程来拟合观测的数据：观测现象——数据呈现——模型建立。通过不同的格式来把信息概念化一般化：一般化：将抽象化的知识转换成可用
聊聊一条岬的《今夜，即便这份恋情从世界消散》醉烟雨
在开始谈这本书前，我想问几个问题，那就是爱情是什么呢？如果离开这个世界，你希望留下什么？如果忘记你能让你喜欢的TA更好的生活在这世界上，你是否有勇气选择抹去所有自己存在的痕迹？2021年豆瓣评分第一名的爱情电影《花束般的恋爱》于今年二月份上映，如果可以，我希望今年七月在日本上映的电影《今夜，即使这份恋情从世界消散》也能够在国内上映。电影《今夜，即便这份恋情从世界消散》《今夜，即便这份恋情从世界消散
《最好的晚年》：人生暮年，如何寻找属于自己的幸福与满足？前程似锦LIU
《最好的晚年》：人生暮年，如何寻找属于自己的幸福与满足？老年，这个生命阶段，带给我们无尽的人生智慧与丰富的经历。然而，很多人在这个阶段感到迷茫与孤独。《最好的晚年》这本书的出现，为我们指名了新的方向，提供了实用的建议与创新思维。通过本书的引导，我们可以重新审视自己的晚年生活，用积极的态度面对这个阶段。本书深入浅出地探讨了老年生活的各个方面。作者以他独特的见解，引导我们理解晚年的多种可能性。通过引入
我的人生系列之何时能击碎枷锁凤凰花开新一代女性理念创立者
你问我，为什么总是不笑？我叹一口气，我觉得说活着都筋疲力尽，那里还有精力笑？还要天天保持，只怕那是苦笑多过真心，决定不再装，不是挺好挺真实？我看很多人，进入中年，要么笑得满脸皱纹，老皮横生，桃花纷飞；要么愁得眉头紧锁，故作高深，真正笑得天真无邪，发自肺腑，还有几个？生活，只有越来越沉重，负担不断剧增，责任层层叠上，哪里能谈坐看潮起潮落，什么云淡和风轻，只是文人卖弄骚姿，仿佛寄托笔墨，才能得以释怀，
人生就是一场永无止境的修行爱自己1985
遇到任何问题告诉自己:“这就是修行”在大学刚毕业那会儿，觉得工作是最重要的，先生存才能谈生活。现在有房、有车，也有了一份稳定的工作，但是内心还是常常有不安的感觉。因为自己没有什么成长，在孩子教育上也没有成长。告诉自己这就是修行。不要焦虑，每天进步一点点，学会去发现自己和孩子的优点。今天虽然没有看书，但是晚上一家人去吃鱼了，吃完一起去散步，回来接到一个同事的电话，聊了两个小时。她明年就50周岁了，可
跟领导谈加薪？这3点你做不好，再多口舌也没用！哈默老师
在职场中，每个人都希望自己能够涨薪水，早点升职，挣更多的钱。一般来说，涨工资这件事情都掌握在领导手里，只要领导愿意给你提薪，你的工资肯定低不了，节节高升没问题。但是，对于领导来说，一方面他们事情很多，有时候意识不到要给你涨工资；另一方面，如果你不主动提的话，他们也可能会装傻，毕竟这与他实际利益并没有很大联系，领导们总是想着多一事不如少一事。那么，员工就必须要懂得为自己争取权益。当你觉得自己的工资，
系统架构师软考历年论文题目（2009-2024年）及分析 pccai-vip 系统架构师系统架构
时间题目20091.论基于DSSA的软件架构设计与应用；2.论信息系统建模方法；3.论基于REST服务的Web应用系统设计；4.论软件可靠性设计与应用20101.论软件的静态演化和动态演化及其应用；2.论数据挖掘技术的应用；3.论大规模分布式系统缓存设计策略；4.论软件可靠性评价20111.论模型驱动架构在系统开发中的应用；2.论企业集成平台的架构设计；3.论企业架构管理与应用；4.论软件需求获取
大数据新视界 --大数据大厂之数据挖掘入门：用 R 语言开启数据宝藏的探索之旅青云交大数据新视界数据库大数据数据挖掘 R 语言算法案例未来趋势应用场景学习建议大数据新视界
亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客，正是这样一个温暖美好的所在。在这里，你们不仅能够收获既富有趣味又极为实用的内容知识，还可以毫无拘束地畅所欲言，尽情分享自己独特的见解。我真诚地期待着你们的到来，愿我们能在这片小小的天地里共同成长，共同进步。本博客的精华专栏：Ja
郭德纲金牌搭档"于谦"谈"动物园"之事，品人生，道人性的观点一米街西
说起于谦，众所周知他是德云社里的金牌相声演员，郭德纲的"黄金搭档"。人们曾评价，没有于谦，就没有郭德纲。因为有了于谦，郭德纲的相声更加的有声有色。人们还知道于谦有三大兴趣爱好"抽烟、喝酒、烫头"。但极少人知道他还有另外一个称号"玩儿家"。他对"玩"带有极高的敬意，并且态度认真。面对"玩"，于谦拥有一个占地60亩的私人动物园，园内有马场，还有50多匹珍贵的马，几千条条锦鲤，更有猴、鹿、狗、鸽子，猫等
ASM系列四利用Method 组件动态注入方法逻辑 lijingyao8206 字节码技术 jvm AOP 动态代理 ASM
这篇继续结合例子来深入了解下Method组件动态变更方法字节码的实现。通过前面一篇，知道ClassVisitor 的visitMethod()方法可以返回一个MethodVisitor的实例。那么我们也基本可以知道，同ClassVisitor改变类成员一样，MethodVIsistor如果需要改变方法成员，注入逻辑，也可以
java编程思想 --内部类百合不是茶 java 内部类匿名内部类
内部类;了解外部类并能与之通信内部类写出来的代码更加整洁与优雅 1,内部类的创建内部类是创建在类中的 package com.wj.InsideClass; /* * 内部类的创建 */ public class CreateInsideClass { public CreateInsideClass(
web.xml报错 crabdave web.xml
web.xml报错 The content of element type "web-app" must match "(icon?,display- name?,description?,distributable?,context-param*,filter*,filter-mapping*,listener*,servlet*,s
泛型类的自定义麦田的设计者 java android 泛型
为什么要定义泛型类，当类中要操作的引用数据类型不确定的时候。采用泛型类，完成扩展。例如有一个学生类 Student{ Student(){ System.out.println("I'm a student....."); } } 有一个老师类
CSS清除浮动的4中方法 IT独行者 JavaScript UI css
清除浮动这个问题，做前端的应该再熟悉不过了，咱是个新人，所以还是记个笔记，做个积累，努力学习向大神靠近。CSS清除浮动的方法网上一搜，大概有N多种，用过几种，说下个人感受。 1、结尾处加空div标签 clear:both 1 2 3 4 .div 1 { background : #000080 ; border : 1px s
Cygwin使用windows的jdk 配置方法 _wy_ jdk windows cygwin
1.[vim /etc/profile] JAVA_HOME="/cgydrive/d/Java/jdk1.6.0_43" (windows下jdk路径为D:\Java\jdk1.6.0_43) PATH="$JAVA_HOME/bin:${PATH}" CLAS
linux下安装maven 无量 maven linux 安装
Linux下安装maven(转) 1.首先到Maven官网下载安装文件，目前最新版本为3.0.3，下载文件为 apache-maven-3.0.3-bin.tar.gz，下载可以使用wget命令； 2.进入下载文件夹，找到下载的文件，运行如下命令解压 tar -xvf apache-maven-2.2.1-bin.tar.gz 解压后的文件夹
tomcat的https 配置,syslog-ng配置 aichenglong tomcat http跳转到https syslong-ng配置 syslog配置
1) tomcat配置https,以及http自动跳转到https的配置 1)TOMCAT_HOME目录下生成密钥(keytool是jdk中的命令) keytool -genkey -alias tomcat -keyalg RSA -keypass changeit -storepass changeit
关于领号活动总结 alafqq 活动
关于某彩票活动的总结具体需求，每个用户进活动页面，领取一个号码，1000中的一个；活动要求 1，随机性，一定要有随机性； 2，最少中奖概率，如果注数为3200注，则最多中4注 3，效率问题，（不能每个人来都产生一个随机数，这样效率不高）； 4，支持断电（仍然从下一个开始），重启服务；（存数据库有点大材小用，因此不能存放在数据库）解决方案 1，事先产生随机数1000个，并打
java数据结构冒泡排序的遍历与排序百合不是茶 java
java的冒泡排序是一种简单的排序规则冒泡排序的原理：比较两个相邻的数，首先将最大的排在第一个，第二次比较第二个，此后一样；针对所有的元素重复以上的步骤，除了最后一个例题；将int array[]
JS检查输入框输入的是否是数字的一种校验方法 bijian1013 js
如下是JS检查输入框输入的是否是数字的一种校验方法： <form method=post target="_blank"> 数字：<input type="text" name=num onkeypress="checkNum(this.form)"><br> </form>
Test注解的两个属性：expected和timeout bijian1013 java JUnit expected timeout
JUnit4：Test文档中的解释：　　The Test annotation supports two optional parameters. 　　The first, expected, declares that a test method should throw an exception. 　　If it doesn't throw an exception or if it
[Gson二]继承关系的POJO的反序列化 bit1129 POJO
父类 package inheritance.test2; import java.util.Map; public class Model { private String field1; private String field2; private Map<String, String> infoMap
【Spark八十四】Spark零碎知识点记录 bit1129 spark
1. ShuffleMapTask的shuffle数据在什么地方记录到MapOutputTracker中的 ShuffleMapTask的runTask方法负责写数据到shuffle map文件中。当任务执行完成成功，DAGScheduler会收到通知，在DAGScheduler的handleTaskCompletion方法中完成记录到MapOutputTracker中
WAS各种脚本作用大全 ronin47 WAS 脚本
　　　http://www.ibm.com/developerworks/cn/websphere/library/samples/SampleScripts.html 　　　无意中，在WAS官网上发现的各种脚本作用，感觉很有作用，先与各位分享一下　　　获取下载这些示例 jacl 和 Jython 脚本可用于在 WebSphere Application Server 的不同版本中自
java-12.求 1+2+3+..n不能使用乘除法、 for 、 while 、 if 、 else 、 switch 、 case 等关键字以及条件判断语句 bylijinnan switch
借鉴网上的思路，用java实现： public class NoIfWhile { /** * @param args * * find x=1+2+3+....n */ public static void main(String[] args) { int n=10; int re=find(n); System.o
Netty源码学习-ObjectEncoder和ObjectDecoder bylijinnan java netty
Netty中传递对象的思路很直观： Netty中数据的传递是基于ChannelBuffer（也就是byte[]）；那把对象序列化为字节流，就可以在Netty中传递对象了相应的从ChannelBuffer恢复对象，就是反序列化的过程 Netty已经封装好ObjectEncoder和ObjectDecoder 先看ObjectEncoder ObjectEncoder是往外发送
spring 定时任务中cronExpression表达式含义 chicony cronExpression
一个cron表达式有6个必选的元素和一个可选的元素，各个元素之间是以空格分隔的，从左至右，这些元素的含义如下表所示：代表含义是否必须允许的取值范围 &nb
Nutz配置Jndi ctrain JNDI
1、使用JNDI获取指定资源： var ioc = { dao : { type :"org.nutz.dao.impl.NutDao", args : [ {jndi :"jdbc/dataSource"} ] } } 以上方法,仅需要在容器中配置好数据源,注入到NutDao即可.
解决 /bin/sh^M: bad interpreter: No such file or directory daizj shell
在Linux中执行.sh脚本，异常/bin/sh^M: bad interpreter: No such file or directory。分析：这是不同系统编码格式引起的：在windows系统中编辑的.sh文件可能有不可见字符，所以在Linux系统下执行会报以上异常信息。解决： 1）在windows下转换：利用一些编辑器如UltraEdit或EditPlus等工具
[转]for 循环为何可恨？ dcj3sjt126com 程序员读书
Java的闭包(Closure)特征最近成为了一个热门话题。一些精英正在起草一份议案，要在Java将来的版本中加入闭包特征。然而，提议中的闭包语法以及语言上的这种扩充受到了众多Java程序员的猛烈抨击。不久前，出版过数十本编程书籍的大作家Elliotte Rusty Harold发表了对Java中闭包的价值的质疑。尤其是他问道“for 循环为何可恨？”[http://ju
Android实用小技巧 dcj3sjt126com android
1、去掉所有Activity界面的标题栏　　修改AndroidManifest.xml 　　在application 标签中添加android:theme="@android:style/Theme.NoTitleBar" 2、去掉所有Activity界面的TitleBar 和StatusBar 　　修改AndroidManifes
Oracle 复习笔记之序列 eksliang Oracle 序列 sequence Oracle sequence
转载请出自出处：http://eksliang.iteye.com/blog/2098859 1.序列的作用序列是用于生成唯一、连续序号的对象一般用序列来充当数据库表的主键值 2.创建序列语法如下： create sequence s_emp start with 1 --开始值 increment by 1 --増长值 maxval
有“品”的程序员 gongmeitao 工作
完美程序员的10种品质　　完美程序员的每种品质都有一个范围，这个范围取决于具体的问题和背景。没有能解决所有问题的完美程序员（至少在我们这个星球上），并且对于特定问题，完美程序员应该具有以下品质：　　1. 才智非凡- 能够理解问题、能够用清晰可读的代码翻译并表达想法、善于分析并且逻辑思维能力强（范围：用简单方式解决复杂问题）　　
使用KeleyiSQLHelper类进行分页查询 hvt sql .net C#asp.net hovertree
本文适用于sql server单主键表或者视图进行分页查询，支持多字段排序。KeleyiSQLHelper类的最新代码请到http://hovertree.codeplex.com/SourceControl/latest下载整个解决方案源代码查看。或者直接在线查看类的代码：http://hovertree.codeplex.com/SourceControl/latest#HoverTree.D
SVG 教程（三）圆形，椭圆，直线天梯梦 svg
SVG <circle> SVG 圆形 - <circle> <circle> 标签可用来创建一个圆：下面是SVG代码： <svg xmlns="http://www.w3.org/2000/svg" version="1.1"> <circle cx="100" c
链表栈 luyulong java 数据结构
public class Node { private Object object; private Node next; public Node() { this.next = null; this.object = null; } public Object getObject() { return object; } public
基础数据结构和算法十：2-3 search tree sunwinner Algorithm 2-3 search tree
Binary search tree works well for a wide variety of applications, but they have poor worst-case performance. Now we introduce a type of binary search tree where costs are guaranteed to be loga
spring配置定时任务 stunizhengjia spring timer
最近因工作的需要，用到了spring的定时任务的功能,觉得spring还是很智能化的,只需要配置一下配置文件就可以了,在此记录一下，以便以后用到： //------------------------定时任务调用的方法------------------------------ /** * 存储过程定时器 */ publi
ITeye 8月技术图书有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的8月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 8月试读活动回顾： http://webmaster.iteye.com/blog/2102830 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《跨终端Web》 gleams：http

深入浅出谈数据挖掘zz

你可能感兴趣的:(深入浅出谈数据挖掘zz)