kmeans算法经典案例C语言,kmeans聚类算法以及使用案例

1、psm价格敏感度分析对应的是不同的用户对于价格的敏感度,分析的角度是从消费者的角度的。体现的是客户和消费者的直接关系,没有考虑到其他的竞争者的因素的出现的。

PSM模型比较适合用于网游中的道具或服务的定价: 适用范围是是没有任何竞争者的下面的,消费者对于产品的价格的敏感程度的。

下面是项目中的kmeans的实际操作的流程的信息。

kmeans的训练和预测部分

需要注意的是kmeans的训练和预测对应的是需要不同的数据的。并且训练和预测一般的是分开执行操作的,对应的数据源也是不一样的。

kmeans其主要目的是将n个样本点划分为k个簇,使得相似的样本尽量被分到同一个聚簇。

K-Means的一个重要的假设是:数据之间的相似度可以使用欧氏距离度量,如果不能使用欧氏距离度量,要先把数据转换到能用欧氏距离度量,这一点很重要。使用距离表明两个点是否处于同样的一个类别之下的。

哲学思想:距离相近的人总是拥有相同的特质的。相同的类别之内总是可以找到共同的特点的。

psm价格敏感度分析的实质是建立kmeans的族信息和tag的类别数据之间的关联关系。实现的是大量的数据到离散数据的聚类操作。将数据划分为不同的类别从而与现实业务中的各种类别进行匹配操作从而得到及预测的结果信息。

kmeans的优缺点以及适用的场景分析:

1.需要实现确定k,也就是中心点的个数的。需要确定对应的族的类别的总数的。这个类别一般的是需要和业务的类别保持一致或者是包含业务类别的,这个很不理想。

2.计算的是距离,数据中存在异常点或者偏差的时候,中心点会向着异常点移动,造成异常的。没有事先进行数据的处理操作和降噪处理的。

3.数据分布凸形的数据的,不能处理凹形或者是更多的其他形状的数据的。

4.聚簇中心初始化,收敛到局部最优,未考虑密度分布等等。没有考虑到更多的数据的密度等的数据精确性的问题的,处理的问题比较的简单的。

现在使用的较为简单的kmeans算法存在精度太低的问题的,不能够完整的反应出来数据本身的异常的。需要采用更加准确的聚类算法和更加优秀的评价指标来评价数据的相似性的。

下面是使用kmeans的两个类型的区分操作信息:

1.RFM:客户消费行为评分模型

对应的从三个维度对客户进行打标签操作的,而不是从整体上执行操作的。

对应的维度数据是这样的,下面是对应的维度数据分析操作。

最近一次消费-Recency:近期购买的客户倾向于再度购买。对应的指标是R

消费频率-Frequency:经常购买的客户再次购买概率高,对应的指标是F

消费金额-Monetary:消费金额较多的客户再次消费可能性更大,对应的指标是M

需要从这三个维度给客户加上标签信息的:

RFM分析应用为客户分组,即将三个指标分别分为“高”和“低”两种,高于均值的为“高”,低于均值的为“低”。因此有三件事要做:计算出各个指标得分的平均值;将各个变量高于平均分的定义为“高”,低于平均分的定义为“低”;根据三个变量“高”“低”的组合来定义客户类型;如“高”“高”“高”为高价值客户。

#  RMF模型数据的使用:针对下面的标签可以采取不同的处理措施来进行处理操作的。

RMF维度数据的划分操作

2.PSM价格敏感度分析操作:针对的是客户对于价格的接受程度执行分析的。进行的是单一维度的kmeans操作分析的。

你可能感兴趣的:(kmeans算法经典案例C语言)