关于数据挖掘的几点思考(二)

3. The Ongoing Relationship ,The Ongoing Data mining

在提到社会化营销中说品牌商和消费者之间的关系应该是ongoing的,那么在做消费者洞察的data mining也应该是ongoing的,是一个不断learning改进的循环。

关于数据挖掘的几点思考(二)_第1张图片

光看这个图片有点抽象结合我们做过的具体项目而言,① 定义挖掘目的:通过社会化网络的数据挖掘,找到潜在的消费者社区,并了解他们 ② 通过数据挖掘得到Actionable Insight: 找到品牌商在的消费者;该人群的兴趣图谱,品牌图谱语言地图的描绘;该人群关系图谱的呈现;③ 将信息转变为行动:制定营销内容策略,与重点影响者进行engagement;④ 效果监测衡量:在活动结束后一个月内,我们又对此次活动的传播影响力进行衡量,又通过线上访谈的方式对获得了参与活动本人和周围人对于活动的反馈。

原来公司的业务一直都特别多的涉及到④的效果监测衡量的部分。但后来发现效果监测的部分也会产生非常有价值的数据,例如我们后来在做项目评估的时候,得到了很多消费者的反馈内容,里面包括消费者觉得活动能够改进的具体措施。如果这些信息能够在活动刚推进不久就快速得到,那么品牌商就可以根据消费者的反馈信息及时调整措施,更好提高活动效果。另外,我们也可以得到参与活动消费者和没有参与活动消费者的数据,了解什么样的消费者响应度更高,了解消费者使用社交媒体,主动分享品牌信息的特点,从而为下一步更好的定义新的数据挖掘的目的提供更多的指导。

总结来说,就是通过对效果的衡量将会为未来做出更明智的决定提供信息。通过学习,数据挖掘将连接过去与未来的行动。品牌商与消费者之间的关系是ongoing的,那么通过数据挖掘的方式,了解消费者与品牌之间的互动信息数据也应该是一个ongoing,learning process。

4.技术相关应用的一点思考

① 时代的开端,仍然需要很多人工经验的积累

通常我们说数据挖掘,会说让计算机完成其最擅长的工作:从许许多多的数据中挖掘,让人们完成人们最擅长的工作:提出问题并且理解结果。但在做具体的项目中发现不能仅仅太依靠machine learning就能得到我们结果,人的智慧在现阶段积累的经验将会为未来越来越自动化的machine learning提供基础。

例如在做表达数据的处理中,我们会遇到词语的分词识别问题,针对于对于不同的数据、项目目标,我们匹配的词语数据库就会有所差异。在数据去水的过程中,我们也会慢慢积攒起去水词语相关的数据内容。并且这些数据库也不是不变的,而是处于不断的修正更新的状态。

公司里的博士哥哥经常讲,现在人们才刚刚揭开数字时代的一个面纱,在进入一个新的时代里,在新时代的初端还是需要很多人工的智慧的积累,久而久之这种积累就可以变成自动化和机器更智能的一部分。后来我也会去思考,目前人们就像是工业革命一开始利用着水电,靠着水动力推动纺织机器的一个个河边的作坊,但正因为这样一代代人的经验累积才让后来大规模流水线作业成为可能。

② 对算法一些基本原理的掌握

也许这点感触仅仅是对于我这种菜鸟级别在做数据分析过程中碰壁,走过弯路后一个很深的体会。虽然我们不需要懂得算法里面每一行代码是怎样的,但还是要了解算法的基本原理,同样的算法在处理不同的数据带来的信息就会不同。

例如现在自然语言处理的分词就有好几种算法,但是目前使用的算法大部分都是统计 商品配对,这样分词技术带来的消费者表达信息洞察和对商品电商昵称处理上就会带来截然不同的信息。商品昵称的分词结果会因为昵称数据结构的多样出现很大偏差,所以商品的分词结果仅仅只能当做一个信息引导来看,而不能绝对的看成商品多少的比较。现在聚类算法也很多,但结合具体的数据结构和分析目标公司还是开发了适应于项目目标的算法。

此次分享就先写到这里了,很多detail的细节就不一一说明了,希望和大家更多的交流,也希望感兴趣的筒子们可以加入我们~

你可能感兴趣的:(关于数据挖掘的几点思考(二))