为什么要埋点?埋点如同装在智能机器人身上的传感器,在机器人研发过程中,技术人员将内传感器和电机、轴、手臂、手腕等关键部位安装在一起,实时监控机器人的位置、速度、力度的测量,判断机器人的稳定性与风险,最终实现伺服控制。
传感器是机器人的埋点,网站与APP也需要如此埋点。昨天小编发了《埋点最大误区:忽略业务需求》一文,介绍企业在追求精益化数据分析的路上,应如何科学选择埋点方式。本文针对埋点另外两大误区,进行剖析:埋点与数据采集、数据分析的关系?如何规避埋点混乱?
误区一:重分析,轻采集!
在追求精益管理的道路上,大多企业深知数据驱动是第一生产力。然而,在企业搭建数据分析平台,或选型第三方数据分析平台时,经常会陷入“重分析,轻采集”的误区。
数据分析是实现数据驱动的前提,固然重要。而数据分析的深度取决于数据采集的质量,顾此失彼,数据驱动道路只能越走越窄。神策数据创始人&CEO桑文锋多次强调,数据采集应该遵循“大”、“全”、“细”、“实”四字法则。
“大”强调宏观的“大”,而非物理的“大”。大数据不是一味追求数据量的“大”,比如每天各地级市的苹果价格数据统计只有2MB,但基于此研发出一款苹果智能调度系统,就是一个大数据应用;
“全”强调多种数据源。大数据采集讲求全量,而不是抽样。除了采集客户端数据,还需采集服务端日志、业务数据库,以及第三方服务等数据,全面覆盖。
“细”强调多维度数据采集,即把事件的维度、属性、字段等都进行采集。如电商行业“加入购物车”的事件,除了采集用户的click数据,还应采集用户点击的是哪个商品、对应的商户等数据,方便后续交叉分析。
“时”强调数据的时效性。显然,具有时效性的数据才有参考价值。
总之,埋点混乱、采集无序则根基不稳,令数据驱动的实现如“空中楼阁”。只有将数据采集和建模等基础搭建好,数据驱动才能真正落地。
误区2:夯实数据基础,无埋点优越于代码埋点?
数据基础夯实与否,取决于数据的采集方式。埋点方式多种多样,按照埋点位置不同,可以分为前端(客户端)埋点与后端(服务器端)埋点。其中无埋点是目前较为流行的前端埋点方式之一。
“无埋点”概念已烂大街,而在实际进行事件设计与实施的过程中,技术人员有道不尽的爱恨情仇:一方面,无埋点神秘无比,甚至被誉为“最全、最便捷、界面友好、技术门槛低”的数据采集方式;另一方面,运营人员又发出“为何所采数据与业务数据库数值相差这么大?”等各种抱怨。简言之,无埋点采用“全部采集,按需选取”的形式,对页面中所有交互元素的用户行为进行采集,通过界面配置来决定哪些数据需要进行分析,实质与“全埋点”并无无实质差异。
图 无埋点的优劣势分析
为解释颇具迷惑性的无埋点概念,笔者总结了其优势与劣势,优势包括:
1.可视化展示界面最基本度量,满足基本数据分析需求。无埋点可视化展现界面PV、UV等网站或APP分析的最基本度量,告诉运营人员每个控件被点击的概率是多大,哪些控件值得做更进一步的分析等。如此有助于企业了解用户行为,为进一步数据分析指明方向。
2.技术门槛低,使用与部署较简单。无埋点极大程度避免了因需求变更、埋点错误等原因导致的重新埋点繁复工作。
3.用户友好性强。运营人员可以直接应用手指或者鼠标进行操作,自动向服务器发送数据,避免手工埋点的失误。
然而,作为前端埋点的方式之一,无埋点有先天缺陷,带来易用性的同时,也牺牲部分数据的采集深度。无埋点的劣势如下:
1.无埋点只能采集到用户交互数据,且适合标准化的采集,自定义属性的采集需要代码埋点来辅助。
每个用户的交互行为均有许多属性,无埋点无法深入到更细、更深的粒度。例如在电商行业中,用户点击“购物车”是一次交互行为,无埋点会忽略掉用户信息、商品品类等其它维度信息,此时需要配合代码埋点来辅助数据采集;再如用户上滑屏幕时,内容瀑布流的底部载入、商品或广告的加载展示、下拉菜单中下拉内容的数据点击等情况,这类自定义行为的采集需要代码埋点辅助实现采集。
由于无埋点仅适合标准的方案采集,一些数据分析平台也开始支持用户为每个event添加自定义属性,如此能大大扩展事件分析的效能。值得一提的是,神策数据为用户提供的自定义属性无数量限制。
2.无埋点兼容性有限。
例如在安卓系统进行埋点时,不同工程师可能会给APP界面中相同的button起不同名称的ID,当运营人员想筛选出所需数据时,不同名称会给运营人员带来困扰。另外,由于目前第三方框架较多,如RN框架,容易造成无埋点兼容性问题。
3.无埋点具有前端埋点的固有缺陷。
无埋点是前端数据采集方式之一,因此具有前端埋点的天然缺陷,如数据采集不全面、传输时效性较差、数据可靠性无法保障等问题。无埋点的技术原理依赖网站或者APP后端技术开发的严谨性与规范性、网络状态、网络口径等因素。
总之,数据采集方式决定所采集到用户行为数据的深度和粒度。夯实数据基础,无埋点需要配合前端代码埋点实现,而前端数据采集的固有劣势,应该结合后端埋点完成。数据采集不准、不全、不细容易让后续数据分析工作陷入“巧妇难为无米之炊”的困境。
综上所属,笔者做出如下总结:
1、数据驱动是第一生产力,数据采集非“大全细实”,数据驱动如“空中楼阁”;
2、大数据时代≠无埋点时代。“无埋点”顶多个是个“万金油”,功能很多,应急抹一抹,想治病还是难。