源头数据采集与智能设备投资


源头数据是企业大数据应用的基础,也是所有数据分析和挖掘工作的基础。没有原始数据,所有的大数据都找不到依据。很多企业之所以不知道“大数据在哪里呢”,就是因为没有构建原始数据集,没有数据的积累。没有数据,如何进入大数据时代?这个问题就像“没有播种,哪里来的收获”这么简单。


原始数据不会自动产生,需要企业有意识地采集。很多企业对外公开的大数据是这些公司多年奋斗的成果。现在最出名的几家互联网公司都拥有大数据,他们已经为此奋斗了很多年。当我们看到这些公司的大数据的时候,可能只看到了别人的成功,而没有看到这些拥有大数据的公司最初艰苦的奋斗和过程中的艰难变革。


如果一个企业希望在大数据时代有所作为,能够拥有自己的大数据,并能够利用大数据做出一些改变,使公司能够获得突破性发展,这个想法是好的,但“立马拥有大数据”的想法是不切实际的。如果今天不开始,明天你还是两手空空。所以,了解源头数据的采集方法以及积累和管理的方法至关重要。如果企业没有大量的数据可以使用,那么最好的决策不是马上拥有数据,而是蹲下身去开始行动——积累数据。

1.1 静态数据采集与信息的全面性保障

数据是事物发生和发展的数字化记录,那么所有的数据都必须有一个主体——事物。要想了解事物,就需要有专业的方法来描述事物及与事物相关的活动。对事物本身的描述可称做静态数据,对事物的活动记录可称做动态数据。


你不可能描述了一个行为,而不知道这个行为的主体是谁。对主体的描述构成了企业的大数据集。


对主体的描述是静态数据,放到企业大数据层面,数据的主体就是企业的各种资源,包括企业内部拥有的资源和与企业相关但不被企业所拥有的资源。这些资源的全面性直接影响着企业大数据的全面性,而对这些资源静态描述的全面性,则体现着数据的全面性。


对企业资源的梳理可以使用顺藤摸瓜的方法来进行,以保证所有的资源或者相关资源的信息都得到采集,保证源头数据的全面性。


先从企业内部资源开始梳理,企业内部员工方面有高层、中层、基层、顾问等;财方面有存款、应付账款、应收账款、预收款等;物方面有固定资产、生产资料、办公用品、劳保用品等;比较难梳理的是公司信息方面的资源,包括公司的制度、信息系统、战略规划、年度计划等。这些人、财、物和信息方面的资源需要进行静态的描述,从而形成企业资源的静态数据。


企业内部的资源比较容易梳理,而且数据也比较容易采集,无论是手工采集数据还是设备自动化采集数据,都比较容易实现。而对外部资源的梳理,则往往会碰到一个问题,就是想要的数据得不到。梳理外部资源的时候,常使用“接触点”进行梳理,比如,销售部门会接触到:

(1)渠道客户,(2)消费者,(3)竞争对手,(4)竞争对手的产品等。采购部门会接触到:(1)供应商,(2)采购代理商,(3)海关(进出口),(4)潜在供应商,(5)物流公司,(6)质检或者安检(货物运输过程中的检查)等。人力资源部门会接触到:(1)猎头公司,(2)社保机构,(3)保险机构,(4)招聘网站,(5)大学或者各种技校培训机构,(6)潜在人才对象,(7)人才市场等。


数据的采集方法不同,数据库的结构不同,存在形式也会不同,企业需要构建合理的数据架构和数据库来完成对数据的采集和存储。比如对员工的信息的管理可以使用OA系统来完成;对财务数据的管理可以使用财务软件来完成;对物的管理可以使用公司的ERP系统来管理;对制度流程的管理可以使用公司的KM(知识管理)系统来管理等。这些系统之间要通过一定的方式实现数据的连接,最好是一个系统能够整合所有这些资源信息,即一个软件包涵了OA模块、ERP模块、财务模块、KM模块等。目前已有的产品大多数难以满足以上所有的要求,这就导致了后期需要定制开发软件的功能,以实现各个模块之间的对接和相互访问。有些供应商提供的系统比较开放,为其他程序的访问提供了数据接口,而有的系统则没有,后期系统对接的时候,需要从底层数据库的角度实现对接。当然,如果公司实力足够,可以通过开放整合所有的信息来完成数据的相互关联。

1.2 要素数据与属性数据的定义思路

对资源进行静态描述的时候,需要考虑两方面的内容:资源的构成要素和资源的属性。比如“人”这个资源,无论是内部的人—员工,还是外部的人—供应商、客户、渠道商、合作方等,这些“人”都需要具备一些常规的属性,但是不同的人也有不同的属性。比如内部的员工,可以从姓名、性别、民族、出生日期、籍贯、身高、体重、血型、入职日期、学历信息、婚姻状况等角度对其进行描述;而对供应商的描述则应该主要描述与供应商相关的信息。


要素是资源本身的组成部分。比如对产品的描述,需要包含产品包装、产品价格,甚至还要包括产品的BOM(BalanceofMaterials——产品生产配方)。


企业资源的要素数据和属性数据是不断丰富的,随着数据采集手段和方法的进步,以及管理流程的不断规范,企业会采集到更多的数据信息。比如,企业一般难以采集到供应商销售人员的个人信息,但在与之洽谈的过程中,可以了解到这部分的信息,这个时候如果企业将这些数据录入系统,则意味着企业有更多更丰富的供应商销售人员的信息,这样有利于企业在跟供应商谈判的过程中更好地把控谈判过程。如果通过这些数据信息了解到,该销售人员还需要一个大订单来完成年底的销售目标,而此时的这个订单是他手中唯一有可能帮助其完成销售目标的订单,则企业可以在谈判中利用这个信息来争取谈到最好的销售条件。


企业对数据的采集也会随着企业管理的精细化和数据使用经验的增加而增加。初期可能因为不知道某些信息是否有用,就没有采集相关的信息,但当需要的时候就需要采取各种手段来弥补,这是非常正常的情况。当然,如果企业在初期采集的时候,能够将能采集到的数据都采集下来是最好的。因为随着企业对数据需求的增加,过后再弥补的做法是非常麻烦的,甚至会影响工作的进程,如果有足够的历史数据可供挖掘和分析,会减少很多不必要的工作。

1.3 动态数据描述与数据采集即时性

动态数据是记录资源活动的数据,一般意义上讲,所有的动态数据都具有以下几个特征。


1、动态数据都有固定的行为主体,即数据主体。

动态数据记录着资源的活动,该资源就是数据主体。销售订单数据记录着公司同客户之间的交易活动,公司即作为这个动态数据的主体。当然,这一数据也可以拆分成不同业务部门的订单数据,这个时候业务部门就是这个动态数据的行为主体。

员工上下班打卡数据是动态数据集,记录的是员工的上下班行为活动;绩效考核数据记录的是员工业绩输出数据,主体是员工;采购订单数据是公司主体与供应商客体之间的交易活动。


2、动态数据都是重复的数据,即动态数据具有重复性。

动态数据一般意义上都是具有重复性的活动记录,某一行为在时间轴上是重复发生的。完成销售订单产生一条数据记录;每给一名员工发一次工资,就会产生一条数据记录;员工上班每次打卡就会产生一条数据记录。这些记录是重复的,随着时间而逐步累加。

动态数据与静态数据的更新有本质的区别。动态数据的更新是叠加数据,而静态数据的更新是替换原有的数据。


3、动态数据都有时效性,需要即时采集。

一般情况下动态数据都是在资源转换活动发生时记录的数据。数据具有时效性,如果过后补充数据就容易造成数据的失真。即时发生、即时记录是动态数据的基本要求。

每个公司的操作流程都不同,有的公司可以实现即时记录,有的公司在制定工作流程的时候没有考虑到对数据的采集,需要在工作完成后进行事后的补记录,后者往往在数据的准确性、即时性上差很多。特别是当实际操作与BOM或者公司的工作流程要求有着巨大区别的时候,员工就有可能凭借记忆来记录各种数据,而不是按照实际操作来记录,这种情况下,就很容易导致原材料浪费、生产时间浪费等问题,但这些问题无法通过数据发现。


静态数据比较强调数据记录的完整性,而动态数据更加强调数据记录的时效性。

1.4 智能设备的发展与未来

随着科技的发展,智能设备越来越普及,也越来越便宜。一个几百元的普通智能手机就能够拥有十几种智能数据采集的传感器,图像识别、声音识别、远程录像等功能已经非常普遍。


智能穿戴设备也在快速发展,包括智能手环、智能手表、智能鞋子等智能穿戴设备已经上市,它们能够随时采集人体的各种信息,包括体温、血压、脉率等。


随着智能设备的普及,数据采集可以越来越自动化和智能化。一个普通的行车记录仪可以在车行进的时候开启,在车静止的时候停止,当静止车辆受到外界干扰可以自动记录当时的画面,如果车辆没有受到干扰或者记录的图像30秒内没有变化,那么这段数据会自动消除,从而节省存储空间,也为后期的查询提供了方便,减少了数据记录的数量,这也算是一种智能化的数据记录,虽然实现起来技术难度不大。


数据采集的智能化是一个趋势,因为人工采集的数据会受数据采集人员的责任心、个人喜好、工作认真程度等影响,数据的准确性不高,即时性也难以保障。智能化采集则不会有这样的问题,只要保持智能采集设备的正常运转,数据就会源源不断地被采集、存储和应用。


智能化数据采集也是未来实现智能生产,包括工业4.0以及中国制造2025目标的基础。智能化数据采集为智能化管理提供了基础的数据源,并通过自动化控制来实现智能生产,这是未来的发展趋势,在这方面投资能够帮助企业更早地实现智能化生产—尤其是对生产制造企业来说。

1.5 智能设备投资回报核算方法

智能设备自动采集数据是很有好处的,但对智能设备的投资是企业需要承担的。企业需要根据自身的需求以及对数据精确度、及时性等方面的要求,并考量数据本身的价值决定是否投资采购智能数据采集设备。在智能化数据采集方面的投资,企业一定要采取循序渐进的方式进行,一次性投资过大,也往往会因为数据结构规划不完善、数据间的关联未能有效设计等,从而导致所采集的数据成为数据孤岛,无法同其他的数据进行关联,导致所获得的价值无法达到预期。


当然,谨慎的投资并不代表不可以一次性投资。在其他企业试点完成之后,企业可根据标杆企业的实施情况以及自身实际情况综合考虑是否可以一次性投资。一次性实施可以带来标准的统一,而不用考虑设备版本号不同、软件版本不同带来的对接问题。通过充足的准备,事前做好精准的设计,在资金允许的情况下一次上线通过,也不是不可以的。


对智能设备投资的回报率的核算是一个难题。设备的成本和维护费用比较容易核算,但投资后的收益却是非常难以计算的。


对数据的价值评估目前还没有权威的方法和模型。企业实践中的评估也会因为高层管理理念的不同而有所不同,有些企业高层更加关注现在的价值,而有些企业的高层更加关注数据未来的价值。比如员工上下班指纹打卡设备,如果仅仅把数据拿来考核员工是否准时上班和下班的话,那么这个设备的实际价值不大。如果该设备采集到的数据跟企业的人力资源行为模型的数据高度融合,则在分析具有什么样的行为习惯的员工在什么岗位上将表现非常优秀,那么这个打卡数据可以作为基础数据之一,其价值就非常高。对智能门禁设备的投资评估,如果只是将门禁当做各个办公室的安全保障措施,那么这个设备价值就非常低了。但是如果将门禁的数据作为员工行为数据的一部分,用来分析各个员工的行为,从而了解员工绩效与行为的关系,那么这个设备就产生了更高的价值。

因此,对智能设备的价值评估跟企业要采集的数据以及数据的用途有密切的关联。数据被使用越多,价值越高,设备的投资回报必然就高。因此,在投资一套智能设备之前要考虑好数据的实际使用目的。但现实情况是,很多企业在数据使用上由于缺乏经验,导致实际采集到的数据并没有像想象中那样发挥出价值,初期的投资预期过高,导致后期的失望,这会影响后续对智能设备投资的信心。所以,企业在投资智能设备的时候,最好能够统筹规划,引进数据专业分析团队,共同谋划投资,保证投资产出效率和回报率。


全文摘自《企业数据化管理变革-数据治理与统筹方案》赵兴峰著

该文转载已取得作者认可

版权说明:版权所有归明悦数据所有,如需转载请联系我们,我们将在第一时间处理,或请注明内容出处(《企业数据化管理变革》赵兴峰著),非常感谢!【往期内容已在(明悦数据)公众号同步发布】

下期内容更实战!


你可能感兴趣的:(源头数据采集与智能设备投资)