一切事物都在遵照其规律和因果关系运转着,只是我们所知有限,现在大数据技术可以让我们窥得一二,让我们掌握规律、预防问题,让事情向正确的方向发展。
大数据只是一种处理信息的方法,人们一直在使用,并非什么新鲜事物。
两个故事
1906年夏天,纽约的银行家华伦带着全家去长岛消夏,雇佣玛丽做厨师。8月底,华伦的夫人、两个女儿、两个女佣、园丁相继感染。他找到了一名伤寒病专家,这名专家查找了过去7年美国的伤寒暴发案例,发现每个案例中都有一名叫玛丽的女人,最终确认玛丽是伤寒杆菌的超级传播者。
第一个故事从大量同类事件中发现共同因素,是人工进行的大数据收集和分析。
80年代初期,有一家生产磁带机和驱动系统的公司,他们的客户在执行一个6小时的打印任务时一个驱动器总是会停止工作,导致所有工作必须重来。公司技术人员尝试了各种方法都无法解决问题,他们请来一个专家。这个专家要了一把椅子和一杯咖啡,坐在了计算机房,在系统又发生三次崩溃以后,他发现当一个值班人员走过某块地板时崩溃就会发生,这块地板变形了,当值班人员踩过时会产生静电并造成电磁干扰,破坏的RAM的工作,操作系统也就崩溃了,更换地板后,问题就这样解决了。
从第二个故事中可以看到,一些问题的根源隐藏在人们难以想象的地方,必须把导致问题的直接原因和间接原因全部分析到才行,这正是用计算机进行大数据分析的优势,毕竟请专家或培养专家的成本太高。
大在哪儿?
在大数据分析之前,有没有小数据分析呢?有,基于少量的经验和数据进行判断,就是小数据分析。比如有个视频,一个俄罗斯小男孩错把洋葱当成苹果,但嘴硬不承认,含着泪也要把它啃完,这就是小数据分析的应用。
大数据的“大”到底体现在哪儿?一是数据量大,二是涉及的数据源多,三是数据之间的依赖和因果关系复杂。上帝知晓一切,但我们不是上帝,只有尽可能的记录各种数据、分析数据之间关系。
秀才不出门,能知天下事,是因为秀才学习了历史大数据,掌握了世代兴替的规律,能够通过分析周围的环境而判断天下走势,见微知著。
各行业的疑难问题经常要找专家汇诊,因为专家的大脑中保存着大量的案例,多个专家合并这些经验,就能够做出当前最好的判断,提出最好的解决方案。
企业在进行投资之前要做市场调研和分析,也是大数据分析,分析市场需求、商品受众、产品推出时机和方式、经济趋势、政策环境等。
国家的发展也是要做大数据分析,在制订政策之前,对政治、经济、军事、外交的现状和趋势进行分析,这些研究可以委托专业公司和院所进行。
大数据技术的出现是自然而然的,人类社会本就是一个相互协作的有机体,随着合作的加深和信息技术的发展,必然从各自为政走向充分协同,从数据孤岛走向数据共享,从局部数据处理走向全局数据处理。
图像识别
图像分析是利用人工智能对图像内容进行识别,这种识别主要是代替人的判断,比如识别车牌号、车辆类型、车辆装载的货物、车辆品牌、人脸与身份、人的性别、人的年龄、人的行为(打架、聚集、跌倒、横穿马路、登高、着装、有无戴安全帽等)、火情、读表、各种物品识别等。
这种图像的识别主要是代替人的操作。
如果把识别范围扩展到非可见光频率,如红外线、X线束、γ射线,可以进行热源检测、断层扫描,发现人眼不可见的事物和特征。
轨迹回溯
根据摄像头、道闸、门禁、消费记录、手机位置等信息,对人员、车辆的行进路线进行回溯。
在以往缺少信息技术时比较难以实现,比如以前对一些案件的分析,需要进行大量的走访,而取得的信息还不全,存在很多空白。
这种分析在城市、乡村管理和企业内部管理上都可以应用,主要应用于安全方面。
行为预测
比如预测购物行为,分析人们购买的物品之间的关联,有些人买了某样商品后,很大可能性去买另一种商品,发现这些规律后,商家(线下或线上)可以对用户进行定向推送。在所有服务中都可以使用这种技术。
一个超市通过数据分析发现,如果一个男人买了奶粉,往往会再买啤酒,所以就把这两样商品放在一起,果然促进了销售。还有一个例子,一个男人周五帮老婆买妇女用品,结果销售人员分析了他的需求,成功推销给他一副钓鱼杆,还有一艘船。
这种分析可以应用在设备管理上,统计设备运行周期的各个阶段出现的故障类型及频率;设备运行参数出现的哪些异常是导致问题的前兆等等。
因果分析
通过大数据可以分析问题可能的原因,从而可以提前防范。
比如医生分析某种疾病的产生的原因,这个原因可能和病人的年龄、地域、职业、性格、性别、习惯、家庭环境、基因等都有关系。
结果可以得出喜欢吃槟榔的人容易得口腔疾病;抽烟的人容易得肺病;熬夜的人容易猝死;肥胖的人三高;空气污染严重的地方呼吸道疾病比较多等等。
这种大数据分析应用的方面非常多,比如统计婚姻问题与职业、收入、出生年代、性格、认识方式、交往时间之间存在的因果关系等。
突变预警
当一件经常发生的事不正常时,往往意味着出现了问题。
有很多类似的案例:有一个经常和保安打招呼的冷冻厂工作人员,有一天下班时没有保安打招呼,保安发现不正常去查找,发现这名工作人员被关在冷冻室。一个老师发现有一个学生没来上课,也没请假,马上到他家里去,发现一家人煤气中毒。
企业可以进行这种分析,比如某项物资采购的价格突变、某种维修活动增加、项目执行周期变长、设备故障数量突变、某部门人员变动增加、某部门安全事件发生数量异常等,有时候变多和变少都有可能不正常,需要进行分析。
国家可以进行这种分析,比如某种原材料价格突涨、某地公司大量注销或注册、某种资源出口大增、某地用电量突变、资金异常聚集等。
应急协调
大数据不仅是涉及数据的釆集、传输、存储、加工、分析,还可以参与控制,我们可以把基于大数据的系统看做一个大脑。
比如一个区域出现火情,发现火情的可能是对摄像头画面的AI分析、烟感探头、热感应传感器、温度传感器,通过智能多感知多模式判断或远程人工确认后,触发告警;通过推送视频画面,发送短信,在监控屏幕跳出窗口,拨打电话的方式通知消防、安保、应急、救护人员,特别是最近区域的安保人员;通过判断火情所处位置,在一定区域内触发声光报警、停止电梯、打开门禁,通过广播告知受影响区域人员撤离。
设计规划
根据选定的分析模式、基于大数据可以进行设计规划。
可以基于大数据可以对需求进行反复模拟,从中找出最佳方案。比如城市交通的规划,通过分析城市布局,住宅、商场、工作场所的分布,计算人和车的流向、流量,设计出最佳道路规划、公交的线路和站点的位置。
合理判断
有些现象一直存在,但人们并没有意识到它有什么不对;或发现了问题,却不清楚原因,因为没有数据支持。
企业管理主要是管人、财、物等资源和事务流程,目标是充分、高效利用资源。
企业可以对内部流程进行分析,如果发现某个角色存在于大量的流程当中,这可能是职责分配不当;某些流程非常长,有的则异常短,这可能是没有优化或完善;某些部门经常与其它部门产生冲突,这可能是流程梳理不清。
企业对人和设备的管理目标是一致的,要让人处于最好的工作状态。
可以对职员个人发展进行分析,分析每个职员个人发展情况与标准化发展模型的差异,与个人业绩之间的关系,与领域、部门、专业、学历、社会关系之间的关系,与工作状态之间的关系。还可以分析企业职员个人发展健康状况与企业总体经营业绩之间的关系等等。
可以对人员工作分配进行分析,根据一个人的年龄、家庭状况、身体状况、系统运维经验、项目管理经验、当前职务职级,来安排对应的工作。对团队的组建也是这样,要有梯队建设,“分槽养马,同槽喂猪”,像组装设备一样合理搭配。
国家和地方政府也可以进行合理性分析,通过常握的各种经济数据,可以分析产生链的完整性;技术上存在哪些关键的依赖,在依赖链上有什么重要环节需要突破;某个地域产业的缺点和优势;地方人才与产业之间的关系;同类型地域发展与本地的异同,有无可借鉴之处;周边环境中存在的机遇等等。