以内部视角来观察10个数据分析的成功案例
以下是首席信息官如何成功利用数据分析和机器学习来实现业务目标的成功案例。
如果把数据看成是一种新的石油,那么知道如何将其提炼成可操作的情报则是释放其潜力的关键。为此,首席信息官们正在利用预测分析、精心设计的机器学习算法和久经考验的分析解决方案来追求提升业务效率和服务客户的新方法。
首席信息官们意识到,降低成本或增加收入可以帮助他们在高管层和董事会眼中熠熠生辉,因此他们在支持数据科学的技术上投入的资金比以往任何时候都多。
根据市场研究公司IDC的数据,今年全球大数据和商业分析软件的收入将超过1660亿美元,比2017年增长11.7%。此外,能够与新兴分析技术合作的人才争夺战也正处于白热化的状态。
一些首席信息官已经找到了提振上下游增长的方法,他们研究了最近分享的数据,从中吸取了教训,并为从事类似工作的同行提供了建议。
石油公司壳牌通过分析数据以预测机器故障
很少有行业能比能源行业产生更多的数据了。但多年来,石油巨头壳牌甚至不知道其在世界各地的各种设施中的零件都位于哪里;它不知道什么时候需要再进货;直到部件开始出现故障,它才知道什么时候出现了维护问题。由于机器停机每天给公司造成了数百万美元的损失,于是壳牌决定收集数据以避免这些问题。
壳牌卓越数据科学中心的总经理Daniel Jeavons表示,壳牌基于多家供应商的软件建立了一个分析平台,运行预测模型,以预测3000多种不同的石油钻井机的部件何时会出现故障。
其中一个名为Databricks的工具通过Apache Spark来捕获流数据。壳牌使用这个工具来更好地计划什么时候购买机器部件,保存多长时间,以及在哪里存放库存物品。
该工具托管在微软Azure的云中,帮助壳牌将库存分析从超过48小时减少到不到45分钟,每年减少数百万美元的库存转移和重新分配成本。
经验总结:避免机器故障需要很多工具。Jeavons表示,壳牌的平台包括了来自Databricks、Alteryx、C3、SAP和其他供应商的软件,所有的这些软件共同帮助了他的数据科学家来产生商业见解。最终,首席信息官必须正确评估这些工具,并在进行大额购买之前了解哪些才是有效的。
ARC启用了新的数据管理工具
数据是航空报告公司( ARC )的生命线,该公司每年结算航空公司之间价值超过880亿美元的机票交易,包括德尔塔航空公司、美国航空公司、英国航空公司、阿拉斯加航空公司以及Expedia等旅行社。航空公司付费获取ARC在这些交易中收集的数据,以了解更多的关于旅行者的目的地、旅行时间以及在此过程中每年为超过22亿次航班支付的费用的信息。
ARC捕获数据,将其输入分析引擎,对其进行细化,并为其客户构建定制的报告。ARC 的CIO Dickie Oliver表示,该公司正从Teradata的数据仓库迁移到Snowflake的云软件中,这将帮助ARC更快地将数据产品推向市场,并提供更大的可伸缩性和性能,这得益于其在AWS上的业务。Oliver表示,Snowflake是为了将计算资源与数据存储分开而设计的,它使ARC能够为客户快速构建新的定制报告。Oliver补充说,多亏了这个项目,ARC将能够为考虑新数据形式的客户量身定制新的产品。
经验总结:迁移到一个新的数据平台通常是令人畏惧的,不仅仅是因为技术的转变;变更管理是其中真正的麻烦所在。Oliver说,让人们“从一开始就专注于改变,并让他们经历改变过程是这个过程中最具挑战性的部分”,他补充说,他正全力培训员工,包括让他们通过认证,并引进顾问,如让Slalom来帮助我们进行变更管理。
TD银行在数据湖方面的天赋
TD银行的数据分析团队花了几年时间来更新数据基础设施,以满足当前和未来的需求,并创建了一个企业Hadoop数据湖。
TD银行企业信息高级副总裁Joe DosSantos表示,我们使用了基于Cloudera的数据湖用来培养对客户的洞察力,包括从跟踪员工的流失率,到为客户提供合适的产品。
TD 银行的一个核心关注点包括让业务分析师能够从数据湖中提取数据,可用且可操作的能力,而无需数据科学家来亲自操控。 DosSantos表示:“我们正在让人们广泛使用这些数据集。”他补充道,TD Bank还尝试使用其分析平台来检测欺诈和其他渎职行为。
经验总结:过去几年来,TD Bank一直在重新构想其企业数据平台,筛选数十年来的客户交易和其他数据。TD银行没有过度依赖Hadoop,而是使用了Talend的软件来提取、转换原始数据并将其加载到可用于可操作商业智能的信息中。
DosSantos解释道:“Hadoop对于理解如何从A点到B点获取数据方面并不是很好。而Talend有一个元数据管理器和一个中央存储库来跟踪数据湖中的数据移动和转换。”
嘉吉公司正为虾农提供数据分析
嘉吉公司(Cargill)的动物营养部门开发了一款名为iQuatic的移动数据跟踪应用,帮助养虾人降低产量的死亡率。
嘉吉动物营养公司的CIO Tiffany说,该应用程序能够基于环境因素(如温度、pH值和营养)来预测虾池中的生物量,并与嘉吉公司的iQuatic自动喂虾系统协同工作。Snyder在8月的CIO 100研讨会上介绍了iQuatic系统。
只要农民将应用程序中的数据保存到云中,然后访问实时的操作仪表盘,便能够直观显示池塘的性能,提供关键的测量和预测分析,帮助他们更好地管理虾健康并提高产量。以前,农民是用传统的方式——用笔和纸来收集的这些数据。
经验总结:为了构建这个应用程序,嘉吉公司派遣了工程师和企业高管去厄瓜多尔的一个养虾场,了解农民是如何从池塘中获取数据的。“我们让农民成为了我们团队的一部分,”Snyder说。通过在敏捷、two-pizza的团队中快速工作,为在5个月内成功进行试点铺平了道路,并最终实现了产品发布。
让数据分析在默克公司发挥作用
全球医疗保健公司默克希望利用在ERP和核心系统中收集到的数据来进行生产执行和库存控制,以获得更多的商业见解。但是,由于它的工程师花费了60%到80%的精力去寻找、访问和获取每个项目的数据,以至于许多商业目标没有得到实现。默克公司的IT制造首席信息官Michelle D’alessandro表示:“我们没有把数据视为一种可行的、永久的、有价值的资产。我们希望建立一种文化,在这种文化中,我们可以尽量在移动和报告数据上少花时间,从而将更多的时间花在使用数据来实现有意义的业务成果上。”
默克公司创建了MANTIS(制造和分析智能)系统,这是一个über数据仓库系统,包括了内存数据库和开源工具,可以处理在结构化和非结构化系统中的数据,包括文本、视频和社交媒体。重要的是,该系统能够允许非技术业务分析师在可视化的软件中轻松的查看数据。而数据科学家可以通过复杂的模拟和建模工具访问信息。MANTIS系统已经使公司整体IT分析项目总业务量的时间和成本降低了45%。有形的业务成果包括平均提前期减少了30%,平均库存持有成本减少了50%。
经验总结:D’Alessandro表示,她成功的关键是在亚太地区的一家工厂中设立了一个“标杆”分析项目,默克将在那里获得最大的回报。而在那里展示了MANTIS的成功之后,它就为其他网站树立了榜样。她还学会了如何步步为营。D ‘Alessandro说,她在一个早期的实验中使用了人工智能和机器学习来分析默克制造过程的成本,但她“做得过头了”。她说:“这并不是因为缺乏赞助或缺乏远见,我们只是无法让它发挥作用。”
胡椒博士集团通过机器学习来进行语境相关性研究
多年来,胡椒博士集团(Dr. Pepper Snapple Group)的销售员工通常会拿着一个装满客户数据、销售记录和促销信息的大活页夹,然后开始着手争取沃尔玛(Wal-Mart)和塔吉特(Target)等客户。如今,销售人员都配备了ipad,它会告诉他们需要访问哪些商店,能够提供什么,以及其他的关键指标。胡椒博士集团的首席信息官Tom Farrah表示:“他们是光荣的接单员。现在,他们正在成为智能销售人员,手中掌握着帮助其实现目标的信息。”
该平台名为MyDPS,配备了机器学习和其他分析工具,当员工加载应用程序时,这些工具就可以提供推荐,并向他们提供每日的运营记分卡。算法将向员工展示他们将如何执行预期的计划,包括他们是否按计划完成计划,以及如果没有按计划完成,该如何纠正。“如果我想让一个人成功,我就必须确保他们所拥有得信息是与工作内容相关的,”Farrah说。
经验总结:为了测试MyDPS的概念证明,Farra将软件交给了一家分公司的四个人,并让业务总裁去拜访他们。他们透露,在使用了MyDPS之后,执行销售自上个月以来已经提高了50%,这一结果让总裁批准了该项目。“他看到了结果,这就是销售所需要的,这不仅仅是为了项目的商业赞助,也是为了得到预期的结果,这一点非常重要。”Farrah说。
柏克德通过卓越的大数据中心颠覆了自己
柏克德(Bechtel)公司的首席信息官Carol Zierhoffer说,与建筑相关的支出占到了GDP的13%,但在过去20年里,该行业的生产率只增长了1%。但专家表示,通过重新安排合同、提高工人技能、改善现场执行以及其他的一些调整措施,该行业可以将生产率提高50%至60%。于是,建造了胡佛水坝、英吉利海峡隧道和其他奇迹工程的柏克德尔公司,开始从埋藏在商业各个领域的数据中挖掘灵感。
Zierhoffer建立了一个卓越的大数据中心,其中有一个包含5 P数据的数据湖,并开始了概念验证。该公司使用了照片识别技术来代表客户检查和标注网站照片,以此节省了200万美元。还使用了自然语言处理(NLP)工具来解析索赔、提案请求和合同。在过去需要几天或几周的估计和计划现在只需要几个小时。柏克德还扩展了分析工作,以考察员工的留任情况,包括试图预测员工可能的离职时间。Zierhoffer说:“我们相信我们正在敲开生产力挑战的大门。”。
经验总结:数据仓库和质量是关键。虽然柏克德可以分析大量数据,但必须提高整个企业的数据质量。“我们不得不颠覆自己,了解自己是如何工作的,并将所以数据都连接起来。”
借助机器学习,RRD走向了新的业务之路
几年前,营销传播公司RRD成立了一个物流部门,向消费者和企业运送印刷材料。为了支持这项业务,RRD自己管理货物,并代表其合作伙伴运送从洗衣机到狗食的任何东西,最终发展成为了一个价值10亿美元的企业。需要面临的挑战?那就是在这个联邦快递和UPS是无可争议的王者的世界里,找到一个最优的运费。
天气、地理、司机和政治气候等变量都可能使其业务损失惨重。RRD的CIO Ken O ‘Brien说,由于迫切需要对费率变量进行预测,RRD转向了机器学习和分析。它雇佣员工和大学来帮助编写算法,测试700条路线上的数千个场景,直到能够实时预测运费——甚至提前七天以99%的准确率来预测运费。 O’Brien表示:“这个项目在不到一年的时间里就收回了成本,而且我们仍然看到与货运相关的业务在持续增长。”
经验总结:新企业需要高水平的投入,尽管O ‘Brien承认他的一些商业伙伴已经准备好了在不同的阶段放弃。他们不信任这项技术,因为这一过程通常是凭感觉和猜测完成的。但RRD建立了一个协作环境,在这个环境中,业务部门和IT部门能够共同努力来影响结果。“你可能会绊倒,也会有挑战,但你要有耐心,”O’Brien说。
孟山都利用机器学习来优化种植
农民们总是在苦苦思索该种哪种种子,种多少,以及在哪里和在什么时候。种子巨头孟山都(Monsanto)也是如此,它利用数据科学,通过利用数学和统计模型,绘制出最佳的时间线来种植雄性和雌性植物,以及在哪里种植,从而为种植者提供指导性的建议。孟山都全球IT分析主管Adrian Cartier表示,该公司的机器学习算法能够在几天内,而不是几周或几个月的时间,就能处理超过900亿个数据点。这能带来多少商业利益?2016年,孟山都节省了600万美元,减少了4%的供应链足迹。Cartier说:“在北美,4%的土地利用率的下降就意味着很多土地没有被使用,这将节省大量资金。”
经验总结:孟山都成功的关键是在它和供应链业务之间建立了一种“从摇篮到坟墓”的合作方式。他们具有农业和供应链角度的专业知识,而我们具有数学和统计领域的专业知识,两者结合起来,就创造了我们能够提供的价值,Cartier说他还找到了“改变领导人和支持者”在供应链中角色的方法来抵消反对者的数量,以此形成一种健康的平衡。
对于Pitt Ohio来说,预测分析带来了成功
Pitt Ohio的首席信息官Scott Sullivan表示,货运行业正受到“亚马逊效应”的猛烈冲击。价值7亿美元的货运公司Pitt Ohio已经习惯了在第二天提货并将货物交付给客户。但是多亏了亚马逊,顾客越来越期待能够当天交货。他们期待着更多关于他们包裹的信息。
Sullivan说:“客户现在不仅想知道什么时候可以拿到,还想知道将如何拿到,这样他们就可以规划自己的工作。”。通过使用历史数据、预测分析和算法实时计算各种货物的重量、行驶距离和其他因素,Pitt Ohio可以以99%的准确率估算出司机到达目的地的时间。该公司估计,他们由此可以通过老客户的订单增加收入(估计每年5万美元),并减少客户流失的风险(估计每年6万美元)。
经验总结:Sullivan说,这是一个涉及市场研究、销售运营和IT的跨部门事务,所有人都必须反复检查结果,以确保自己实现了目标。Sullivan说:“在你的企业内部中其实有很多的数据——你需要创新,并寻找具有挑战性的方法来使用它们。”