在传统行业做数据

来相宜本草也是一个月了,回到了传统行业做数据,感觉还是不一样的。

第一家公司在德邦物流,在这儿,我完成了一次职业转型,上大学的时候以至于出入职场,都是做Java开发,一开始的目标也是成为一名高级Java开发工程师,可是Java的路也就走了半年,公司有一个BI项目,需要借调很多人去支援,我成为了其中的一员,当时都不知道啥是BI,我能去干啥,听说都是新技术,公司里也没人会,想着应该挺有意思的,大家都一样,都从头开始。
德邦算一家传统公司了,物流行业嘛,但是德邦的IT架构并不想传统行业,公司里所有的系统都是自己研发的,IT团队当时就三四百人,和IBM、麦肯锡之类的咨询公司合作。所以印象中,传统行业会和德邦差不多,重视流程,规章制度比较完善,各种考核,各种认证,企业文化。

后面工作的几年都是互联网公司,当时离开德邦的时候,想着也是去互联网公司看看,感受一下氛围,在互联网公司的这几年也算是完成了当年的愿望,现在想想,到底怎样呢?这个问题有点儿大,容我想想,接着来说这篇的主题吧。

兜兜转转几年,上个月,我又回到了传统行业,化妆品行业,一家上海本土的化妆品行业,相宜本草。想想挺有意思,转了一圈又回来了,冥冥之中自由天定吧。

相宜本草的信息化建设,步子跟的还是很紧的,在12年的时候,就上了BIEE,后面还有什么Qlikview,前两年还上了Tableau,移动BI,节奏是对的,但是路线有点儿问题。从我一个做数据的角度来说,有几个问题:

  • 数据混乱
    说白了,没有人从公司的角度去做数据治理,做数据架构,相宜每次上BI相关的项目,都搞了一个数仓,我看下起码有3套,数据放在这,没有人知道这个表有没有人在用,谁在用,用来干嘛,表的处理逻辑,也就是存储过程或者ETL任务在哪儿,任务什么时候调度,上下游是什么,所有的问题,都没有人清楚。这可能和公司这方面人员的流失有关,没有留下相关文档有关;也和这些实施的供应商捞了一笔钱就撤,不关心项目后期的使用有关;最终要的还是公司没有人真正的在乎关心这件事情,这也是和互联网公司最大的不同吧,数据这么有价值的资产,就这样处在混沌之中,太可惜了。

  • 业务架构
    业务系统是数据平台的上游,业务架构的好坏,直接影响了数据的质量,以相宜来说,有ERP,有OA,有费控,有DMS,还有通过接口拉取的数据,还有通过文件推送解析的数据,还有爬虫抓取的数据,数据来源的确挺复杂,也是零售行业的一个特点。而现在,公司里没有一个人知道各个系统之间怎样进行交互,有多少个接口,每台机器上都部署了什么,哪些机器直接有交互......

其实,有点儿惨不忍睹,来之前我是真没想到IT现状是这样的,挑战真的太大了。

下面说说,我上个月的工作。

刚入职的时候,我看到了那些交接文档,看到了那些说是数仓的表,这一看,真是呵呵了,这也是数仓吗?留下的只有一个Excel页的表名,这些奇葩的命名,看上去好像有点儿关系的表,看完了发现并没有关系。光有表不行啊,你得告诉我这个表的处理逻辑,或者ETL任务在哪儿啊,没有!数仓架构是什么,哪些是最底层的表?没有,不知道。
刚入职那一周,我是懵的,我都怀疑人生了,还不如啥都不给我,让我从零开始呢。这几天,我是一点儿一点儿摸索,有个同事还算了解一些表是干啥的,黑夜中,仿佛有了一点点光亮。
好在,最近的工作都是和相宜荟有关,相宜荟嘛,就是我们的一个小程序,算是电商平台,它的数据是目前最清晰的,最全的,有用户,有销售,有用户行为,最近就直接在MySQL上写SQL了,传说中留下的那些数仓表,我是没有用到,也不敢用,都不知道去哪儿改。
所以说,最近都是在原系统取数,处在原始时代。
目前主要任务是出一个相宜荟的分析报告,和领导过了一次,正在优化中。我也不想从零开始在搞一个数仓了,公司计划搞数据中台,已经在选厂商了,我想着就在中台项目中,把数据梳理下吧,自己搞一个也得废弃掉,没什么价值,先将就着吧。

你可能感兴趣的:(在传统行业做数据)