数据科学家杨滔揭秘阿里内部数据运用

在国内的互联网企业中,阿里巴巴算是对数据非常重视的一个。作为电商巨头,依靠淘宝和支付宝平台,本身就可以获得大量数据,此外还通过收购(友盟、高德等),来丰富数据来源。

 

那么,这些数据具体是如何为企业运营服务,帮助业务部门提高收益的。或许可以从阿里巴巴数据科学家杨滔所分享的三个实际案例,来做些了解。

 

下面是杨滔分享的部分内容摘录:

 

我们团队的使命,第一个是以大数据为原材料,以机器学习和数据挖掘技术为工具,提升阿里巴巴业务部门的KPI;第二个让这种数据创造价值的过程规模化、可复制化、通用化、产品化,最终形成产品,以大数据为核心,以算法为核心。第三个是应用实践过程中,研发核心算法和模型。

 

三个实际的案例,第一个是消费者超级数据集,第二个是淘宝网微市场,第三个是聚划算商品销售预测系统。

 

1、超级数据集

 

就是对消费者本职信息的提炼,通过你的购物记录,支付宝的记录等,提炼出来你的性别、年龄,所在地的级别(是在城里还是乡里,是在几级乡,几级城市),是在沿海还是内陆,还有南方和北方,是不是结婚了,是不是有孩子了,还有反映你的消费力,通过支付宝的转账,社交关系和身份职业,这些信息都是从大量非机构数据化提炼出来的。

 

比如说,我们通过支付宝和淘宝的数据,发现淘宝网有近两千万的大学生。而大学生的标签是本身数据中没有的,我们通过用户收货地址挖掘出来的,把大学职工和在职人员排除在外。

 

还有是不是有孩子,是大孩还是小孩,你买母婴,孩子的用品,甚至汽车的用品,对于我们预测你有没有孩子是非常有帮助的。

 

2、淘宝网的微市场

 

我们把用户分到一个不同的群体,在这个群体中再找到淘宝网达人买家,用达人买家所喜欢的商品来给用户做推送,提升用户个性化的体验。

可能你是一个大学生,可能你是一个都市的美少女,可能你是一个小城的贵妇,你是不同的群体就有不同的商品需求。

 

首先我们给用户分成了很多群,这个群就是用到刚才所谓的消费者超级数据集,再根据用户的购物行为做动态的分组,比如说一个贵妇也喜欢买便宜的东西,一个不是有钱的大学生也可能买奢侈品,不同的行业里面和不同类目里面,根据消费者的行为做购物的动态分析。

 

第三个是我们的专利,达人推荐,找到你所在的群体中比较活跃,善于发现淘宝商品的达人,用达人来给你做推荐。

 

如果你是一个潜在的,比较追求高品质商品的人,和你相似的达人,都是买一些有品质商品的人,他们所喜欢的商品可能你都没有见过,但是能拔高你的需求,而不是重复你的需求。

在女装微市场我们测试了六个群体,如果你在我们六个群体中,你不会知道,但是你默认看到的东西和别人看到的东西是不一样的。这六个群体是用到了分群和达人推荐,各项指标提升得都非常明显。

 

其中成交转换化,客单价和UV价值平均提升20%以上。其中“贵妇群”支付宝交易额UV价值提升60%以上,贵妇群以前在淘宝很难找到适合她的商品,淘宝更照顾便宜和性价比高的人群,我们找到达人买家,直接提升类目的KPI。

 

3、聚划算商品预测系统

 

聚划算中筛选商品是关键的一环,大家都想上,但我们只选少量的商品。

 

做这个项目之前我们了解了业务的实际需求,聚划算的运营人员,每人平均每天要审200个商品,没有数据的支持拍脑袋是非常辛苦的,而且没有一定的标准。

 

我们是提升选品效率,增加爆款量,根据聚划算、淘宝的属性,卖家的属性,品牌属性,自动让工作人员筛选高销售的商品和卖家。

 

我们把完全用机器审核和完全用人审核做了一个对比,具体的数字不方便透露,最后的指标看平均一个坑位的销售额,人审核和机器审核,提高了人工平均单产是64%,在人必须审核的时候减轻人的运营成本和操作压力。

我们做这一套销售预测系统不仅有算法的创新,解决聚划算的实际问题,对于未来淘宝网精细化的运营,包销,机器自动审核频道,招商,如何从海量的卖家中去找到最合适这个平台的卖家,还有合理的定价和库存管理,就是一个基础的工具。

你可能感兴趣的:(算法)