数仓中的口径及常用口径

最近去面试,被面试官问到,你们的数仓搭建过程中的口径是什么?当时一脸懵逼,不知道如何回答,这是什么鬼?后来阅读了几篇博文,哦~~~原来口径指的就是你的取数逻辑,也就是你们的一套规则,口径是统计学中的一种叫法,比如要研究某一地区中白富美的对某类化妆品的消费情况,那么所研究的这一指标就是口径的衡量值,人家问你口径是什么,其实问的是你的取数逻辑,把这套逻辑告诉人家就好了嘛~
那就来撸一撸常用的指标口径吧:
1、新增用户:简单说,即之前在数据库中没有信息的(包括账户名、设备id我们一般取设备id),新增加的用户,这部分用户的得出可以使用原表left join新增表,结果为null的即为新增用户。
2、活跃用户:一段时间内打开该产品的用户,比如今天打开的用户,就是今天的活跃用户,周活就是这周内至少打开过一次该产品的,依次类推…但注意,活跃用户不会被重复计算,是去重了之后的用户,如果该用户在这段时间内打开了5次,只能算作一次。
3、用户新鲜度:即新增用户数占活跃用户的比率。
4、留存/留存率:留存即该用户为新增用户,一段时间后,该用户依然在登录使用我们的产品。统计该指标可以延伸出次日留存、七日留存、30日留存…
5、流失用户数:该部分用户新增后,新增当天还在登录,在我们规定的时间范围内,该部分再也没有登录了,我们就把他们定义成流失用户。

你可能感兴趣的:(数仓面试小细节)