腾讯高级数据分析师采访2

之前推荐了第 1 篇腾讯高级数据分析师的采访,可以点击查看:

我采访了一位腾讯高级数据分析师

今天推荐第二位来自腾讯天美的数据分析师。

唐松——腾讯天美数据分析师

第二期邀请的嘉宾是唐松,我个人最看好的一名数据分析师

唐松来腾讯之前,从事过数据解决方案的咨询工作,然后去美国进修了数据科学的研究生课程,进入腾讯后,快速成长,在直播行业和游戏运营有丰富经验。他开发的潜力主播挖掘模型,为运营创造了巨大价值,他同时也是python爬虫畅销书的作者(著有《Python网络爬虫从入门到实践 第2版》)。我从他身上看到敬业、拼搏、热爱、好学的优点,以及对理想的执着。

某种意义上,邀请他做这次访谈,是我这个前浪向这位后浪的致敬,我在他这个年纪,达不到这种高度。我内心深处,期待更多后浪数据分析师涌现,超越我们这些前浪,放大数据的力量。

腾讯高级数据分析师采访2_第1张图片

▲唐松的自我介绍PPT

01

为何选择做数据分析师?

1、你为何选择数据分析师这个职业?

唐松:发现和探索未知是底层的原因,通过分析数据,可以得到很多原来未知的结论。还记得大学本科时代,当时帮香港的一家餐饮集团做数据分析项目,发现吃猪扒饭的食客很喜欢点可乐,这个小发现帮助了业务上的改进,当时的快乐和满足感一直无法忘记。

于是,本科找工作也是做了数据咨询,之后去了美国读数据科学的研究生,再然后来到腾讯做数据挖掘的模型,也是围绕着从数据中发现和探索,不断地输出自己的价值,为业务增长做出贡献来做。

2、你觉得美国的数据科学教育和中国的有什么不同?

唐松:我没有在国内学过数据科学,仅谈谈我在美国学习的感受。

在美国学数据,有一种被服务的感觉。教授会把机器学习的知识掰开揉碎了讲,学起来不费功夫。就算机器学习上课听不懂,课后也有21个左右的TA可以提问,平均下来每天3个,覆盖了早中晚,简直就是全方位的服务;还有一个类似论坛的线上平台,同学们可以随时提问,教授和TA一般会在1小时内回答。

此外,教授的上课会更讲究“道”。每一个算法,上课都会讲原理,总结出使用场景和优缺点;下课要用python从0实现一遍算法,然后在一个场景应用。这样撸一遍之后,基础会非常扎实。这也是我为什么当时面试腾讯,能拿到“技术大咖”的原因,问一个机器学习算法都能把公式背下来。

第三,学习的过程是双向的。上课的过程不只是老师在上面讲课,同学也可以随时提问。几乎每个老师都会把课程的参与列入最终成绩,会时不时提很多问题,激发同学的思考。回答没有对错,只有回答的勇气,以及是否对该问题有充分的思考。

3、你python学得很好,你认为学好python,最关键是什么?

唐松:Python的学习在我的书里也有分享,其实很简单:手输代码,反复练习。我们学Python的目的是为了解决问题,那么可以针对自己感兴趣的点,用Python去实现去钻研。很多同学和我说,我们从不生产代码,我们只是代码的搬运工。这点在学习的初期非常错误,如果你只是复制粘贴的话,给你一张白纸,你会什么代码都写不出。

4、什么原因促使你写了python爬虫的书?

唐松:缘分。因为给港中文的学生上课,讲Python爬虫,所以我在知乎更新了Python爬虫文章;因为我在知乎更新了Python爬虫教程,所以有编辑找上了我;因为我当时正好有空,所以我有时间把整个知识进行系统的输出,所以这是意想不到的缘分。

腾讯高级数据分析师采访2_第2张图片

▲唐松的书

02

数据分析师应该指导团队打仗

5、你觉得什么人适合从事数据分析工作?

唐松:热爱数据分析的人。虽然听上去这句话是废话,但其实却是最真实的。没有适合不适合,只有热爱不热爱。如果你怀着热爱,你就会发动自己一切有限的技能去分析数据,并且坚持下去。对数据分析的爱终将发光,让你的数据分析技能就不断生长,最后人们会说,哇,你真的是一个数据分析天才。

6、你觉得优秀的数据分析师应该具备什么素质和技能?

唐松:要求的能力需要很全面,我这里应用我之前的老师,LinkedIn前数据总监的模型,Ask Measure Learn简单列一下。

(1)Ask,就是提出问题。真正的厉害的数据分析师,应该是团队的指挥官,用数据和思考指导团队打仗的:面对着复杂的业务场景,能进行深度思考,问出其中关键性的问题。相比之下,一般的数据分析师,能够将业务提的需求,转化成数据问题,用数据的角度来尝试解答,而不是一上来就瞎跑数。

(2)Measure,就是处理数据的过程。为了解决问题,一个优秀的数据分析师,必须有18般武艺,包括了写Python和SQL等代码的能力,包括了建模能力,统计概率知识,可视化等等。除了以上的硬实力,还有一点非常重要:逻辑推理能力,不能凭自己的感觉和猜想一步就跳到结论,整个过程必须要论据充分,论证严谨,需要具有经得起挑战的逻辑推导到结论。

(3)Learn,就是分析的结论如何?下一步该怎么做?一般来说,我们分析三类问题:

    1. 是什么?对产品的现状或者活动的好坏下定义

    2. 为什么?归因分析,找出好或者不好的原因

    3. 怎么做?下一步该怎么改进

这里我有8字箴言:“战战兢兢,如履薄冰”,因为对于数据分析报告中的每个字,对于团队而言就是一锤定音,每个字都要斟酌。一个优秀的数据分析师,需要抱着中立的态度,能够用简洁准确的话语,用准确形象的数据可视化来传递信息。

腾讯高级数据分析师采访2_第3张图片

7、在数据分析工作中,你最不愿意干的活是哪些?

唐松:最不愿意做的是纯跑数,比如说帮我看一下xxx数据,却不告诉我为啥要看。这样感觉自己只是个没感情的机器,新时代的搬砖小工,不停转磨的那头驴。

8、在数据分析工作中,哪些让你觉得最有成就感?

唐松:最初我的感觉是自己数据分析的结果,最终能推动业务落地,带来价值,成就感就非常高了。在我慢慢转型业务的过程中,我慢慢觉得,我和业务是一体的,产品的收入上涨,活跃留存变好,我也非常有成就感。我觉得这个更像是一种增长的思维。

9、你觉得数据科学未来的趋势会是怎样?

唐松:data science这个词太大了,包含的内容很多,自认为还没到能够谈对未来趋势的水平。只是谈谈我自己对数据分析的看法。

(1)生产力整合和提升是未来的趋势。数据中台概念的提出,就是在于过去粗放式发展抢夺蓝海市场已经遇到瓶颈,必须深耕细作,才能将亩产不断提高。

(2)数据会被更多地放到业务的全局去看。就像目前大火的增长黑客一样,其实是从整个产品的大局出发,透过数据分析等多种方法找到增长点,既不忽视数据分析的作用,也不轻视商业思维产品思维的价值。

10、你觉得增长黑客的方法与传统的增长方法,有什么不同?

唐松:通过我自己在数据中台和运营团队的经验,我觉得主要的差异点有三个:

(1)增长黑客的方法强调AB Test

增长黑客的方法,非常强调决策的判断要通过科学而严谨的方法来进行测试,正向收益的行为和决策才会真正放到线上来实现;一般运营团队的方法是通过数据分析+强大的产品思维来判断,或者先上线,看数据再调整,再看数据再调整,但一般缺乏严谨的因果论证,另外也不够敏捷。

(2)增长黑客的方法强调性价比

增长黑客的方法强调行为的性价比,会将目标进行拆解,通过增长等式来量化收益,发现其中性价比最高的机会,团队之间也会围绕这目标一起努力。传统的增长方法,虽然都是会看KPI(也就是北极星指标)做事,但是一般缺少了对每个行为的绝对量化,一般是自我感觉或者老板来决定了做事的优先级,例如花费大量人力的事情去做新增,但是可能产品已经在成熟期,新增对DAU影响很小;或者花费大量时间拉付费渗透,其实对收入影响不大。

(3)增长黑客的方法强调团队的协作性

增长黑客强调了团队之前的协作性,统一向一个目标前进。传统的方法,各个团队的KPI可能是不一样的,例如数据分析可能会用数据分析报告的数量作为KPI,开发用bug率和完成量等作为KPI,市场用拉新作为KPI,活跃运营负责活跃,商业化运营负责收入。但是,增长团队是把大家的利益捆绑在一起,围绕北极星指标一起努力,作为一个团队努力。

腾讯高级数据分析师采访2_第4张图片▲增长黑客的含义

03

数据分析师的“蘑菇理论”

11、你觉得,最理想的数据分析团队,应该是怎样的?

唐松:数据团队往往被认为是业务的支撑角色,给业务写SQL提供报表服务的。但是理想的数据分析团队,绝不是完全的支撑部门,应该有自己的理想,去引领和驱动业务的前进。只有这样,每一个成员才有一定的使命感和成就感,才是有战斗力,有创造力的团队

想要让数据分析团队变得有价值,就必须站在半个产品/运营负责人的角度,用产品的语言和思维进行沟通,不仅仅去理解业务,而是和业务站在一起。天美工作室有个“蘑菇理论”去理解用户,同样的也可以用在数据分析师上。把这些思考,站在数据、技术、产品和用户的角度去理解,推动解决

注:蘑菇理论由天美总裁提出,核心思想是想办法潜入目标用户群,感同身受并理解用户。

12、你如何平衡你的工作和生活?

唐松:这是我目前非常大的挑战,平时工作时间比较长,而且可能随时被call,这对于平衡生活是很大的挑战。对于我而言,我会要求自己保持运动,另外在周末的时候,按照自己舒服的节奏来过,比如周日和朋友去吃个brunch,然后宅家看一天书,或者和朋友出去玩,把周末这一天过得舒服。除此之外,把自己的目标从单纯工作拓展到更多目标,例如目标是每年出去2次大旅游,比如今年打算去看极光和非洲(目前很难实现)等等。

13、善良和聪明,你觉得哪个更重要,为什么?

唐松:对于数据分析师来说,这里先引用一下Alice对于善良和聪明的理解:善良是让严谨的数据说话,不带任何个人偏向去解读数据;聪明是老板想要什么样的数据,或者你想让数据呈现什么样的结论。

在我看来,善良更重要。但做数据分析师,需要善良但不失聪明。

数据分析工作,无时无刻在强调善良的重要性,数据需要尽可能反映实际的表现情况,否则就被挑战。首先在准确性上,数据容不得半点错误,任何一个微小的错误,都会要被纠正;其次在态度上,数据同学需要尽量中立地反映实际的情况,整个过程必须论据充分,论证严谨,得出的结论必须是一锤定音,无懈可击的

但是为啥要加上不失聪明呢?因为没有绝对的对错,事物都是有两面性的,特别是从数据分析到落地策略的时候,如果不发挥自己的创造性和思考能力,是很难产生有价值的推动落地的。

腾讯高级数据分析师采访2_第5张图片

14、你最近从支持部门的数据分析团队去到产品运营团队做数据分析,你觉得两者最大的不同是什么?

唐松:研究火箭和战场肉搏的区别。

我之前做过一个比喻,在支持部门做数据分析,就像是在研究所研究火箭和导弹,每天想着开发出新的模型和工具帮助各个业务精准击中敌人;在产品运营团队做数据分析,就像是上战场肉搏,每天都面临真实的商业环境,在战火中淬炼;在洞察--> 落地 -->评估,这个循环的流程中,不断强化自己的分析能力和业务推动力,身处在顶尖的游戏工作室,要求高,时间紧,一段时间下来,回头看看自己的业务能力已经提升了很多,但是对于高精尖的技术能力有些落下了。

15、你认为AI会取代数据分析师吗,为什么?它能够取代哪部分?

唐松:不会,目前看来对于人工智能来说,有多少人工就有多智能,能够解决的问题多在有监督学习的场景,例如人脸识别,语音识别等场景。数据分析师不光是和数据打交道,和人打交道才是重点。

04

给数据新人的推荐

16、对于想进入数据分析领域的新人,你有什么建议?推荐哪些书?

唐松:建议是真正到一款产品,从0开始,深入参与数据分析和策略落地过程,不断重复Ask Measure Learn这个过程。如果没有这个机会的话,可以开始看书上课打好基础:

推荐的课程:

(1)维上:《增长黑客》(Sean Ellis那本)和《硅谷增长黑客实战笔记》

(2)统计上:概率要懂,机器学习的基础算法要懂,推荐Andrew Ng的机器学习课,概率推荐Udacity的 Introduction to Inferential Statistics;以上都是基础课,想要更深入的话,网上有大量的美国名校免费课,比如首推我上过的康奈尔的大神Kilian教的机器学习CS480,还有Stanford的CS229(机器学习),哈佛的Stat 110(学概率论)

(3)AB测试:仅推荐Udacity的 A/B Testing课程,其他的中文书不推荐

(4)编程上:SQL和Python要会,这里不推荐书,SQL推荐去W3school学一遍,既简单又免费;Python的基础推荐去看廖雪峰老师的Python文章,免费又讲的好,然后去kaggle刷一个简单的比赛,看看大神的代码,想学爬虫的可以看我的书《Python网络爬虫》。

相关课程链接

1. 康奈尔的机器学习

https://www.youtube.com/watch?v=MrLPzBxG95I

2. Andrew Ng的机器学习课

https://www.coursera.org/learn/machine-learning

3. Udacity - Introduction to Inferential Statistics

https://www.udacity.com/course/intro-to-inferential-statistics--ud201

4. Stanford的CS229

http://cs229.stanford.edu/

5. 哈佛的Stat 110

https://projects.iq.harvard.edu/stat110/youtube

6. Udacity - A/B Testing

https://www.udacity.com/course/ab-testing--ud257

7. SQL - W3school

https://www.w3school.com.cn/sql/index.asp

8. 廖雪峰Python

https://www.liaoxuefeng.com/wiki/1016959663602400

  延伸阅读  
Python:
☞ 这是我看过的最好的Python零基础Pandas教程
☞ 入门必看 Python 书单汇总
☞ 我用 Pyhton 做了款可开淘宝店赚钱的工具

☞ 一个超有意思的 Python 综合能力测试网站



技能GET:
☞ 拍一拍,微信史上最短一行代码
☞ 立刻、马上对你的电脑做这三件事!
☞ 专为技术人员打造的搜索引擎,提升n倍搜索效率!
☞ 一个聚合全网热点信息的神网站



你可能感兴趣的:(大数据,数据挖掘,编程语言,机器学习,人工智能)