秋招(每年的10、11月份)和春招(每年的3、4月份)
Attitude is everything! details determine success or failure。
数据分析技能
领域的选择:1.自己感兴趣的,2.自己擅长的,3.有钱途的。
流程:对项目的背景有所了解->数据的结构->数据的清洗->探索性分析->特征工程的转化->建模->调试模型->评估模型->最后做出你的结论。
从数据的采集、清洗、特征抽取、组合、分析到模型的训练、评估、调参到服务打包上线等一系列流程。
第一层境界:了解要面试的行业基本信息;
第二层境界:在网上找到一些实际的案例文章,再加上自己的见解;
第三层境界:爬取竞品相关数据,并生成一个数据分析和可视化的报告。
如果能做到第三层境界,基本上能做到一击必中。
整项目:学习了很多数据分析的理论和工具,找几个具有代表性、复杂的项目进行实践,检验自己的学习成果。
eg:以来源于Kaggle平台的Prosper公司2007-2014年113936条贷款数据为研究对象,首先利用Python实现对数据的清洗整理,其次利用Tableau对数据进行快速探索分析,总结了Prosper平台上的贷款客户特征、贷款业务特征、贷款违约影响因素。最后回到Python建立贷款违约预测模型,预测贷款违约率,准确率高达90%。
投简历:工作经历带点数据驱动业务决策的描述。
多总结:1、自我介绍(恰到好处地表达出自己对数据的热爱与激情)2、谈谈你在数据分析岗位的工作内容()3、你有什么比较出彩的项目,描述下你的项目()4、工作中遇到的最大挑战是什么,你怎么应对(实际业务场景还原)5、为什么辞职(从兴趣、发展、待遇三个角度做大)
关键技能:精通SQL、Excel,熟悉python或者R等统计类工具(重点技能,精通SQL、Excel,两大王牌你必须要精通,是基础分析工具;而python或者R等统计工具你要熟悉,熟悉即可,根据工作需要进行调整学习。建议是:先学Excel、SQL,两项可以占日常工作量的80%(一般公司规模),根据二八原则,明智的选择是把两项技能学扎实,请注意,扎实!!!python/R技能也要学习,根据自己的进度来学习,俗话说:“技多不压身!”哈哈~~)
准备前期:调研,目标岗位职责、公司历史、现状、未来规划、主营业务、发展特点等。了解自己的价值(性格能力兴趣和趋势)。理论知识体系+实践(项目和能力范围)。
比较常见JD里工作职责:理解公司业务,建立运营分析体系;搭建完善指标体系,提供数据支持;提供策略方案分析报告(如:运营策略、客户需求、业务增长点和产品改进点)。1. 针对业务问题,进行数据提取、整理和分析工作;2. 参与数据可视化开发工作;3. 协助整理编写项目相关文档及数据分析报告。更详细一份的职位描述:1. 负责用户增长相关的战略分析,具备用户增长、用户运营、用户分析方法论能力,以及从宏观战略到微观战术的战略视野,为业务开展提供战略支持;2. 负责用户增长专项研究,围绕全站用户增长,从下沉、拉新、促活、核心用户留存等关键议题入手,协同业务开展专项研究;3. 搭建全站用户数据健康度指标体系,包含战略、运营、营销等多个层面,跟进核心指标变化,并具备问题诊断、业务建议输出、可行性论证的能力,驱动业务增长;4. 负责用户调研相关工作,负责包括问卷设计、定性访谈、进度管理、报告撰写、对外沟通等环节,将定量分析与定性发现相结合,并给到业务落地方案。
比较常见JD里的任职资格:1. 本科,计算机、统计、信息技术等相关专业;2. 对数据库有一定的认识,可独立进行SQL代码编写,了解数据可视化研发或有EXCEL VBA运用经验者优先考虑;3. 热爱数据工作,逻辑思维能力强,对数据具有一定的敏感性,具有独立思考、分析问题、解决问题的能力;4. 认真细致,积极主动,责任心强,有良好的执行力和沟通能力。
基本上,这几个月,先后看了《python核心编程》《利用python进行数据分析》《R语言实战》 还看了SQL的一些教程(主要是wsc教程的
笔试题目:
1、概念题:期望、方差、标准差、协方差、相关系数。2、正态分布 二项式分布和泊松分布的定义和特点。3、一元线性回归和最小二乘法的定义。4、分类和聚类的区别以及典型算法。5、给一个数据表格,4年16个季度的营业额(1)用移动平均法匀化数据(2)算出线性模型,预测长期走势(3)用月平均法剔除法比较季度走势(4)用2,3剔除法,预测下一年每个季度的营业额。6、数据工程师可以做哪些工作,举例说明。7、如果某三天点击量异常增大,而公司没有新游戏发布、补丁或者升级,可能是什么情况。8、新游戏上市后人数会一下子上升,几个月后出现下降,称为用户流失。试建立一个用户流失预测模型帮助公司。简述如何设计。
数据分析师面试
HR一般性问题:你为什么来(事先了解从事的领域和擅长)?你能做什么?你是什么样的人?你与竞争同一职位的人有何区别?你还有什么问题?你在工作中遇到最大的问题是如何解决的?
1.自我介绍
自我介绍大概1-2分钟的时间,包括:
姓名学历专业+工作经历+为什么应聘这个岗位(说明你的优势及胜任这个岗位的理由,这里主要针对JD和职位要求来)。一句话概括说明经历和优势;简述之前的工作;简述最近一份工作及重点业绩;简要描述对目标岗位的理解和想法;一句话表明应聘的意愿。
自我介绍虽然不是每家公司都会提到,但是80%的公司都会让你做一遍自我介绍,尤其是一面,然后面试官快速扫一下你的简历,针对简历提问题。
例子1:首先非常感谢各位能给我这次面试的机会,我是。。。我来自。。。2016届毕业生,应聘的职位是。。。首先用三个词来概括下我这个人,分别是A,B,C。。我以为这些特点/优点对应聘*****岗位来说尤为重要,一旦融入这个行业,我相信我可以很快的进步,我自信通过不断地努力可以给你带来不错的结果。我喜欢这个行业,很享受跟数据打交道的这份工作。我相信我的实力能胜任这个岗位,感谢各位的聆听。
例子2:X经理您好,我叫XXX,XX年出生,XX年毕业,之前在XX公司担任XX职位X年。(背景介绍)面试之前我有简单了解过贵公司的XX岗位的招聘职责,主要是AAA,BBB,CCC三大板块。而这三大板块,恰好也是我之前一直在做的事情并取得了一些小小成就。(知己知彼)贵公司属于XX行业,并且是一家年轻的创业型公司,这两点非常吸引我。XX行业是我多年来一直所关注的,并立志长期在该行业发展。创业型公司对我来讲意味着挑战跟机遇,意味着强大的执行力与创造力,我非常喜欢这样的环境跟氛围。(为什么选择该公司)所以那天我看见贵公司的招聘需求后,立刻投递了简历,今天非常荣幸能够跟您面对面沟通!
2.简历环节
接下来,面试官就要针对简历提问题了,这里只想强调一点,简历一定要经得起推敲,什么是经得起推敲呢,就是面试官问你简历上的问题,都能回答的上来。介绍项目经历讲故事的逻辑:面对。。挑战,你做了什么,结果和得到了什么。比如:你说你做了XX模型,将转化率提高了10%,能具体介绍一下当时的背景以及你如何用数据分析得出结论并最终推进落地的吗?
你说你擅长异常数据分析,拿举一个你分析异常数据的例子,是如何判断数据异常的。
3.面试官常问问题之业务异常数据分析(某个指标下降了10%,你怎么去分析)
工作中遇到的最复杂的事/你觉得做的最棒的一件事,如何做的
你用什么数据分析方法,推动了业务的增长/节省了成本
4..数据分析工具(excel sql Python tableau)Excel:基本只要说会透视表和vlookup就行,问的细的会问,vlookup四个参数是啥意思,一般都是用True(精确匹配),下来自己查了一下模糊匹配的用法
SQL:刷题吧,一般给你个业务场景,让你写SQL,常见的考点就是 row_number,行转列,其次是自连接查询(求每门科目最高分及学生姓名),还有就是常见知识点:什么是索引、union all 和union的区别,where 和 having的区别,用过哪些时间函数,写过存储过程没有?
Python:pandas、numpy、matplotlib。数据处理以及可视化。python问的不多。iloc和loc的区别,groupby写一个示例,merge的用法等,都是一些基础的
Tableau:出去面试才发现,现在很多公司都用Tableau了,大家Tableau一定要熟练啊,这个没什么说的,自己下载个软件去练习吧,不会的官网看教程。
5.统计学与基础机器学习算法这个问的也不是很多,大部分公司都没有问,问就是一些基础的算法
什么是监督学习和非监督学习
有哪些分类算法
回归分析、时间序列分析、主成分分析等分析方法,要知道应用场景和方法
6.你有什么要问我的吗?一般问到这个问题,那就意味着本轮面试快要结束了,针对不同的面试官,至少要准备2个问题,千万不能说没有,面试官会以为你对公司意向度不高
直接领导:这个岗位的工作职责是什么/KPI是什么/这个团队有多少人,分别负责什么?
部门老大/数据负责人:咱们部门近期目标是什么/团队架构是怎样的?
HR:正常的上班时间/多久调一次薪/晋升空间是什么?
最后提问一些其他的:应聘的岗位出于什么原因产生空缺?工作所面临的的最大的挑战?你能描绘一下在这一职位上典型的工作日情形吗?我会接受何种培训吗?参加培训对我本人有何要求?这份工作的难点、工作情况和晋升?我在现在的基础上还需要掌握什么样的技能才能做好?这份工作最大的挑战是什么?若被录用需要注意什么?问HR最喜欢公司的哪点?公司未来的大体发展规划是什么?哪些培训能让我更快适应现在的岗位上手工作?补充前面的遗漏和不完美(面试后发邮件感谢并补充回答不好的问题,概述之前谈到的东西,以及你如何认为你适合他们的公司)。
对薪资的期望:了解晋升通道和考核要求。我现在处于学习阶段,也做过一些调查,从基础工资开始,我要关注工作中能学习的东西和发展前景,更看重的是能力的提升、培训的机会、给公司创造的价值,公司提供的平台,愿意和公司共同成长。
建议书单:
统计学:深入浅出统计学、赤裸裸的统计学、商务与经济统计、可汗学院的统计学教程、吴喜之-《统计学·从数据到结论》、数据之美(大约掌握信息图形化、条件概率、贝叶斯公式、相关与独立、几何分布、二项分布、泊松分布、正态分布、统计抽样、估计、置信区间、假设检验这些,就差不多了。)
分析思维:精益数据分析、电商行业:《数据化管理:洞悉零售及电子商务运营》、游戏行业:《游戏数据分析实战》-作者:黎湘艳出版社:电子工业出版社、网站:《网站分析实战》、HR行业 《人力资源与大数据分析》、金融行业:《消费金融真经:个人贷款业务全流程指南》、其他行业:国外作者肖恩的《增长黑客》、《网站分析实战》、《啤酒与尿布》、《数据之魅》、《Storytelling with Data》
AARRR模型:获取用户->激活用户->提高留存->增加收入->推荐
Excel:Excel高效办公数据处理与分析、Excel2013数据处理与分析、谁说菜鸟不会数据分析、王佩丰Excel学习笔记(网易云课堂)
SQL:SQL必知必会、《SQL基础教程》(作者:Mick)、MySQL的官方教程
Python:《与孩子一起学编程》、《利用Python进行数据分析》、Python编程从入门到实践、Python3 网络爬虫(崔庆才)、最重要的是Numpy, Pandas, matplotlib, Seaborn, scikit-learn这几个库包
R:R语言实战
可视化:人人都是数据分析师:Tableau应用实战
练习:参加一些统计建模比赛、kaggle/天池等线上的数据挖掘项目、
机器学习:能够熟悉常见算法的基本原理、了解其用途和优缺点即可。比如:分类算法里的贝叶斯、决策树、随机森林;回归算法里的线性回归、Adaboost回归;聚类算法里的K-means算法等。另外了解一下用于降维的PCA等。
就是excel做数据分析可以实现Python一样的效果,那用Python的意义在哪呢?
第一,在处理海量数据时,Python效率远高于excel。一般几万行的数据以上,excel基本就无能为力,很卡了。但是Python依然可以行云流水,效率高几十倍上百倍都有可能。
第二,Python的自动化水平非常高。你也许觉得excel的VBA一样可以自动化对不对?但是VBA有个致命弱点是,它只能基于excel内部进行自动化,其他方面就没办法了。比如你要对硬盘某些储存几百个的文件名称批量修改,VBA没办法,但Python实现起来很简单。
第三,Python是可以做算法模型的。Python语言可以让你搞懂一些最基础的算法原理,然后根据这些搭建一些算法模型,并通过matplotlib模块表现出来。
Python的文章整理:Python基本语法、基本数据类型、常用的数据结构、条件和循环、函数、模块
Python数据分析的包(numpy, pandas, matplotlib)
能够用python操作结构化数据,进行数据清洗,数据抽取,数据可视化等
使用python操作数据库
统计概率需要掌握的核心技能有:描述性统计(平均值,标准差,中位数)
概率(独立事件,相关事件,期望,包括贝叶斯)
概率分布(离散概率分布,连续概率分布)
统计推断(抽样,置信区间,假设检验)
机器学习算法需要掌握的核心技能:
分类算法:逻辑回归,贝叶斯、决策树、随机森林。回归算法:线性回归。聚类算法:K-means特征工程
模型评价
交叉检验(用已有的数据监测算法的预测力)
业务指标需要掌握的核心技能:
数据分析师每天要关注大量数据指标,而数据指标又与具体的领域业务相关,掌握常用的数据指标可以灵活应对面试中提出的业务问题。
比如面对新的数据需求,能否将它拆分成具体的指标进行计算? 各个指标如何衡量,比如app的转换率,是点击算转化还是注册了算转化还是购买产品后算转化?某一领域的知识概要(只需要大致了解)
数据分析思维:漏斗思维,分类思维,平衡思维,A/B test等
相关性和因果关系的区别, 通过案例可以分析出来
欢迎你来微信“趣往生活”一起进步啊,获取数据分析、Python、sql等学习视频。