Dathoner分享:中高级岗数据分析师面经

(文末有资料领取)#大数据#  #数据分析#  #Python#  #开源#  #编程#  #人工智能#

       Hi,我是小匿。

       近期我会邀请一些Dathoner来分享下转行与找工作的真实面试经验,帮助大家一起提高知识。本次分享的Dathoner,是一个已经有一年经验的同学,结合课程辅助与自身努力,最终拿到中高级数据分析师offer的经历。

一、转行背景介绍

       我是19年6月底从工作了三年的手机公司辞职,并且下定决心转行数据分析师(受一位转行师姐的影响)。首先从知乎找攻略,并按照师姐的推荐系统的学习了《深入浅出统计学》和《利用python进行数据分析》,简单过了一遍《Mysql必知必会》,然后开始做了两三个项目【网上找的PM2.5分析,淘宝用户行为数据分析和奥林匹克运动员数据分析】,并且写成了数据分析报告上传至网站上链接附在简历上,最后就是投简历找工作阶段,整个过程大概三个多月的时间。

       其实到最后一个月开始投简历阶段就有点慌了,因为脱产学习沉没成本越大心态越崩,刚开始投简历回复很少几乎没有邀约面试的。最后不得已在51上广撒网,十一之后面试多起来,总共面试五家,拿了三家offer,最后选择了一家小的B2B电商公司。关于几个找工作软件,对于转行人士建议BOSS和51job,拉勾上回复很少。

       至此,我算是转行了,但是这家公司数据量很少,并且数据分析师就我跟另外一个同事,而那位同事业务经验丰富,但是分析工具只限于Excel,除了从业经验这家公司给不了我其他的经验提升,因此我希望借鉴网上同行的经验提高自己的技能水平和分析能力。这也是为啥我在知乎上发现了小匿。

       小匿的转行经历让我觉得找到前辈,就像考试找到小抄一样。非科班出生,没有丰富的商分经历,靠提升硬技能出圈。因此我也加入了小匿的社群,偶尔小匿会在群里发一些自己对某些问题的见解,我觉得很专业。大概在群里潜水大半年之后,当小匿要开班时,我果断报名了,因为我想系统的学习下数据分析的知识点,另外在群里这么长时间觉得小匿还是蛮靠谱值得信赖的人。

二、总结面试问题

“公司1”

1.数据是怎么监控的,跑python定时脚本,脚本多了卡死怎么办

2.询报价时间按周的非周末是否达标。

周一到周四产生的达标了,周五周六的要80小时。周日20-50小时波动。

3.清洗程序,怎么做的?上线后会不会很耗时间。

不会耗时,毫秒级。

编辑距离相似度是2-4秒。

4.聊聊自己的方向

5.是否有涨薪

6.聊聊自己的欠缺的方面

7.为什么跳槽

       首先我得职业发展方向是数据分析师这个宗旨是不变的,我很感谢前公司给了我这样一样入行的机会,在这里我磨砺了很多分析,编程,报告的技能,当然我也为公司带来了相应的改变。但是目前我已经具备了一定的积累,为了职业生涯考虑我希望能够迈向一个更合适的平台,发挥自己的价值。

       为什么说贵公司是更合适的,对于数据从业者来说,大家都知道数据是原材料,是根基。贵公司的规模之大(说一些该公司业务细节,比如门店多)。这对我来说吸引力非常大,我希望能够有幸接触到这些宝贵的数据并从中发掘价值。

帮财务sumproduct分析。

相似度分析:19%-23%

“公司2”

1.决策树怎么选择特征的,用信息熵增益?基尼系数。讲一讲基尼系数的原理。

2.lgbm的底层是什么树,回归树还是分类树?

3.文本相似度用编辑距离有没有比较过其他算法,还知道其他方法吗?

4.pandas用的比较多的方法,列与列之间的呢

5.有没有用过spark.

6.如何与业务方沟通需求

1.首先需要明确问题,明确解决问题的方式以及需要做到的程度。2.明确背景及产品迭代过程,明确业务方对于该项功能的预期。明确业务方的思路。3.细节问题。数据分析是将具体的业务问题抽象为有组织的数据,从而发现规律,所以在抽象过程中可能会涉及到假设和模型,我们需要沟通假设和模型的合理性;如果涉及到有歧义的指标,需要进一步沟通指标的定义和时间范围等等。

是什么,为什么,是如何,细节问题

7.文本数据如何转为数值数据? one hot encoding,label encoder. 有什么区别。

8.字典排序

"公司2二面"

1.某个项目的难点

2.怎么去熟悉整个工作环境

       先从整体了解整个部门在公司的定位和产品,在了解自己的岗位职责,输入是什么,输出是什么,最后深入一个项目去由点及面扩展

3.说说逻辑回归,是解决什么问题?

4.如何判断逻辑回归的阈值是否合适

5.过拟合和欠拟合怎么办

6.推荐系统,你怎么去做?应该是问我怎么去选择特征?

"公司3"

http://1.inexist 哪个效率高? not in 和not exist呢?

2.事务的特点

3.相关与回归的区别

4.回归的R2可以用来做模型评估吗?

5.回归分析的步骤

6.回归与因果的关系

7.标准化回归分析

8.primary key和unique key的区别

9.为什么索引的效率会比较高

10.哪些地方用索引哪些不用索引

11.case when 对数值区间的影响

12.整群抽样

13.python读取文件

14.如何判断特征的重要程度。方差分析。

15.datetime转为date

相关和因果

相关:两个变量之间的关系,互为相关,没有先后顺序;

因果:有先后顺序

判断方式:

1.将要素套到原因和结果当中,依据经验来判断

2.看是否纯属巧合

3.是否同时存在第三个变量同时影响

4.是否有逆向关系,如果成立则不是因果

5.制造反事实,如果不体检会不会影响寿命

做实验对比判断 看是否有显著性差异。

P值是假设检验中,某个小概率事件发生的真实概率,如果这个小概率事件发生了(即具备显著性),那么就要接受H1,拒绝H0;反之,拒绝H1,接受H0。

三、Dathon课程感受

       Dathon课程总结下来就是干货满满,之前我也病急乱投医买过一些其他课程,但是对比下来会发现Dathon课程设计很用心每个主题都会讲解的很透:配有原理和python实战,而不是随便收集网上的录屏和资料让大家自己看。另外,小匿会督促大家打卡,我们一期的小伙伴都很用心学习,大家在小组群里互相探讨问题,小匿以及助教会解答大家的难题。

       此外,Dathon课程有精心设计的项目,一是让大家简历上有拿得出手的项目,二是这些项目技能可以直接用在工作中。小匿还会指导大家的简历和面试全程输出经验。我觉得转行路上有这样的老师相伴,踏实。

        感恩遇到小匿!今年已跳槽拿到满意的offer!期待后续能跟着小匿大佬继续提升!

结尾

       恭喜这位同学!每一位Dathoner来报喜时我真得非常的开心,一是替这位同学开心,二是让我感受到教学的意义。感谢,感谢每位Dathoner,数据之路长着呢,后续,我们一起加油!

       另外,准备了不少数据资料,需要的同学可以点击获取哈~

适合小白学习的数据分析免费资料(持续更新)

你可能感兴趣的:(Dathoner分享:中高级岗数据分析师面经)