某游戏公司数据分析岗面试题记录

还是有点没准备好,耳机声音贼小,就有点尴尬。题目主要是针对PYTHON、模型以及代码的一个询问。没想到数据分析也会让你手撕代码,计算机专业的悲苦嘤嘤嘤。

1、自我介绍、玩啥游戏
2、用PYTHON还是用R
3、PYTHON四个基础数据类型(list,dict,string,numbers)
4、PANDAS里面是啥数据类型(dataframe\series)
5、机器学习集成的方法在哪个包里?(sklearn)
6、介绍一下机器学习的流程(结合具体的项目说)
7、如何评价模型(分成回归和分类进行指标评价,与BASELINE模型比较等等)
8、数据分析和数据挖掘区别在哪里,如何挽回一个可能要离开游戏的用户
9、ZEN OF PYTHON 的源代码在哪里看?(PYTHON的彩蛋,哈哈果然是游戏公司,这道题我没回答上来)
>>> import this
The Zen of Python, by Tim Peters

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!

Python 之禅, by Tim Peters
优美胜于丑陋(Python 以编写优美的代码为目标) 
明了胜于晦涩(优美的代码应当是明了的,命名规范,风格相似) 
简洁胜于复杂(优美的代码应当是简洁的,不要有复杂的内部实现) 
复杂胜于凌乱(如果复杂不可避免,那代码间也不能有难懂的关系,要保持接口简洁) 
扁平胜于嵌套(优美的代码应当是扁平的,不能有太多的嵌套) 
间隔胜于紧凑(优美的代码有适当的间隔,不要奢望一行代码解决问题) 
可读性很重要(优美的代码是可读的) 
即便假借特例的实用性之名,也不可违背这些规则(这些规则至高无上) 
不要包容所有错误,除非你确定需要这样做(精准地捕获异常,不写except:pass风格的代码) 
当存在多种可能,不要尝试去猜测 
而是尽量找一种,最好是唯一一种明显的解决方案(如果不确定,就用穷举法) 
虽然这并不容易,因为你不是 Python 之父(这里的 Dutch 是指 Guido) 
做也许好过不做,但不假思索就动手还不如不做(动手之前要细思量) 
如果你无法向人描述你的方案,那肯定不是一个好方案;反之亦然(方案测评标准) 
命名空间是一种绝妙的理念,我们应当多加利用(倡导与号召)

10、介绍一下随机森林,好在哪里,缺点在哪里?泛化和过拟合具体指的是什么?还知道别的方案吗,比如牛顿法?(我只说在统计学习里面看过这个名字,其他的不清楚)

11、考了个DEF函数的输出
12、还有什么要问我的(公司的培训体系、以及对我的建议)

你可能感兴趣的:(Python)