2022秋招蚂蚁金服面试

一、一分钟自我介绍。

二、简历相关问题。

1、实习中主要做的事情,从三方面来回答,工作内容、为谁工作、主要指标。

对这部分人做了什么?

结果:提升转化率、留存。

2、ABtest的流程、原理、参数设置、主要关注的统计效果。

分享了一个AB测试的项目

3、我用到的主要工具、语言?

分两块。一是hive sql用来取数;二是python、excel,用来数据可视化。

4、sql问题

4.1 数据库底层知识:主键是什么?

主键是指,表中经常有一个列或者多列的组合,其值能够唯一地标识表中的每一行。ton过他可以强制表的实体完整性。当创建或者更改表时可以通过定义PRIMARY KEY约束来创建主键。一个表只能有一个PRIMARY KEY来约束,而且不接受空值。

特征:1)唯一性,2)非空,3)用于其他表的外键关联。

4.2 窗口函数了解吗?举例。

  1. 静态窗口函数:用于排序,row_number,rank,dense_rank

  2. 滑动窗口函数:

    1. 聚合函数:累计求和sum(),求平均avg(),percent_rank累计百分比,cume_dist累计分布

    2. 取值函数:lead,lag,first_value,last_value,nth_value,ntile

2022秋招蚂蚁金服面试_第1张图片

参考链接:窗口函数

4.3 Null和empty的区别。

null:空值。is null、is not null

empty: =“”

可以用ifnull 来判断。

  1. SQL语句中对空字符串进行判断时可以使用=、>、<符号;但是对NULL进行判断时必须使用is null或is not null。

  2. 使用count()函数进行统计时,会过滤掉NULL值,但不会过滤掉空字符串。

4.4hive sql和sql的区别

总体一致,hiveSQL的设计目的是让会SQL不会编程MapReduce的也能使用Hadoop进行数据处理

  1. hive 不支持等值连接

  2. hive对分号不敏感

  3. hive中string类型的字段为empty时,对他进行isnull的判断等于FALSE

  4. hive不支持将数据插入现有的表或分区中,仅支持覆盖重写整个表。 支持 insert overwrite

  5. hive 不支持 insert into 表 values(),update、delete操作

  6. hive支持嵌入MapReduce程序,来处理复杂的逻辑

  7. hive支持将转换后的数据直接写入不同的表、分区、hdfs、本地目录

参考链接:hive SQL 和SQL

5、python相关的问题

5.1 常用的模块。

分三块。一是excel数据处理相关的,numpy、pandas;二是数据可视化相关的,matplotlib、seaborn;三是机器学习相关的,scikit-learn。

参开链接:机器学习常用Python扩展包 - mo_wang - 博客园

5.2 数据处理的问题:日期的处理,怎么把date转化成int格式?

datetime 中strptime:string转datetime

strftime:datetime转string

参考链接:python中date、datetime、string的相互转换_yuchenwuhen的专栏-CSDN博客

6、想做商业数据分析师还是数据科学家?

答:商业数据分析师。

        1、兴趣

        2、经验

        3、能力

7、异常分析。日活上涨20%,分析原因?

三、反问

1、主要负责什么内容?

2、校招数据分析师需要具备的能力和素质?

        1)技术能力。SQL、机器学习。

        2)业务能力。business sense。做商业数据分析师,更重要的是对业务的理解能力。

四、其他

面试官好心帮我看了一下流程,说会有很多轮,他也不知道下一轮是谁,等待安排,他只能看见前面一轮的时间在9.16。

我的感受:

问的东西广,但是不深。

阿里果然有很多很多轮。加油,每一轮都要好好表现啊。

结果:

无后续了,流转了。TT

你可能感兴趣的:(sql,面试,职场和发展,数据分析)