数分面试题1-牛客

1、python中你常用的包

包名+作用+哪里使用过

  1. numpy:主要用来做多维数组的运算,高效的数值计算与数组操作,之前在推荐系统的项目中使用过
  2. pandas :用于数据处理与分析,提供了灵活的数据结构与数据操作功能
  3. matplotlib:数据可视化,比如想看数据的分布情况-箱线图,还有热力图、直方图、面积图、雷达图、极坐标图、等高线图等
  4. sklearn:用于机器学习与数据挖掘项目,提供多种机器学习算法与工具。
    例如:决策树(Decision Trees): 使用树状结构,通过一系列的判断条件将数据分类或预测。
    支持向量机(Support Vector Machines): 寻找将数据点分开的最优超平面,用于分类和回归任务。
    随机森林(Random Forests): 结合多个决策树形成集成模型,用于分类和回归任务。
    K近邻算法(K-Nearest Neighbors): 基于距离度量,在训练集中找到最接近的k个邻居进行分类或回归。
  5. TensorFlow和PyTorch:用于深度学习和神经网络的构建和训练。

2、python用到哪些地方

数据清洗与数据建模
1,用python中的numpy和pandas完成了xx量级的数据清洗工作
2,用sklearn中的xxx算法,完成了xxx,最后精度达到了xxx。

3、费米问题:北京11点左右上空飞行的飞机数量?

思路:一年游客数/365-----每天游客数
每天游客数/每架飞机载客数==每日飞机数
每日飞机数/一天几小时飞机=一小时内的飞机数
一小时飞机数/上空滞留时间 = 11点这一个小时内,飞机的数量

4、估算北京五环实时车流量

北京每日车流量/主要时间段= 每小时车流量
北京六环的车流量比例

5、估计北五环有多少辆车

北京家庭数平均每家多少辆车(各环数的车辆比)

6、若贝壳要进入一个新的城市要如何去估计这个城市的需求量

买房租房需求,外来年轻人
问卷调查去获取

7、怎么估算上海外卖员的数量

外卖员数量 = 每日外卖份数/每人每天平均送份数

每日外卖分数= 点外卖人数* 每天点单次数= 上海总人数 ×点外卖人员占比×每天平均单数
每人每天平均送份数 = 每天工作时间/完成一个订单需要的时间= 每天工作时间/(骑手到商家的时间+排队等待时间+配送时间 + 用户等待时间)

8、如何预估全国大学生人数

大学生为大一到大四的人数,一般为18-22岁,我们可以找到1999-2003年的出生人数平均为1800w,假设上学率为80%,都进行了九年义务教育,中考升学率60%,高考升学率60%,则最后 全国大学生人数1800X4X0.8X0.6X0.6=2000w

9、如何预估2030年高考生的数量。

18岁高考
2012年人口出生×上学率×中考升学率

10、估算江苏省面积

我国总土地面积960平方公里,扣除面积大的省份(新疆、西藏、内蒙古、青海、四川、黑龙江、甘肃、云南八个省份约占我国2/3的土地),剩下的省份平均。

11、估算今年国庆全国的旅游消费总支出?

人口数×出游率×平均出游天数×日均消费,(划分一线二线等城市,不同的日均消费)

12、用过Tableau嘛

用过,做可视化图表与仪表盘。
举例:销售仪表盘
通过将销售数据可视化,可以创建一个仪表盘,显示销售额、利润、销售渠道、地域等信息。可以包括柱状图显示销售额按产品类别的分布,折线图显示销售趋势,地图显示销售地理位置以及交互式过滤器和参数,加筛选器以便用户可以根据地域、日期范围或产品类别进行数据切换和分析。

做具体的地图方法:拖拽,选择图类型,最后加标签即可
栗子:气泡图:把‘地区’拖到‘列’,‘记录数’拖到‘行’,然后点击‘智能显示’中的‘气泡图’,最后再添加标签就做好了

13、EXCEL的熟悉程度

excel概念:工作簿:excel创建的文件,由工作表组成; 工作表:即电子表格,由许多横向和纵向的网格组成; 单元格:工作表的最小单位,由行号和列标所确定的坐标来标示和引用

1,熟悉常用快捷键
Ctrl + C 、Ctrl +v
Ctrl + 方向键: 快速移动到整列或整行的首个非空单元格。
Ctrl + Z: 撤销上一步操作。
Ctrl + S: 保存当前工作簿。
2,熟练使用常用函数:iferror 、vlookup、sumif、rank,average,sum
3,会使用数据透视表
4,可以搭建Excel可视化看板

14、Power BI和Excel的对比

Power BI可以连接各种不同的源,而Excel只可以连接到有限的源。
Power BI仪表板更具交互性和自定义性,而Excel仪表板交互性不强。
Power BI 主要用于数据可视化和与大量用户的仪表板共享,而Excel主要用于深入的驱动程序分析。

总结: Power BI 处理大数据、共享性、数据源的多样性

15、数据分析常用软件

数据分析包括:需求分析、数据收集、数据清洗和统计、数据分析、报告撰写几个主要阶段。每个阶段涉及到的软件也是不同的。

需求分析常用X-Mind来构建分析思路;
数据收集、数据清洗和统计常用软件有关系型数据库管理工具,如Navicat,SQL取数
数据分析阶段常用软件有:Excel、python、spss
可视化工具:FineBI、Tableau等;
报告撰写软件有:PPT、FineBI等。

你可能感兴趣的:(面试问题,python,数据分析)