jd数据分析岗笔试

选择题30道,有单选,有多选

1 哈希双探查(主要考察哈希冲突的解决)

2 两个队列完成栈的功能,输入n个数,需要多少次操作。

栈后入先出,队列先入先出。
那么先全部进入队列1,需要n次操作。
将1到n-1移到队列2,输出n。
将1到n-2移到队列1,输出n-1。
依次操作,和为n+…1。

3 DNN过拟合的解决方法

1.增加训练集的数据量

over-fitting的一个形成原因就是训练集的数据太少导致无法学习到想要的模型,因此当发生over-fitting时首先应该考虑的就应该是增加训练集的数据量,理论上来说只要数据集足够大就不会发生over-fitting和under-fitting,但是很明显数据集的收集和制作是个很大的工作量,因此就需要下面的几个常用办法。
2.正则化
3.Dropout
4.Early stopping提前终止训练
5 输入加入噪声
6 集成学习

4 基于Hadoop的数据分析软件

Apache Hive

5 Pearson相关系数

Pearson相关系数(Pearson Correlation Coefficient)是用来衡量两个数据集合是否在一条线上面,它用来衡量定距变量间的线性关系。
https://blog.csdn.net/qq_42198071/article/details/89432891

6 数据预处理的主要功能

https://blog.csdn.net/weixin_42521211/article/details/107004579?utm_medium=distribute.pc_aggpage_search_result.none-task-blog-2alltop_click~default-4-107004579.nonecase

7 select * from a,b

https://blog.csdn.net/zhbitxhd/article/details/11969739
https://www.cnblogs.com/zzliu/p/11370272.html

8 数据库字段的索引

https://blog.csdn.net/qq_42786761/article/details/96352323

9 概率与统计的知识

线性回归
区间估计
四大分布的性质
对称:t分布和正态分布
F分布:
jd数据分析岗笔试_第1张图片

jd数据分析岗笔试_第2张图片
jd数据分析岗笔试_第3张图片
卡方分布:
jd数据分析岗笔试_第4张图片
n越大,越对称。

10 实体完整性和标识唯一性

1、实体完整性——实体完整性指表中行的完整性。要求表中的所有行都有唯一的标识符,称为主关键字。主关键字是否可以修改,或整个列是否可以被删除,取决于主关键字与其他表之间要求的完整性
2.参照完整性—一参照完整性属于表间规则。对于永久关系的相关表,在更新、插入或删除记录时,如果只改其一不改其二,就会影响数据的完整性:例如修改父表中关键字值后,子表关键字值未做相应改变;删除父表的某记录后,子表的相应记录未删除,致使这些记录称为孤立记录;对于子表插入的记录,父表中没有相应关键字值的记录;等等。对于这些设计表间数据的完整性,统称为参照完整性。

11 完全二叉树

12 平衡二叉树

平衡二叉树,又称AVL树,指的是左子树上的所有节点的值都比根节点的值小,而右子树上的所有节点的值都比根节点的值大,且左子树与右子树的高度差最大为1。因此,平衡二叉树满足所有二叉排序(搜索)树的性质。至于AVL,则是取自两个发明平衡二叉树的科学家的名字:G. M. Adelson-Velsky和E. M. Landis。
https://baijiahao.baidu.com/s?id=1646617486319372351&wfr=spider&for=pc

13 N-gram

n=2的情形,属于NLP的基础。

编程题

1求最大公共子序列

2求M和N之间删去一个数字成为回文素数的个数。

110-120之间有10个:
110
111
112
113
114
115
116
117
118
119
都是,因为11是回文素数。
参考https://blog.csdn.net/for62/article/details/107850918
他用的枚举的方法。

你可能感兴趣的:(jd数据分析岗笔试)