山东大学数据科学导论2021-2022期末试题回忆

为众人负薪者,不可使其毙于风雪。
本来考完试应该休息一下的,但是想到这次考试多亏有学长的真题回忆和资料整理才能如此从容应对,所以我要接过这个回忆的任务来造福后来的学弟学妹们。
2021.12.23 15:04 刚出考场 马不停蹄的回来码字

考的内容ponytail基本都有背过,都是卢老师PPT上的内容。
考试题目回忆如下:(用词可能些许不一致,括号均为笔者自加)

顺便整理了word文档,有CSDN会员或者积分的可以点我下载支持一下

1.(1)大数据的定义是什么,大数据的四个特性(4v)
(2)数据处理流程和什么是ETL

2.解析XML的方法有哪些并列出优缺点(考试的时候卢老师嫌我写的少==能写出这个题的就已经很不错了好吧!)

3.SQL包含哪些方面,并写出创建一个名为student,具有sid,name,age三列数据的表格的sql语句。

4.一个表格题,考的是sql的inner join和left outer join,让你写出输出的表格内容。
5. 画图并解释说明mapreduce的处理过程。
6. 探索性数据分析的定义和基本方法
7. K-means算法的原理步骤
8. 给出一句话
Shandong university is a famous university in China.
请写出2-grams和3-grams的输出
9.请写出平常见到的图数据并举出常见的数据可视化工具

我不能保证我的答案正确性。大家可以自行查阅资料,或者私信我。

学弟学妹们上课的一定尽可能的听一下这门课,否则期末复习真的像开天辟地。
而且这门课比较特殊,每年讲的内容都不一样,复习起来难度也比较大,在这里ponytail想说如果你只想及格的话,就可以只看往年学长学姐整理的资料,可能会跟现学的有一定出入,但是大考点都在里面,及格是肯定没有问题的。但是如果你想得高分(卷)的话,就需要以老师的ppt为重点。就像本次考试的xml数据解析方法,sql和数据图表是往年复习资料没有的。

最后附上往年试题与整理链接。

山东大学数据科学导论2020-2021期末考试题目(回忆)

数据科学导论复习个人整理(这个学长的文章屡次帮我大忙O(∩_∩)O)

你可能感兴趣的:(big,data,大数据)