大数据基础及应用试题分析

第一题:30分)。编制程序为小学生生成计算题和答案,该程序运行一次生成20道小题,每道小题是两个两位数的算术运算(加或减)。  

生成的题目存储在test.txt文本文件中,每行包含1道小题,共20行。该文件中的部分行如下:

(1)11+23=

(2)21+18=

(3)18-9=

(4)28-25=

生成的答案存储在rest.txt文本文件中,每行包含1道小题的答案,共20行。该文件的部分行如下::

(1)34

(2)39

(3)9

(4)3

 

具体要求:

    1.test.txt文件中的每个小题包含小题的序号(序号为1~20)、两个需要计算的两位数、一个运算符号和一个等号;(15分,其中正确表示小题序号5分,正确存储‘+’和‘-’号5分,正确表示两个计算数和等号5分)

    2.rest.txt文件中的每个答案包含小题的序号(序号为1~20)和该小题的答案;每行1个小题。(5分)

    3.出题时不能出现为计算结果为负数的小题。(10分)

 

提示

    1.产生随机整数的方法:

    import random

#调用randint函数一次就产生区间[low,high]内的随机整数。

randrom.randint(low,high)  

2.每道小题产生两个随机整数作为参与计算的数字,另外产生一个随机整数(产生范围包含0和1的随机整数,0表示加法,1表示减法)表示运算符。

3.计算式子转换为字符串

 Python中提供了str.format方式将其他数据类型的值转化为字符串的方法,例如下面的语句实现了将字符串name和整数age拼接为了一个字符串,拼接时由format括号中的变量依序替换前面字符串中的‘{}’。

name="Jack"

age=18

str="The age of {} is :{}".format(name,age)

print(str)

 

题目难度:Easy

题目的题干描述已经给出了算法,如果没有给出算法,那么就具有一定难度,其实Python有现成的方法,还能处理四则运算。

 

 

 

第二题:(30分。根据下面的具体要求绘制暑期票房分析图。

  1. 根据2017.txt票房文件,绘制暑期票房前十分布饼图。(10分)运行结果如图1所示:

 

大数据基础及应用试题分析_第1张图片

要看数据格式,是否需要特殊处理,如果不需要处理,那么很简单,注意饼图的中文显示问题比较麻烦,不知道容不容易解决。

 

(2)根据2018.txt票房文件,绘制从2010-8到2018-8,每年8月的票房前十的总票房,最高票房以及最低票房的这三个数据的折线图,横轴标记为:2010-8至2018-8这九个标记。(10分)

运行结果如图2所示:

 

大数据基础及应用试题分析_第2张图片

(3)根据2018.txt票房文件,绘制从2010-8到2018-8,每年8月的票房前十的堆叠柱状图,横轴标记为:2010-8至2018-8这九个标记。(10分)

运行结果如图3所示,其中每一列代表一年数据的堆叠:

 

大数据基础及应用试题分析_第3张图片

我个人比较不喜欢这题,调API函数,没什么意义。

 

第三题:利用Keras构建神经网络对CIFAR100数据集进行分类。

CIFAR100数据集中的图片大小为32*32的彩色图像(3通道),类别数为100,其中训练数据为50000个,测试数据为10000个。具体要求如下:

(1)正确准备训练和测试数据。(10分)

(2)正确搭建网络模型。(15分)。

(3)程序正确训练.。(10分)

(4)测试集中准确率在30%以上。(5分)

   备注:

(1)该数据集已经完成下载到你的考试用机。

(2)由于DS1408机器老旧,可以考虑训练时只用部分训练数据。

(3)如果构建的网络为全连接网络,在处理数据时需要考虑将一个图像(32*32的3通道图像)变形为一个长度为32*32*3的一维数组。

 

这道题目比较坑爹,数据量很大,没有给出神经网络的具体类型,根据要求调通就行。

 

总体难度低

 

 

 

 

你可能感兴趣的:(算法)