1.Python Pandas处理缺失值,以下哪个选项是对缺失值NaN进行删除操作(C)。
A.isnull
B.notnull
C.dropna
D.fillna
解析:
A选项,Isnull()返回表明哪些值是缺失值的布尔值;
B选项,notnull()返回表明哪些值不是缺失值的布尔值;
C选项,dropna()对data进行处理,在默认情况下会删除所有包含NA值的行;
D选项,fillna()补全data数据中的缺失值;
故正确答案选择C。
2.以下对pandas库中的to_numberic(arg,errors,downcast)函数的参数解释错误的选项(D)。
A.errors=’raise’将非数字字符串转换为数字,数据中如果存在非数字字符串则会返回出错误,时间类型转换为int。
B.errors=’ignore’只对数字字符串进行转换,其他类型一律不转换。
C.errors='coerce'将数字字符串和bool类型转换为数字,其他均转换为NaN。
D.downcast =’signed’所有值都将转换为浮点型。
解析:
errors存在三个参数{'ignore','raise','coerce'},默认情况下为'raise'。如果为“ raise”,则无效的解析将引发异常;如果为“强制”,则无效的解析将设置为NaN;如果为“ ignore”,则无效的解析将返回输入。downcast =’signed’所有值都将转换为整型。
3.存在一组DataFrame类型数据data数据输出结果如表格所示:
index | A | B | C |
0 | 1 | 4 | 7 |
1 | 2 | 5 | 8 |
2 | 3 | 6 | 9 |
那么以下可以获得DataFrame数据中‘5’的选项是哪个(B)。
A.data.iloc[1,’B’]
B.data.iloc[1,1]
C.data.loc(1,’B’)
D.data.loc[1,1]
解析:
在panda包中处理DataFrame类型数据时候,iloc按照索引值来定位数据元素,loc是按照标签值来定位元素,所以在这个题目当中应该选择B。
4.使用可视化扩展库matplotlib中的pyplot模块中的legend()函数设置图像标题时,下面哪个参数用来设置文本的字体(B)。
A.loc
B.prop
C.fontsize
D.frameon
解析:
A选项,loc参数设置图列位置;
B选项,prop设置字体参数;
C选项,fontsize参数设置图例字体大小;
D选项,frameon控制是否应在图例周围绘制框架;
因此选择B选项。
5.以下为DataFrame类型数据df
Name | Goodlabel | |
0 | Xiaoming |
001 |
1 | Liming | 003 |
2 | Daming | 005 |
3 | Zhongming | 006 |
4 | Liming | 011 |
5 | Lining | 002 |
选项中哪种操作不能够实现将列名’Goodlabel’换为’label’(D)。
A.df.columns=['Name','label']
B.df=pd.read_excel("C:/.../工作簿1.xlsx",columns=['Name','label'])
C.df.rename(columns={'Goodlabel':’label’})
D.df.rename(columns={'Goodlabel':’label’},inplace=True)
解析:
A.直接通过暴力手段修改df的列名称;
B.在pandas读取excle数据列表的时候,直接在读取时更改列名;
C.和D.选项是一样的方法,使用rename函数修改指定列的列名,但是后面需要使用inplace参数,并设置为True,因此选择D选项。