作业一
读取 “作业数据” 数据
import pandas as pd
data = pd.read_excel("D:\数据\作业数据_第五节.xlsx")
#print(data)
DataFrame=pd.DataFrame(data)
# 1、增加一列数据
# DataFrame['工作年限'] = [8,7,6,5,4,3,2,1,0]
# print(DataFrame)
# 2、删除行或列的代码
# axis=0,指删除index(索引,行号)默认 axis = 0,因此删除columns时要指定 axis = 1
# inplace=True 更改内存中的 data 数据集,没有 inplace 属性 那么就不会更改内存中的 data 数据集,就相当没有做什么操作
# data.drop(['性别'],axis = 1,inplace=True)
# 这行代码和 12 行代码是等价的
DataFrame = DataFrame.drop(['编号'],axis = True)
print(DataFrame)
# 3、修改某一个数据
data['收入'][1] = 0
print(data)
# 4、输出指定范围的行
print(data[0:3])
作业二
读取 “作业数据” 数据
import pandas as pd
import numpy as np
from demo_1 import DataFrame
data = pd.read_excel("D:\数据\作业数据_第五节.xlsx")
DataFrae = pd.DataFrame(data)
print(DataFrae)
# 1、将 “性别” 列的第一个数据改为 nan 值
# DataFrae['性别'][0] = np.nan
# print(DataFrae)
# 2、打印每列数据中空缺值的数量
# print("每列空缺值的数量:\n",DataFrame.isnull().sum())
# 3、将包含 NaN 元素所在的整行数据删除
# how='all’时表示删除全是缺失值的行(列)
# how='any’时表示删除只要含有缺失值的行(列)
# DataFrame.dropna(how='any',axis=0,inplace=True)
# print(DataFrame)
# 4、将数据中所有 nan 元素修改为 '空缺值'
DataFrae.fillna('空缺值',inplace=True)
print(DataFrae)