4月10号星期天上午Python数据分析实战笔记

作业一
读取 “作业数据” 数据

  1. 增加一列数据“工作年限”,自定义数据
  2. 删除“编号列”
  3. 将“收入”列的第二个数据改成0
  4. 查询前三行数据
import pandas as pd

data = pd.read_excel("D:\数据\作业数据_第五节.xlsx")
#print(data)
DataFrame=pd.DataFrame(data)
# 1、增加一列数据
# DataFrame['工作年限'] = [8,7,6,5,4,3,2,1,0]
# print(DataFrame)

# 2、删除行或列的代码
# axis=0,指删除index(索引,行号)默认 axis = 0,因此删除columns时要指定 axis = 1
# inplace=True 更改内存中的 data 数据集,没有 inplace 属性 那么就不会更改内存中的 data 数据集,就相当没有做什么操作
# data.drop(['性别'],axis = 1,inplace=True)

# 这行代码和 12 行代码是等价的
DataFrame = DataFrame.drop(['编号'],axis = True)
print(DataFrame)

# 3、修改某一个数据
data['收入'][1] = 0
print(data)

# 4、输出指定范围的行
print(data[0:3])

作业二
读取 “作业数据” 数据

  1. 将“性别”列的第一个数据改为 nan 值
  2. 打印数据中空缺值的数量
  3. 将包含 NaN 元素所在的整行数据删除
  4. 将数据中所有 nan 元素修改为 “空缺值”
import pandas as pd
import numpy as np

from demo_1 import DataFrame

data = pd.read_excel("D:\数据\作业数据_第五节.xlsx")
DataFrae = pd.DataFrame(data)
print(DataFrae)

# 1、将 “性别” 列的第一个数据改为 nan 值
# DataFrae['性别'][0] = np.nan
# print(DataFrae)

# 2、打印每列数据中空缺值的数量
# print("每列空缺值的数量:\n",DataFrame.isnull().sum())

# 3、将包含 NaN 元素所在的整行数据删除
# how='all’时表示删除全是缺失值的行(列)
# how='any’时表示删除只要含有缺失值的行(列)
# DataFrame.dropna(how='any',axis=0,inplace=True)
# print(DataFrame)

# 4、将数据中所有 nan 元素修改为 '空缺值'
DataFrae.fillna('空缺值',inplace=True)
print(DataFrae)

你可能感兴趣的:(python)