import numpy as np
import pandas as pd
sdata = {'Ohio': 35000, 'Texas': 71000, 'Oregon': 16000, 'Utah': 5000}
example_1 = pd.Series(sdata)
example_1`
data = {'state': ['Ohio', 'Ohio', 'Ohio', 'Nevada', 'Nevada', 'Nevada'],
'year': [2000, 2001, 2002, 2001, 2002, 2003],'pop': [1.5, 1.7, 3.6, 2.4, 2.9, 3.2]}
example_2 = pd.DataFrame(data)
example_2在这里插入代码片
小结:dateframe和series
区别:
series,只是一个一维数据结构,它由index和value组成。
dataframe,是一个二维结构,除了拥有index和value之外,还拥有column。
联系:
dataframe由多个series组成,无论是行还是列,单独拆分出来都是一个series。
df= pd.read_csv("train_chinese.csv")
df
data['columns'] #columns即你需要的字段名称即可
#注意这列的columns不能是index的名称
#如果要打印index的话就data.index
data.columns #与上面的一样
test=pd.read_csv("test.csv")
test
test_1 = pd.read_csv('test_1.csv')
test_1.head在这里插入代码片
del test_1['a']
test_1.head
df=test_1
df
df1=df.drop(labels='a',axis=1) # axis=1 表示按列删除,删除gender列
print(df1)
df.drop(['PassengerId','Name','Age','Ticket'],axis=1)
df[df["Age"]<10]
midage = df[(df["Age"]>10)& (df["Age"]<50)]
midage
midage = midage.reset_index(drop=True)
midage
midage.loc[[100],['Pclass','Sex']]
midage.loc[[100,105,108],['Pclass','Name','Sex']]
总结:本操作中主要涉及到了
1、两个数据类型DateFrame和Series的认识,前者是数组 后者是数列,也就是二维和一维的差别;
2、如何查看一张表的数据、以及查看表中某一行的数据
3、查看指定行的数据 查看指定列的数据有两种方法loc和 https://blog.csdn.net/W_weiying/article/details/81411257
4、删除某行或者是某一列的数据。
添加链接描述