使用pandas库中的DataFrame对象,可以通过行标签和列标签来获取某个或某些行列的数据。
df.loc[row_label]
df.iloc[row_index]
df[df['column_name'] == 'value']
df[column_label]
df[[column_label1, column_label2]]
同时获取指定的行和列:
df.loc[row_label, column_label]
df.iloc[row_index, column_index]
举个例子:
import pandas as pd
# 创建一个DataFrame
data = {'name': ['Alice', 'Bob', 'Cathy', 'David'],
'age': [25, 30, 35, 40],
'gender': ['female', 'male', 'female', 'male'],
'score': [90, 85, 80, 75]}
df = pd.DataFrame(data, columns=['name', 'age', 'gender', 'score'])
# 获取第2行数据
print(df.iloc[1])
# 获取gender列的数据
print(df['gender'])
# 获取第3行的score列数据
print(df.loc[2, 'score'])