在数据分析过程中,经常需要基于现有数据计算新的数据列。Pandas 允许你轻松地向 DataFrame 添加新列,并基于现有列进行计算。
# 准备数据和示例代码的运行结果,用于案例 44
# 示例数据
data_column_addition = {
'A': [1, 2, 3],
'B': [4, 5, 6]
}
df_column_addition = pd.DataFrame(data_column_addition)
# 添加新列
df_column_addition['C'] = df_column_addition['A'] + df_column_addition['B']
df_column_addition['D'] = df_column_addition['A'] * df_column_addition['B']
df_column_addition
在这个示例中,我们添加了两个新列:C
(列 A
和列 B
的和)和 D
(列 A
和列 B
的乘积)。
A B C D
0 1 4 5 4
1 2 5 7 10
2 3 6 9 18
这个结果展示了两个新添加的列,其中包括了基于现有列的简单算术计算。添加新列是数据处理和特征工程中常见的操作。