原始数据放在csv文件中的第二列,第一列为日期,如下所示
想要对第二列数据进行多次添加噪声,做数据增广
最后将生成的带噪声数据放在csv文件中,每次添加噪声的数据放在一列
第一列还是原始的日期信息
代码如下
import pandas as pd
import numpy as np
# 读取原始数据
data = pd.read_csv('original_data.csv')
# 选取需要添加噪声的列
column_to_noise = 'pressure'
# 假如生成10个样本的噪声数据
num_samples = 10
noisy_data = pd.DataFrame()
for i in range(num_samples):
# 添加白噪声
noise = np.random.normal(0, 1, len(data))
noisy_column = data[pressure] + noise
# 把新生成的列添加到数据中
new_column_name = f'{column_to_noise}_noisy_{i+1}'
noisy_data[new_column_name] = noisy_column
# 合并日期列和噪声数据列
result = pd.concat([data['date'], noisy_data], axis=1)
# 保存到同一个CSV文件中
result.to_csv('noisy_data.csv', index=False)
生成数据如下: