当一堆数据差异过大如何选?

我们通过采样获得一对数组,但是他们差异过大,所以我们选择进行一次滤除。

先看基本概念:

  1. 移动平均(Moving Average): 计算每个数据点及其相邻数据点的平均值,可以使用不同的窗口大小。这有助于平滑数据并减小突然的差异。

  2. 中值滤波(Median Filtering): 将每个数据点及其相邻数据点的值进行排序,然后选择中间值作为新的数据点。这对于去除离群值效果较好。

  3. 高斯滤波(Gaussian Filtering): 使用高斯核函数对数据进行滤波,可以有效地平滑数据并保留趋势。

  4. 阈值剔除: 将与相邻数据相比差异过大的数据点视为异常值,并根据设定的阈值进行剔除或修正。

  5. 差分: 计算相邻数据点之间的差异,然后根据一定规则进行处理,例如替换为平均值或通过插值进行修正。

  6. 局部异常因子检测(Local Outlier Factor, LOF): 通过计算每个数据点的局部异常因子来识别异常值,并进行相应处理。

通过对概念了解

我们将选用中值滤波。

% 示例数组
inputArray = [1, 3, 7, 15, 100, 8, 6, 5, 4, 3];

% 中值滤波窗口大小
windowSize = 3;

% 对数组进行中值滤波
outputArray = medfilt1(inputArray, windowSize);

% 显示结果
disp('原始数组:');
disp(inputArray);

disp('中值滤波后的数组:');
disp(outputArray);

在中值滤波中,窗口大小是指用于计算中值的数据点的数量。在 MATLAB 中,medfilt1 函数中的 windowSize 参数表示滤波窗口的大小。

对于每个数据点,中值滤波会考虑包含该点及其邻近数据点的窗口,然后计算窗口中所有数据点的中值,并将该中值作为滤波后的值。窗口的大小由 windowSize 参数控制。

(左图为处理前)(右图为中值滤波后)

当一堆数据差异过大如何选?_第1张图片                           当一堆数据差异过大如何选?_第2张图片

你可能感兴趣的:(算法,图像处理,数据分析)