基于样本平衡策略的多源迁移学习方法及其在乙烯精馏塔质量指标预测的应用

摘要: 基于数据驱动的工业过程建模需要依赖大量的标记良好的数据集,但与目标任务直接相关的标注数据往往是有限的。因此,可以利用与其具有相关性的辅助训练数据进行建模以实现任务迁移。然而,样本的不平衡问题一定程度上影响了迁移学习的性能表现。因此,提出了一种基于样本平衡策略的多源迁移学习方法,首先,对于同一源域内样本,采用最小二乘方法融合多个候选预测器得到单个源预测器,以协同利用域内不同样本包含的可迁移信息。此外,对于不同源域间样本,基于误差函数将多个源预测器加权组合得到多源预测模型。最后以乙烯精馏塔为对象进行案例分析,验证了所提出方法的有效性。

关键词: 多源迁移学习    样本平衡    Tradaboost算法    决策树    乙烯精馏塔    

0 引言

在工业过程中,产品的质量指标预测对于设备的平稳运行、企业的提质增效等方面发挥着至关重要的作用。然而,基于工艺机理的建模方法往往无法高效地在线监测产品质量。近年来,随着数据采集、传输、存储技术的发展,基于数据驱动的建模方法被广泛应用于实际工业过程,包括支持向量机[1

你可能感兴趣的:(大数据及数据管理(治理)专栏,迁移学习,决策树)