基于加权朴素贝叶斯的水质数据分类研究

摘要

为更好地实施水环境管理政策,水质评价是基础环节,即根据某一水域多个水质参数,如何将其合理地划分到特定水质类别。针对该问题,提出了一种改进的朴素贝叶斯分类方法,该方法赋予不同属性以不同的权值,削弱了朴素贝叶斯条件独立性的假设,使分类结果更接近实际类别。首先,参考国家地表水水质自动监测站(以下简称国控水站)发布的数据,选取其中500条水质数据作为样本,基于溶解氧、高锰酸盐指数、氨氮和总磷4个指标建立评价体系;然后,利用改进朴素贝叶斯分类方法对样本进行学习与评价,并采用五折交叉验证法验证其分类性能。结果表明,改进朴素贝叶斯分类方法的准确率、精确率、召回率和F1值分别达到96.0%、95.9%、93.8%和94.8%,水质数据分类的性能指标相较于其他朴素贝叶斯分类方法更高,可对实际工程中遇到水质数据分类的问题提供一定的参考。

关键词: 水质评价 ; 朴素贝叶斯 ; 五折交叉验证 ; 性能指标

0 引言

工业化的发展必然会带来一系列的环境问题,其中水环境的破坏日趋严重。水环境的污染问题严重制约着国家经济发展,影响民众的饮食健康。尤其在发展中国家,缺乏适合当地的水质评估方法,使得水资源管理政策实施起来困难重重,在缺乏有效水质监测与评估的情况下,几乎所有穿过城镇的河流都成为生活、工业和商业所产生废液的倾倒场[1]。因此,积极开展水环境的监控防治刻不容缓。水质数据的分类问题是水环境管理与保护的重要基础[2],水质数据分类模型的好坏对水环境防治决策起着至关重要的作用。早期的水质数据分类问题依靠人工定期采样水体,然后带回实验室进行水质数据分析,最后做出

你可能感兴趣的:(物联网及AI前沿技术专栏,分类,python,数据挖掘)