使用PaddleNLP识别垃圾邮件准确率98.5%的垃圾邮件分类器(附数据集下载)

使用PaddleNLP识别垃圾邮件准确率98.5%的垃圾邮件分类器(附数据集下载)。

使用PaddleNLP识别垃圾邮件准确率98.5%的垃圾邮件分类器(附数据集下载)_第1张图片

什么是垃圾邮件?

垃圾邮件泛指未经请求而发送的电子邮件,例如未经发件人请求或允许而发送的商业广告或非法的电子邮件。垃圾邮件的常见内容包括赚钱信息、成人广告、商业或个人网站广告、电子杂志、连环信等。垃圾邮件可以分为良性和恶性的。良性垃圾邮件是各种宣传广告等对收件人影响不大的信息邮件。恶性垃圾邮件是指垃圾邮件炸弹或附带有病毒的具有破坏性的电子邮件。发送垃圾邮件的用户大都是已经购买或者得到了电子邮件地址列表,会对众多的邮件用户产生滋扰。

使用PaddleNLP识别垃圾邮件准确率98.5%的垃圾邮件分类器(附数据集下载)_第2张图片

垃圾邮件可以说是互联网带给人类最具争议性的副产品,它的泛滥已经使整个互联网不堪重负。

据中国互联网络信息中心2003年7月公布的《中国互联网络发展状况统计报告》显示,中国网民平均每周收到16.1封电子邮件,其中垃圾邮件占据了8.9封,垃圾邮件数量超过了正常邮件数量,并有进一步增长的趋势。

垃圾邮件(spam)现在还没有一个非常严格的定义。一般来说,凡是未经用户许可就强行发送到用户的邮箱中的任何电子邮件。

在垃圾邮件出现之前,美国一位名为桑福德·华莱士(或称Spamford或“垃圾福”)的人,成立了一间公司,专门为其他公司客户提供收费广告传真服务,由于惹起接收者的反感,以及浪费纸张,于是美国立法禁止未经同意的传真广告。后来垃圾福把广告转到电子邮件,垃

你可能感兴趣的:(机器人智慧之心,PaddleNLP,垃圾邮件,分类器,数据集,NLP,随机森林,朴素贝叶斯)