qq1744828575

基于图像识别的垃圾分类

基于机器学习的垃圾分类

摘要：2019年垃圾分类由上海开始实施，继而向全国推行，主要将垃圾种类进行划分，其分类包括可回收、厨余、有害和其他。本文以垃圾分类为核心展开系列探究，使用机器学习对垃圾进行分类，主要对白色污染物和有害垃圾进行识别。利用了机器学习的卷积神经网络等功能，借助于深度学习和图像识别将垃圾作出系列研究处理，最终通过Jupyter显示出这个图片的垃圾是哪个类型的垃圾。
本文使用Xception模型做出卷积神经网络对有害垃圾和白色污染物的识别，Xception仅支持 TensorFlow 作为后端。故而使用Jupyter进行展示。Xception主要为卷积神经网络当中所具有的特征图所存在的跨通道相关新能够与空间相关性消除联系。是一个非常好用的卷积神经网络，它对提高识别效果作用非常显著。使用一系列辅助函数，例如：加入目录和文件名的辅助函数，用于画图的辅助函数等。通过scikit-learn去计算权重尽可能平衡数据集。低层的卷积神经网络可以识别图像中的不同形状。它是最后几个全连接的层将这些特征组合成整个图像的分类。因此，将模型的最后一个卷积层的输出重新接到一个新的全连接神经网络，用它来对数据集进行分类。Keras在每个“epoch”结束时记录性能指标，以便稍后进行绘图。在训练期间，训练集的损失值通常会降低，但测试集的损失值有点不稳定。相同的是，在训练集上，分类精度通常有所提高，而在测试集中有些不稳定。在训练之后，使用Keras API中的单个函数来评估新模型在测试集中的性能。
关键词：垃圾分类，卷积神经网络，图像识别，图像处理, Xception模型，迁移学习

Garbage classification based on machine learning

Abstract： In 2019, the garbage classification started from Shanghai and then implemented nationwide, mainly to classify the types of garbage. The classification includes recyclable, food waste, hazardous and others. This article takes garbage classification as the core to carry out a series of investigations, using machine learning to classify garbage, mainly to identify white pollutants and harmful garbage. Using convolutional neural networks and other functions of machine learning, with the help of deep learning and image recognition, the garbage is made into a series of research and processing, and finally Jupyter shows which type of garbage this picture is.
In this paper, the Xception model is used to identify harmful garbage and white pollutants by convolutional neural networks. Xception only supports TensorFlow as a backend. Therefore, Jupyter is used for display. Xception is mainly to eliminate the correlation between the cross-channel correlation existing in the feature maps in the convolutional neural network and the spatial correlation. It is a very easy to use convolutional neural network, which has a very significant effect on improving the recognition effect. Use a series of auxiliary functions, such as auxiliary functions for adding directory and file names, auxiliary functions for drawing, etc. Use scikit-learn to calculate weights to balance the data set as much as possible. The low-level convolutional neural network can recognize different shapes in the image. It is the classification of the last few fully connected layers that combine these features into the entire image. Therefore, the output of the last convolutional layer of the model is reconnected to a new fully connected neural network and used to classify the data set. Keras records performance indicators at the end of each “epoch” for later plotting. During training, the loss value of the training set is usually reduced, but the loss value of the test set is a bit unstable. The same is that, on the training set, the classification accuracy is usually improved, while the test set is somewhat unstable. After training, a single function in the Keras API is used to evaluate the performance of the new model in the test set.
Keywords： Garbage classification, convolution neural network, image recognition, image processing, Xception model, transfer learning

第1章绪论 1
1.1研究背景和意义 1
1.1.1垃圾分类的背景分析 1
1.1.2 本课题的研究意义 3
1.2 文献综述 4
1.2.1 国内研究 4
1.2.2 国外研究 5
1.3垃圾分类的技术 6
第2章相关技术研究综述 7
2.1机器学习综述 7
2.2机器学习分类 7
2.3机器学习主要算法 8
2.3.1神经网络 8
2.3.2 机器学习的其他算法 9
2.4 机器学习面临的挑战与机遇 9
2.5 总结 10
第3章垃圾图像的智能分类算法 11
3.1 分类垃圾图像的预处理[15] 11
3.1.1 灰度处理 11
3.1.2 均值滤波去噪 12
3.2 垃圾图像的特征提取 12
3.2.1 垃圾图像的HSV颜色特征提取 12
3.3 卷积神经网络 13
3.3.1 卷积神经网络发展历程 13
3.3.2 卷积神经网络特点 13
3.3.3 卷积神经网络的结构 14
3.3.4 AlexNet卷积神经网络 16
3.3.5 基于Xception卷积神经网络的迁移学习 17
3.4 Keras框架[11] 18
3.5 本章小结 20
四垃圾分类实验 20
4.1 基于迁移学习和Xception网络分类仿真 20
4.1.1 实验环境 20
4.1.2 模型构建 21
4.1.3 样本数据集 22
4.1.4 训练步骤 22
4.1.5 训练结果 23
4.2 本章小结 24
五总结与展望 24
5.1 总结 24
5.2 展望 25
参考文献 25
致谢 27

第1章绪论

1.1研究背景和意义
1.1.1垃圾分类的背景分析
日常生活当中有个东西无处不在–垃圾，我们可以将这些垃圾分为可回收垃圾、有害垃圾、厨余垃圾、其它垃圾等，这样有利于对垃圾进行有效的处理，也可以针对于不同的垃圾采用不同的处理方式。
我国对垃圾进行分类的标准主要将垃圾划分成四类，也就是可回收、厨余、有害以及干垃圾。上述四种垃圾当中，可回收以及有害垃圾具有较为明显的特征便于区分，厨余主要指的是食物、果皮等腐烂速度较快的垃圾，而干垃圾就是不包括上述垃圾在内的所有垃圾。
据统计数据显示，我国2010年产生的生活垃圾共计可达2.21亿吨，发展至2015年已经达到了2.58亿吨。涨幅较大的城市在情节以及垃圾分类方面作出了适当整改。据2018年数据显示，2017年垃圾清运量产量已经高达2.15亿吨。[1] 通过数据显示，说明我国的城市垃圾呈现出的趋势为逐年增长，并随着垃圾分类的全国推广，未来清运量会增长的更快。

图1-1生活垃圾清运量

根据垃圾分类相关文件的颁布，按照指示国内首先进行落实垃圾分类的城市有46个，在2020年末，规定的生活垃圾回收率必须提高至35%。其中主要包括的城市有北上广深等等。46个城市当中成功落实垃圾分类的达到31%，而北上广深等城市已经高出70%。
以往的垃圾处理当中，仅仅将可回收垃圾进行人工分类，然后作为回收资源进行处理，其他垃圾都没有得到有效减少。厨房当中产生的废物以及干废物一般是混合收集和转移。所以一边能够进行更为细致的划分，垃圾在收集以及销售层面上主要以可回收废物为对象，并且能够独立形成厨房垃圾以及危险废物的源头，减少焚烧或填埋的压力,减少环境污染。以住房以及城乡建设有关部门进行的数据调查，2017年我国对城市垃圾进行的无害化处理共计20138.2万吨。详情如图1-2所示。

图1-2 2017年中国城市生活垃圾无害化处理结构图
有害垃圾主要包括能够对人体健康进行破坏的有害金属以及有毒物质等等，都是日常生活当中的潜在危害。例如废旧灯泡、电池等，是“废油漆罐，废旧家用电器，过期的化学药品，过期的化妆品等”。它由卫生部的专门机构安全处理。
具体范围如图：

图1-3 有害垃圾
塑料垃圾对环境造成的污染称为白色污染。对于目前逐渐恶化的白色污染，必须要寻找塑料的代替品，既能够代替塑料的各方面性能，又能够进行有效降解。对上述类型的新型塑料进行研究发现，化学结构较以往发生了较大变化，能够使得性能上呈现下滑趋势，基本对自然环境没有危害。比如淀粉填充塑料，能够容易地被微生物分析的酶进行降解，因此其薄膜力学方面的能力降低。但是对土壤来说有着良性影响。[2]

图1-4 白色污染物

1.1.2 本课题的研究意义
生活垃圾分类对垃圾焚烧项目盈利能力的影响是复杂的:积极方面:(1)垃圾分类后，对厨余低热值垃圾进行了分离，降低了垃圾含水率，提高了垃圾的平均热值，增加了吨垃圾的在线功耗;(2)减少厨房垃圾与塑料的比例，降低氯含量，减少二恶英排放;(3)提高废渣发热量后，减少了所需的辅助燃料量，降低了运行成本。(4)分类后，降低了废弃物的含水率，大大降低了渗滤液处理的运行成本。随着生活垃圾分类率的提升，垃圾含水率逐渐下降，低位热值逐渐上升，当垃圾分类率分别达到28.6%和39%时，热值提升比例分别约44%和68%。[3]
因为生活垃圾的种类过于繁杂，目前没有制定相应的分类标准，因此很多人在实际操作的过程中无法进行准确判断。基于卷积神经技术，建立准确的分类模型，利用技术手段改善居住环境。
1.2 文献综述
1.2.1 国内研究
“分步、分级、目标”将城市各方面生活垃圾分类制定系列罚款制度。第一，需要对垃圾分类系统进行优化提升一级补充，给出更为细致的垃圾分类标准以及原则，并且将垃圾分类收集进行统计，给出系列评价标准；第二，需要将种类不同的垃圾运输交通车辆对垃圾进行首次划分，防止后续操作产生混乱。另外还需要将垃圾收费体系进行革新，以垃圾的具体处理量以及分类处理具体实施过程加以收费流程；在城市当中的生活垃圾处理的最终点进行实时税收，同时与前期以及中间的关节进行适当专项资金的扶持。并且奖励以及惩罚系统需要进一步完善，打造一个公开的信息系统，实时掌握垃圾在处理方面的收费以及使用等状况；进一步鼓励群众对垃圾各方面的处理以及管理进行监督，通过采取具体的奖励手段来提高群众参与的积极性。
从垃圾分类的整体当中来看，前端处理应该进行适当简化，对干垃圾以及湿垃圾进行大致划分，转移至垃圾处理站再进行进一步的筛选，以降低居民对垃圾分类繁杂步骤的不满。而后端分拣主要针对干垃圾设置相应的分拣线，使得垃圾在分拣线上进行相应的筛选以及后续分拣。
首先需要建立相应的执法机构以及体系对垃圾分类制度进一步作出保障，同时进行相应费用的支付。例如，在每个垃圾处理站设置一名监督员，监督倾倒垃圾的居民按照规定对垃圾进行分类。如垃圾分类不按规定进行，监理应采取一定的处罚措施。强有力的执法有利于提升市民的垃圾分类意识，提高我国垃圾分类进度。

北极星固废网研究表明，目前垃圾分类大致能够发现以下几点问题：
(1)相关规定滞后，操作性不强
从当前社会来说，对垃圾进行分类进行一定奖励。垃圾分类没有明确的规定，也没有相应的法律法规。
(2)居民认识不到垃圾分类的重要性
大部分市民没有高度的分类意识，对垃圾分类暂时没有进行全面的掌握。居民对社区的宣传设施视而不见，许多人有一种高高挂起的心态，认为什么都不重要。
(3)生活垃圾投入费用没有相应的管理机构
生活垃圾在收费方面没有相应的制度进行规定，且收费没有标准。
(4)资金投入无法覆盖垃圾生命周期
城市公共财政未能对垃圾分类给予高度支持，垃圾分类只停留在“清理”的层面，没有达到真正的无害化处理，更不用说分类了。
(5)资源水平低下
对于可再生资源进行的管理方面水平较低，且盈利较为落后，产业链需要进一步完善，市场有待提高。进行分类之后的垃圾，能够进行回收利用的资源却没有地方可去。
(6)垃圾治理存在的大环境基础薄弱
市民与环卫局之间缺乏信任与合作。两者陷入囚徒困境，相互抱怨。
1.2.2 国外研究
德国目前的部分法律法规对垃圾分类进行较为严格的规定，也就是一个人犯错整个小区都需要被惩罚。一旦垃圾没有进行分类，所有居民都将被警告。
美国出台了相关法律法规，在很多城市将乱扔垃圾的行为进行罚款处理以及拘留等。
比利时在这方面规定居民如果不将垃圾进行分类，则会进行拒收处理。
日本对垃圾分类有着世界上的较高水准，目前来说，日本垃圾的分类较为严谨，比如东京，对家庭垃圾的分类作出了细致的划分，将所有大类又进行了更加详细的划分，比如资源垃圾当中又包括水平纸张等等。并且所有种类垃圾放置的区域不同，很多物品的废弃物都需要重新进行付费。

图1-5 日本垃圾回收种类
奥地利对生活垃圾的划分也有着非常具体的规定，使得可回收垃圾能够具有较高的利用率。从而使得环境负担有效降低。居民楼设置有一些收集垃圾的点，并且能够进行统一管理。奥地利对儿童都会进行垃圾分类的相关教育。将垃圾分类理念融入市民生活，并在潜移默化间化为市民的习惯，才能真正达到垃圾回收利用的效率最大化。
澳大利亚对于垃圾的分类较为简便，以不同颜色的桶盖进行区分，红色为填埋垃圾，黄色为干垃圾，绿色是有机物垃圾等等。全澳大利亚都以该统一标准进行分类，不会造成不同州不同治的问题。同时在学校也设置了相关课程。[4]
1.3垃圾分类的技术
对于目前存在的技术具有的问题进行提升优化，此次研究对机器学习[5]当中的卷积神经网络对白色污染物以及有害垃圾进行分类并打印出该垃圾所属种类，其目的在于对投放的垃圾图片作出准确的分类识别，来对人们在垃圾分类方面进行指导。同时能够降低人工分拣的压力，使得时间以及人力资源都能够得到节约，，提高资源的回收和利用效率。
将建立Xception[6]模型，尽可能使acc率提高。绘制神经网络模型图，绘制并分析学习曲线。基于Python的OpenCV[7]库进行图像的相关处理。使用Numpy[8]库进行相关数值运算，使用Torch[9]框架，Xception[10]模型，使用 Keras[11]等框架建立深度学习模型等。

第2章相关技术研究综述

2.1机器学习综述
机器学习的相关概念主要为：智能科学范畴的分支，以人工智能为核心展开研究。总之，经过各种文献当中的相关定义，机器学习就是将无序数据转化成为具有价值的信息。
机器学习属于一个交叉学科，与很多领域都有着一定联系，其中包括概率论、统计学等等。主要以计算机为研究对象来进行人类的学习性的模拟，使得其能够得到新技能的掌握，对自身知识储备进行高度优化。这属于人工智能最为重要的部分，能够使得计算机具备最基本的智能特点，其交叉领域非常多，主要借助于归纳以及整合。并且目前已经能够应用于人工智能当中的多个分支，比如自动推理、自然语言理解等等。[13]
2.2机器学习分类
机器学习以处理的数据当中有无具体标注作为依据进行有监督以及无监督的划分。就像垃圾分类中的有害垃圾，因为有些有害垃圾比较小，使用需要使用到监督学习，对有害垃圾的知识进行了解。
对学习数据进行监督的流程包括预训练以及人工进行目标的标注。以此使得学习对象得到有效划分，同时能够利用相关规则对数据进行结果显示，将被标记的方法进行输出。目前监督学习最主要的算法包括逻辑回归、卷积神经网络[13]等。
无监督学习，主要适用范围是没有进行过分类表及的数据同时不需要作出预训练，经过学习来搜集数据之间存在的潜在规律，并且描绘出样本数据最为准确的结构特性。其主要目的为基于学习把各种具有共性的原理进行区分。其中最为经典的算法主要包括自动编码器、深度置信网络[14]等。

图2-2 机器学习流程
2.3机器学习主要算法
2.3.1神经网络
二十世纪八十年代神经网络算法逐渐开始成为一大热点。目前深度学习的出现唤醒了神经网络算法的发展。
神经网络主要以大脑的工作为基础，机器学习的相关人员基于神经网络发展了一系列的机器学习的实验，并且发现在视觉和语言识别方面效果显著。
神经网络主要分为三个层面。输入层进行信号的接收，对数据进行分解。原型代表独立的处理单元，也就是神经元。进一步组成一二层，逐渐形成神经网络。[8]

图2-3 神经网络图[9]
2.3.2 机器学习的其他算法
机器学习的算法是多种多样的，但是因为不是我们的主要研究对象，所以就仅仅在这里简单提一下：
回归算法:(1)回归算法可以使我们从统计到机器学习的平稳迁移(2)回归算法属于机器学习的基石，如果没有学习好回归算法，基于这个算法的很多高阶算法将会学习事倍功半。
聚类算法：给不同种类添加不同标签，计算一个种类中每个数据的距离，依据距离远近从而将数据分为多个族群。
降维算法：特点是将数据从一个高维度问题降低一个或多个维度去探讨问题。就像我们数学中的点线面这种的，从面到线再到点这样子的一个类型。可以更深层度的保留数据的本源，所以是个很有用的一个算法。
推荐算法：这个算法在业界十分火，例如我们经常看的东西，然后下一次你就会收到相关的资料，这种就是最恶心的也是电商们最喜欢的，让你有种被监视了的感觉的推荐算法。当然推荐算法的好处就是关联性强，你不必因为上次逛的哪种类型忘记了而烦恼，因为推荐算法会把你之前最感兴趣的种类推荐给你，然后再给你推荐相关的商品，你可能一不小心就掉入了他们的陷阱，从而剁手。
当然还有各种其他的算法。可以看出，机器学习界还有许许多多别的算法，例如Logistic回归，K-紧邻算法等算法。但是除了我主要使用的神经网络之外，略带详细介绍的这六个算法是使用最多，影响最广也是种类最全的典范。机器学习特点：百家争鸣，百花齐放。
2.4 机器学习面临的挑战与机遇
目前，机器学习领域已经有了逐渐显著的成果，，极大地推动了人工智能的发展。然而，还应该注意到，还需要进一步的研究和理论支持。深度学习具有的局限性：理论不足以及机制不明确；不允许无人监督的学习。
另外，神经网络需要以人类大脑为基础。尽管深度学习与人脑相接近，然而各个方面上都与人脑差距很大。并且在生物层面，人们对大脑的发掘与认知上还不够深入，现如今要模拟人脑的的神经系统，目前还难以实现。因此，未来有很长一段时间需要进步，不止是在神经科学的研究上，对大脑的认知以及挖掘上也需要进一步的加深。
总而言之，在机器学习中有着广阔的研究和应用前景，挑战也是不可忽视的，取各自精华，才能把机器学习推向更高的境界。
总而言之，在机器学习中有着广阔的研究和应用前景，挑战也是不可忽视的，取各自精华，才能把机器学习推向更高的境界。
特别在5G推行之下，智能家居的普及将成为未来一个趋势，这个时候如果能抓得住机遇将能使机器学习往前推进一大步，而且人们对人工智能的认知也需要进一步的普及，而不应该一昧的认为它好或者不好。
2.5 总结
本章重点介绍了机器学习的神经网络算法，还有就是机器学习的未来的一些挑战以及机遇，不管怎么样，也许十年后，二十年后，我们都用上了智能家具，智能机器人，就会发现原来机器学习一直在我们身边，虽然我们可能从未发现它的身影或者说不懂他们的运行机制。但我们要相信的一点就是，科技的进步是为了让人类越变越好的，哪怕过程是坎坷的，艰辛的，因为这是从零到一的过程，难免会有走一些弯路，就像计算机的诞生一样，开始是只能计算简单是运算，而且占比十分的大。到现在计算机的运算速度以及类型等的变化是惊人的。因此，对于机器学习，我们要走的路一定很长，而且也会很曲折，但是未来一定是光明的。

第3章垃圾图像的智能分类算法

垃圾分类的acc值的高低是检验垃圾分类的关键因素，一个分类能力低下的垃圾分类工具是毫无用处的，所以如何提高垃圾分类的准确度，是本文的重点。本文利用卷积神经网络中的图片识别，Xception模型，Keras框架。

3.1 分类垃圾图像的预处理[15]
3.1.1 灰度处理
生活中，我们能看到的图像一般为彩色或者RGB图像，RGB图像拥有R、G、B三个颜色通道，这个跟我们美术的三原色（红黄蓝）不同，计算机中，我们看到的所有颜色都是有这三个通道（红、绿、蓝）按照一定比例组合而成的。分析一张彩色图片，如果放大N倍，我们可以看到它会由一个个小小的色素块组成，每个色素块由R、G、B三种颜色按照一定比例混合形成，我们成这些小方块状的色素块为像素点，就是JS中常用的px，它是一张图像的基本单位。

图3-1灰度处理前后对比图
一般图像的RGB仅仅是在光学上的一个颜色分配，在图像的反应形态特征方面反而不如灰度图像和HSV图像，因此在作图像的特征提取前，需要对RGB图像进行灰度处理，将三位图像转换成灰度图像，这种灰度图像有深浅不同的黑色像素点组成的二维数组，是三维RGB图像的一个分量，类似于之前提到的降维算法，把三维颜色的图片转换成二维颜色的图片。转变成灰度图之后，原来的三通道变成了一通道，即每一个像素点由0~255的量级表示灰度的程度，与RGB图像不同的是，灰度图像每个像素点只有一个灰度值。
由RGB图像转变为灰度图的计算公式如下：
Gray = R0.299 + G0.587 + B0.114 （3-1）
3.1.2 均值滤波去噪
图像滤波的作用主要是根据各方面细节为标准进行噪声处理，为一个不可或缺的环节。[16]由于部分无法左右的因素，图像会包含一些错误的信息，这些错误信息称为图像噪音，而均值滤波器[17]的作用是削弱图像中的无用噪音。其工作原理是计算某一区域除中心外的像素均值，将这个均值代替中心点。就像在一个66的像素区域中，由一个中央像素和35像素组成，经过系列处理去掉整个图像的像素点，这样子的效果之后图像中的噪音会被削弱，但是无法100%的去除。仅仅能去除图像中一些微弱噪音，使图像变得更平滑，这种滤波方式比其他方法简单易懂，而且在处理图像时的速度很快。均值滤波对消除高斯噪音效果较好。
3.2 垃圾图像的特征提取
3.2.1 垃圾图像的HSV颜色特征提取
(1) HSV颜色空间[23]
二十世纪A.R.smith提出HSV空间替代传统RGB空间作为新的颜色空间。 HSV模型类似于六角的圆锥体形状。拥有H、S、V三个分量。HSV如图所示。H是色调，其范围为（0°~ 360°），由旋转V轴角度决定。S是饱和度，范围为（0.0 ~ 1.0）；V代表亮度，范围为（0 ~ 1），从上至下颜色逐渐变深。HSV的颜色空间和RGB相比较更接近于人的视觉感知，它的颜色空间比较直观，具有良好的线性伸缩性。目前很多图像处理软件应用HSV颜色空间，效果显著于RGB。

图3-2 HSV模型[23]
(2)颜色特征
常用的有：颜色直方图[24]，颜色集[25]等。
①颜色直方图
描述各颜色中图像具体位置，与颜色位置没必要联系，这种特征在图像检索方面应用较广。

图3-3 颜色直方图
②颜色集
量化HSV颜色空间以获得多个二进制位置，进一步将图像进行划分，然后作出索引。得出颜色索引集合。
③颜色相关图
相关图与直方图一样，能表现某种颜色在图像中的分布情况，不同的是，它能表达出不同颜色的相关性。

3.3 卷积神经网络
3.3.1 卷积神经网络发展历程
卷积神经网络为当前计算机视觉方面最常用的算法，对于图像分析有着较大提高。已经通过了理论、实验以及应用和深入研究的阶段。
3.3.2 卷积神经网络特点
卷积神经网络属于前馈神经网络，由多个层次组成。[28]一般的三位图像未经处理就可作为网络模型的输入，模型的前部结构能对图像进行特征提取，该点与BP神经网络有本质区别。BP算法在图像处理有缺陷，过于依赖图像的特征提取，而且会陷入局部最优，识别精度较低。卷积神经网络的输出结果是各种类别的最后得分，借助于softmax分类器对其求得类别的相对概率，最后通过输出层输出。

图3-4 CNN模型
3.3.3 卷积神经网络的结构
卷积神经网络当中很多卷积核构成卷积层，其中具体作用主要是输入进行卷积运算，得出特征值通过对后面的输出结果反向传播优化卷积核从而得到最优解，一个卷积核只能提取一个特征，一般每个卷积层有很多卷积核，通过这些卷积核能够提取多种特征，如纹理、线条、边缘等，这些特征仅仅是图片的一些浅层特征，卷积层后一般会有池化层，作卷积运算后的降维处理。多层网络通过不断地卷积池化，能够得到更深层次的特征。全链接层的作用类似于人工神经网络，对提取的特征做训练，最终得到想要的结果。
(1)输入层
在CNN中，输入层是整个网络的第一层，如上图最左边的船的图像就是输入层，未经处理过的三维图片可以直接作为输入训练网络，但是输入层的图片规格需要保持一致，以方便后几层的卷积和池化运算。在做卷积神经网络训练时可以不用对图像进行预处理。
(2)卷积层
卷积层顾名思义就是对输入数据作卷积运算，它的做那个就是对输入数据提取特征处理。在特征提取时，需要将上层的输入数据与该层的权重作卷积运算。卷积层输出越高，则代表着匹配度越高，就越能体现图片的特征。这就好比一个5x5的图像，和一个3x3的卷积核，步长为1，其中卷积核中有9个参数，所以有9个神经元，输出又重新组成一个3x3的矩阵，如下图。

图3-5 卷积过程
(3)池化层
池化层能够对卷积层所有的输出作出维度降低，将计算量大大降低。
假设是2×2的池化，子矩阵的每个元素包含着2×2个元素，同理，4×4池化，子矩阵中每一元素含有4×4个元素，这样就做到了降低维度的作用。
想要压缩数据，必须具备池化标准。
如下图，我们使用MAX标准，对不同颜色区域取最大值，且步长为2，即取完一个元素就去另一个颜色区域取最大值。最终将4×4的矩阵压缩到了2×2矩阵。

图3-6 最大值池化

(4)全连接层
所有连接层都能够使得多个特征值进行增和。图像经输入层输入后，经过多次卷积、激励和池化运算过后，提取图像的深层特征，将这些离散的特征经过全连接层的作用转变为反应图像的全局特征，这些特征可以作为计算最后分类的得分来使用。
(5) 输出层
CNN的输出层是一个分类器。本文研究的目的是要对白色污染物和有害垃圾进行分类，因为有害垃圾的种类较多，因此有害垃圾分类是一个多分类问题。Softmax是常用的分类器，这种分类器可以平均各个概率，概率总和为1。，SotfMax常常用在完成多分类任务的输出层。其结构如下图所示。

图3-7 Softmax层结构图
Softmax概率计算函数函数如下图所示：

图3-8 Softmax计算函数
其中，Zi为全连接层的输出值，Si为最后分类的概率。

3.3.4 AlexNet卷积神经网络
(1)AlexNet网络
AlexNet于2012年，Alex Krizhevs设计出。AlexNet网络是一种对1000类图像进行分类的卷积神经网络，结构分八层，每个卷积层后面都会伴随着池化层、Dropout、激活函数等，通过这些层的组合，能够提取图像深层次的特征，可以有效的提高图像分类精度和减少过拟合。后儿层主要是对前面提取的特征进行训练，从而获得一个较高精度的分类器。

图3-9 迁移学习流程
(2)迁移学习
将所学到的知识进行转移加以解决，目标领域主要是无法进行任务的标准化进程。
在图像分类方面，普通的算法需要大量的图像作为输入样本，而且需要对这些样本做好标签，有的样本数据获得困难，如果要重新训练整个网络对人的精力消耗极大。而迁移学习能够克服这种困难，这是因为卷积神经网络首个卷积层提取的底层特征如纹理、颜色、边缘特征等在很多分类问题中都是通用的，迁移学习主要去除己有的卷积模型因此在样本较少的情况下也有较好的效果。

图3-10 底层特征
3.3.5 基于Xception卷积神经网络的迁移学习
Xception 是 Google 继 Inception 后提出的对 Inception-v3 的另一种改进。
在Inception 中，有多种方法提取特征，Inception 结构将一个输入做多重提取特征方式，之后做 concat 。Xception结构通过卷积网络提取特征。
Xception在ImageNet在top-1的精度最高，top-5的更是高达0.945。Xception数据集图像格式为299×299，并且预处理函数也有不同。目前该模型后端仅支持Tensorflow。

图3-11 Inception-v3结构图
Xception：首先进行卷积操作，再进行后续分支操作。结果 concat：

图3-12 Xception结构图
Xception网络结构基于ResNet，卷积层转换为Separable Convolution。下图为Xception网络。

图3-13 Xception网络结构
Xception 在 ImageNet 上，准确率高于 Inception-v3 ，所需参数低于Inception-v3， Xception 加入残差连接使其效果更好，收敛速度提高。本文中 Xception 的计算量低于Inception。Xception结构在不增加网络复杂度前提下提高了模型效果。
3.4 Keras框架[11]
Keras为神经网络API，Python进行编写，能够满足以下需求：
原型设计；支持CNN、RNN；可切换GPU和CPU。
设计原则：

图3-14 用户友好

图3-15 模块化

图3-16 易扩展性

图3-17 与Python协作
Keras：序贯模型类似于网络的线形叠加。

图3-18 Keras框架架构
对Keras而言，有Sequential序贯模型、Model函数式模型。
其中序贯模型API主要用于深度学习模型，主要以单核输入以及输出。无法进行多核以及特征提取等复杂操作的情况。
keras的model模块在HDF5文件中对Keras训练模型进行储存。详情如下图。

图3-19 HDF5文件内容
3.5 Tensorflow
Tensorflow在2015年由谷歌首发，由于其性能以及功能的强大，很多神经网络的使用者纷纷抛弃Numpy这个编写程序困难，执行时间长的库，转而投入了Tensorflow大家庭当中。短短数年，就确立了其地位，在GitHub上拥有上万投稿，这体现了Tensorflow的流行性以及性能的强大。

图3-20 深度学习框架
我们可以从上图看出，Tensorflow在发布至今，已经成为了一尊大佛，随着时间的顺延，Tensorflow库已经成为现如今不可或缺的一个深度学习库。
Tensorflow的介绍：支持CPU、GPU、PC端等，仅需使用API就可无缝部署；能自动求导，并且它还是一个开源库，拥有多种训练模型，可以进行预训练，常用的CNN、RNN架构都可以在Tensorflow上面使用。本文使用的RNN就是基于Tensorflow的基础上进行预训练的。
Tensorflow特点如下图：

图3-21 Tensorflow的特点
3.6 本章小结
基于人工智能分类算法的垃圾图像检测分类，本章介绍了卷积神经的发展、结构以及重点介绍了智能分类垃圾的技术支持，主要有卷积神经网络发展历史、垃圾图像的预处理、HSV颜色特征提取垃圾图像，Alexnet模型和Xception模型的迁移学习，Keras框架的介绍以及Tensorflow库的介绍。

四垃圾分类实验

4.1 基于迁移学习和Xception网络分类仿真
卷积神经网络对图像进行识别具有系列优势，在输入样本特征的时候无需进行提取，比传统途径智能，但是也存在不足，训练一个卷积神经网络需要一个庞大的样本数据集。本节主要使用Xception网络图像分类算法做迁移学习。
4.1.1 实验环境
本实验是windows10系统，开发语言Python3.7，Xception模型，Jupyter，Tensorflow，Keras框架，样本数据集为干电池、纽扣电池、蓄电池、白色垃圾袋、药膏、过期药品，共2220 张图片数据，随机选取 264 张作为训练样本，其余作为测试样本。
首先导入机器学习所需库，如下图：

图4-1 本文所需库
4.1.2 模型构建
本文利用现有Xception模型用来解决有害垃圾、白色污染物的图像分类问题。首先，先建立一系列辅助函数，有添加目录和文件名的辅助函数；专门用于画图的函数，用于显示正确的预测类别的函数；混淆矩阵函数，用于找出被错误分类图片的辅助函数，避免因为图片分类错误而产生不必要的错误；使用Keras API画出训练历史，用于找出分类的准确率和损失率。

图4-2 白色污染物

图4-3 干电池(错误分类)

图4-4 过期药膏(错误分类)
通过对类的权重进行分析计算，尽量平衡数据集。各类垃圾权重数值如下图：

图4-5 各类垃圾的权重
通过对图像进行建模，并对训练历史进行记录，通过不断的预训练并导入训练好的HDF5文件，进行迁移学习。尝试将模型的最后一个卷积层输出接到新的全连接神经网络上，通过它来对数据集进行分类。
4.1.3 辅助函数
构建不同功能并相辅相成的辅助函数，首先先定义混淆矩阵，用于对精度有一个确定值，混淆矩阵是最基本的也是最容易操作的方法，通过对图像的分类进而达到对精度的提高。

图4-6 混淆矩阵

图4-7 训练历史
4.1.4 样本数据集
共拥有6个数据集，分别为白色污染物、干电池、药膏、过期药品、纽扣电池以及蓄电池。其中白色污染物占比最高，占比约为20%。其中测试集使用数据较少，平均每样样本45张图片，其余照片作训练集使用。

图4-8 数据集

图4-9 定义数据集
4.1.5 训练步骤
低层的卷积神经网络可以识别图像中的不同形状。它是最后几个全连接的层将这些特征组合成整个图像的分类。因此，可以尝试将模型的最后一个卷积层的输出重新接到一个新的全连接神经网络，用它来对数据集进行分类。
首先导入模型，接着进行训练，并把训练结果通过Keras模型进行保存。接着Keras在每个“epoch”结束时记录性能指标。为方便绘图，在训练期间训练集的损失值会降低，但是测试集的损失值不稳定。并且，在训练集中分类精度会有所提高，在测试集中则有些不稳定。

图4-10训练和测试精度
训练过后，通过Keras API中的单个函数测试模型在测试集中的性能。之后打印混淆矩阵。并将训练好的模型进行批量测试。通过OpenCV对图像进行轮廓识别，其目的是为了获取边界矩阵。

图4-11 打印混淆矩阵

图4-12 混淆矩阵
4.1.6 训练结果
通过调用数据集、训练模型对垃圾的图像识别以及分析，最终根据图像识别显示结果判断预测结果是否正确。对训练集进行定义以及最终验收效果：

图4-13 垃圾的预测分类
训练成果如下：

图4-14 干电池

图4-15 过期药品

图4-16 白色污染物
训练成果效果可观，对于一些容易区分，辨识度高的数据可以做到近百分百准确度，但是如果遇到一些角度刁钻些的数据，就会比较容易出现错误，当然未来的科技发展起来，这些问题将不复存在。
4.2 本章小结
本章主要研究基于Xception迁移学习的算法。事实证明了卷积神经网络在垃圾分类方面更具有实用性，故而使用卷积神经网络对白色污染物以及有害垃圾进行垃圾分类。由于使用的数据集比较少，而且只对白色污染物、有害垃圾的一部分进行了数据整合，数据集的缺失以及训练模型的搭建，将很大程度的影响之后训练集的成品展示，如果训练模型没搭建成功，测试集没测试完全，最终训练集中将可能会出现大片预测错误的可能出现。

五总结与展望

5.1 总结
本文主要研究基于深度学习的白色污染物、有害垃圾的垃圾分类，利用卷积神经网络、Keras框架以及Xception模型制作了一个智能垃圾的预测模型，将所需要测试的图片放进训练集进行预测，对图片进行分析预测，并正确分类进行比对，若显示分类正确，将提示预测正确。
课题主要研究内容包括：对国内外垃圾分类的现状分析，对机器学习进行介绍，对卷积神经网络进行介绍，还有一些所需要用到的算法知识以及拓展知识的介绍。完成了垃圾图像的处理以及通过Xception卷积神经网络这个优秀的模型进行实现垃圾分类的效果。
5.2 展望
本文主要是对城市中垃圾分类的趋势进行的一个对有害垃圾、白色污染物进行的研究，由于时间和经验方面的局限性，本文还有很多需要改进以及完善的地方。生活垃圾在以前都是打包在一起然后丢出去的，而因为过不久就需要把垃圾分类打包到不同的垃圾桶中，为了方便个人所以做出一个对垃圾分类的一个小尝试，希望能在未来有人能用到我做的这个垃圾分类的小程序啊，或者是一个APP那是最好的，说明我的产品就做到了全垃圾分类。不过因为本文现在做的是对有害垃圾和白色污染物的识别，可能对海边那种的会比较实用，因为现在海洋很多白色污染物、以及有害垃圾的排放，对海洋生物造成了巨大的影响，所以如果能把这些垃圾进行分类，可能会对大自然有一定的帮助吧。毕竟地球是我们的母亲，谁都希望地球变好。

参考文献

[1] 2019年中国垃圾分类行业发展现状及产业政策分析
[2] 百度百科—白色污染物
[3] 2019年中国垃圾分类行业发展现状分析及未来发展空间预测
[4] 北极星固废网
[5] 机器学习实战 [美] Peter Harrington
[6] 深度学习入门：基于Python的理论与实现 [日本] 斋藤康毅
[7] 学习OpenCV [美] 布拉德斯基（Bradski，G.），（美）克勒（Kaehler，A.）著，于仕琪，刘瑞祯译
[8] 模式分类 [美] Richard O. Duda Peter E. Hart David G. Stork
[9] https://www.cnblogs.com/magicalzh/p/9273402.html
[10] 深度学习实战之垃圾分类https://blog.csdn.net/public669/article/details/100176888
[11] Keras: The Python Deep Learning library
[12] 《人工智能》机器学习
[13] https://blog.csdn.net/a1742326479/article/details/81048473
[14] Very Deep Convolutional Networks for Large-Scale Image Recognition
[15] 基于深度学习的城市垃圾桶智能分类研究_黄国维
[16] 百度百科—图像滤波
[17] 陈家益，曹会英，熊刚强，徐秋燕基于灰度修建和均衡化的加权均值滤波算法 [J].四川师范大学学报 2017(2).277-284
[18] 侯群群，王飞，严丽，基于灰度共生矩阵的彩色遥感图像纹理特征提取 [J]国土资源遥感，2013(4):26
[19] 刘辉，张云生，张印辉等，基于灰度差分统计的火焰图像纹理特征提取 [j].控制工程2013.20(2):213-218
[20] Watson A,Neill M O, Kitching I, Automated identification of live moths(Macrolepidoptera)using digital automated identification system(DAISY) [J].Systematics & Biodiversity, 2004.1(3):287-300
[21] 胡召玲，李海权，杜培军，SAR图像纹理特征提取与分类研究 [J]中国矿业大学学报,2009,38(3):422-427
[22] 张军，代科学，李国辉. 基于HSV颜色空间和码本模型的运动目标检测．《系统工程与电子技术》，2008
[23] JACOB IJ, SRINIVASAGAN K G, JAYAPRIYA K. Local oppugnant color texture pattern for image retrieval system [j].Pattern Recognition Letters, 20148
[24] BRUNELLI R, MICH O. Histongrams analysis for image retrieval [J]. Pattern Recognition, 2001
[25] Huang J, Kumar S R, Mitra M, et al.Imageindexing using color cor-relograms[C]//Proceedings of IEEE Conference o Computer Vision and Pattern Recognition.San Juan, Puerto Rico,1997
[26] Stricker A M A, Orengo M. Similarity of Color Images[J]. Proceedings of SPIE - The International Society for Optical Engineering, 1970, 2420:381–392.
[27] 杜敬.基于深度学习的无人机遥感影像水体识别[J].江西科学.2017,01:158-161+170.
[28] Huang W, Kim K, Yang Y, et a1.Automatic shadow removal by illuminance in HSV color space[J].Computer Science and Information Technologies, 2015, 3 (3) :70-75.

致谢

四年的学习生活即将结束，四年的每一个日日夜夜，老师的教诲与指导，师兄师姐和同学的帮助都历历在目，父母的支持与鼓励总使我的步伐不断向前迈进。我是幸运的，能结识这么多的良师益友，能顺利、愉快地完成学业。

你可能感兴趣的:(java,java)

Long类型前后端数据不一致 igotyback 前端
响应给前端的数据浏览器控制台中response中看到的Long类型的数据是正常的到前端数据不一致前后端数据类型不匹配是一个常见问题，尤其是当后端使用Java的Long类型（64位）与前端JavaScript的Number类型（最大安全整数为2^53-1，即16位）进行数据交互时，很容易出现精度丢失的问题。这是因为JavaScript中的Number类型无法安全地表示超过16位的整数。为了解决这个问
LocalDateTime 转 String igotyback java 开发语言
importjava.time.LocalDateTime;importjava.time.format.DateTimeFormatter;publicclassMain{publicstaticvoidmain(String[]args){//获取当前时间LocalDateTimenow=LocalDateTime.now();//定义日期格式化器DateTimeFormatterformat
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
DIV+CSS+JavaScript技术制作网页（旅游主题网页设计与制作）云南大理 STU学生网页设计网页设计期末网页作业 html静态网页 html5期末大作业网页设计 web大作业
️精彩专栏推荐作者主页:【进入主页—获取更多源码】web前端期末大作业：【HTML5网页期末作业(1000套)】程序员有趣的告白方式：【HTML七夕情人节表白网页制作(110套)】文章目录二、网站介绍三、网站效果▶️1.视频演示2.图片演示四、网站代码HTML结构代码CSS样式代码五、更多源码二、网站介绍网站布局方面：计划采用目前主流的、能兼容各大主流浏览器、显示效果稳定的浮动网页布局结构。网站程
【华为OD机试真题2023B卷 JAVA&JS】We Are A Team 若博豆 java 算法华为 javascript
华为OD2023（B卷）机试题库全覆盖，刷题指南点这里WeAreATeam时间限制：1秒|内存限制：32768K|语言限制：不限题目描述：总共有n个人在机房，每个人有一个标号（1<=标号<=n），他们分成了多个团队，需要你根据收到的m条消息判定指定的两个人是否在一个团队中，具体的：1、消息构成为：abc，整数a、b分别代
关于城市旅游的HTML网页设计——(旅游风景云南 5页)HTML+CSS+JavaScript 二挡起步 web前端期末大作业 javascript html css 旅游风景
⛵源码获取文末联系✈Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业|游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作|HTML期末大学生网页设计作业，Web大学生网页HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScrip
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
node.js学习小猿L node.js node.js 学习 vim
node.js学习实操及笔记温故node.js，node.js学习实操过程及笔记~node.js学习视频node.js官网node.js中文网实操笔记githubcsdn笔记为什么学node.js可以让别人访问我们编写的网页为后续的框架学习打下基础，三大框架vuereactangular离不开node.jsnode.js是什么官网：node.js是一个开源的、跨平台的运行JavaScript的运行
Java 重写(Override)与重载(Overload) 叨唧唧的
Java重写(Override)与重载(Overload)重写(Override)重写是子类对父类的允许访问的方法的实现过程进行重新编写,返回值和形参都不能改变。即外壳不变，核心重写！重写的好处在于子类可以根据需要，定义特定于自己的行为。也就是说子类能够根据需要实现父类的方法。重写方法不能抛出新的检查异常或者比被重写方法申明更加宽泛的异常。例如：父类的一个方法申明了一个检查异常IOExceptio
简单了解 JVM 记得开心一点啊 jvm
目录♫什么是JVM♫JVM的运行流程♫JVM运行时数据区♪虚拟机栈♪本地方法栈♪堆♪程序计数器♪方法区/元数据区♫类加载的过程♫双亲委派模型♫垃圾回收机制♫什么是JVMJVM是JavaVirtualMachine的简称，意为Java虚拟机。虚拟机是指通过软件模拟的具有完整硬件功能的、运行在一个完全隔离的环境中的完整计算机系统（如：JVM、VMwave、VirtualBox）。JVM和其他两个虚拟机
1分钟解决 -bash: mvn: command not found，在Centos 7中安装Maven Energet!c 开发语言
1分钟解决-bash:mvn:commandnotfound，在Centos7中安装Maven检查Java环境1下载Maven2解压Maven3配置环境变量4验证安装5常见问题与注意事项6总结检查Java环境Maven依赖Java环境，请确保系统已经安装了Java并配置了环境变量。可以通过以下命令检查：java-version如果未安装，请先安装Java。1下载Maven从官网下载：前往Apach
Java企业面试题3 马龙强_ java
1.break和continue的作用(智*图)break：用于完全退出一个循环（如for,while）或一个switch语句。当在循环体内遇到break语句时，程序会立即跳出当前循环体，继续执行循环之后的代码。continue：用于跳过当前循环体中剩余的部分，并开始下一次循环。如果是在for循环中使用continue，则会直接进行条件判断以决定是否执行下一轮循环。2.if分支语句和switch分
JVM、JRE和 JDK：理解Java开发的三大核心组件 Y雨何时停T Java java
Java是一门跨平台的编程语言，它的成功离不开背后强大的运行环境与开发工具的支持。在Java的生态中，JVM（Java虚拟机）、JRE（Java运行时环境）和JDK（Java开发工具包）是三个至关重要的核心组件。本文将探讨JVM、JDK和JRE的区别，帮助你更好地理解Java的运行机制。1.JVM：Java虚拟机（JavaVirtualMachine）什么是JVM？JVM，即Java虚拟机，是Ja
Java面试题精选：消息队列(二) 芒果不是芒 Java面试题精选 java kafka
一、Kafka的特性1.消息持久化：消息存储在磁盘，所以消息不会丢失2.高吞吐量：可以轻松实现单机百万级别的并发3.扩展性：扩展性强，还是动态扩展4.多客户端支持：支持多种语言（Java、C、C++、GO、）5.KafkaStreams（一个天生的流处理）:在双十一或者销售大屏就会用到这种流处理。使用KafkaStreams可以快速的把销售额统计出来6.安全机制：Kafka进行生产或者消费的时候会
白骑士的Java教学基础篇 2.5 控制流语句白骑士所长 Java 教学 java 开发语言
欢迎继续学习Java编程的基础篇！在前面的章节中，我们了解了Java的变量、数据类型和运算符。接下来，我们将探讨Java中的控制流语句。控制流语句用于控制程序的执行顺序，使我们能够根据特定条件执行不同的代码块，或重复执行某段代码。这是编写复杂程序的基础。通过学习这一节内容，你将掌握如何使用条件语句和循环语句来编写更加灵活和高效的代码。条件语句条件语句用于根据条件的真假来执行不同的代码块。if语句‘
python语法——三目运算符 HappyRocking python python 三目运算符
在java中，有三目运算符，如：intc=(a>b)?a:b表示c取两者中的较大值。但是在python，不能直接这样使用，估计是因为冒号在python有分行的关键作用。那么在python中，如何实现类似功能呢？可以使用ifelse语句，也是一行可以完成，格式为：aifbelsec表示如果b为True，则表达式等于a，否则等于c。如：c=(aif(a>b)elseb)同样是完成了取最大值的功能。
ArrayList 源码解析程序猿进阶 Java基础 ArrayList List java 面试性能优化架构设计 idea
ArrayList是Java集合框架中的一个动态数组实现，提供了可变大小的数组功能。它继承自AbstractList并实现了List接口，是顺序容器，即元素存放的数据与放进去的顺序相同，允许放入null元素，底层通过数组实现。除该类未实现同步外，其余跟Vector大致相同。每个ArrayList都有一个容量capacity，表示底层数组的实际大小，容器内存储元素的个数不能多于当前容量。当向容器中添
Java爬虫框架（一）--架构设计狼图腾-狼之传说 java 框架 java 任务 html解析器存储电子商务
一、架构图那里搜网络爬虫框架主要针对电子商务网站进行数据爬取，分析，存储，索引。爬虫：爬虫负责爬取，解析，处理电子商务网站的网页的内容数据库：存储商品信息索引：商品的全文搜索索引Task队列：需要爬取的网页列表Visited表：已经爬取过的网页列表爬虫监控平台：web平台可以启动，停止爬虫，管理爬虫，task队列，visited表。二、爬虫1.流程1)Scheduler启动爬虫器，TaskMast
Java：爬虫框架 dingcho Java java 爬虫
一、ApacheNutch2【参考地址】Nutch是一个开源Java实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。Nutch致力于让每个人能很容易,同时花费很少就可以配置世界一流的Web搜索引擎.为了完成这一宏伟的目标,Nutch必须能够做到:每个月取几十亿网页为这些网页维护一个索引对索引文件进行每秒上千次的搜索提供高质量的搜索结果简单来说Nutch支持分
python怎么将png转为tif_png转tif weixin_39977276
发国外的文章要求图片是tif，cmyk色彩空间的。大小尺寸还有要求。比如网上大神多，找到了一段代码，感谢！https://www.jianshu.com/p/ec2af4311f56https://github.com/KevinZc007/image2Tifimportjava.awt.image.BufferedImage;importjava.io.File;importjava.io.Fi
JavaScript 中，深拷贝（Deep Copy）和浅拷贝（Shallow Copy）跳房子的前端前端面试 javascript 开发语言 ecmascript
在JavaScript中，深拷贝（DeepCopy）和浅拷贝（ShallowCopy）是用于复制对象或数组的两种不同方法。了解它们的区别和应用场景对于避免潜在的bugs和高效地处理数据非常重要。以下是对深拷贝和浅拷贝的详细解释，包括它们的概念、用途、优缺点以及实现方式。1.浅拷贝（ShallowCopy）概念定义：浅拷贝是指创建一个新的对象或数组，其中包含了原对象或数组的基本数据类型的值和对引用数
JAVA·一个简单的登录窗口 MortalTom java 开发语言学习
文章目录概要整体架构流程技术名词解释技术细节资源概要JavaSwing是Java基础类库的一部分，主要用于开发图形用户界面（GUI）程序整体架构流程新建项目，导入sql.jar包（链接放在了文末），编译项目并运行技术名词解释一、特点丰富的组件提供了多种可视化组件，如按钮（JButton）、文本框（JTextField）、标签（JLabel）、下拉列表（JComboBox）等，可以满足不同的界面设计
WebMagic：强大的Java爬虫框架解析与实战 Aaron_945 Java java 爬虫开发语言
文章目录引言官网链接WebMagic原理概述基础使用1.添加依赖2.编写PageProcessor高级使用1.自定义Pipeline2.分布式抓取优点结论引言在大数据时代，网络爬虫作为数据收集的重要工具，扮演着不可或缺的角色。Java作为一门广泛使用的编程语言，在爬虫开发领域也有其独特的优势。WebMagic是一个开源的Java爬虫框架，它提供了简单灵活的API，支持多线程、分布式抓取，以及丰富的
博客网站制作教程 2401_85194651 java maven
首先就是技术框架：后端：Java+SpringBoot数据库：MySQL前端：Vue.js数据库连接：JPA(JavaPersistenceAPI)1.项目结构blog-app/├──backend/│├──src/main/java/com/example/blogapp/││├──BlogApplication.java││├──config/│││└──DatabaseConfig.java
00. 这里整理了最全的爬虫框架（Java + Python）有一只柴犬爬虫系列爬虫 java python
目录1、前言2、什么是网络爬虫3、常见的爬虫框架3.1、java框架3.1.1、WebMagic3.1.2、Jsoup3.1.3、HttpClient3.1.4、Crawler4j3.1.5、HtmlUnit3.1.6、Selenium3.2、Python框架3.2.1、Scrapy3.2.2、BeautifulSoup+Requests3.2.3、Selenium3.2.4、PyQuery3.2
JAVA学习笔记之23种设计模式学习 victorfreedom Java技术设计模式 android java 常用设计模式
博主最近买了《设计模式》这本书来学习，无奈这本书是以C++语言为基础进行说明，整个学习流程下来效率不是很高，虽然有的设计模式通俗易懂，但感觉还是没有充分的掌握了所有的设计模式。于是博主百度了一番，发现有大神写过了这方面的问题，于是博主迅速拿来学习。一、设计模式的分类总体来说设计模式分为三大类：创建型模式，共五种：工厂方法模式、抽象工厂模式、单例模式、建造者模式、原型模式。结构型模式，共七种：适配器
JavaScript `Map` 和 `WeakMap`详细解释跳房子的前端 JavaScript 原生方法 javascript 前端开发语言
在JavaScript中，Map和WeakMap都是用于存储键值对的数据结构，但它们有一些关键的不同之处。MapMap是一种可以存储任意类型的键值对的集合。它保持了键值对的插入顺序，并且可以通过键快速查找对应的值。Map提供了一些非常有用的方法和属性来操作这些数据对：set(key,value):将一个键值对添加到Map中。如果键已经存在，则更新其对应的值。get(key):获取指定键的值。如果键
切换淘宝最新npm镜像源是 hai40587 npm 前端 node.js
切换淘宝最新npm镜像源是一个相对简单的过程，但首先需要明确当前淘宝npm镜像源的状态和最新的镜像地址。由于网络环境和服务更新，镜像源的具体地址可能会发生变化，因此，我将基于当前可获取的信息，提供一个通用的切换步骤，并附上最新的镜像地址（截至回答时）。一、了解npm镜像源npm（NodePackageManager）是JavaScript的包管理器，用于安装、更新和管理项目依赖。由于npm官方仓库
【Java】已解决：java.util.concurrent.CompletionException 屿小夏 java 开发语言
文章目录一、分析问题背景出现问题的场景代码片段二、可能出错的原因三、错误代码示例四、正确代码示例五、注意事项已解决：java.util.concurrent.CompletionException一、分析问题背景在Java并发编程中，java.util.concurrent.CompletionException是一种常见的运行时异常，通常在使用CompletableFuture进行异步计算时出现
设计模式之建造者模式(通俗易懂--代码辅助理解【Java版】） ok!ko 设计模式设计模式建造者模式 java
文章目录设计模式概述1、建造者模式2、建造者模式使用场景3、优点4、缺点5、主要角色6、代码示例：1）实现要求2）UML图3)实现步骤：1）创建一个表示食物条目和食物包装的接口2）创建实现Packing接口的实体类3）创建实现Item接口的抽象类，该类提供了默认的功能4）创建扩展了Burger和ColdDrink的实体类5）创建一个Meal类，带有上面定义的Item对象6）创建一个MealBuil
Js函数返回值 _wy_ js return
一、返回控制与函数结果，语法为：return 表达式;作用: 结束函数执行，返回调用函数，而且把表达式的值作为函数的结果二、返回控制语法为：return;作用: 结束函数执行，返回调用函数，而且把undefined作为函数的结果在大多数情况下,为事件处理函数返回false,可以防止默认的事件行为.例如,默认情况下点击一个<a>元素,页面会跳转到该元素href属性
MySQL 的 char 与 varchar bylijinnan mysql
今天发现，create table 时，MySQL 4.1有时会把 char 自动转换成 varchar 测试举例： CREATE TABLE `varcharLessThan4` ( `lastName` varchar(3) ) ; mysql> desc varcharLessThan4; +----------+---------+------+-
Quartz——TriggerListener和JobListener eksliang TriggerListener JobListener quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208624 一.概述 listener是一个监听器对象，用于监听scheduler中发生的事件，然后执行相应的操作；你可能已经猜到了，TriggerListeners接受与trigger相关的事件，JobListeners接受与jobs相关的事件。二.JobListener监听器 j
oracle层次查询 18289753290 oracle；层次查询；树查询
.oracle层次查询(connect by) oracle的emp表中包含了一列mgr指出谁是雇员的经理，由于经理也是雇员，所以经理的信息也存储在emp表中。这样emp表就是一个自引用表，表中的mgr列是一个自引用列，它指向emp表中的empno列，mgr表示一个员工的管理者， select empno,mgr,ename,sal from e
通过反射把map中的属性赋值到实体类bean对象中酷的飞上天空 javaee 泛型类型转换
使用过struts2后感觉最方便的就是这个框架能自动把表单的参数赋值到action里面的对象中但现在主要使用Spring框架的MVC，虽然也有@ModelAttribute可以使用但是明显感觉不方便。好吧，那就自己再造一个轮子吧。原理都知道，就是利用反射进行字段的赋值，下面贴代码主要类如下： import java.lang.reflect.Field; imp
SAP HANA数据存储：传统硬盘的瓶颈问题蓝儿唯美 HANA
SAPHANA平台有各种各样的应用场景，这也意味着客户的实施方法有许多种选择，关键是如何挑选最适合他们需求的实施方案。在《Implementing SAP HANA》这本书中，介绍了SAP平台在现实场景中的运作原理，并给出了实施建议和成功案例供参考。本系列文章节选自《Implementing SAP HANA》，介绍了行存储和列存储的各自特点，以及SAP HANA的数据存储方式如何提升空间压
Java Socket 多线程实现文件传输随便小屋 java socket
高级操作系统作业，让用Socket实现文件传输，有些代码也是在网上找的，写的不好，如果大家能用就用上。客户端类： package edu.logic.client; import java.io.BufferedInputStream; import java.io.Buffered
java初学者路径 aijuans java
学习Java有没有什么捷径?要想学好Java，首先要知道Java的大致分类。自从Sun推出Java以来，就力图使之无所不包，所以Java发展到现在，按应用来分主要分为三大块：J2SE,J2ME和J2EE,这也就是Sun ONE(Open Net Environment)体系。J2SE就是Java2的标准版，主要用于桌面应用软件的编程；J2ME主要应用于嵌入是系统开发，如手机和PDA的编程；J2EE
APP推广 aoyouzi APP 推广
一，免费篇 1，APP推荐类网站自主推荐最美应用、酷安网、DEMO8、木蚂蚁发现频道等,如果产品独特新颖，还能获取最美应用的评测推荐。PS：推荐简单。只要产品有趣好玩，用户会自主分享传播。例如足迹APP在最美应用推荐一次，几天用户暴增将服务器击垮。 2，各大应用商店首发合作老实盯着排期，多给应用市场官方负责人献殷勤。 3，论坛贴吧推广百度知道，百度贴吧，猫扑论坛，天涯社区，豆瓣（
JSP转发与重定向百合不是茶 jsp servlet Java Web jsp转发
在servlet和jsp中我们经常需要请求,这时就需要用到转发和重定向; 转发包括;forward和include 例子;forwrad转发; 将请求装法给reg.html页面关键代码; req.getRequestDispatcher("reg.html
web.xml之jsp-config bijian1013 java web.xml servlet jsp-config
1.作用：主要用于设定JSP页面的相关配置。 2.常见定义： <jsp-config> <taglib> <taglib-uri>URI(定义TLD文件的URI,JSP页面的tablib命令可以经由此URI获取到TLD文件)</tablib-uri> <taglib-location> TLD文件所在的位置
JSF2.2 ViewScoped Using CDI sunjing CDI JSF 2.2 ViewScoped
JSF 2.0 introduced annotation @ViewScoped; A bean annotated with this scope maintained its state as long as the user stays on the same view(reloads or navigation - no intervening views). One problem w
【分布式数据一致性二】Zookeeper数据读写一致性 bit1129 zookeeper
很多文档说Zookeeper是强一致性保证，事实不然。关于一致性模型请参考http://bit1129.iteye.com/blog/2155336 Zookeeper的数据同步协议 Zookeeper采用称为Quorum Based Protocol的数据同步协议。假如Zookeeper集群有N台Zookeeper服务器(N通常取奇数，3台能够满足数据可靠性同时
Java开发笔记白糖_ java开发
1、Map<key,value>的remove方法只能识别相同类型的key值 Map<Integer,String> map = new HashMap<Integer,String>(); map.put(1,"a"); map.put(2,"b"); map.put(3,"c"
图片黑色阴影 bozch 图片
.event{ padding:0; width:460px; min-width: 460px; border:0px solid #e4e4e4; height: 350px; min-heig
编程之美-饮料供货-动态规划 bylijinnan 动态规划
import java.util.Arrays; import java.util.Random; public class BeverageSupply { /** * 编程之美饮料供货 * 设Opt（V’，i）表示从i到n-1种饮料中，总容量为V’的方案中，满意度之和的最大值。 * 那么递归式就应该是：Opt（V’，i）=max{ k * Hi+Op
ajax大参数（大数据）提交性能分析 chenbowen00 Web Ajax 框架浏览器 prototype
近期在项目中发现如下一个问题项目中有个提交现场事件的功能，该功能主要是在web客户端保存现场数据（主要有截屏，终端日志等信息）然后提交到服务器上方便我们分析定位问题。客户在使用该功能的过程中反应点击提交后反应很慢，大概要等10到20秒的时间浏览器才能操作，期间页面不响应事件。根据客户描述分析了下的代码流程，很简单，主要通过OCX控件截屏，在将前端的日志等文件使用OCX控件打包，在将之转换为
[宇宙与天文]在太空采矿,在太空建造 comsci
我们在太空进行工业活动...但是不太可能把太空工业产品又运回到地面上进行加工,而一般是在哪里开采,就在哪里加工,太空的微重力环境,可能会使我们的工业产品的制造尺度非常巨大.... 地球上制造的最大工业机器是超级油轮和航空母舰,再大些就会遇到困难了,但是在空间船坞中,制造的最大工业机器,可能就没
ORACLE中CONSTRAINT的四对属性 daizj oracle CONSTRAINT
ORACLE中CONSTRAINT的四对属性 summary:在data migrate时,某些表的约束总是困扰着我们,让我们的migratet举步维艰,如何利用约束本身的属性来处理这些问题呢?本文详细介绍了约束的四对属性: Deferrable/not deferrable, Deferred/immediate, enalbe/disable, validate/novalidate,以及如
Gradle入门教程 dengkane gradle
一、寻找gradle的历程一开始的时候，我们只有一个工程，所有要用到的jar包都放到工程目录下面，时间长了，工程越来越大，使用到的jar包也越来越多，难以理解jar之间的依赖关系。再后来我们把旧的工程拆分到不同的工程里，靠ide来管理工程之间的依赖关系，各工程下的jar包依赖是杂乱的。一段时间后，我们发现用ide来管理项程很不方便，比如不方便脱离ide自动构建，于是我们写自己的ant脚本。再后
C语言简单循环示例 dcj3sjt126com c
# include <stdio.h> int main(void) { int i; int count = 0; int sum = 0; float avg; for (i=1; i<=100; i++) { if (i%2==0) { count++; sum += i; } } avg
presentModalViewController 的动画效果 dcj3sjt126com controller
系统自带(四种效果)： presentModalViewController模态的动画效果设置： [cpp] view plain copy UIViewController *detailViewController = [[UIViewController al
java 二分查找 shuizhaosi888 二分查找 java二分查找
需求：在排好顺序的一串数字中，找到数字T 一般解法：从左到右扫描数据，其运行花费线性时间O(N)。然而这个算法并没有用到该表已经排序的事实。 /** * * @param array * 顺序数组 * @param t * 要查找对象 * @return */ public stati
Spring Security（07）——缓存UserDetails 234390216 ehcache 缓存 Spring Security
Spring Security提供了一个实现了可以缓存UserDetails的UserDetailsService实现类，CachingUserDetailsService。该类的构造接收一个用于真正加载UserDetails的UserDetailsService实现类。当需要加载UserDetails时，其首先会从缓存中获取，如果缓存中没
Dozer 深层次复制 jayluns VO maven po
最近在做项目上遇到了一些小问题，因为架构在做设计的时候web前段展示用到了vo层，而在后台进行与数据库层操作的时候用到的是Po层。这样在业务层返回vo到控制层，每一次都需要从po-->转化到vo层，用到BeanUtils.copyProperties(source, target)只能复制简单的属性，因为实体类都配置了hibernate那些关联关系，所以它满足不了现在的需求，但后发现还有个很
CSS规范整理（摘自懒人图库） a409435341 html UI css 浏览器
刚没事闲着在网上瞎逛，找了一篇CSS规范整理，粗略看了一下后还蛮有一定的道理，并自问是否有这样的规范，这也是初入前端开发的人一个很好的规范吧。一、文件规范 1、文件均归档至约定的目录中。具体要求通过豆瓣的CSS规范进行讲解：所有的CSS分为两大类：通用类和业务类。通用的CSS文件，放在如下目录中：基本样式库 /css/core
C++动态链接库创建与使用你不认识的休道人 C++dll
一、创建动态链接库 1.新建工程test中选择”MFC [dll]”dll类型选择第二项"Regular DLL With MFC shared linked"，完成 2.在test.h中添加 extern “C” 返回类型 _declspec(dllexport)函数名(参数列表); 3.在test.cpp中最后写 extern “C” 返回类型 _decls
Android代码混淆之ProGuard rensanning ProGuard
Android应用的Java代码，通过反编译apk文件（dex2jar、apktool）很容易得到源代码，所以在release版本的apk中一定要混淆一下一些关键的Java源码。 ProGuard是一个开源的Java代码混淆器（obfuscation）。ADT r8开始它被默认集成到了Android SDK中。官网： http://proguard.sourceforge.net/
程序员在编程中遇到的奇葩弱智问题 tomcat_oracle jquery 编程 ide
　　现在收集一下：　　排名不分先后，按照发言顺序来的。 1、Jquery插件一个通用函数一直报错，尤其是很明显是存在的函数，很有可能就是你没有引入jquery。。。或者版本不对 2、调试半天没变化：不在同一个文件中调试。这个很可怕，我们很多时候会备份好几个项目，改完发现改错了。有个群友说的好：在汤匙
解决maven-dependency-plugin (goals "copy-dependencies","unpack") is not supported xp9802 dependency
解决办法：在plugins之前添加如下pluginManagement，二者前后顺序如下： [html] view plain copy <build> <pluginManagement

基于图像识别的垃圾分类

基于机器学习的垃圾分类

目 录

第1章 绪 论

第2章 相关技术研究综述

第3章 垃圾图像的智能分类算法

四 垃圾分类实验

五 总结与展望