weixin_39681171

python ssd目标检测_【目标检测】SSD

1. 动机(motivation)

在SSD之前，目标检测的主流方法主要分为两大类：

two-stage：以R-CNN系列为代表，这类方法通常包括两个部分，第一部分先使用selective search、卷积神经网络等筛选出一些proposal boxes，然后第二部分再对这些proposal boxes进行分类和回归。这就相当于进行了两次分类和回归，因此检测的准确率较高，但是可想而知检测的速度也就比较慢了。
one-stage：以YOLO为代表，这类方法的主要思路就是在图片的不同位置进行密集采样，然后使用CNN网络提取特征并直接进行分类和回归，整个过程只要一步就可完成。这种方法的优势是检测速度快，但是检测的准确率却不是很高。

于是为了让检测过程又快又准确，SSD就被提出来了。SSD借鉴了YOLO的one-stage的思想，直接对bbox进行回归和分类，同时也参考了Faster R-CNN中的anchor机制来提升准确率。通过将两种方法的优点结合，并加以改进，SSD保持了很快的检测速度，同时还提高了检测的准确率。

2. 创新(Innovation)

和YOLO类似，SSD也是one-stage的检测方法，即使用一个神经网络直接进行分类和回归，但是为了提高准确率，SSD做了以下改进：

Multi-scale feature map：使用多尺度的feature map来进行检测。在base network之后加了几层卷积，这些卷积层会逐渐减小feature map的size，然后在不同size的feature map上进行检测，进而实现了一个多尺度的检测。因为不同size的feature map的感受野不同，因此可以检测不同大小的物体，比较大的特征图，感受野较小，适合检测相对较小的物体，而较小的特征图，感受野较大，适合检测相对较大的物体。如下图中，
的feature map中蓝色框更适合来检测猫，而

的feature map中红色的框更适合来检测狗。

图1 multi-scale feature map

Convolutional predictors；在YOLO中使用全连接层来进行分类和回归，但是在SSD中改为使用卷积层，对于
的feature map，用两个

的卷积核分别进行分类和定位，然后得到预测结果。
Default boxes and aspect ratios；我们之前分析过YOLO的缺陷，首先YOLO中每个cell只预测两个bbox和一个类别，这就限制了能预测重叠或邻近物体的数量，同时YOLO直接预测bbox的位置，这样会增加训练难度。因此在SSD中就借鉴Faster R-CNN中的anchor机制，为feature map中的每个点设置几个不同尺寸和宽高比的default boxes(anchors)，然后以这些anchors为基准去拟合ground truth box，这样就减小了训练的难度。同时，在SSD中通过计算anchor和ground truth box的IoU来确定哪个anchor负责哪个物体，而不是像YOLO一样通过物体的中心点来确定，这样就能更好的预测那些重叠或近邻的物体。

3. 网络结构(Architecture)

在文中，SSD使用VGG16来做为base network，然后在VGG16的基础上添加了新的卷积层以获得不同size的feature map，具体的网络结构如下图所示：

图2 SSD网络结构

首先对基础网络VGG16进行了修改，其中Conv5_3之前的卷积层保持不变，而原来的FC6和FC7分别变成

和

的卷积层Conv6和Conv7，去掉了原来的dropout和FC8层。此外，还将池化层pool5由原来的

的

变成

的

，为了配合这种变化，Conv6的卷积采用的是

的空洞卷积(空洞卷积可参考:Jacqueline：【目标检测】R-FCN)。在基础网络之上SSD又添加了新的卷积层，例如图中的Conv8_2，Conv9_2，Conv10_2，Conv11_2。其中，Conv4_3，Conv7，Conv8_2，Conv9_2，Conv10_2和Conv11_2层输出的特征图用于检测。因为Conv4_3比较靠前，norm会比较大，因此会对Conv4_3输出的特征图先进行了一个L2 normalization，减少其和后边检测层的差异。最终一共有6个特征图，大小分别为(38，38)，(19，19)，(10，10)，(5，5)，(3，3)，(1，1)。然后在不同size的特征图上设置不同大小和个数的default boxes(anchors)，Conv4_3特征图上有4个anchor，Conv7有6个，Conv8_2有6个，Conv9_2有6个，Conv10_2有4个，Conv11_2有4个，所以最终anchor的数量为：

。

为了预测每个anchor的类别和位置offset，SSD将这6个的特征图分别输入到两个

的卷积中进行结果预测。其中，classifier的卷积输出维度为：

， regressor的卷积输出维度为：

。如下图所示，对

的feature map上的每一点都设置6个anchor，然后用于定位的卷积使用

的卷积核，输出

的定位结果，用于定位的卷积使用

的卷积核，输出

的分类结果，21是类别数。

图3 卷积层预测

如下图所示，负责localization的卷积，会输出

个anchor的offset预测值，共4维

，负责classification的卷积，会输出

个anchor的类别预测，共21维。例如，对于input image中的一个anchor(红色虚线框)，SSD会预测一个4维的offset，根据offset对该anchor进行位置变换，就可以得到最终预测的box(红色实线框)，同时，SSD也预测该anchor所属的类别，最终得到

，所以box的类别是car。按照同样的过程，我们可以得到个box以及对应的类别。

图4 卷积层输出

得到检测结果之后，再进行非极大值抑制(NMS)来删除掉多余的boxes，便得到最终的检测结果。NMS的具体过程可以参考我这篇文章:Jacqueline：【目标检测】基础知识：IoU、NMS、Bounding box regression

图5 NMS

4. 训练(Training)

4.1 匹配策略(Matching Strategy)

在训练时，我们首先要确定哪个anchor对应哪个ground truth box。在SSD中主要采取了两种匹配策略；(1)对于每个ground truth box，首先将它匹配给和它有最大的IoU(jaccard overlap)的anchor。这样可以保证对于每一个ground truth box都有一个anchor来对应。这些和ground truth对应的anchor为正样本，然后没有匹配到的anchor为负样本，由于一张图中ground truth较少，而最后得到的anchor数量又很多，所以这种方法就会导致正负样本的极不平衡，所以需要第二种匹配策略来缓解。(2)第二种匹配策略就是对于剩余的anchor，如果它和某个ground truth box的IoU大于某个阈值(0.5)，那么将这个ground truth box匹配给这个anchor，如果某个anchor和多个ground truth box的IoU大于阈值，那么选择IoU最大的ground truth进行匹配。这样一个ground truth就对应多个anchor，但是每个anchor只能对应一个ground truth。

4.2 Hard negative mining

虽然在上述的匹配过程中一个ground truth可以对应多个anchor，但是由于ground truth box的数量和anchor的数量相差好几个量级，所以正负样本的数量还是很不均衡，因此文中采取了Hard negative mining策略。具体就是：对所有的负样本按照置信度loss(预测背景的置信度越小，loss越大)进行降序排列，然后选取top-k个作为负样本，以保证正负样本的比例为1:3。实验证明，这样可以加快收敛速度，使得整个训练过程更稳定。

4.3 损失函数(Loss Function)

目标检测算法的损失函数一般分为两个部分：置信度误差 (confidence loss)和位置误差(localization loss)，SSD的损失函数同样也是这两部分的加权和：

其中，

是正样本的个数，

为1。如果

，那么loss就为0。

为ground truth，

为类别置信度预测值，

是位置预测值，

为ground truth的位置值。其中置信度误差采用softmax loss，位置误差采用smooth L1 loss。

置信度误差

置信度误差是计算预测的类别置信度

和ground truth类别之间的误差，使用softmax loss：

其中，

是一个指示器，当

时，表示第

个anchor和第

个ground truth相匹配，且ground truth的类别为

，当

时，就代表第

个anchor为负样本，没有匹配的ground truth box。

位置误差

位置误差是用来计算预测的位置信息和ground truth位置信息之间的误差：采用的是smooth L1 loss：

和Faster R-CNN相同，预测结果输出的4个值分别为anchor的中心点和宽高的offset(

)，而位置信息的ground truth值为anchor

和ground truth box

之间的offset(

)，如下式。所以smooth L1主要是计算两者之间的误差。

4.4 anchor设置

SSD会为不同size的feature map设置不同大小和数目的anchor。在SSD300中，共有6个feature map，每层对应的anchor数分别为4，6，6，6，4，4。而每层feature map都有两个参数min_size和max_size，分别代表该层上anchor的最小scale和最大scale。其中，每层的anchor的scale按照下式进行计算：

其中，

为feature map的个数，

为0.2，

为0.9。第k层的min_size为

，第k层的max_size为

。

如下图所示，在计算anchor时，首先，为feature map上的每个点都设置两个正方形的anchor，其中小正方形的长用min_size来表示，大正方形的长用

来表示。

图6 anchor的设置

此外，每个点还有多个长方形的anchor，长方形anchor的数目每层也不同，由每层anchor的数目决定，长方形anchor的长宽由下式决定：

其中，ratio为长宽比，值域为{

}。当ratio=1时，anchor就是那个小正方形。

计算好anchor的位置之后，我们还需要判断anchor是否超出图片的边缘，对于超出图片边缘的anchor，我们需要进行clip，如下图所示：

图7 clip

4.5 数据扩增(Data Augmentation)

为了提高算法对不同size和shape的object的鲁棒性，SSD对训练数据进行了数据扩增，主要方法包括：有水平翻转(horizontal flip)，随机裁剪(random crop)，颜色扭曲(color distortion)，随机采集块域(Randomly sample a patch)等。

5. 测试(Testing)

整个测试过程比较简单，就是将测试样本输入到SSD网络中，然后网络会为每个anchor输出类别和位置预测结果。之后，根据类别的预测值确定每个anchor的类别，并过滤掉那些属于背景的anchor，然后根据类别置信度阈值过滤掉置信度较低的anchor。对于留下来的anchor，再根据预测的位置offset进行位置变换，得到预测的box。得到预测的box之后，再根据box的类别置信度进行降序排列，然后保留前k个box。最后进行NMS，去掉重叠度高的box，NMS之后剩下的box就为最终的检测结果。

6. 性能比较

最后，给出一张性能比较图，图中包括了two-stage和one-stage的比较经典的目标检测算法，并对这些算法的检测速度和精确度进行了比较。可以看出，SSD300的的检测速度和精确度都高于这些算法。而SSD512可以获得更高的精确度，但是检测速度也会慢一些，但也和YOLO的检测速度持平，而且也快于two-stage的方法。

图8 性能比较

总结

本文提出了一种新的one-stage的目标检测方法SSD，主要包括以下的改进和创新：使用多尺度feature map，使用卷积层来进行预测，在不同层设置不同大小和数目的anchor，限制正负样本的比例、数据扩增。这些改进使得SSD检测的速度和准确度都优于state-of-the-art。但是，SSD也仍有不足之处，那就是在小目标检测方面，其准确度仍然不敌Faster R-CNN。

本文都是根据个人理解编写的，希望可以帮到大家。此外，如有误，烦请指正。如果喜欢，请点赞哦，谢谢～

我将持续更新目标检测领域的经典paper，欢迎大家订阅哦！

Python, C ++,C #开发全球英才阐教版集结令APP Geeker-2025 python c++c语言
以下是为使用**Python、C++和C#**开发**全球英才(阐教版)集结令APP**的深度技术方案，融合三语言优势构建跨平台、高智能的玄门英才聚合系统：---###一、系统架构设计```mermaidgraphTDA[多端客户端]-->B{C#阐道引擎}B-->C[C++玄法核心]C-->D[Python慧识层]D-->E[AI英才匹配]C-->F[天机推演]B-->G[三界通信]G-->H[
Python, Rust 开发教育/医疗/文化资源去中心化分配APP Geeker-2025 python rust
以下是为教育、医疗、文化资源设计的**去中心化分配APP**的完整技术方案，结合Python的灵活性和Rust的高性能与安全性，实现公平透明的资源分配：---###系统架构设计```mermaidgraphTDA[用户终端]-->B[区块链网络]A-->C[分配引擎]B-->D[智能合约]C-->E[资源数据库]D-->F[分配记录]subgraph技术栈C-.Rust.->G[核心分配算法]D-
Python, Go 开发客户服务软件APP Geeker-2025 python golang
以下是一个结合Python和Go开发的**客户服务软件APP**的完整技术方案，充分利用Python的AI能力和Go的高并发特性，构建高性能、智能化的客户服务系统：---###系统架构设计```mermaidgraphTDA[客户端]-->B[GoAPI网关]B-->C[工单管理]B-->D[实时聊天]B-->E[知识库]B-->F[AI引擎]C-->G[工单数据库]D-->H[消息队列]F-->
Step-by-Step Diffusion&Flow Model Notes 克斯维尔的明天_ 机器学习人工智能深度学习算法
Step-by-StepNotesFundamentalsofDiffusion生成模型的目标与扩散模型的基本思想生成模型的目标生成模型的目的是给定一组来自某个未知分布p∗(x)p^{*}(x)p∗(x)的独立同分布(i.i.d.)样本，构建一个采样器，能够近似地从相同的分布中生成新的样本。例如，假设我们有一组狗的图像训练集，这些图像来自某个潜在分布pdogp_{\text{dog}}pdog，我
（C++）学生管理系统（测试版）（map数组的应用）（string应用）（引用）（C++教学）（C++项目）双叶836 C++基础教学 STL C++C++项目 c++算法开发语言数据结构后端
源代码：#include//输入输出流库，提供cin/cout等基本I/O功能#include//映射容器库，提供map数据结构（键值对集合）#include//字符串库，提供string类及字符串操作#include//输入输出格式化库，提供setw等格式化控制usingnamespacestd;//使用标准命名空间，避免写std::前缀//定义学生结构体：包含多个相关数据的复合类型struct
MySQL 中的慢查询分析与优化：定位并解决性能瓶颈 you的日常 #MySQL mysql android 数据库 database
在任何数据库驱动的应用程序中，**慢查询（SlowQuery）**都是性能瓶颈的罪魁祸首之一。一个执行缓慢的SQL查询不仅会延长用户的等待时间，降低用户体验，还可能长时间占用数据库资源，导致连接耗尽、系统吞吐量下降，甚至引发连锁反应导致整个系统崩溃。因此，识别、分析和优化慢查询是数据库性能调优的重中之重。本文将深入探讨MySQL中的慢查询分析与优化技术，从开启慢查询日志、定位慢查询，到利用EXPL
基于nodejs+vue.js服装商店电子商务管理系统
如果你是一个小白,你不懂得像javaPHP、Python等编程语言，那么Node.js是一个非常好的选择。采用vscode软件开发,配套软件安装.包安装调试部署成功,有视频讲解前端:html+vue+elementui+jQuery、js、css数据库：mysql,Navicatvue框架于Node运行环境的Web框架,随着互联网技术的飞速发展，世界逐渐成了一个地球村，空间的距离也不再是那么重要。
《Effective Python》第十一章性能——延迟加载模块，通过动态导入减少 Python 程序启动时间不学无术の码农 Effective Python 精读笔记 python 开发语言
引言本文基于《EffectivePython:125SpecificWaystoWriteBetterPython,3rdEdition》第11章:性能中的Item98：Lazy-LoadModuleswithDynamicImportstoReduceStartupTime。本文旨在总结书中关于延迟加载模块的核心观点，并结合我自己的开发经验，深入探讨其在实际项目中的应用场景与优化价值。Pytho
C++网络编程Socket网络编程基础入门 weixin_47868976 网络 c++开发语言
Socket网络编程基础入门-从理论到实践1.Socket基本概念1.1什么是Socket？Socket（套接字）是网络编程的基础，它是应用层与传输层之间的抽象接口。简单来说，Socket就是网络通信的端点，就像电话的听筒一样，用于发送和接收数据。在你的FileHub项目中，Socket被封装在多个层次中：//从net/Socket.h可以看到Socket的封装classSocket:noncop
「日拱一码」010 Python常用库——statistics 胖达不服输「日拱一码」python python常用库 statistics
目录平均值相关mean()：计算算术平均值，即所有数值相加后除以数值的个数fmean()：与mean()类似，但使用浮点运算，速度更快，精度更高geometric_mean()：计算几何平均值，即所有数值相乘后开n次方根（n为数值的个数）harmonic_mean()：计算调和平均值，即数值个数除以每个数值的倒数之和median()：计算中位数，即将一组数值按大小顺序排列后位于中间的数。如果数值个
「日拱一码」013 Python常用库——Numpy 胖达不服输「日拱一码」python numpy 常用库
目录数组创建numpy.array：创建一个ndarray对象numpy.zeros：创建一个指定形状和数据类型的全零数组numpy.ones：创建一个指定形状和数据类型的全1数组numpy.empty：创建一个指定形状和数据类型的未初始化数组。其元素值是随机的，取决于内存中的初始状态numpy.arange：类似于Python内置的range函数，但返回的是ndarraynumpy.linspa
python日记Day17——Pandas之Excel处理石石石大帅 Python笔记 excel python 数据分析
python日记——Pandas之Excel处理创建文件importpandasaspddf=pd.DataFrame({'ID':[1,2,3],'Name':['Tom','BOb','Gigi']})df.to_excel("C:/Temp/Output.xlsx")print("done!")读取文件importpandasaspdpeople=pd.read_excel("C:/Temp
分布式锁的实现方式：使用 Redisson 实现分布式锁（ Spring Boot ） weixin_43833540 分布式 spring boot 后端
Redisson提供了分布式和可扩展的Java数据结构，包括分布式锁的实现。1.添加依赖在pom.xml中添加Redisson依赖：org.redissonredisson-spring-boot-starter3.16.42.配置Redisson客户端创建Redisson配置类：importorg.redisson.Redisson;importorg.redisson.api.Redisson
利用ADB实现PC与Android设备的通信与数据交互虾仁芝麻卷
本文还有配套的精品资源，点击获取简介：本文详细介绍了如何使用AndroidDebugBridge（ADB）实现PC与Android终端的通信，特别是通过Java编程语言的应用。介绍了配置ADB、设备连接、端口映射、Java编程实现设备通信、异常处理以及关闭连接等关键步骤，并强调了该技术在多种开发场景下的应用和注意事项。1.ADB功能与重要性AndroidDebugBridge（ADB）是一种多功能
android 多通道音频,支持多通道录音虾仁芝麻卷 android 多通道音频
原生Android只支持2channel的录音。可是偏偏会有多mic的需求，比如说语音识别。目前已知TDM协议可以将多mic数据从kernel送到hal，从内核空间搬运到用户空间中。可是原生AudioRecord接口是完全不支持多channel录音数据的采集的，怎么修改，才能让原生进行支持呢?我们就从AudioRecord的构造函数开始往下研究。无论行不行，都要研究出个所以然来！我们如果写个录音a
尚未调用 CoInitialize 问题解决
在线程开头处添加即可importpythoncompythoncom.CoInitialize()执行完成需要用pythoncom.CoUninitialize释放资源
计算机网络基础知识+学习路线早起的小懒虫计算机网络网络
计算机网络是一种将多个计算机设备通过通信线路连接在一起，使其能够相互传输数据和共享资源的技术和设施。1.基础知识学习计算机网络需要了解计算机硬件、操作系统、编程语言等基础知识。计算机硬件：计算机硬件包括中央处理器（CPU）、存储器、输入输出设备等。CPU是计算机的核心，负责执行程序和控制计算机的各种操作。存储器主要有随机存储器（RAM）和只读存储器（ROM），用于存储数据和程序。输入输出设备包括键
计算机毕业设计Node.js+Vue新海图书商城网页设计论文（程序+源码+LW+部署) Node.js橙子毕设程序 vue.js 课程设计 node.js
该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程。欢迎交流项目运行环境配置：Node.js+Vscode+Mysql5.7+HBuilderX+Navicat11+Vue+Express。项目技术：Express框架+Node.js+Vue等等组成，B/S模式+Vscode管理+前后端分离等等。环境需要1.运行环境：最好是Nodejs最新版，我们在这个版本上开发的。其他版本理论上也可
【常见问题】Python自动化办公，打开输出的word文件，报错AttributeError: module ‘win32com.gen_py.00020905-0000-0000-
Python自动化办公，打开输出的word文件，出现ERROR：File"D:\Develop\Building_save_energy\BuildingDiagnoseRenovationTool.py",line2930,inopen_docdoc_app=win32.gencache.EnsureDispatch('Word.Application')File"C:\Users\Jay\.c
利用Infoway API接入实时股票行情API的方法 kk_stoper 大数据 python java javascript
随着金融科技的发展，越来越多的投资者、交易平台和量化交易团队开始使用股票行情API来获取市场数据。然而，很多人虽然听说过行情API，却并不清楚不同类型的接口之间有何区别，适合用于哪些场景。本文将系统地介绍几种常见的股票行情接口，帮助您建立对行情API的全面理解。一、延迟行情接口（主流平台的默认选择）延迟行情（DelayedMarketData）是最普遍、成本最低的行情接口形式。其核心特征是存在时间
森林的智慧：随机森林与集成学习的民主之道田园Coder 人工智能科普人工智能科普
当约阿夫·弗罗因德和罗伯特·沙皮尔提出的AdaBoost算法在90年代末期以其强大的预测精度震惊机器学习界，展示了“团结弱者为强者”的集成魅力时，另一种集成思想也在悄然孕育。这种思想同样信奉“众人拾柴火焰高”，但走的是一条与AdaBoost截然不同的路径：它不执着于反复调整数据权重去“关注”被前序模型分错的困难样本，而是致力于创造尽可能多样化的模型，然后让这些模型平等地投票。它的核心哲学是：如果每
工具学习_CVE Binary Tool
1.工具概述CVEBinaryTool是一个免费的开源工具，可帮助您使用国家漏洞数据库（NVD）常见漏洞和暴露（CVE）列表中的数据以及Redhat、开源漏洞数据库（OSV）、Gitlab咨询数据库（GAD）和Curl中的已知漏洞数据来查找软件中的已知脆弱性。该工具有两种主要操作模式：二进制扫描程序：可帮助您确定哪些包可能已作为软件的一部分包含在内。该程序包括360检查器，扫描程序主要适用于常见的
【网络】Linux 内核优化实战 - net.core.busy_read
目录核心功能工作原理与优势配置方式1.临时配置（重启失效）2.永久配置（重启生效）与`net.core.busy_poll`的协同作用适用场景与注意事项适用场景：注意事项：总结net.core.busy_read是Linux内核中与网络性能优化相关的参数，主要用于控制socket层的忙轮询（BusyPolling）行为，与net.core.busy_poll配合使用，共同优化网络数据包的处理效率。
第十一节：Vben Admin 最新 v5.0 (vben5) + Python Flask 快速入门 - 角色菜单授权锅锅来了 Vben vben5 Vben Admin python3 后台管理框架
Vben5系列文章目录基础篇✅第一节：VbenAdmin最新v5.0(vben5)+PythonFlask快速入门✅第二节：VbenAdmin最新v5.0(vben5)+PythonFlask快速入门-PythonFlask后端开发详解(附源码)✅第三节：VbenAdmin最新v5.0(vben5)+PythonFlask快速入门-对接后端登录接口(上)✅第四节：VbenAdmin最新v5.0(v
python 内置函数大全及完整使用示例慧一居士 Python python
Python内置函数是预先定义好的高效工具，涵盖数学运算、类型转换、序列操作等多个领域。以下是常见内置函数的分类大全及使用示例：一、数学运算函数abs(x)返回数值的绝对值，支持整数、浮点数和复数[1][2][4]。abs(-10)#输出10abs(-3.5)#输出3.5abs(3+4j)#输出5.0divmod(a,b)返回商和余数的元组，等价于(a//b,a%b)[2][4]。divmod(9
智能停车场管理系统：如何实现停车场精细化运营管理？捷码小编数字孪生低代码信息可视化软件需求智慧城市
分享大纲：1、可视化运营中枢：全局掌握车场动态2、后台管理：灵活查看数据，配置规则策略3、移动化协同：提升现场管理效率在传统模式下，面对放下停车资源日益紧张的今天，停车场逐渐面临管理粗放、效率低下、车主体验差等问题。杭州远眺科技基于AI+低代码打造的智能停车场管理系统，为停车运营方提供一套全流程、多终端、可简单配置的数字化管理方案。可视化运营中枢:全局掌握车场动态智能停车场管理系统：如何实现停车场
Python —— pandas 主要方法和常用属性（一）墨码笔记知识点 python 数据分析 Pandas
Pandas基础类型Series类型创建SeriesSeries的自定义索引读取SeriesPandaspandas数据分析统计包，是一款功能强大的用于数据分析的操作工具，由于其的实用性对操作数据的方便性广受欢迎，今天就来学习一下Pandas数据包的用法吧！在此之前推荐了解一下numpy基础类型说道数据类型，大家熟知的大概都是intstrbool等数据类型，或者是Python中的listtuple
机器学习：集成学习方法之随机森林(Random Forest) 慕婉0307 机器学习集成学习机器学习随机森林
一、集成学习与随机森林概述1.1什么是集成学习集成学习(EnsembleLearning)是机器学习中一种强大的范式，它通过构建并结合多个基学习器(baselearner)来完成学习任务。集成学习的主要思想是"三个臭皮匠，顶个诸葛亮"，即通过组合多个弱学习器来获得一个强学习器。集成学习方法主要分为两大类：Bagging(BootstrapAggregating)：并行训练多个基学习器，然后通过投票
「日拱一码」014 Python常用库——Pandas
目录数据结构pandas.Series：一维数组，类似于数组，但索引可以是任意类型，而不仅仅是整数pandas.DataFrame：二维表格型数据结构，类似于Excel表格，每列可以是不同的数据类型数据读取与写入读取数据pd.read_csv()：读取CSV文件pd.read_excel()：读取Excel文件pd.read_sql()：从数据库读取数据写入数据DataFrame.to_csv()
Python 项目完整结构示例慧一居士 Python python
以下是一个典型的Python项目完整结构示例，适用于中等规模的应用程序或库。该结构遵循最佳实践，具有良好的模块化、可维护性和扩展性。项目结构示例my_project/├──src/#源代码目录│├──__init__.py#标记为Python包│├──main.py#主程序入口（可选）│├──core/#核心功能模块││├──__init__.py││├──app.py││└──utils.py│
sql统计相同项个数并按名次显示朱辉辉33 java oracle
现在有如下这样一个表： A表 ID Name time ------------------------------ 0001 aaa 2006-11-18 0002 ccc 2006-11-18 0003 eee 2006-11-18 0004 aaa 2006-11-18 0005 eee 2006-11-18 0004 aaa 2006-11-18 0002 ccc 20
Android+Jquery Mobile学习系列-目录白糖_ JQuery Mobile
最近在研究学习基于Android的移动应用开发，准备给家里人做一个应用程序用用。向公司手机移动团队咨询了下，觉得使用Android的WebView上手最快，因为WebView等于是一个内置浏览器，可以基于html页面开发，不用去学习Android自带的七七八八的控件。然后加上Jquery mobile的样式渲染和事件等，就能非常方便的做动态应用了。从现在起，往后一段时间，我打算
如何给线程池命名 daysinsun 线程池
在系统运行后，在线程快照里总是看到线程池的名字为pool-xx，这样导致很不好定位，怎么给线程池一个有意义的名字呢。参照ThreadPoolExecutor类的ThreadFactory，自己实现ThreadFactory接口，重写newThread方法即可。参考代码如下： public class Named
IE 中"HTML Parsing Error:Unable to modify the parent container element before the 周凡杨 html 解析 error readyState
错误： IE 中"HTML Parsing Error:Unable to modify the parent container element before the child element is closed" 现象：同事之间几个IE 测试情况下，有的报这个错，有的不报。经查询资料后，可归纳以下原因。
java上传 g21121 java
我们在做web项目中通常会遇到上传文件的情况，用struts等框架的会直接用的自带的标签和组件，今天说的是利用servlet来完成上传。我们这里利用到commons-fileupload组件，相关jar包可以取apache官网下载：http://commons.apache.org/ 下面是servlet的代码： //定义一个磁盘文件工厂 DiskFileItemFactory fact
SpringMVC配置学习 510888780 spring mvc
spring MVC配置详解现在主流的Web MVC框架除了Struts这个主力外，其次就是Spring MVC了，因此这也是作为一名程序员需要掌握的主流框架，框架选择多了，应对多变的需求和业务时，可实行的方案自然就多了。不过要想灵活运用Spring MVC来应对大多数的Web开发，就必须要掌握它的配置及原理。　　一、Spring MVC环境搭建：（Spring 2.5.6 + Hi
spring mvc-jfreeChart 柱图(1) 布衣凌宇 jfreechart
第一步：下载jfreeChart包，注意是jfreeChart文件lib目录下的，jcommon-1.0.23.jar和jfreechart-1.0.19.jar两个包即可；第二步：配置web.xml; web.xml代码如下 <servlet> <servlet-name>jfreechart</servlet-nam
我的spring学习笔记13-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java P
java 线程池使用 Runnable&Callable&Future antlove java thread Runnable callable future
1. 创建线程池 ExecutorService executorService = Executors.newCachedThreadPool(); 2. 执行一次线程，调用Runnable接口实现 Future<?> future = executorService.submit(new DefaultRunnable()); System.out.prin
XML语法元素结构的总结百合不是茶 xml 树结构
1.XML介绍1969年 gml (主要目的是要在不同的机器进行通信的数据规范)1985年 sgml standard generralized markup language1993年 html(www网)1998年 xml extensible markup language
改变eclipse编码格式 bijian1013 eclipse 编码格式
1.改变整个工作空间的编码格式改变整个工作空间的编码格式，这样以后新建的文件也是新设置的编码格式。 Eclipse->window->preferences->General->workspace-
javascript中return的设计缺陷 bijian1013 JavaScript AngularJS
代码1： <script> var gisService = (function(window) { return { name:function () { alert(1); } }; })(this); gisService.name(); &l
【持久化框架MyBatis3八】Spring集成MyBatis3 bit1129 Mybatis3
pom.xml配置 Maven的pom中主要包括： MyBatis MyBatis-Spring Spring MySQL-Connector-Java Druid applicationContext.xml配置 <?xml version="1.0" encoding="UTF-8"?> &
java web项目启动时自动加载自定义properties文件 bitray java Web 监听器相对路径
创建一个类 public class ContextInitListener implements ServletContextListener 使得该类成为一个监听器。用于监听整个容器生命周期的，主要是初始化和销毁的。类创建后要在web.xml配置文件中增加一个简单的监听器配置，即刚才我们定义的类。 <listener> <des
用nginx区分文件大小做出不同响应 ronin47
昨晚和前21v的同事聊天，说到我离职后一些技术上的更新。其中有个给某大客户(游戏下载类)的特殊需求设计，因为文件大小差距很大——估计是大版本和补丁的区别——又走的是同一个域名，而squid在响应比较大的文件时，尤其是初次下载的时候，性能比较差，所以拆成两组服务器，squid服务于较小的文件，通过pull方式从peer层获取，nginx服务于较大的文件，通过push方式由peer层分发同步。外部发布
java-67-扑克牌的顺子.从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的.2-10为数字本身，A为1，J为11，Q为12，K为13，而大 bylijinnan java
package com.ljn.base; import java.util.Arrays; import java.util.Random; public class ContinuousPoker { /** * Q67 扑克牌的顺子从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的。 * 2-10为数字本身，A为1，J为1
翟鸿燊老师语录 ccii 翟鸿燊
一、国学应用智慧TAT之亮剑精神A 1. 角色就是人格就像你一回家的时候，你一进屋里面，你已经是儿子，是姑娘啦，给老爸老妈倒怀水吧，你还觉得你是老总呢？还拿派呢？就像今天一样，你们往这儿一坐，你们之间是什么，同学，是朋友。还有下属最忌讳的就是领导向他询问情况的时候，什么我不知道，我不清楚，该你知道的你凭什么不知道
[光速与宇宙]进行光速飞行的一些问题 comsci 问题
在人类整体进入宇宙时代，即将开展深空宇宙探索之前，我有几个猜想想告诉大家仅仅是猜想。。。未经官方证实 1：要在宇宙中进行光速飞行，必须首先获得宇宙中的航行通行证，而这个航行通行证并不是我们平常认为的那种带钢印的证书，是什么呢？下面我来告诉
oracle undo解析 cwqcwqmax9 oracle
oracle undo解析2012-09-24 09:02:01 我来说两句作者：虫师收藏我要投稿 Undo是干嘛用的？ &nb
java中各种集合的详细介绍 dashuaifu java 集合
一，java中各种集合的关系图 Collection 接口的接口对象的集合 ├ List 子接口 &n
卸载windows服务的方法 dcj3sjt126com windows service
卸载Windows服务的方法在Windows中，有一类程序称为服务，在操作系统内核加载完成后就开始加载。这里程序往往运行在操作系统的底层，因此资源占用比较大、执行效率比较高，比较有代表性的就是杀毒软件。但是一旦因为特殊原因不能正确卸载这些程序了，其加载在Windows内的服务就不容易删除了。即便是删除注册表中的相应项目，虽然不启动了，但是系统中仍然存在此项服务，只是没有加载而已。如果安装其他
Warning: The Copy Bundle Resources build phase contains this target's Info.plist dcj3sjt126com ios xcode
http://developer.apple.com/iphone/library/qa/qa2009/qa1649.html Excerpt: You are getting this warning because you probably added your Info.plist file to your Copy Bundle
2014之C++学习笔记（一） Etwo C++Etwo Etwo iterator 迭代器
已经有很长一段时间没有写博客了，可能大家已经淡忘了Etwo这个人的存在，这一年多以来，本人从事了AS的相关开发工作，但最近一段时间，AS在天朝的没落，相信有很多码农也都清楚，现在的页游基本上达到饱和，手机上的游戏基本被unity3D与cocos占据，AS基本没有容身之处。so。。。最近我并不打算直接转型
js跨越获取数据问题记录 haifengwuch jsonp json Ajax
js的跨越问题，普通的ajax无法获取服务器返回的值。第一种解决方案，通过getson，后台配合方式，实现。 Java后台代码： protected void doPost(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException { String ca
蓝色jQuery导航条 ini JavaScript html jquery Web html5
效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/39.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery鼠标悬停上下滑动导航条 - 柯乐义<
linux部署jdk,tomcat,mysql kerryg jdk tomcat linux mysql
1、安装java环境jdk: 一般系统都会默认自带的JDK,但是不太好用，都会卸载了，然后重新安装。 1.1）、卸载：（rpm -qa :查询已经安装哪些软件包； rmp -q 软件包：查询指定包是否已
DOMContentLoaded VS onload VS onreadystatechange mutongwu jquery js
1. DOMContentLoaded 在页面html、script、style加载完毕即可触发，无需等待所有资源（image/iframe）加载完毕。（IE9+） 2. onload是最早支持的事件，要求所有资源加载完毕触发。 3. onreadystatechange 开始在IE引入，后来其它浏览器也有一定的实现。涉及以下 document , applet, embed, fra
sql批量插入数据 qifeifei 批量插入
hi，自己在做工程的时候，遇到批量插入数据的数据修复场景。我的思路是在插入前准备一个临时表，临时表的整理就看当时的选择条件了，临时表就是要插入的数据集，最后再批量插入到数据库中。 WITH tempT AS ( SELECT item_id AS combo_id, item_id, now() AS create_date FROM a
log4j打印日志文件如何实现相对路径到项目工程下 thinkfreer Web log4j 应用服务器日志
最近为了实现统计一个网站的访问量，记录用户的登录信息，以方便站长实时了解自己网站的访问情况，选择了Apache 的log4j,但是在选择相对路径那块卡主了，X度了好多方法(其实大多都是一样的内用，还一个字都不差的)，都没有能解决问题，无奈搞了2天终于解决了，与大家分享一下需求：用户登录该网站时，把用户的登录名,ip,时间。统计到一个txt文档里，以方便其他系统调用此txt。项目名
linux下mysql-5.6.23.tar.gz安装与配置笑我痴狂 mysql linux unix
1.卸载系统默认的mysql [root@localhost ~]# rpm -qa | grep mysql mysql-libs-5.1.66-2.el6_3.x86_64 mysql-devel-5.1.66-2.el6_3.x86_64 mysql-5.1.66-2.el6_3.x86_64 [root@localhost ~]# rpm -e mysql-libs-5.1