爱学习的数据喵

“泰迪杯”挑战赛 - 基于图像处理的道路缺陷类型自动识别

研究目标
分析方法与过程
2.1. 总体流程
2.2. 具体步骤
2.3. 结果分析
结论
参考文献

1. 挖掘目标

本次建模目标是在缺陷类型的道路图像进行增强去噪等预处理、图像特征值的选择与提取的基础上，利用提取得到的真实数据，采用数据挖掘技术，分析各类道路图像特征值与缺陷类型之间的相互关系，训练自动分类算法，根据分类器的分类结果判断待识别样本属于何种类别的缺陷，从而实现不同道路缺陷类型的自动识别。

2. 分析方法与过程

2.1. 总体流程

本用例主要包括如下步骤：

步骤一:缺陷道路图像预处理

通过对路面图像的分析原始图像的特征，选择合适的预处理手段，先对图像进行剪切，取出无用部分，再增强图像目标与背景的对比度，使目标边缘平滑，检测目标边缘，最后通过形态学运算（腐蚀、膨胀、开运算、闭运算）减少二值图像的噪声点，为进一步提取图像特征做准备。

步骤二：：道路缺陷目标道路缺陷目标特征提取

根据路面图像预处理后得到的缺陷特征，选择合适的算法，提取出图像的 4 特征值，作为路面缺陷类型自动识别的基础，分别为（1）基于投影的特征提取（2）基于 proximity算法的特征提取（3）基于破损密度因子的路面破损特征提取（4）基于分型的特征提取。

步骤三：：路面缺陷类型的分类识别路面缺陷类型的分类识别：

根据步骤二四类方法对路面图像提取的七个特征，对这七个特征对路面裂缝的分类识别进行可行性分析，然后基于这七类特征应用支持向量机算法对路面裂缝分类识别，其后对这七类特征的分类结果进行分析比较，最后结合七个特征再次应用向量机算法对路面裂缝分类识别并预测。

2.2. 具体步骤

2.2.1 缺陷路面特点分析

在对公路路面图像数据的采集过程中,由于摄像设备的因素以及路面信息本身的多样性,使得采集到的路面图像具有不同的特征,这些特征又影响甚至决定了路面图像在预处理、特征提取过程中算法的选取以及特征值与图像本身特点的关联性，从而影响最终图像自动识别的精确度。从样本图像的分析得出以下特点：
（1）由于路面材料的不均匀性,即使正常路面，纹理也不均匀，因此,所采集的图像背景本身有较大地变化。
（2）裂缝图像也有同样的情况，由于严重程度不同,其大小面积也不同，如果裂缝中有与背景颜色相近甚至更亮的比较大的颗粒,也会导致裂缝图像颜色的变化，但总的来说,裂缝图像比正常路面的暗。
（3）代表裂缝的像素数量远远小于代表背景的像素数量，但轻微缺陷路面与正常路面之间的差异某些情况下难以识别。
（4）正常路面的灰度值与裂缝的灰度值有部分重叠。
（5）由于自然和人为因素的影响,复杂的背景噪声一般都叠加在有用的路面数据之中,所以必须进行滤波来减少噪声,增强裂缝边缘。

2.2.2 缺陷道路图像预处理

上面路面图像的特征分析可知，图像特征的多样性和复杂性对图像的分析和处理造成了困难。因此,了便于后面对图像进行特征提取，提高识别的准确度,必须对路面裂缝图像进行前期处理。一般情况下，成像系统获取的图像（即原始图像）由于受到种种条件限制和随机干扰，往往不能在视觉系统中直接使用。

图像分析中，对输入图像进行特征抽取、分割和匹配前所进行的处理称为数字图像的预处理。图像预处理的主要目的是消除图像中无关的信息，恢复有用的真实信息，增强有关信息的可检测性和最大限度地简化数据，从而改进特征抽取、图像分割的可靠性。

在对路面图像进行预处理中，本文先把彩色图像转换为灰度图，接着采用了 3 种空间域图像增强算法，分别为直方图均化、分段线性变换以及平滑滤波，在对比处理效果基础上采用了以 Sobel 为边缘检测算子的边缘检测算法。

(1)图像切割及灰度图转换（Gray Scale Image Transformation）

由于路面样本图像中包含了取样时的人的鞋子和阴影，因此需要通过图像切割的方法，图像中取出有代表意义的一小块路面图像作为真实的路面样本。图像剪切使用MATLAB 图像处理工具箱的 imcrop 函数。

观察所采集的样本图片发现，虽然路面多为灰色，但由于自然和人为因素的影响，使得有其他颜色的噪音，影响图片的进一步处理，为了要比较准确地表达图像的真实视觉效果,通过 MATLAB 中的图像处理工具箱中的 rbg2gray 函数将彩色图像二值化，转换成黑白双色的图像。

(2) 直方图均化（Histogram Equalization）

直方图是图像灰度密度函数的近似，它是灰度级的函数，它表示图像中具有某种灰度级的像素的个数，反映了图像中某种灰度出现的频率。直方图均衡化是图像处理领域中利用图像直方图对对比度进行调整的方法。这种方法通常用来增加许多图像的局部对比度，尤其是当图像的有用数据的对比度相当接近的时候。

由缺陷路面特点分析所得的特点四：正常路面的灰度值与裂缝的灰度值有部分重叠，并且由 MATLAB 图像处理工具箱的 histeq 函数做出图像的直方图。对直方图中灰度的分布进行分析，若集中在小区域内，则对像素多的灰度级进行展宽，对像素个数少的灰度级进行缩减。

(3)分段灰度线性变换（Piecewise Linear Transformation）

直方图均衡法和灰度变换法都是对比度增强算法，通过直方图均衡化后发现，路面图像的对比度仍然难以满足进一步处理的需求。分段灰度线性变换的基本思想是将图像灰度值的区间分成两段或多段,分别作灰度变换，分段灰度变换法的好处是可以根据用户的需要,突出目标的灰度，相对抑制背景的灰度级。分段变换的分界点通过键盘交互式输入的方法来确定。

原始灰度记为 f(x,y),变换后的灰度记为 g(x,y), $M_f$ 为原图像最大的灰度值，分段线性灰度变换的数学表达式如下所示：

$\begin{cases} \frac{Y_a}{X_a} f(x,y), 0 \leq f(x,y) \leq X_a\\ \frac{Y_b- Y_b}{X_b-X_a}[f(x,y)-X_a]=Y_a, 0 \leq f(x,y) \leq X_a\\ \frac{M_g- Y_b}{M_f-X_a}[f(x,y)-X_b]=Y_a, 0 \leq f(x,y) \leq X_a\\ \end{cases} \tag{1}$

（4）平滑平滑滤波（Mean Filtering）

均值滤波是一种在空间域平滑图像和是典型的线性滤波算法，易实现而且效果较好。均值滤波的原理是把图像中一个像素与其周围邻近几个像素的灰度值相加后将得到的平均值作为新图像中该像素的灰度值。它适合去除图像中的颗粒噪声。

加权邻域均值滤波，相同尺寸的模板可针对不同的位置系数用不同的数值加权。通常认为离模板中心位置近的像素对滤波结果的影响较大。因此离模板中心近的像素的系数应较大,相应的离模板中心位置越远的模板边界附近的系数应越小。

中值滤波是抑制噪声的非线性处理方法。对于给定的 n 个数值{a1,a2,…,an},将他们按大小有序排列。组中值记为 med{{a1,a2,…,an }，图像中滤波后某像素的输出等于该像素中各像素灰度的中值。

均值滤波和加权邻域均值滤波都可以用MATLAB图像处理工具箱的filter函数实现，只是要选择不同的模板，在均值滤波中，选用所有元素都相同的模板，而在加权邻域均值滤波中，因此离模板中心近的像素的系数应较大,相应的离模板中心位置越远的模板边界附近的系数应越小。中值滤波可用MATLAB中的medfilt2函数实现。

经过对大量路面缺陷图像进行滤波实验，寻找具有最好去噪和图像的平滑效果的方法。

（5））边缘检测边缘检测（Edge Detect）

边缘（edge）是图像中的区域。在这些区域中，图像的亮度发生了剧烈的变化。在路面裂缝目标的特征提取和模式识别之前,要把路面缺陷的特征从整幅图像的背景中提取出来,而路面缺陷的主要特征就表现为裂缝的边缘,因此我们需要先对图像进行比较精确的边缘检测，才能正确的实现路面裂缝区域的分割。

对路面裂缝来说,检测与分类的效果与精度在很大程度上受边缘检测算法的好坏的影响。运用梯度边缘检测算子,并从中选择一种对裂缝图像做边缘检测，分别为：Roberts算子、Canny 算子和 Sobel 算子。

本文对经过均值滤波后得到的灰度图像进行边缘检测,以此确定裂缝的大致走向。

（6）二值图像噪声点的去除

经过的灰度图像的边缘检测后,得到只有黑白两种颜色的二值图像，但除裂缝目标外检测结果中还存在许多噪声点,这主要是受光照的变化及路面其他轻微破损物体、油迹的影响。消除这些噪声后，缺陷目标的特征提取和模式识别的精度。

数学形态学是常见的去除孤立噪声和小区域噪声的方法。

数学形态学中有两个基本运算，膨胀（dialation）和腐蚀（erosion)

膨胀的运算定义为：
$\bigoplus B = \{ a+b|a \in A, b \in B \}$

腐蚀运算的定义式为
$\bigodot B = \{ z \in \Omega|B^z \subseteq A \}$

膨胀运算可解释为将与目标接触的所有背景点合并到该物体中，使边界向外部扩张的过程。腐蚀运算可解释为消除边界点，使边界向内部收缩的过程。

开运算（opening）和闭运算（closing）是由腐烛和膨胀组合得到的,先腐烛后膨胀的运算称为幵运算,它能消除图像中孤立的小区域和毛刺,而且还有平滑物体边界的作用。先膨胀后腐烛的运算称为闭运算,它具有填充物体内部的细小孔洞,连接临近物体和平滑边界的作用。

2.2.3 道路缺陷目标特征提取

路面图像经过直方图均化、分段线性变换以及平滑滤波及边缘检测等预处理之后，得到了具有一定宽度的路面裂缝的二值图像。为了最终根据一定的特征将路面缺陷进行分类识别。因此,在对缺陷类型进行分类识别之前要提取经过预处理的路面图像的特征。

常用的图像特征有颜色特征、纹理特征、形状特征、空间关系特征或分为以下几类。

1、灰度:包括多光谱、彩色信息。
2、边缘:它描述了灰度变化的程度和位置。
3、纹理特征:它描述了在图像中反复出现的局部模式和它们的排列规则，反映宏观意义上灰度变化的一些规律。
4、形状特征:它描述了物体、区域或基元的外形，从微观上精细地反映景物及其组成部分的形状。
5、物体表面主方向，即三维物体表面的法向。
6、传感器与物体表面各点的距离。
7、物体运动信息。

根据道路图像预处理后的二值图像的特点，选取了用 4 种方法提取的路面特征值。

（1）基于投影的特征提取

假设有一幅路面裂缝的二值图像 B,用 I(I,j)表示,图像 B 的大小为 MxN 若背景像素点
I(I,j)的值是 0,目标像素点值是 1。分别把该裂缝的二值图像 B 向 X 轴与 Y 轴投影,这样
就会得到两条投影曲线。

根据以上假设和分析,路面裂缝二值图像 I（i，j）,向 X 轴的投影统计曲线 X(I)和向 Y 轴上的投影统计曲线 Y(I)的计算式分别为:

$X(i)=\sum_{i=1}^{N}I(i,j), i=1,2,...,M$

$Y(i)=\sum_{i=1}^{M}I(i,j), i=1,2,...,N$

（2）基于基于 proximity 算法的特征提取。

Proximity 算法同样也是以图像的投影统计图为基础,其计算的步骤主要为:对路面裂缝的二值图像 I(x,y),分别向 X 轴与 Y 轴作投影,得到向 X 轴的投影序列为 $X(i)= \{x_1,x_2,...,x_m \}$ ,向 Y 轴的投影序列 $Y(i)= \{y_1,y_2,...,y_m \}$ ,然后通过下式计算:

$sum_x=\sum_{i=1}^{M-1}|X_{i+1}-X_i|$

$sum_x=\sum_{j=1}^{N-1}|Y_{j+1}-Y_j|$

$S_0=\sum_{j=1}^{N}$

Proximity 算法是把 sum_x,sum_y 和作为路面裂缝目标图像的特征值,对路面裂缝图像进行分类识别。

（3）基于破损密度因子的路面破损特征提

通过研究分析几类路面裂缝图像的特征,为了可以更好地反映各类裂缝的特征,本文给出了破的定义: 路面破损密度因子是一种可以用来描述路面图像破损程度的卷积模版,破损密度因子的基本形式即为如下所示的 1x3,3x3 和 5x5 的破损密度因子。

$S1=\{1 \times 3 \ 密度因子于二值化的子块图像的卷积和\}$
$S3=\{3 \times 3 \ 密度因子于二值化的子块图像的卷积和\}$
$S5=\{5 \times 3 \ 密度因子于二值化的子块图像的卷积和\}$

假设原始子块图像二值矩阵的数值总和为 $S_0$ ，计算下面的特征值：
$_1=(S_1-S_0)/S_0$
$_3=(S_3-S_0)/S_0$
$_5=(S_5-S_0)/S_0$
我们把$ F_1, F_2,F_3$ 这三个值作为路面裂缝目标图像的特征值,用于对路面裂缝进行分
类识别。

（4）基于分型的特征提取

本文用简单的盒计数法计算分形的维数。以尺寸为 $\epsilon$ 的网格覆盖整个图像，计数网格中有图形象素(不管有许多象素还是很少象素)的格数目 $(\epsilon)$ ，不断减小网格尺寸:继续计数含图形象素的网格数，直至最小的网尺寸达到象素为止。最后将一系列 $(\epsilon)$ ， $\epsilon$ 数据作 ln N( $\epsilon$ )~ln(1/ $\epsilon$ )图，求出分形维数（盒子维数）。进而求得不同盒子所包含的像素点数来反映裂缝形状的复杂程度。

2.2.4 路面缺陷类型的分类识别

（1）分类识别算法的选取：
传统的基于统计的模式识别对数据的要求比较高，它们研究的是样本数目趋于无穷大的渐进理论，也只有在这种情况下其分类识别的性能才有所保证。但是，在公路路面裂缝的分类识别中，样本的数量是有限的，所以运用传统的基于统计的方法对路面裂缝的分类识别效果并不理想。在 90 年代中期，Vapnik 等人提出的支持向量机[6]（Support Vector Machine, SVM）是以统计学理论为基础的机器学习方法，以结构风险最小化为基本原则（Structural Risk Minimization ,SRM），专门针对有限样本情况，得到现有信息下的最优解而不仅仅是样本数趋于无穷大时的最优解，从而解决了在神经网络方法中无法避免的局部极值问题。因此它可以有效地应用在小样本、非线性等分类识别问题上，即适用于本文对路面缺陷的分类识别。

（2）支持向量机基本思想：

支持向量机（SVM）算法是通过事先选择的某种非线性映射函数（即核函数），把输入响亮映射到某个高维的特征空间，并且在这个高维特征空间中寻找最有分类超平面，它可以将两类数据点尽可能准确地分开，且使两类数据点距离分类面最远。支持向量机算法的目的就是寻找这个最优超平面，其能够将训练样本中的数据分开，且使两类数据之间的间隔最大。

定义和标识训练样本为： $X_i, Y_i], i=1,…l$ ,输入向量 $X_i=(X_i^{(1)},...,X_i^{(n)}) \in R^n$ ,种类值 $Y_i \in \{ -1,+1\}, i=1,...,l$ 。

根据 Vapnik 的原始公式，支持向量机（SVM）分类机满足下列条件：

$\begin{cases} W^T \phi (X_i) +b \geq+1,如果Y_i+1\\ W^T \phi (X_j) +b \leq-1,如果Y_i-1\\ \end{cases} \tag{1}$

这等同于
$Y_I[W^T \phi (X_i) +b] \geq1,..,l \tag{2}$

其中，w 代表权重向量，b 是纵截距。非线性函数 $\phi(*)_1 R^n \rightarrow R^n k$ 将输入或测量空
间映射进一个高维的、可能是无穷维的特征空间中。公式（2）可以归结为特征空间的一个分离超平面 $(W^T \phi (X_i) +b=0)$ 的两边构造两个平行的边界超平面，并使得两个超平面之间的距离（带宽）等于 $2/||W||^2)$ 。接着，在原来的权重空间，分类机采用形如公式（3）的决策函数：
$Y=sgn(W^T \phi (X_i) +b) \tag{3}$

然后，大多数分类问题是不可线性分离的，使用允许错分类的松弛变量 $\xi_i$ 以发现权重向量。可以定义原优化问题为：

$\in (W,b, \xi)(\frac{1}{2}W^TW+C \sum_{i=1}^{N} \xi_i) \tag{4}$

受约束于：
$\begin{cases} Y_i(W^T \phi (X_i) +b \geq 1- \xi_i,i=1,...,N)\\ \xi_i \geq0,1,...,N \end{cases} \tag{5}$

其中， $\xi$ 是允许错分类的松弛变量， $\in R^+$ 是一个权衡带宽与分类误差重要性的调和超参数，代表这模型的推广能能力。在构建拉格朗日公式后，可获得原最优化问题的解。原问题的拉格朗日函数式为:

$L_p=\frac{1}{2}W^TW+C \sum_{i=1}^{N} \xi_i-\sum_{i=1}^{N} \alpha_i|y_i(W^TW \phi(X_i)+b)-1+\xi_i|-\sum_{i=1}^{N}\mu_i \xi_i \tag{6}$

其中， $\alpha_i \geq0$ 和 $\mu_i \geq0$ 是拉格朗日乘子。

其中，是拉格朗日乘子。根据最优化的条件，可以获得含有拉格朗日乘子 $\alpha_i$ 的二次规划问题（QP）。对于每一训练样本均存在乘子 $\alpha_i$ 。对应于非零 $\alpha_i$ 的训练样本称为支持向量。

另一方面，上述原问题可以转化为下列具有目标函数（7）和（8）约束的对偶问题。由于此问题的决策变量是拉格朗日乘子的支持向量，因此，解释这一对偶问题的解比解释原问题的解容易。

$Max_\alpha \frac{1}{2} \alpha^T Q \alpha -e^T\alpha \tag{7}$

受约束于：

$\begin{cases} 0 \leq \alpha_i \leq C, i=1,...,N\\ y^T \alpha =0 \end{cases} \tag{8}$

在上述对偶问题中，Q 是一个 N*N 半正定矩阵，e 为所有元素均为 1 的向量， $Q_ij=y_iy_jK(x_i,x_j)$ ,并且 $K(x_i,x_j)= \phi(x_i)^T\phi(x_j)$ 是核函数。这里，训练向量被函数 $\phi$ 映射进一个更高维的 Hilbert 特征空间中 $\phi(*):R^n \rightarrow H$ 。根据 SVM 的特点，不必计算 w 和转换函数 $\phi(*)$ , 这是根据 Mercer 条件可将函数 $\phi(x)$ 映射为如下的核函数：

$K(x_i,x_j)= \phi(x_i)^T\phi(x_j) \tag{9}$

对于核函数，可以有几个选择方案如：

线性核函数 $K(x_i,x_j)=(x_i^T x_j)$ ；
具有阶数 d 的多项式核函数： $K(x_i,x_j)=(Yx_i^T x_j + r)^d,Y >0$
放射状基础核函数（RBF）: $K(x_i,x_j)=exp|-\frac{1}{\delta^2}(x_i-x_j)|$ , 其中 $\delta^2$ 是放射状基础核函数的带宽
sigmoid(S 型 ) 核函数 $K(x_i,x_j)=tanh(yx_i^Tx_j+r)$ , 其中d 和 $\in N$ 以及 $\in R^+$ 是常数。

接着，可以构建 SVM 分类决策函数如同式（10），并利用这以分类原则对一个由向量 x 描述的路面进行分类：
$Y=sgn(\sum_{i}^{N} \alpha_i y_i K(x_i,x_j)+b) \tag{10}$

其中，Y 是分类结果， $y_i$ 是训练样本 $x_i$ 的种类数，向量 $x_i=(x_i^{(1)},...,x_i^{(n)})$ 对应于一个输入，并且向量 $x_i,i=1,...,N$ 是支持向量，b和 $\alpha_j$ 是却确定超平面的参数。

（3）基于支持向量机对分类器的构造：

本文将路面分为正常、裂缝、龟裂、网裂、剥落、坑槽和修补这七类，我们采用 1v1SVM算法由于支持向量机的基本类型是二分类的支持向量机，于是我们可以对这七类中任意两种类型构造一个二分类支持向量机，这样，一共需要构建 7*（7-1）/2=21 个二分类支持向量机，在训练第 i 类和第 j 类对应的分类器时，在样本集中选取属于类别 i 和类别 j 的数据作为训练样本，并将属于第 i 类的样本标记为正类，将属于第 j 类的样本标记为负类。对应的优化问题如下：

$min_{w^{ij},b^{ij},\delta^{ij}} \frac{1}{2}||W^{ij}||^2+C^{ij} \sum_{t=1}^{l} \xi^{ij}$
$W^{ij} \phi(x_i)+b^{ij} \geq1-\xi_t^{ij} 如果y_t=i,$
$W^{ij} \phi(x_i)+b^{ij} \leq-1+\xi_t^{ij} 如果y_t=j,$
$\xi_{ij} \geq 0$ .

求解这 21 个优化问题可以得到 21 个决策函数：

$f_{ij}(x)=sgn(W^{ij} \phi(x)=b^{ij}),i,j=1,...,21且i \neq j$

用 1v1 SVM 算法对待分类样本进行分类时，每一个分类器 $f_{ij}$ 都要对其进行判断，并为相应的类别“投一票”，最后得票最多的类别即为待分类样本的类别。

（4）支持向量机核函数的选取

由于本文研究的问题为分类识别，根据前人大量实验研究，得到了核函数的较好的使用范围，在此先验基础上，我们知道选取 RBF 作为核函数能够满足我们的分类要求，而且由下面结果分析可以知道选取这个作为核函数是合适的。

2.3. 结果分析

本文的使用 MALAB2011r 对路面图像进行预处理和特征提取，具体代码详见附件 “图像预处理和特征提取代码.txt”和“Pre_Processing_Feature_Extraction.m”

2.3.1 缺陷道路图像预处理

下面以图像样本中的“严重龟裂”之一进行预处理示范。其他图像的处理过程相似，处理结果显示在附件的文件夹中。

(1)图像切割及灰度图转换灰度图转换（Gray Scale Image Transformation）

图 1 为“严重龟裂“的原始图像，可以看到路面样本图像中包含了路面修补的痕迹，剪切后的图像的突出了主要信息，转换为灰度图后，图像的颜色按照不同的灰度级分布，有利于进一步处理。

(2)直方图均化（Histogram Equalization）

用 matlab 的 imhist 函数做出灰度图转换后的图像的灰度直方图如下：

原始的路面裂缝图像的灰度分布集中在较窄的区间,致使图像的裂缝细节不够清晰, 路面图像背景的灰度值与路面裂缝的灰度值有部分的重叠,在步骤一的图像特点分析中就得知，总的来说,裂缝图像比正常路面的暗，所以可以通过直方图均化增强背景与目标之间的对比度。

经过直方图均衡化后,路面图像的灰度值在较大的动态范围内趋于均化，各灰度等级的比例更加平衡，图像的对比度比原图像增大,路面裂缝目标的清晰度增大,进而达到了图像增强的目的。

（3）分段灰度线性变换分段灰度线性变换（Piecewise Linear Transformation）

由于直方图均衡没有考虑图像的内容，简单地将图像进行直方图均衡，使得图像看起来亮度过高，不够灵活，故采用分段灰度线性变换的方法进一步增强图像的对比度。

通过 matlab 编写程序，对已经经过灰度图转换和直方图均匀化的路面图像进行分段灰度线性变换，并显示出分段线性变换的示意图，在本次建模中，对所有图片都分三段进行灰度变换。

从图7可以看出,与经直方图均衡化后的图5相比,分段线性变换使图像的裂缝变得更加清晰,图像的对比度增大,相对地提高了图像的质量利于提取图像的信息,裂缝目标更加突出,从而更容易提取裂缝目标的特征。

（4）平滑滤波（Mean Filtering）

经过对大量的路面缺陷图像进行滤波实验发现,加权邻域均值滤波的效果相对于均值滤波和中值滤波的效果主要有两个优点:一是加权邻域均值滤波去噪效果明显,对图像的平滑效果更好;二是加权邻域均值滤波对图像的边缘模糊影响较小。因此,本文采用加权邻域均值滤波进行裂缝图像的平滑。

（5）边缘检测（Edge Detect）

对路面裂缝来说,检测与分类的效果与精度在很大程度上受边缘检测算法的好坏的影响。运用梯度边缘检测算子,并从中选择一种对裂缝图像做边缘检测，分别为：Canny算子 Sobel 算子和 Roberts 算子。

通过图 9、图 10 和图 11 对比分析可知:Roberts 算子边缘定位精度较髙,但抑制噪声能力较弱,图像中有很多的噪声点; Canny 算法对灰度的变化十分敏感,虽然可以几乎完整地检测出路面裂缝目标的边缘,但是同时也产生了裂缝目标边缘的误检测,这样不但不能消除噪声的影响而且还可能使效果更差。Sobel 算子边缘检测是采用的灰度加权平均法,在水平方向和垂直方向上形成了最强烈的边缘具有较强的方向性。Sobel 算子边缘检测,对灰度值的渐变和噪声都处理的比较好,结合路面裂缝目标的实际处理情况,本文选用 Sobel 算子进行边缘检测。

（6) 二值图像噪声点的去除。

由图14的效果图可以看到,噪声被滤除了一些,且同时保持了裂缝的尺寸几乎不发生变化,这样就完成了路面裂缝区域的分割。

2.3.2 道路缺陷目标特征提取

对其中严重龟裂二值图像作投影图，统计其在水平和垂直投影的像素点。统计图像如图 15 所示。

经过实验,我们看出,不同缺陷类型,由于其有不同的几何形状特征，其在 X 轴与 Y 轴的投影特征是不同的,因此我们可以将裂缝的投影特征作为对裂缝进行分类识别的依据。

由路面特征值分类表可看出：

（1）对于同一幅裂缝图像，I_X_MAX 和 I_Y_MAX 的差别比较大，而对于其他类型的图像，两者之间比较接近，但不同种类之间数值大小存在差异性，这个结论符合特征提取的原则,且与理论分析的结果是一致的,基本所有的裂缝都符合这个特性,由此说明基于投影的特征提取所得的 I_X_MAX和 I_Y_MAX 投影特征对路面裂缝进行分类识别是可行的。

（2）对于基于 proximity 算法提取的特征值 P1 和 P2，正常路面，龟裂，网裂之间的数值有明显的差异性，而相同种类内部有相似性，然而，对于裂缝和网裂，此特征值差异并不是很理想，但结合其他特征值，P1 和 P2 这类特征向量对路面裂缝图像进行分类识别也是有可能的，但不一定能得到比较理想的效果。

（3）基于破损密度因子的路面破损特征提取, 相同的缺陷类别,其相应的特征参数具有相似性,各个值之间的差异很小,不同的缺陷类别,其对应的特征值之间的差异比较明显，基于以上分析,利用这类特征对裂缝图像进行分类识别是可行的。

（4）本文用简单的盒计数法计算分形的维数。将一系列 N ( ) ，数据作 ln N( )~ln(1/ )图（图 16），求出分形维数（盒子维数）。以其斜率作为二值图像的特征值之一。

2.3.3 路面缺陷类型的分类识别：

本文采用台湾林智仁博士等开发的 LIBSVM 软件包对路面图像的特征向量进行分类。

（1）样本数据转化为 LIBSVM 格式：

LIBSVM 使用的训练数据和测试数据文件的格式为：〈label〉〈index 1〉:〈value 1〉: …
其中训练数据文件中的是训练数据集的目标值,是对类别的标记,测试数据文件中的只用于计算分类的准确度或误差。是以 1 幵始的整数,用于表示特征的序号。

本文所使用的数据中，包含的类别数是 7，因此使用需要构造 6 个两类分类器，将得到的 30 幅路面图像的特征向量按 LIBSVM 软件包要求的数据格式进行标注，即对 7 类样本分别使用数字 1,2,3,4,5,6,7 进行标记，则系统输出的数字与训练样本类别的数字相对应，这样就可以根据分类器的分类结果判断待识别样本属于何种类别的路面。经处理后 LIBSVM 数据格式见附件”样本 LIBSVM 格式.xls”。

（2）数据的归一化处理：

在训练之前先将所有的数据进行归一化，第一可以避免一些特征值范围过大而另一些特征值范围过小，从而大数淹没小数；第二可以避免在训练时为了计算内积引起的数值计算的困难。

本文运用 LIBSVM 软件包中的 svm-scale.exe 对已转化 LIBSVM 格式的样本数据进行归一化，得到的数据具体在附件”样品 scale.txt”。

（3）参数选优

对于每一个核函数来说，对应不同的参数，会得到不同的训练模型，对样本的检验和预测自然会得到不同预测结果。而且由实验可知有时参数选择对预测结果的影响会比显著，因此，我们需要对参数进行优化选择。

对于参数的选择一般由两种方法：一是利用专家的先验知识预先选定不同的参数，这样在一般情况下是使用给出的默认参数。但对于不同的分类情况，默认参数不一定适合，所以有第二种参数选择方法：分别使用不同的参数，归纳实验得到分类准确率最高的参数，但这种方法要付出一定的内存和时间的代价。

本文使用的是第二种方法，而 LIBSVM 软件包的工具 grid.py 可以对参数进行优化选择，利用经过归一化的数据，可以得到如下图像：

由图像可以知道，当选择核函数中的参数为 0.5 时，惩罚系数 c 为 8 时可以提高分类的正确率，在下面的训练和预测将可以得到体现。（注：的默认值为 1/k，其中 k 为特征数；c 默认值为 1）。

（4）模型训练：

由于选取的图像的样本数只有 30 幅，但却有 7 种类型这么多，有的类型甚至只有一幅图像，若是还将其分开为训练数据和预测数据，并不能很好使训练模型的准确性得到保证。于是，我们将样本数据作交叉检验，这样，便能够使样本数据得到充分利用，而且能使训练模型得到更广泛的推广。

本文中利用 LIBSVM 软件包中的 svm-train.exe 对已归一化处理的样本进行训练，而且选择由（3）得到的参数 =0.5，与 c=10，并选取 5 折交叉检验模式进行训练。得到如下结果( 具体见附件“样品 train_grid”)：

说明：

（5）模型预测

得到训练模型后，重要的还是对模型的进行验证，以求得到更好的训练模型。下面我们将继续用样本数据对模型进行检验，为了比较不同的参数选择对训练模型的影响，我们将分别用由默认提供的参数和经我们优选后的参数得到训练模型进行检验。

利用 LIBSVM 软件包的 svm-predict.exe 得到如下预测结果：

转化为混淆矩阵比较得：

简单分析：

选择默认参数时，出错率非常高，几乎把每一类都预测为第 1 类，正确率仅为 40%，这个训练模型并不理想。当选择优选参数时，能得到非常好的预测，在这个小样本中，几乎能完美的预测，虽然在大样本中，预测可能不那么完美，却依然可以满足我们的要求。

经过上述过程，我们可以得到道路缺陷自动识别的一个基本模型。它会对自动采集的路面图形，通过图像预处理，提取其特征值，再利用已有的训练模型进行预测验证。最后我们还可以同过预测的评价结果反馈给模型，再进行训练，能使模型得到不断的完善。

3. 结论

（1）采集的裂缝图像存在大量的噪声,后续工作的进行是十分不利的。对路面裂缝进行图像预处理操作，进行定性和定量的比较分析,大部分图像预处理后都达到了去噪的目的。但对于轻微裂缝和轻微龟裂的预处理效果还有待提高，这是本次研究的不足之处。

（2）道路图像的四种特征值从不同的方面反映了路面二值图像的特征，不同的特值各有优势，但共同的一点是相对于同的缺陷类别,其相应的特征参数具有相似性,各个值之间的差异很小,不同的缺陷类别,其对应的特征值之间的差异比较明显。因此，四种算法所得到的值都可以作为图像的特征。

(3)通过对支持向量机理论和目标识别技术的深入研究，设计了 SVM 分类器，通过对训练模型的改善，在只有小样本数据的情况下，都取得了较好的分类效果，有效地实现了道路图像的分类，且解决了传统模式识别方法容易出现的过学习和欠学习问题，成为当前模式识别领域的首选分类器。

4. 参考文献

[1]张小波数据挖掘应用 20 个案例分析[M] 广州太普信息技术有限公司 2012 145-152

[2]孙即祥图像分析[M] 北京:科学出版社,2005 1-2

[3]李倩基于图像处理的路面裂缝识别研究[D] 沈阳东北大学 2011

[4]孙兆林 MATLAB 6.x 图像处理[M] 北京:清华大学出版社,2002 267-269

[5]肖旺新路面破损图像自动识别关键技术研究[D] 南京:东南大学,2004

[6]张小波数据挖掘应用实战基础[M] 广州太普信息技术有限公司 2012 39-42

[7]秦玉平基于支持向量机的文本分类算法研究[D] 大连大连理工大学 2008

[8] LibSVM 学习 http://blog.csdn.net/flydreamGG/archive/2009/08/21/4470477.aspx

[9]杨毓蒙肖莲用支持向量机_SVM_构建企业破产预测模型[J] 2006.10 金融研究65-75

你可能感兴趣的:(泰迪杯论文,大数据项目案例,数据挖掘,大数据,图像处理,路面缺陷类型,自动识别,支持向量机)

斤斤计较的婚姻到底有多难？白心之岂必有为
很多人私聊我会问到在哪个人群当中斤斤计较的人最多？我都会回答他，一般婚姻出现问题的斤斤计较的人士会非常多，以我多年经验，在婚姻落的一塌糊涂的人当中，斤斤计较的人数占比在20～30%以上，也就是说10个婚姻出现问题的斤斤计较的人有2-3个有多不减。在婚姻出问题当中，有大量的心理不平衡的、尖酸刻薄的怨妇。在婚姻中仅斤斤计较有两种类型：第一种是物质上的，另一种是精神上的。在物质与精神上抠门已经严重的影响
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
android系统selinux中添加新属性property 辉色投像
1.定位/android/system/sepolicy/private/property_contexts声明属性开头：persist.charge声明属性类型：u:object_r:system_prop:s0图12.定位到android/system/sepolicy/public/domain.te删除neverallow{domain-init}default_prop:property
C语言如何定义宏函数？小九格物 c语言
在C语言中，宏函数是通过预处理器定义的，它在编译之前替换代码中的宏调用。宏函数可以模拟函数的行为，但它们不是真正的函数，因为它们在编译时不会进行类型检查，也不会分配存储空间。宏函数的定义通常使用#define指令，后面跟着宏的名称和参数列表，以及宏展开后的代码。宏函数的定义方式：1.基本宏函数：这是最简单的宏函数形式，它直接定义一个表达式。#defineSQUARE(x)((x)*(x))2.带参
Cell Insight | 单细胞测序技术又一新发现，可用于HIV-1和Mtb共感染个体诊断尐尐呅
结核病是艾滋病合并其他疾病中导致患者死亡的主要原因。其中结核病由结核分枝杆菌（Mycobacteriumtuberculosis,Mtb）感染引起，获得性免疫缺陷综合症（艾滋病）由人免疫缺陷病毒（Humanimmunodeficiencyvirustype1,HIV-1）感染引起。国家感染性疾病临床医学研究中心/深圳市第三人民医院张国良团队携手深圳华大生命科学研究院吴靓团队，共同研究得出单细胞测序
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
《策划经理回忆录之二》路基雅虎
话说三年变六年，飘了，飘了……眨眼，2013年5月，老吴回到了他的家乡——油城从新开启他的工作幻想症生涯。很庆幸，这是一家很有追求，同时敢于尝试的，且实力不容低调的新星房企——金源置业(前身泰源置业)更值得庆幸的是第一个盘就是油城十路的标杆之一:金源盛世。2013年5月，到2015年11月，两年的陪伴，迎来了一场大爆发。2000个筹，5万/筹，直接回笼1个亿！！！这……让我开始认真审视这座看似五线
Long类型前后端数据不一致 igotyback 前端
响应给前端的数据浏览器控制台中response中看到的Long类型的数据是正常的到前端数据不一致前后端数据类型不匹配是一个常见问题，尤其是当后端使用Java的Long类型（64位）与前端JavaScript的Number类型（最大安全整数为2^53-1，即16位）进行数据交互时，很容易出现精度丢失的问题。这是因为JavaScript中的Number类型无法安全地表示超过16位的整数。为了解决这个问
扫地机类清洁产品之直流无刷电机控制悟空胆好小清洁服务机器人单片机人工智能
扫地机类清洁产品之直流无刷电机控制1.1前言扫地机产品有很多的电机控制，滚刷电机1个，边刷电机1-2个，清水泵电机，风机一个，部分中高端产品支持抹布功能，也就是存在抹布盘电机，还有追觅科沃斯石头等边刷抬升电机，滚刷抬升电机等的，这些电机有直流有刷电机，直接无刷电机，步进电机，电磁阀，挪动泵等不同类型。电机的原理，驱动控制方式也不行。接下来一段时间的几个文章会作个专题分析分享。直流有刷电机会自动持续
消息中间件有哪些常见类型 xmh-sxh-1314 java
消息中间件根据其设计理念和用途，可以大致分为以下几种常见类型：点对点消息队列（Point-to-PointMessagingQueues）：在这种模型中，消息被发送到特定的队列中，消费者从队列中取出并处理消息。队列中的消息只能被一个消费者消费，消费后即被删除。常见的实现包括IBM的MQSeries、RabbitMQ的部分使用场景等。适用于任务分发、负载均衡等场景。发布/订阅消息模型（Pub/Sub
【一起学Rust | 设计模式】习惯语法——使用借用类型作为参数、格式化拼接字符串、构造函数广龙宇一起学Rust #Rust设计模式 rust 设计模式开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、使用借用类型作为参数二、格式化拼接字符串三、使用构造函数总结前言Rust不是传统的面向对象编程语言，它的所有特性，使其独一无二。因此，学习特定于Rust的设计模式是必要的。本系列文章为作者学习《Rust设计模式》的学习笔记以及自己的见解。因此，本系列文章的结构也与此书的结构相同（后续可能会调成结构），基本上分为三个部分
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
如果做到轻松在股市赚钱？只要坚持这三个原则。履霜之人
大A股里向来就有七亏二平一赚的说法，能赚钱的都是少数人。否则股市就成了慈善机构，人人都有钱赚，谁还要上班？所以说亏钱是正常的，或者说是应该的。那么那些赚钱的人又是如何做到的呢？普通人能不能找到捷径去分一杯羹呢？方法是有的，但要做到需要你有极高的自律。第一，控制仓位，散户最大的问题是追涨杀跌，只要涨起来，就把钱往股票上砸，然后被套，隔天跌的受不了，又一刀切，全部割肉。来来回回间，遍体鳞伤。所以散户首
python八股文面试题分享及解析(1) Shawn________ python
#1.'''a=1b=2不用中间变量交换a和b'''#1.a=1b=2a,b=b,aprint(a)print(b)结果：21#2.ll=[]foriinrange(3):ll.append({'num':i})print(11)结果:#[{'num':0},{'num':1},{'num':2}]#3.kk=[]a={'num':0}foriinrange(3):#0,12#可变类型，不仅仅改变
番茄西红柿叶子病害分类数据集12882张11类别 futureflsl 数据集分类数据挖掘人工智能
数据集类型：图像分类用，不可用于目标检测无标注文件数据集格式：仅仅包含jpg图片，每个类别文件夹下面存放着对应图片图片数量(jpg文件个数)：12882分类类别数：11类别名称:["Bacterial_Spot_Bacteria","Early_Blight_Fungus","Healthy","Late_Blight_Water_Mold","Leaf_Mold_Fungus","Powdery
Redis系列：Geo 类型赋能亿级地图位置计算 Ly768768 redis bootstrap 数据库
1前言我们在篇深刻理解高性能Redis的本质的时候就介绍过Redis的几种基本数据结构，它是基于不同业务场景而设计的：动态字符串(REDIS_STRING)：整数(REDIS_ENCODING_INT)、字符串(REDIS_ENCODING_RAW)双端列表(REDIS_ENCODING_LINKEDLIST)压缩列表(REDIS_ENCODING_ZIPLIST)跳跃表(REDIS_ENCODI
Rust基础知识 GRKF15 rust 开发语言后端
1.Rust语言简介1.1基础语法变量声明：let关键字用于声明变量，可以指定或不指定类型，如leta=10;和letmutc=30i32;。函数定义：使用fn关键字定义函数，并指定参数类型及返回类型，如fnadd(i:i32,j:i32)->i32{i+j}。控制流：包括if、else等，控制语句后需要使用;来结束语句。1.2数据类型整数类型：i8、i16、i32、i64、i128，以及无符号的
C++菜鸟教程 - 从入门到精通第二节 DreamByte c++
一.上节课的补充(数据类型)1.前言继上节课,我们主要讲解了输入,输出和运算符,我们现在来补充一下数据类型的知识上节课遗漏了这个知识点,非常的抱歉顺便说一下,博主要上高中了,更新会慢,2-4周更新一次对了,正好赶上中秋节,小编跟大家说一句:中秋节快乐!2.int类型上节课,我们其实只用了int类型int类型,是整数类型,它们存贮的是整数,不能存小数(浮点数)定义变量的方式很简单inta;//定义一
对于写作者最重要的两点：热情和分享鱼和熊掌兼得
【热情】在开头，塔奇曼提到光有热情是不够的。但是，要想长期的坚持写作，没有热情是不行的。很多人都说，这是一个对写作者很优待的时代，也有很多人前仆后继的写作。在写作这条路上的人，始终很多，一些人来了，一些人走了，但是能坚持下来的却只有那么几个。不知道什么时候开始，写作变现这个词火了起来。不管是谁，都想来分一杯羹。可是写作变现真的没有这么容易，鱼哥说过，写作的人千千万万，能变现的也不过是其中的千分之一
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
OPENAIGC开发者大赛企业组AI黑马奖 | AIGC数智传媒解决方案 RPA中国人工智能 AIGC 传媒
在第二届拯救者杯OPENAIGC开发者大赛中，涌现出一批技术突出、创意卓越的作品。为了让这些优秀项目被更多人看到，我们特意开设了优秀作品报道专栏，旨在展示其独特之处和开发者的精彩故事。无论您是技术专家还是爱好者，希望能带给您不一样的知识和启发。让我们一起探索AIGC的无限可能，见证科技与创意的完美融合！创未来AI应用赛-企业组AI黑马奖作品名称：AIGC数智传媒解决方案参赛团队：深圳市三象智能技术
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
女儿考研完报考雅思捡拾流年
是否我过于焦虑？会不会无形间让女儿觉得压力太大了啊。2022年对于我们家来说是不平常的一年。女儿今年大四，为了准备考研，暑假也没回家，年初去了学校到了年末才回家。女儿自己一个人面对考研，没有参加培训，大四学校作业论文等课业也多，她同时也是很努力复习考研的。在疫情开放很多羊的时期，女儿终于顺顺利利参加12月24、25号的考研，我们和家人都觉得女儿回家来要好好休息调养。可女儿回到家，我再查阅考研信息，
上班的路毛毛虫小姑娘
七点半起床，拉开窗帘，天公不作美今儿是个阴雨天，天灰蒙蒙的，毛毛雨细细密密洒落下来。脑海里的两个小人开始斗争了，一个说：“毛毛雨啦，穿着风衣打着伞穿行在雨中，是一道亮丽的风景，说不定能遇见帅哥呢！”一个说：“不要不要，走到公司衣服鞋子都潮呼呼的，趴在身上很不舒服，外面湿气这么重，对身体不好！”我思索片刻，慢吞吞为自己冲了杯五谷粉，悠哉悠哉喝完去坐班车了。
关于Mysql 中 Row size too large (＞ 8126) 错误的解决和理解秋刀prince mysql mysql 数据库
提示：啰嗦一嘴，数据库的任何操作和验证前，一定要记得先备份！！！不会有错；文章目录问题发现一、问题导致的可能原因1、页大小2、行格式2.1compact格式2.2Redundant格式2.3Dynamic格式2.4Compressed格式3、BLOB和TEXT列二、解决办法1、修改页大小（不推荐）2、修改行格式3、修改数据类型为BLOB和TEXT列4、其他优化方式（可以参考使用）4.1合理设置数据
母亲节如何做小红书营销美橙传媒
小红书的一举一动引起了外界的高度关注。通过爆款笔记和流行话题，我们可以看到“干货”类型的内容在小红书中偏向实用的生活经验共享和生活指南非常受欢迎。根据运营社的分析，这种现象是由小红书用户心智和内容社区背后机制共同决定的。首先，小红书将使用“强搜索”逻辑为用户提供特定的“搜索场景”。在“我必须这样生活”中，大量使用了满足小红书站用户喜好和需求的内容。内容社区自制的高质量内容也吸引了寻找营销新途径的品
白骑士的Java教学基础篇 2.5 控制流语句白骑士所长 Java 教学 java 开发语言
欢迎继续学习Java编程的基础篇！在前面的章节中，我们了解了Java的变量、数据类型和运算符。接下来，我们将探讨Java中的控制流语句。控制流语句用于控制程序的执行顺序，使我们能够根据特定条件执行不同的代码块，或重复执行某段代码。这是编写复杂程序的基础。通过学习这一节内容，你将掌握如何使用条件语句和循环语句来编写更加灵活和高效的代码。条件语句条件语句用于根据条件的真假来执行不同的代码块。if语句‘
张芝华49天共修 - 草稿李娟AINI
祈禱、靜心、源代碼編程、觀想發願四根支柱，運用靈性能量的助力，讓夢想和渴望在最大向度中輕鬆實現。共修群指定书籍:1.能断金刚麦克格西2.新世界：灵性的觉醒埃克哈特·托尔3.爱是一切的答案芭芭拉迪安吉莉思4.完美的爱,不完美的关系约翰•威尔伍德5.爱的业力法则麦克格西6.漫画《金刚经》蔡志忠7.蔡志忠典藏国学漫画系列(套装共6册)作业:全部在共修群里完成，并请保存好自己的作业。l一周三次共修觉察作业
4.C_数据结构_队列荣世蓥数据结构数据结构
概述什么是队列：队列是限定在两端进行插入操作和删除操作的线性表。具有先入先出(FIFO)的特点相关名词：队尾：写入数据的一段队头：读取数据的一段空队：队列中没有数据，队头指针=队尾指针满队：队列中存满了数据，队尾指针+1=队头指针循环队列1、基本内容循环队列是以数组形式构成的队列数据结构。循环队列的结构体如下：typedefintdata_t;//队列数据类型#defineN64//队列容量typ
Python入门之Lesson2:Python基础语法小熊同学哦 Python入门课程 python 开发语言算法数据结构青少年编程
目录前言一.介绍1.变量和数据类型2.常见运算符3.输入输出4.条件语句5.循环结构二.练习三.总结前言欢迎来到《Python入门》系列博客的第二课。在上一课中，我们了解了Python的安装及运行环境的配置。在这一课中，我们将深入学习Python的基础语法，这是编写Python代码的根基。通过本节内容的学习，你将掌握变量、数据类型、运算符、输入输出、条件语句等Python编程的基础知识。一.介绍1
ASM系列四利用Method 组件动态注入方法逻辑 lijingyao8206 字节码技术 jvm AOP 动态代理 ASM
这篇继续结合例子来深入了解下Method组件动态变更方法字节码的实现。通过前面一篇，知道ClassVisitor 的visitMethod()方法可以返回一个MethodVisitor的实例。那么我们也基本可以知道，同ClassVisitor改变类成员一样，MethodVIsistor如果需要改变方法成员，注入逻辑，也可以
java编程思想 --内部类百合不是茶 java 内部类匿名内部类
内部类;了解外部类并能与之通信内部类写出来的代码更加整洁与优雅 1,内部类的创建内部类是创建在类中的 package com.wj.InsideClass; /* * 内部类的创建 */ public class CreateInsideClass { public CreateInsideClass(
web.xml报错 crabdave web.xml
web.xml报错 The content of element type "web-app" must match "(icon?,display- name?,description?,distributable?,context-param*,filter*,filter-mapping*,listener*,servlet*,s
泛型类的自定义麦田的设计者 java android 泛型
为什么要定义泛型类，当类中要操作的引用数据类型不确定的时候。采用泛型类，完成扩展。例如有一个学生类 Student{ Student(){ System.out.println("I'm a student....."); } } 有一个老师类
CSS清除浮动的4中方法 IT独行者 JavaScript UI css
清除浮动这个问题，做前端的应该再熟悉不过了，咱是个新人，所以还是记个笔记，做个积累，努力学习向大神靠近。CSS清除浮动的方法网上一搜，大概有N多种，用过几种，说下个人感受。 1、结尾处加空div标签 clear:both 1 2 3 4 .div 1 { background : #000080 ; border : 1px s
Cygwin使用windows的jdk 配置方法 _wy_ jdk windows cygwin
1.[vim /etc/profile] JAVA_HOME="/cgydrive/d/Java/jdk1.6.0_43" (windows下jdk路径为D:\Java\jdk1.6.0_43) PATH="$JAVA_HOME/bin:${PATH}" CLAS
linux下安装maven 无量 maven linux 安装
Linux下安装maven(转) 1.首先到Maven官网下载安装文件，目前最新版本为3.0.3，下载文件为 apache-maven-3.0.3-bin.tar.gz，下载可以使用wget命令； 2.进入下载文件夹，找到下载的文件，运行如下命令解压 tar -xvf apache-maven-2.2.1-bin.tar.gz 解压后的文件夹
tomcat的https 配置,syslog-ng配置 aichenglong tomcat http跳转到https syslong-ng配置 syslog配置
1) tomcat配置https,以及http自动跳转到https的配置 1)TOMCAT_HOME目录下生成密钥(keytool是jdk中的命令) keytool -genkey -alias tomcat -keyalg RSA -keypass changeit -storepass changeit
关于领号活动总结 alafqq 活动
关于某彩票活动的总结具体需求，每个用户进活动页面，领取一个号码，1000中的一个；活动要求 1，随机性，一定要有随机性； 2，最少中奖概率，如果注数为3200注，则最多中4注 3，效率问题，（不能每个人来都产生一个随机数，这样效率不高）； 4，支持断电（仍然从下一个开始），重启服务；（存数据库有点大材小用，因此不能存放在数据库）解决方案 1，事先产生随机数1000个，并打
java数据结构冒泡排序的遍历与排序百合不是茶 java
java的冒泡排序是一种简单的排序规则冒泡排序的原理：比较两个相邻的数，首先将最大的排在第一个，第二次比较第二个，此后一样；针对所有的元素重复以上的步骤，除了最后一个例题；将int array[]
JS检查输入框输入的是否是数字的一种校验方法 bijian1013 js
如下是JS检查输入框输入的是否是数字的一种校验方法： <form method=post target="_blank"> 数字：<input type="text" name=num onkeypress="checkNum(this.form)"><br> </form>
Test注解的两个属性：expected和timeout bijian1013 java JUnit expected timeout
JUnit4：Test文档中的解释：　　The Test annotation supports two optional parameters. 　　The first, expected, declares that a test method should throw an exception. 　　If it doesn't throw an exception or if it
[Gson二]继承关系的POJO的反序列化 bit1129 POJO
父类 package inheritance.test2; import java.util.Map; public class Model { private String field1; private String field2; private Map<String, String> infoMap
【Spark八十四】Spark零碎知识点记录 bit1129 spark
1. ShuffleMapTask的shuffle数据在什么地方记录到MapOutputTracker中的 ShuffleMapTask的runTask方法负责写数据到shuffle map文件中。当任务执行完成成功，DAGScheduler会收到通知，在DAGScheduler的handleTaskCompletion方法中完成记录到MapOutputTracker中
WAS各种脚本作用大全 ronin47 WAS 脚本
　　　http://www.ibm.com/developerworks/cn/websphere/library/samples/SampleScripts.html 　　　无意中，在WAS官网上发现的各种脚本作用，感觉很有作用，先与各位分享一下　　　获取下载这些示例 jacl 和 Jython 脚本可用于在 WebSphere Application Server 的不同版本中自
java-12.求 1+2+3+..n不能使用乘除法、 for 、 while 、 if 、 else 、 switch 、 case 等关键字以及条件判断语句 bylijinnan switch
借鉴网上的思路，用java实现： public class NoIfWhile { /** * @param args * * find x=1+2+3+....n */ public static void main(String[] args) { int n=10; int re=find(n); System.o
Netty源码学习-ObjectEncoder和ObjectDecoder bylijinnan java netty
Netty中传递对象的思路很直观： Netty中数据的传递是基于ChannelBuffer（也就是byte[]）；那把对象序列化为字节流，就可以在Netty中传递对象了相应的从ChannelBuffer恢复对象，就是反序列化的过程 Netty已经封装好ObjectEncoder和ObjectDecoder 先看ObjectEncoder ObjectEncoder是往外发送
spring 定时任务中cronExpression表达式含义 chicony cronExpression
一个cron表达式有6个必选的元素和一个可选的元素，各个元素之间是以空格分隔的，从左至右，这些元素的含义如下表所示：代表含义是否必须允许的取值范围 &nb
Nutz配置Jndi ctrain JNDI
1、使用JNDI获取指定资源： var ioc = { dao : { type :"org.nutz.dao.impl.NutDao", args : [ {jndi :"jdbc/dataSource"} ] } } 以上方法,仅需要在容器中配置好数据源,注入到NutDao即可.
解决 /bin/sh^M: bad interpreter: No such file or directory daizj shell
在Linux中执行.sh脚本，异常/bin/sh^M: bad interpreter: No such file or directory。分析：这是不同系统编码格式引起的：在windows系统中编辑的.sh文件可能有不可见字符，所以在Linux系统下执行会报以上异常信息。解决： 1）在windows下转换：利用一些编辑器如UltraEdit或EditPlus等工具
[转]for 循环为何可恨？ dcj3sjt126com 程序员读书
Java的闭包(Closure)特征最近成为了一个热门话题。一些精英正在起草一份议案，要在Java将来的版本中加入闭包特征。然而，提议中的闭包语法以及语言上的这种扩充受到了众多Java程序员的猛烈抨击。不久前，出版过数十本编程书籍的大作家Elliotte Rusty Harold发表了对Java中闭包的价值的质疑。尤其是他问道“for 循环为何可恨？”[http://ju
Android实用小技巧 dcj3sjt126com android
1、去掉所有Activity界面的标题栏　　修改AndroidManifest.xml 　　在application 标签中添加android:theme="@android:style/Theme.NoTitleBar" 2、去掉所有Activity界面的TitleBar 和StatusBar 　　修改AndroidManifes
Oracle 复习笔记之序列 eksliang Oracle 序列 sequence Oracle sequence
转载请出自出处：http://eksliang.iteye.com/blog/2098859 1.序列的作用序列是用于生成唯一、连续序号的对象一般用序列来充当数据库表的主键值 2.创建序列语法如下： create sequence s_emp start with 1 --开始值 increment by 1 --増长值 maxval
有“品”的程序员 gongmeitao 工作
完美程序员的10种品质　　完美程序员的每种品质都有一个范围，这个范围取决于具体的问题和背景。没有能解决所有问题的完美程序员（至少在我们这个星球上），并且对于特定问题，完美程序员应该具有以下品质：　　1. 才智非凡- 能够理解问题、能够用清晰可读的代码翻译并表达想法、善于分析并且逻辑思维能力强（范围：用简单方式解决复杂问题）　　
使用KeleyiSQLHelper类进行分页查询 hvt sql .net C#asp.net hovertree
本文适用于sql server单主键表或者视图进行分页查询，支持多字段排序。KeleyiSQLHelper类的最新代码请到http://hovertree.codeplex.com/SourceControl/latest下载整个解决方案源代码查看。或者直接在线查看类的代码：http://hovertree.codeplex.com/SourceControl/latest#HoverTree.D
SVG 教程（三）圆形，椭圆，直线天梯梦 svg
SVG <circle> SVG 圆形 - <circle> <circle> 标签可用来创建一个圆：下面是SVG代码： <svg xmlns="http://www.w3.org/2000/svg" version="1.1"> <circle cx="100" c
链表栈 luyulong java 数据结构
public class Node { private Object object; private Node next; public Node() { this.next = null; this.object = null; } public Object getObject() { return object; } public
基础数据结构和算法十：2-3 search tree sunwinner Algorithm 2-3 search tree
Binary search tree works well for a wide variety of applications, but they have poor worst-case performance. Now we introduce a type of binary search tree where costs are guaranteed to be loga
spring配置定时任务 stunizhengjia spring timer
最近因工作的需要，用到了spring的定时任务的功能,觉得spring还是很智能化的,只需要配置一下配置文件就可以了,在此记录一下，以便以后用到： //------------------------定时任务调用的方法------------------------------ /** * 存储过程定时器 */ publi
ITeye 8月技术图书有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的8月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 8月试读活动回顾： http://webmaster.iteye.com/blog/2102830 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《跨终端Web》 gleams：http