@李忆如

计算机视觉——车道线（路沿）检测

系列文章目录

一、实验内容与方法

二、视频的导入、拆分、合成

1.视频时长读取

2.视频的拆分

3.视频的合成

三、图像处理/边缘检测

0.尝试

1.图像处理->边缘检测（原理）

2.Canny算子边缘检测（原理）

3.Canny算子边缘检测（实现）

3.1 图像转化（彩->灰）

3.2 高斯滤波

3.3 Canny边缘检测

3.4 生成Mask掩膜，提取 ROI

四、基于Hough变换的路沿检测

1.Hough变换（原理）

2.基于Hough变换的路沿检测

2.1 函数参数解释

2.2 直线检测

2.3 直线绘制

Ⅰ、直线的几何特征与空间的结构特征判断

Ⅱ、路沿直线确定

Ⅲ、过度判断的修正

Ⅳ、其他难点问题的优化效果

2.4 直线处理

Ⅰ、对齐（延长）直线

Ⅱ、平滑化处理

2.5 图像融合与视频合成

五、其他路沿检测方法补充

1.传统图像方法综述

2.深度学习方法综述

2.1 基于分割的方法

2.2 基于检测的方法

2.3 基于参数曲线的方法

2.4 基于关键点的方法

六、深度学习方法实践

1.数据集介绍

2.算法介绍

3.代码实践

3.1 环境的搭建与部署

3.2 训练

3.3 测试

七、总结

1.路沿检测步骤

2.路沿检测问题与解决

2.1 图像处理方式的选择

2.2 参数设置问题

2.3 目标直线的筛选与确定

3.基于Hough变换直线检测的分析与补充

3.1 优点

3.2 缺陷

3.3 补充

八、参考资料

总结

系列文章目录

完整代码：李忆如 - Gitee.com

本系列博客重点在计算机视觉的概念原理与代码实践，不包含繁琐的数学推导（有问题欢迎在评论区讨论指出，或直接私信联系我）。

第一章计算机视觉——图像去噪及直方图均衡化（图像增强）_@李忆如的博客

第二章计算机视觉——车道线（路沿）检测

梗概

本篇博客主要介绍基于Hough变换与深度学习的直线检测。其中介绍并使用了各种算子（尤其Canny）进行图像的边缘检测，并在Hough变换后使用几何特征与空间特征等筛选与确定目标直线。（内附数据与python代码）

一、实验内容与方法

实验内容：针对给定的视频，利用图像处理基本方法实现道路路沿的检测；

提示：可利用Hough变换进行线检测，融合路沿的结构信息实现路沿边界定位（图中红色的点位置）。

实验环境：Pycharm2021+Windows10

二、视频的导入、拆分、合成

本实验给定的数据为视频，所以在图像处理前要对视频继续导入与拆分，步骤如下：

1.视频时长读取

为了对导入的视频自适应拆分，需要先读取出视频时长，方法总结如表1，代码详见：

python3 获取视频文件播放时长（三种方法）_小龙在山东的博客-CSDN博客_python获取视频时长

表1 Python进行视频时长读取的常用方法

1.使用VideoFileClip

2.使用CV2（最快）

3.使用FFmpeg

经比较后发现CV2读取最高效，故本实验使用CV2实现，代码如下：

# 获取视频时长
def get_duration_from_cv2(filename):
    cap = cv2.VideoCapture(filename)
    if cap.isOpened():
        rate = cap.get(5)
        frame_num = cap.get(7)
        duration = frame_num / rate
        return duration
    return -1

2.视频的拆分

视频：连续的图像变化每秒超过24帧（frame）画面以上时，根据视觉暂留原理，人眼无法辨别单幅的静态画面；看上去是平滑连续的视觉效果，这样连续的画面叫做视频。

故视频拆分为图像的过程实际为视频的帧分解。在得到视频时长后，可利用cv2.VideoCapture读取视频，并通过cv2库中的get、read等函数对视频的特定帧进行访问，再通过imwrite函数对得到的图片进行写入即可，核心代码（以逐帧分解为例）如下：

# 视频拆分
def Video_splitting(filename):
    cap = cv2.VideoCapture(filename)
    isOpened = cap.isOpened  # 判断视频是否可读
    print(isOpened)
    fps = cap.get(cv2.CAP_PROP_FPS)  # 获取图像的帧，即该视频每秒有多少张图片
    width = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))  # 获取图像的宽度和高度
    height = int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))
    print(fps, width, height)
    length = math.floor(get_duration_from_cv2(filename))  # 向下取整

    i = 0
    while isOpened:
        if i == 24 * length:  # 分解为多少帧(i)
            break
        # 读取每一帧，flag表示是否读取成功，frame为图片的内容
        (flag, frame) = cap.read()
        filename = 'img' + str(i) + '.jpg'  # 文件的名字
        if flag:
            cv2.imwrite(filename, frame, [cv2.IMWRITE_JPEG_QUALITY, 100])  # 保存图片
        i += 1
    return length

拆分样例（02.avi的拆分）如图1：

图3 视频拆分结果样例

3.视频的合成

在后续对图像处理完成之后最终要再形成视频，由（2）中视频定义可知，将图像按设定帧率与顺序连续即可完成视频的合成。在实现上我使用cv2.VideoWriter方法来创建一个video写入器，用cv2.VideoWriter_fourcc创建视频编解码器，代码如下：

# 视频合成
def Video_compositing(length):
    img = cv2.imread('img0.jpg')
    width = img.shape[0]
    height = img.shape[1]
    size = (height, width)
    print(size)

    videoname = "2.mp4"  # 要创建的视频文件名称
    # fourcc = cv2.VideoWriter_fourcc('M', 'J', 'P', 'G') # 编码器
    fourcc = cv2.VideoWriter_fourcc(*'mp4v')  # 编码器修改
    fps = 24  # 帧率(多少张图片为输出视频的一秒)

    # 1.要创建的视频文件名称 2.编码器 3.帧率 4.size
    videoWrite = cv2.VideoWriter(videoname, fourcc, fps, size)
    for i in range(fps * length):
        filename = 'img_line' + str(i) + '.jpg'
        img = cv2.imread(filename)
        videoWrite.write(img)  # 写入

三、图像处理/边缘检测

在真实环境中存在一定噪声，会影响后续目标检测的精度，故在此之前需进行一定的图像处理，具体方法与步骤如下：

0.尝试

最初本人使用实验一中提到的均值滤波（3x3为例）与中值滤波（卷积核为5为例）对实验图像进行处理，样例如图2所示：

图2 图像进行均值、中值滤波前后（上为均值滤波）

分析：由图2可见，使用均值及中值滤波降噪效果均较差，且滤波后图像模糊，丢失较多信息，不能为后续的边缘检测与路沿识别提供优化，故在本实验中使用其他方法。

1.图像处理->边缘检测（原理）

在图像中边缘即为亮度变化明显的点，边缘检测本质上就是检测并绘制出边缘点的集合，实现了简化图像信息，使用边缘线代表图像所携带信息。样例如图3所示：

图3 边缘检测样例

根据边缘定义，要找到亮度变化明显的点，只需要找到梯度大的点即可，图像梯度即当前所在像素点对于X轴、Y轴的偏导数，所以在图像处理领域可以理解为像素灰度值变化的速度。其中二维函数的微分（处理灰度图）定义如图4所示，梯度相关定义如图5所示：

图4 二维函数的微分（处理灰度图）定义

图5 梯度相关定义

根据原理与相关定义，边缘检测一般步骤总结如表2所示：

表2 边缘检测一般步骤

1.滤波：导数的计算对噪声很敏感，因此必须使用滤波器来改善与噪声有关的边缘检测器的性能。

2.增强:增强边缘的基础是确定图像各点邻域强度的变化值（计算梯度幅值）。增强算法可以将邻域(或局部)强度值有显著变化的点突显出来。

3.检测：在图像中有许多点的梯度幅值比较大，而这些点在特定的应用领域中并不都是边缘，所以应该用某种方法来确定哪些点是边缘点。最简单的边缘检测判据是梯度幅值阈值判据。

4.定位：如果某一应用场合要求确定边缘位置，则边缘的位置可在子像素分辨率上来估计，边缘的方位也可以被估计出来。

由上图对图2分析与上述原理与流程的定义可知，本实验进行图像处理的目的是为了更好实现后续的边缘检测与路沿（直线）检测，故图像处理应该与边缘检测的原理紧密结合。本实验给出如下几种边缘检测方法与其对应的图像处理方法。

我们在此介绍一下几种经典的边缘检测算子，Roberts算子、Prewitt算子、Sobel算子、Laplacian算子。其中不同算子的原理对比及缺点汇总如表3所示，样例公式如图6所示：

表3 不同边缘检测算子及其原理与缺点汇总

算子	原理	缺点
Roberts	基于一阶导数	对噪声敏感，难以抑制噪声的影响提取边缘比较粗边缘定位不是很准确
Prewitt	基于一阶导数	像素平均相当于对图像的低通滤波，所以 Prewitt 算子对边缘的定位不准
Sobel	基于一阶导数	由于边缘是位置的标志，对灰度的变化不敏感
Laplacian	基于二阶导数	对噪声比较敏感，只适用于无噪声图像容易丢失边缘方向信息，造成一些不连续的检测边缘

图6 几种经典边缘检测算子公式样例

分析：由表3中结论，经典边缘检测方法在使用中或多或少存在一定问题，求得的边缘图存在很多问题，如噪声污染没有被排除、边缘线太过粗宽等，对于本任务均不是最优选择。故在本实验中选择Canny算子进行边缘检测。不同算子进行边缘检测效果对比样如图7所示：

图7 不同边缘检测算子效果对比

2.Canny算子边缘检测（原理）

经过对比，较适合本实验的边缘检测方法为Canny算子。Canny算子是一种非微分边缘检测算子，目标是找到一个最优的边缘检测解或找寻一幅图像中灰度强度变化最强的位置。最优边缘检测主要通过低错误率、高定位性和最小响应三个标准进行评价。相关标准定义如表4，使用Canny算子进行边缘检测流程及相关原理如表5所示：

表4 Canny相关评价标准定义

评价标准	定义
低错误率	标识出尽可能多的实际边缘，同时尽可能的减少噪声产生的误报
高定位性	标识出的边缘要与图像中的实际边缘尽可能接近
最小响应	图像中的边缘只能标识一次

表5 Canny算子进行边缘检测流程及相关原理

步骤

操作

1	高斯滤波高斯滤波的原理：根据待滤波的像素点及其邻域点的灰度值按照高斯公式生成的参数规则进行加权平均。
2	计算梯度图像与角度图像 canny中使用的梯度检测算子是使用高斯滤波器进行梯度计算得到的滤波器，得到的结果类似于sobel算子，即距离中心点越近的像素点权重越大。角度图像的计算则较为简单，其作用为非极大值抑制的方向提供指导。

3 4	对梯度图像进行非极大值抑制上一步得到的梯度图像存在边缘粗宽、弱边缘干扰等众多问题，现在可以使用非极大值抑制来寻找像素点局部最大值，将非极大值所对应的灰度值置0，极大值点置1，剔除一大部分非边缘的像素点，因此最后生成的图像应为一副二值图像，边缘理想状态下都为单像素边缘。使用双阈值进行边缘连接目前仍存在许多伪边缘，canny算法采用的算法是双阈值法，具体思路是：选取两个阈值，将小于低阈值的点认为是假边缘置0，将大于高阈值的点认为是强边缘置1，介于中间的像素点需要进一步的检查。

3.Canny算子边缘检测（实现）

在正式开始边缘检测前，有以下四个重要特征需要了解，后续设计中帮助提高识别率：

Ⅰ、颜色：车道线（路沿）通常为浅色（白色/黄色），而道路则为深色（深灰色）。因此，黑白图像效果更好，因为车道可以很容易地从背景中分离出来。

Ⅱ、形状：车道线（路沿）通常是实线或虚线，所以可以将它们与图像中的其他对象分开。可以用Canny等边缘检测算法找到图像中的所有边缘/线条。然后我们可以使用进一步的信息来决定哪些边可以被限定为车道线。

Ⅲ、方向：公路车道线（路沿）更接近于垂直方向，而不是水平方向。因此，在图像中检测到的直线的斜率可以用来检查它是否可能是车道。

Ⅳ、在图像中的位置：在一个由行车记录仪拍摄的常规公路图像中，车道线（路沿）通常出现在图像的下半部分。因此，可以将搜索区域缩小到感兴趣的区域，以减少噪声。

根据（2）中的原理与流程设计代码，核心实现的设计与解析如下：

3.1 图像转化（彩->灰）

图像转化原因：边缘检测最关键的部分是计算梯度，颜色难以提供关键信息，并且颜色本身非常容易受到光照等因素的影响，所以只需要灰度图像中的信息就足够了。并且灰度化后，简化了矩阵，提高了运算速度。

原理：将彩色图像(Color Image)转换为灰度图(Gray Scale Image)，即从三通道RGB图像转为单通道图像。

实现：我们实现彩图转化为灰度图需要用到opencv库中的cv.cvtColor函数，需要用到两个参数：src——输入图片，code——颜色转换代码，具体代码如下：

# 灰度图转换
def grayscale(num_img):
    for i in range(num_img):
        filename = 'img' + str(i) + '.jpg'
        img = cv2.imread(filename)
        img_gray = cv2.cvtColor(img, cv2.COLOR_RGB2GRAY)
        filename = 'img_gray' + str(i) + '.jpg'
        cv2.imwrite(filename, img_gray)

转化样例如图8：

图8 图像转化样例

3.2 高斯滤波

高斯滤波选择原因：因为现实中的噪声分布多是随机，故在图5（0）中使用均值滤波与中值滤波效果不好，而Canny算子一般搭配高斯滤波。

简介、原理及操作：高斯滤波是一种线性平滑滤波，适用于消除高斯噪声。高斯滤波每一个像素点的值，都由其本身和邻域内的其他像素值经过加权平均后得到。高斯滤波的具体操作是：用一个模板（或称卷积、掩模）扫描图像中的每一个像素，用模板确定的邻域内像素的加权平均灰度值去替代模板中心像素点的值，其中卷积操作原理样例如图9所示：

图9 高斯滤波卷积操作原理样例

Tips：其中 * 表示卷积操作; Gσ 是标准差为σ 的二维高斯核,定义如图10所示：

图10 二维高斯核定义

实现：高斯滤波在代码中的实现可使用自定义函数与库函数两种方法实现，具体如下：

Ⅰ、自定义函数

若使用定义函数实现高斯滤波，流程如表6：

表6 自定义函数实现高斯滤波步骤

1. 对图像进行zero padding

2. 根据高斯滤波器的核大小和标准差大小实现高斯滤波器

3. 使用高斯滤波器对图像进行滤波（相乘再相加）

4. 输出高斯滤波后的图像

函数实现如下：

def GaussianFilter(img):
    
    h,w,c = img.shape
    # 高斯滤波 
    K_size = 3
    sigma = 1.3
    
    # 零填充
    pad = K_size//2
    out = np.zeros((h + 2*pad,w + 2*pad,c),dtype=np.float)
    out[pad:pad+h,pad:pad+w] = img.copy().astype(np.float)
    
    # 定义滤波核
    K = np.zeros((K_size,K_size),dtype=np.float)
    
    for x in range(-pad,-pad+K_size):
        for y in range(-pad,-pad+K_size):
            K[y+pad,x+pad] = np.exp(-(x**2+y**2)/(2*(sigma**2)))
    K /= (sigma*np.sqrt(2*np.pi))
    K /=  K.sum()
    
    # 卷积的过程
    tmp = out.copy()
    for y in range(h):
        for x in range(w):
            for ci in range(c):
                out[pad+y,pad+x,ci] = np.sum(K*tmp[y:y+K_size,x:x+K_size,ci])
    
    out = out[pad:pad+h,pad:pad+w].astype(np.uint8)
    
    return out

Ⅱ、库函数（本实验方法）

Opencv库中内置高斯滤波函数，用法为cv2.GaussianBlur(src, ksize, sigmaX, sigmaY, borderType)-> dst。经对比后，发现库函数实现与使用较方便，且效果较好，故本实验选择库函数实现高斯滤波，前后对比样例（以高斯矩阵的长与宽为5，标准差取0为例）如图11所示：

图11 图像进行高斯滤波前后

3.3 Canny边缘检测

在进行完图像转化与高斯滤波等图像处理后，正式进入Canny边缘检测，按表4中步骤设计边缘检测代码，如高斯滤波实现，可自定义函数实现，也可直接使用库函数实现。手写实现可见：Python实现Canny算子边缘检测 | Z Blog (yueyue200830.github.io)，本实验使用库函数进行Canny边缘检测。其中每一步生成图像样例及结果对比如图12所示：

图12 Canny边缘检测每一步生成的图像及不同实现方法效果对比

本实验直接使用opencv库中的cv.Canny函数，其中使用到的参数为：src——输入图像，low_threshold ——低阈值，high_threshold——高阈值，边缘检测样例（低阈值=75，高阈值=225为例）如图13所示：

图13 库函数实现边缘检测样例

3.4 生成Mask掩膜，提取 ROI

通过观察我们不难发现，本实验中路沿在图像中的位置基本处于中间偏右，这意味着我们可以对图像进行区域选取，排除其他边缘与线的影响，使识别效果更好，详解如下：

简介：Mask掩模的作用为降低计算代价，核心为遮挡非感兴趣区，只在我们感兴趣部分（ROI）进行算法的计算（mask最终需要与要作用到的输入图像的尺寸与类型保持一致）。本实验中我们感兴趣的部分为路沿，故可设计Mask掩模如图14所示：

图14 Mask掩模样例

Tips：实际任务中根据不同感兴趣区域进行Mask掩模，若需分析区域变化过大不适宜使用。

实现：Mask掩模设计与实现步骤如表7所示，实现样例（以构图点为(280, 0), (340, 0), (500, 480), (340, 480)为例）如图15所示：

表7 Mask掩模设计与实现步骤

1.生成一个与原图大小维度一致的mask矩阵，并初始化为全0，即全黑

2.对照原图在该mask上构建感兴趣区域

3.利用opencv中cv.fillpoly()函数对所限定的多边形轮廓进行填充，填充为1，即全白

4. 利用opencv中cv.bitwise()函数与canny边缘检测后的图像按位与，保留原图相中对应感兴趣区域内的白色像素值，剔除黑色像素值

代码如下：

# 生成感兴趣区域即Mask掩模
def region_of_interest(image, vertices):
    mask = np.zeros_like(image)  # 生成图像大小一致的zeros矩

    # 填充顶点vertices中间区域
    if len(image.shape) > 2:
        channel_count = image.shape[2]
        ignore_mask_color = (255,) * channel_count
    else:
        ignore_mask_color = 255

    # 填充函数
    cv2.fillPoly(mask, vertices, ignore_mask_color)
    masked_image = cv2.bitwise_and(image, mask)
    return masked_image

图15 Mask掩模实现样例（左为原图、中为原图mask、右为边缘mask）

至此，本实验的图像处理与边缘检测部分基本结束，实现及效果在前文中有详述，接下来进入到本实验的核心任务——路沿检测。

四、基于Hough变换的路沿检测

本部分将完成路沿检测，核心为基于Hough变换的直线检测，详解如下：

1.Hough变换（原理）

Hough变换是一种使用表决方式的参数估计技术，其原理是利用图像空间和Hough参数空间的线-点对偶性，把图像空间中的检测问题转换到参数空间中进行。空间映射样例如图16所示：

图16 Hough变换空间映射样例

分析：由于这种实现方式（y=mx+b)不能表示垂直线（斜率为无穷大），故在实际操作中选择极坐标系。根据直角坐标系和极坐标系变换域之间的关系，总结Hough变换主要性质如表8所示，映射样例如图17所示，Hough直线检测步骤如表9所示，Hough直线检测样例如图18所示：

表8 Hough变换主要性质

直角坐标系中的一点对应于极坐标中的一条正弦曲线

变换域极坐标系中一点对应于直角坐标系中的一条直线

直角坐标系一条直线上的N个点对应于极坐标系中共点的N条曲线

图17 Hough变换空间映射样例（极坐标系）

表9 Hough直线检测步骤

1.构建（参数空间）变换域累加器数组，并将其初始化为0

2.读入一幅二值化图像，遍历图像像素点

3.对每一个像素点，进行霍夫变换，按照r和θ的值在变换域累加器数组中的相应位置上加1

4.遍历累加器数组，寻找局部极大值

图18 Hough直线检测样例

2.基于Hough变换的路沿检测

基于（1）中的原理介绍与分析，使用Hough变换进行路沿检测，首先可以使用ImageEnhance.Contrast(img).enhance(n)函数增加图片对比度，如图19所示：

图19 对比度增加样例

然后使用Opencv封装好的cv.HoughLinesP函数进行路沿（直线）检测，其中参数及其解释如下：

2.1 函数参数解释

Ⅰ、第一个参数：InputArray类型的image，输入图像，即源图像，需为8位的单通道二进制图像。

Ⅱ、第二个参数：InputArray类型的lines，经过调用HoughLinesP函数后后存储了检测到的线条的输出矢量，每一条线由具有四个元素的矢量(x_1,y_1, x_2, y_2）表示，其中，(x_1, y_1)和(x_2, y_2) 是是每个检测到的线段的结束点。

Ⅲ、第三个参数：double类型的rho，以像素为单位的距离精度（直线搜索时的进步尺寸的单位半径）。

Ⅳ、第四个参数：double类型的theta，以弧度为单位的角度精度（直线搜索时的进步尺寸的单位角度）。

Ⅴ、第五个参数：int类型的threshold，累加平面的阈值参数，即识别某部分为图中的一条直线时它在累加平面中必须达到的值。大于阈值 threshold 的线段才可以被检测通过并返回到结果中。

Ⅵ、第六个参数：double类型的minLineLength，有默认值0，表示最低线段的长度，比这个设定参数短的线段就不能被显现出来。

Ⅶ、第七个参数：double类型的maxLineGap，有默认值0，允许将同一行点与点之间连接起来的最大的距离。

Ⅷ、输出：输出将是线，它将只是一个数组，包含通过霍夫变换检测到的所有线段的端点（x1、y1、x2、y2）。

2.2 直线检测

在了解cv.HoughLinesP函数参数与解释后，使用其在本任务中进行直线检测，返回直线坐标。其中必须根据你的需求调整参数，在本实验中两组较优参数如下：

 lines = cv2.HoughLinesP(img_canny, 0.5, np.pi / 180, 20, np.array([]), minLineLength=30,
                             maxLineGap=10)  # test1较优参数
    lines = cv2.HoughLinesP(img_canny, 1, np.pi / 180, 100, np.array([]), minLineLength=100,
                            maxLineGap=8)  # ta参

Tips：调参过程切忌过拟合，会降低代码（模型）的泛化能力，在后续过程还可以进行直线的分类与判断确定所需的目标直线。

2.3 直线绘制

在2.2中利用Hough变换返回了检测到的直线的坐标，在本部分进行直线的绘制，绘制函数为opencv库中的cv2.line(image, (x1, y1), (x2, y2), color, pixel)。绘制样例（无mask掩模）如图20所示：

图20 直线绘制样例（无mask掩模）

分析：如图20所示，直接Hough变换存在过度检测、过度判断等问题，故对于目标直线定义一个合理的判断逻辑也至关重要，因此在直线绘制过程中加入如下判断：

Ⅰ、直线的几何特征与空间的结构特征判断

对于过度检测的情况，可以利用直线的几何特征或空间的结构特征对直线进行筛选。空间结构如mask掩模，上文有详述。其对于直线的筛选样例如图21所示。

几何特征如直线斜率，观察本实验数据不难分析，目标路沿斜率变化不大且在某个区间，故利用python进行统计分析，在mask掩模+抽帧方法输出相关直线斜率信息，样例如表10所示：

表10 直线斜率分析样例

直线类型	斜率	视频	帧数
路沿	2.113	1	1
其他	-3.45	1	24
路沿	2.087	2	48
路沿	3.114	2	72
其他	1.03	2	96
路沿	3.432	3	120
其他	-1.112	3	144

分析：对于表10及其他汇总数据进行统计分析，可知本实验中路沿斜率一般为2+，故在本实验中设置低阈值为2，高阈值为3.5。在直线绘制时时加入判断，其对直线的筛选样例如图22所示：

图21 空间的结构特征判断筛选直线样例

图22 直线的几何特征判断筛选直线样例

分析：如图21与图22所示，经过直线的几何特征或空间的结构特征后可以保留路沿相关直线，效果较好，在后续中需在几条直线中提取路沿直线，方法如下：

Ⅱ、路沿直线确定

在经过直线的几何特征与空间的结构特征判断后，仍存在不止一条直线，在其中要确定我们的目标直线（路沿），还需要增加一定的限制条件。在本实验中，确定路沿线以如下三个特点为例：

特点1——直线位置：本实验中路沿直线一般在筛选后直线中间，可以使用拟合后直线x轴坐标用于排除两边直线。

特点2——斜率聚类：对图像几何特征进行分析，图像从左至右直线斜率不断增大，可利用斜率对于筛选后直线聚类，根据特点1，选择中部斜率类进行保留。

特点3——x轴差值：根据特点2，可根据x轴差值（拟合直线在本图像中的最大x差值）确定路沿直线，利用python进行统计分析，在输出相关直线x轴差值信息，样例如表11所示：

表11 筛选后直线x轴差值分析样例

直线类型	X轴差值	视频	帧数
路沿	84	2	48
路沿	113	2	72
其他	162	2	96
路沿	121	3	120
其他	62	3	144

分析：对于表11及其他汇总数据进行统计分析，可知本实验中路沿x轴差值区间为[80，130]。在直线绘制前时加入如上三大特点，其优化效果样例如图23所示：

图23 路沿直线确定优化效果

Tips：不同任务下待检测直线的确定特点有所不同，故路沿（目标）直线确定这一步添加需谨慎，需针对不同实际任务需求做修改。直接迁移有可能起到适得其反的效果，降低模型的泛化能力。在简单任务中也可直接使用直线的几何特征与空间的结构特征判断+后续修正即可，可以确定与目标直线相关的几条直线。

Ⅲ、过度判断的修正

在直线检测中还可能出现过度判断的情况，即未检测出直线，本实验中需对这种情况进行修正。

通过对数据视频的观察，不难发现待检测直线位置随视频帧变化较小，故简单情况下可直接使用上一帧直线+位置修正的方法，核心为存储每一帧的目标直线信息，在过度判断时利用两帧图片的位置偏差对上一帧图片进行位置修正后作为本帧目标直线。用其对过度判断修正样例如图24所示：

图24 上一帧直线+位置修正样例

分析：由图24可见，使用上一帧直线+位置修正可以较好地处理简单情况下过度判断的问题，除此之外，可使用泛化性能更强的卡尔曼滤波对该问题进行优化，原理与方法如下：

卡尔曼滤波：卡尔曼滤波是一种常见的目标追踪算法，作用就是基于传感器的测量值来更新预测值，以达到更精确的估计，如图25所示，核心公式如图26所示，在本实验中跟踪路沿线的步骤如表12所示：

图25 卡尔曼滤波样例

图26 卡尔曼滤波核心公式

表12 卡尔曼滤波跟踪车道线的算法步骤

1.根据当前帧Hough 变换提取的车道线参数，利用卡尔曼滤波跟踪当前车道线

2.每隔5s 扫描一次，比较Hough 变换检测的前、后两帧车道线的参数。如果在一定误差范围内（角度偏差小于±3o），让车辆继续沿原车道线行驶；如果角度偏差大于误差范围，转新的车道线行驶

3.继续跟踪时，转步骤（1）进行

分析：根据原理与流程分析，卡尔曼滤波器通过将测量误差和先前状态相加来平均沿车道检测到的线的变化。使检测到的车道标记线随时间推移保持稳定，并且由于其在以前的状态下仍具有预测特性，因此在环境影响较大的情况下（低光照、模糊、强变化），它可以通过记住先前视频帧中的先前检测到的车道来预测与检测车道。故卡尔曼滤波的优化效果与鲁棒性优于直接使用上一帧直线+位置修正。

Ⅳ、其他难点问题的优化效果

在本实验中存在的其他难点问题有二，解决方案与优化效果详述如下：

难点问题1——模糊：本实验中部分视频存在模糊情况（02.avi尤为明显），在检测时可能会出现限制条件后仍有多条直线的情况，因为视频连续两帧间筛选后直线数量不会突变，故解决方案为卡尔曼滤波+直线数量限制（num_line_this < num_line * 2）,优化前后样例如图27所示：

图27 模糊视频帧直线检测优化

分析：如图27，优化后对于目标直线（路沿）的检测与定位准确，解决了模糊视频图像中直线检测误差问题，效果较好。

难点问题2——过弯：本实验部分视频存在过弯情况（03.avi）拐弯处由于路沿长短的变化以及角度变动幅度比较大，会导致检测过程中出现一系列问题。本实验解决方案为函数参数优化+条件限制（上文有详述），过弯样例如图27所示：

图27 过弯路沿检测样例

Tips：本实验我绘制的直线定长，故存在超出弯道部分，在实际中调节长度即可。

分析：由图27分析，过弯前后均可快速并正确地检测出路沿，较好地解决了过弯问题。

2.4 直线处理

在本实验中为使绘制出的直线更加稳定，可使用对齐（延长）直线与平滑化处理，具体如下：

Ⅰ、对齐（延长）直线

已知检测出直线的两点（x1,y1）,(x2,y2)，利用直线特征将直线延长至定长定起点实现对齐，代码实现样例（以y=250、y=480为例）如下：

x_temp = int(((x2 - x1) * (480 - y2) / (y2 - y1) + x2))  # 直线延长
            x_temp_min = int(((x2 - x1) * (250 - y2) / (y2 - y1) + x2))  # 直线延长

对齐(延长)前后样例如图28所示：

图28 直线对齐样例

分析：使用直线对齐后，检测出直线相对规整，也便于聚类。

Ⅱ、平滑化处理

在路沿部分可能不止一条直线，而属于同一类直线，但探测到的车道线还是不够平滑，我们需要优化，基本思路就是对这些直线的斜率和截距取平均值然后将所有探测出点绘制到一条直线上，实现平滑化处理。

2.5 图像融合与视频合成

在进行完直线检测+直线绘制+直线处理后得到了带绘制灰度图，可以直接按1（3）中的视频合成方法生成最终视频（灰度，本实验使用方法）。或进行图像融合得到待绘制彩色图后按1（3）中的视频合成方法生成最终视频。

图像融合可以使用函数cv.addWeighted（），输入原始彩色图像与绘制灰度图按一定权重融合即可，代码如下：

# 原图像与车道线图像按照a:b比例融合
def weighted_img(img, initial_img, a=0.8, b=1., c=0.):
    return cv2.addWeighted(initial_img, a, img, b, c)

样例（以α=0.8，β=1为例）如图29所示：

图29 图像融合样例

分析：由图29可见，图像融合后对原彩图较好地还原，并在此绘制检测出的直线，有不错的效果。

五、其他路沿检测方法补充

本实验使用了Canny算子边缘检测+Hough变换直线提取的经典方法进行路沿（车道线）检测，在代码实现方面，参数调节、直线筛选与限制条件判断等条件上编写较麻烦；在检测效果上，由于传统方法的限制，直线检测偶有不稳定现象，且模型对于数据集与环境条件依赖过大，可迁移性不强。

故尝试查找相关资料，发现车道线检测领域是一个热门研究领域，与无人驾驶领域有很大的相关性，在对部分论文进行研读后，在此补充并综述一些其他路沿（车道线）检测方法，详情如下：

1.传统图像方法综述

如前文所述，传统图像方法通过边缘检测滤波等方式分割出车道线区域，然后结合Hough变换、RANSAC等算法进行车道线检测。这类算法需要人工手动去调滤波算子，根据算法所针对的街道场景特点手动调节参数曲线，工作量大且鲁棒性较差，当行车环境出现明显变化时，车道线的检测效果不佳。主流方式如表13：

表13 传统图像方法进行车道线检测方法综述

基于Hough变换的车道线检测

基于LSD直线的车道线检测

基于俯视图变换的车道线检测

基于拟合的车道线检测

基于平行透视灭点的车道线检测

缺点：应用场景受限；Hough变换检测方法准确但很难做弯道检测，拟合方法可以检测弯道但不稳定，仿射变换可以做多车道检测但在遮挡等情况下干扰严重。透视变换操作会对相机有一些具体的要求，在变换前需要调正图像，而且摄像机的安装和道路本身的倾斜都会影响变换效果。其次，这些方法都无法满足实时性要求。

2.深度学习方法综述

近年来，随着深度学习在计算机视觉领域的快速发展，对应方法由于其鲁棒性和实时性迅速获得了关注，大致分为四类：基于分割的方法、基于检测的方法、基于参数曲线的方法、基于关键点的方法。下面对四类方法进行简介：

2.1 基于分割的方法

基于分割的方法将车道线检测建模为逐像素分类问题，每个像素分为车道线区域或背景。这类模型通常是在语义分割模型的基础上，增加一个车道线实例判别头，来对车道线是否存在进行监督学习。经典算法有：SCNN、RESA、LaneNet等。

其中以SCNN为例，为了区分不同的车道线，SCNN将不同的车道线作为不同的类别，从而将车道检测转化为多类分割任务。提出一个切片CNN结构（RESA对结构进行改进，加入切片间的不同步幅大小的信息传递，同时解耦相邻层之间的时序上的依赖，增加并行处理能力），以使消息跨行和列传递，原理如图30所示：

图30 SCNN原理

总结：分割模型大，处理速度慢。在严重遮挡情况下表现差，未充分利用车道先验知识。

2.2 基于检测的方法

基于检测的方法通常采用自顶向下的方法来预测车道线，这类方法利用车道线在驾驶视角自近处向远处延伸的先验知识，构建车道线实例。基于Anchor的方法设计线型Anchor，并对采样点与预定义Anchor的偏移量进行回归。应用非极大值抑制（NMS）选择置信度最高的车道线。经典算法有：LineCNN、LaneATT等。

其中以lineCNN为例，其使用从图像边界以特定方向发出的直线射线作为一组Anchor，原理如图31所示：

图31 lineCNN原理

总结：自顶向下的设计能够更好的利用车道线的先验知识，提高检测实时性，同时在处理严重遮挡等情况下能够获得连续的车道线检测实例。但预设Anchor形状会影响检测的灵活性。

2.3 基于参数曲线的方法

基于参数曲线的方法使用预先设定的参数曲线，对车道线形状进行检测，经典算法有：PolyLaneNet、B´ezierLaneNet等。

以PolyLaneNet为例，其通过多项式曲线回归，输出表示图像中每个车道线的多项式。并维持高效性(115FPS)，原理如图32所示：

图32 PolyLaneNet原理

总结：基于曲线的方法可以自然地学习整体车道表示，具有较高的推理速度，但在准确度上不高。

2.4 基于关键点的方法

基于关键点的方法直接对车道线的实例进行检测，使用后处理对实例进行划分。经典算法有：FOLOLane、GANet等。

以FOLOLane为例，其对局部模式进行建模，并以自下而上的方式实现对全局结构的预测，原理如图33所示：

图33 FOLOLane原理

总结：此类方法兼具灵活性和实时性，在处理遮挡问题时如何构建全局信息是需要考虑的问题。

六、深度学习方法实践

本部分以LaneNet为例，对深度学习方法在车道线检测方面进行简单实践，具体如下：

Towards End-to-End Lane Detection: an Instance Segmentation Approach论文（2018）：Towards End-to-End Lane Detection: an Instance Segmentation Approach

代码（tensorflow）：https://github.com/MaybeShewill-CV/lanenet-lane-detection

数据集（tuSimple）：https://github.com/TuSimple/tusimple-benchmark/issues/3

1.数据集介绍

LaneNet官方使用数据集为tuSimple数据集，是车道线识别中常用数据集（网络最早公开的数据集），基本为高速公路车道线检测，相关信息如表14：

表14 tuSimple数据集相关信息

复杂性	良好和中等天气条件、白天不同、多车道与高速公路不同的交通状况
规模	训练：3626个视频剪辑（每个剪辑最后一帧带有标注）测试：2782个视频剪辑
相机与视频片段	1s剪辑20帧相机的视线方向非常接近行车方向
注释类型	车道标记折线

2.算法介绍

LaneNet是一种端到端（输入原数据，无需特征提取）的车道线检测方法，包含 LanNet + H-Net 两个网络模型。是将语义分割和对像素进行向量表示结合起来的多任务模型，最后利用聚类完成对车道线的实例分割。

H-Net 是个小的网络结构，负责预测变换矩阵 H，使用转换矩阵 H 对同属一条车道线的所有像素点进行重新建模（即：学习给定输入图像的透视变换参数，该透视变换能够对坡度道路上的车道线进行良好地拟合）。

整体网络架构与核心流程如图34所示，LaneNet网络架构与实现如图35所示：

图34 LaneNet整体网络架构与核心流程

图35 LaneNet网络架构与实现

优点：通过embedding vector与cluster配合使用，能检测不限条数的车道线。通过HNet学得的perspective transformation，使得lane fitting能够更鲁棒。

缺陷：cluster很耗时，实际工程应用上很难满足实时性的要求。

3.代码实践

Tips：代码详细实践过程可见github或深度学习车道线检测之 LaneNet （使用tensorflow2.4.0）

将数据集与项目代码准备好后，导入到Pycharm，按如下方式部署与运行：

3.1 环境的搭建与部署

可使用anaconda管理环境，使用pip install -r requirements.txt命令安装相关依赖即可。

3.2 训练

在部署好环境后即可进入训练，可使用tuSimple数据集（本次探究使用）与个人数据集（更改data_provider\lanenet_data_feed_pipline.py，需自己采集与标注），训练操作流程如表15：

表15 LaneNet训练操作流程

1.使用项目lanenet-lane-detection中的脚本generate_tusimple_dataset.py产生训练数据

2.根据.json文件转换训练集，生成图片文件夹以及文本文件

3.将标注格式转换成TFRecord

4.运行 tools/train_lanenet_tusimple.py，开始训练

可使用tensorboard可查看训练过程，损失与变化曲线如图36所示，还可以查看模型在训练过程中的分割分支和嵌入分支输出到预测图，如图37所示：

图36 LaneNet训练损失与变化曲线

图37 LaneNet分支预测图样例

3.3 测试

在训练结束后得到模型，将权重文件放在model目录下，即可输入图片进行车道线检测，检测样例如图38所示：

图38 LaneNet车道线检测样例

分析：由图38可见，LaneNet能较好地对测试图像的车道线进行检测，项目实践成功。

七、总结

1.路沿检测步骤

本次实验的核心任务为路沿检测，对实验步骤进行总结，基于Hough变换的路演检测步骤如图39所示：

图39 基于Hough变换的直线（路沿）检测步骤

2.路沿检测问题与解决

本次实验在实现路沿检测的过程中，在各部分均出现了一定问题，几个典型问题及解决方案总结如下：

2.1 图像处理方式的选择

本实验最初尝试使用实验一的均值与中值滤波对图像进行预处理，效果不佳。在后续选择与Canny算子相适配的高斯滤波，在Hough变换前加入对比度增强，解决了此问题。故在实际问题中应该根据算法与数据选择相应的图像处理方式。

2.2 参数设置问题

无论是Canny算子的高低阈值，还是Hough变换中的七个参数，在本实验中的选择均对结果有较大影响。故在本实验中需人工调参，经过不断迭代与优化参数确定较优参数，同时需兼顾参数的准确性与泛化能力。

2.3 目标直线的筛选与确定

在Hough变换后检测出多条直线，如何筛选与确定目标直线（路沿）也是一个问题。本实验中首先使用直线的几何特征（斜率）与空间的结构特征（mask掩模）判断，再利用直线位置、斜率聚类、x轴差值等特点确定目标直线，并使用上一帧直线+位置修正或卡尔曼滤波修正过度判断的情况。对于本实验中出现的视频模糊与过弯情况，使用上述方法也可以较好解决。

3.基于Hough变换直线检测的分析与补充

在利用Hough变换及相关判断完成本实验路沿识别后，对实验效果进行分析如下：

3.1 优点

基于Hough变换进行直线检测的优点在于实现方便、代码复杂度低（高效），对于简单数据处理情况较好。

3.2 缺陷

基于Hough变换进行直线检测的缺陷在于参数调整过程麻烦，最优参数确定困难，模型对环境因素依赖性过强，在变化过大等情况下表现不佳，且泛化能力较差，代码迁移性低。

3.3 补充

在传统图像方法上，除了基于Hough变换的直线检测，还有基于LSD直线、基于俯视图变换、基于拟合、基于平行透视灭点的车道线检测等。

在深度学习方法上，由于其在直线检测任务上表现出的高实时性与鲁棒性，多数方法涌现。大致分为如下四类：基于分割的方法、基于检测的方法、基于参数曲线的方法、基于关键点的方法。

八、参考资料

1.传统车道线检测-canny边缘检测-霍夫变换-完整代码（python）_悬悬小的博客-CSDN博客

2.基于Python的复杂环境中车道线自动检测系统 - 知乎 (zhihu.com)

3.2022-车道线检测综述_棒冰柠檬味的博客-CSDN博客_车道线检测的背景和意义

4.车道线检测传统方法&深度学习方法概览+两篇论文领读LaneATT+LaneNet

5.深度学习车道线检测之 LaneNet （使用tensorflow2.4.0跑通）_tiger&sheep的博客

6.超快的车道线检测 - 知乎 (zhihu.com)

总结

本次实验为计算机视觉的第二次实验，通过本次实验，我熟悉了熟悉图像处理基本操作，包括但不限于视频的拆分与合并、图像灰度化。在图像滤波方面，分别使用高斯滤波与卡尔曼滤波；在边缘检测方面，使用Canny算子，并尝试了深度学习方法。并掌握了图像基本特征抽取以及在实际问题中的应用。

本实验耗时近5天，基本每天都不停在查阅相关资料（~~f**k~~），算是本学期最麻烦的实验了。除了实验要求任务，对于理论部分与深度学习部分本人也做了一定探究，收获颇丰。在本次实验中遇到的各种疑难问题，在查阅实验指导、与同学交流、网上与书本查阅资料搭配个人的独立思考后都基本解决，实验结果符合实验设计与实验预期，完成情况较好。

你可能感兴趣的:(计算机视觉,opencv,计算机视觉,python)

理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
python os.environ 江湖偌大 python 深度学习
os.environ['TF_CPP_MIN_LOG_LEVEL']='0'#默认值，输出所有信息os.environ['TF_CPP_MIN_LOG_LEVEL']='1'#屏蔽通知信息（INFO）os.environ['TF_CPP_MIN_LOG_LEVEL']='2'#屏蔽通知信息和警告信息（INFO\WARNING）os.environ['TF_CPP_MIN_LOG_LEVEL']='
Python中os.environ基本介绍及使用方法鹤冲天Pro #Python python 服务器开发语言
文章目录python中os.environos.environ简介os.environ进行环境变量的增删改查python中os.environ的使用详解1.简介2.key字段详解2.1常见key字段3.os.environ.get()用法4.环境变量的增删改查和判断是否存在4.1新增环境变量4.2更新环境变量4.3获取环境变量4.4删除环境变量4.5判断环境变量是否存在python中os.envi
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
python os.environ_python os.environ 读取和设置环境变量 weixin_39605414 python os.environ
>>>importos>>>os.environ.keys()['LC_NUMERIC','GOPATH','GOROOT','GOBIN','LESSOPEN','SSH_CLIENT','LOGNAME','USER','HOME','LC_PAPER','PATH','DISPLAY','LANG','TERM','SHELL','J2REDIR','LC_MONETARY','QT_QPA
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
python是什么意思中文-在python中%是什么意思编程大乐趣
Python中%有两种：1、数值运算：%代表取模，返回除法的余数。如：>>>7%212、%操作符（字符串格式化，stringformatting），说明如下：%[(name)][flags][width].[precision]typecode(name)为命名flags可以有+，-，''或0。+表示右对齐。-表示左对齐。''为一个空格，表示在正数的左侧填充一个空格，从而与负数对齐。0表示使用0填
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
python八股文面试题分享及解析(1) Shawn________ python
#1.'''a=1b=2不用中间变量交换a和b'''#1.a=1b=2a,b=b,aprint(a)print(b)结果：21#2.ll=[]foriinrange(3):ll.append({'num':i})print(11)结果:#[{'num':0},{'num':1},{'num':2}]#3.kk=[]a={'num':0}foriinrange(3):#0,12#可变类型，不仅仅改变
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
Python快速入门 —— 第三节：类与对象孤华暗香 Python快速入门 python 开发语言
第三节：类与对象目标：了解面向对象编程的基础概念，并学会如何定义类和创建对象。内容：类与对象：定义类：class关键字。类的构造函数：__init__()。类的属性和方法。对象的创建与使用。示例：classStudent:def__init__(self,name,age,major):self.name&#
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
Python 实现图片裁剪（附代码） | Python工具剑客阿良_ALiang
前言本文提供将图片按照自定义尺寸进行裁剪的工具方法，一如既往的实用主义。环境依赖ffmpeg环境安装，可以参考我的另一篇文章：windowsffmpeg安装部署_阿良的博客-CSDN博客本文主要使用到的不是ffmpeg，而是ffprobe也在上面这篇文章中的zip包中。ffmpy安装：pipinstallffmpy-ihttps://pypi.douban.com/simple代码不废话了，上代码
【华为OD技术面试真题 - 技术面】- python八股文真题题库（4) 算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选**1.Python中的`with`**用途和功能自动资源管理示例：文件操作上下文管理协议示例代码工作流程解析优点2.\_\_new\_\_和**\_\_init\_\_**区别__new____init__区别总结3.**切片（Slicing）操作**基本切片语法
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
Python爬虫解析工具之xpath使用详解 eqa11 python 爬虫开发语言
文章目录Python爬虫解析工具之xpath使用详解一、引言二、环境准备1、插件安装2、依赖库安装三、xpath语法详解1、路径表达式2、通配符3、谓语4、常用函数四、xpath在Python代码中的使用1、文档树的创建2、使用xpath表达式3、获取元素内容和属性五、总结Python爬虫解析工具之xpath使用详解一、引言在Python爬虫开发中，数据提取是一个至关重要的环节。xpath作为一门
【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归（LinearRegression）模型形式：关键点：逻辑回归（LogisticRegression）模型形式：关键点：参数估计与评估：3.python浅拷贝及深拷贝浅拷贝（Shal
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
《Python数据分析实战终极指南》 xjt921122 python 数据分析开发语言
对于分析师来说，大家在学习Python数据分析的路上，多多少少都遇到过很多大坑**，有关于技能和思维的**：Excel已经没办法处理现有的数据量了，应该学Python吗？找了一大堆Python和Pandas的资料来学习，为什么自己动手就懵了？跟着比赛类公开数据分析案例练了很久，为什么当自己面对数据需求还是只会数据处理而没有分析思路？学了对比、细分、聚类分析，也会用PEST、波特五力这类分析法，为啥
Python中深拷贝与浅拷贝的区别 yuxiaoyu.
转自：http://blog.csdn.net/u014745194/article/details/70271868定义：在Python中对象的赋值其实就是对象的引用。当创建一个对象，把它赋值给另一个变量的时候，python并没有拷贝这个对象，只是拷贝了这个对象的引用而已。浅拷贝：拷贝了最外围的对象本身，内部的元素都只是拷贝了一个引用而已。也就是，把对象复制一遍，但是该对象中引用的其他对象我不复
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python编译器鹿鹿~ Python编译器 Python python 开发语言后端
嘿嘿嘿我又来了啊有些小盆友可能不知道Python其实是有编译器的，也就是PyCharm。你们可能会问到这个是干嘛的又不可以吃也不可以穿好像没有什么用，其实你还说对了这个还真的不可以吃也不可以穿，但是它用来干嘛的呢。用来编译你所打出的代码进行运行（可能这里说的有点不对但是只是个人认为）现在我们来说说PyCharm是用来干嘛的。PyCharm是一种PythonIDE，带有一整套可以帮助用户在使用Pyt
一文掌握python面向对象魔术方法（二）程序员neil python python 开发语言
接上篇：一文掌握python面向对象魔术方法（一）-CSDN博客目录六、迭代和序列化：1、__iter__(self):定义迭代器，使得类可以被for循环迭代。2、__getitem__(self,key):定义索引操作，如obj[key]。3、__setitem__(self,key,value):定义赋值操作，如obj[key]=value。4、__delitem__(self,key):定义
一文掌握python常用的list（列表）操作程序员neil python python 开发语言
目录一、创建列表1.直接创建列表：2.使用list()构造器3.使用列表推导式4.创建空列表二、访问列表元素1.列表支持通过索引访问元素，索引从0开始：2.还可以使用切片操作访问列表的一部分：三、修改列表元素四、添加元素1.append()：在末尾添加元素2.insert()：在指定位置插入元素五、删除元素1.del：删除指定位置的元素2.remove()：删除指定值的第一个匹配项3.pop()：
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
python中的深拷贝与浅拷贝 anshejd70787 python
深拷贝和浅拷贝浅拷贝的时候，修改原来的对象，浅拷贝的对象不会发生改变。1、对象的赋值对象的赋值实际上是对象之间的引用：当创建一个对象，然后将这个对象赋值给另外一个变量的时候，python并没有拷贝这个对象，而只是拷贝了这个对象的引用。当对对象做赋值或者是参数传递或者作为返回值的时候，总是传递原始对象的引用，而不是一个副本。如下所示：>>>aList=["kel","abc",123]>>>bLis
用Python实现简单的猜数字游戏程序媛了了 python 游戏 java
猜数字游戏代码：importrandomdefpythonit():a=random.randint(1,100)n=int(input("输入你猜想的数字："))whilen!=a:ifn>a:print("很遗憾，猜大了")n=int(input("请再次输入你猜想的数字："))elifna::如果玩家猜的数字n大于随机数字a，则输出"很遗憾，猜大了"，并提示玩家再次输入。elifn
对股票分析时要注意哪些主要因素？会飞的奇葩猪股票分析云掌股吧
　　众所周知，对散户投资者来说，股票技术分析是应战股市的核心武器，想学好股票的技术分析一定要知道哪些是重点学习的，其实非常简单，我们只要记住三个要素：成交量、价格趋势、振荡指标。一、成交量　　大盘的成交量状态。成交量大说明市场的获利机会较多，成交量小说明市场的获利机会较少。当沪市的成交量超过150亿时是强市市场状态，运用技术找综合买点较准；
【Scala十八】视图界定与上下文界定 bit1129 scala
Context Bound，上下文界定，是Scala为隐式参数引入的一种语法糖，使得隐式转换的编码更加简洁。隐式参数首先引入一个泛型函数max，用于取a和b的最大值 def max[T](a: T, b: T) = { if (a > b) a else b } 因为T是未知类型，只有运行时才会代入真正的类型，因此调用a >
C语言的分支——Object-C程序设计阅读有感 darkblue086 apple c 框架 cocoa
自从1972年贝尔实验室Dennis Ritchie开发了C语言，C语言已经有了很多版本和实现，从Borland到microsoft还是GNU、Apple都提供了不同时代的多种选择，我们知道C语言是基于Thompson开发的B语言的，Object-C是以SmallTalk-80为基础的。和C++不同的是，Object C并不是C的超集，因为有很多特性与C是不同的。 Object-C程序设计这本书
去除浏览器对表单值的记忆周凡杨 html 记忆 autocomplete form 浏览
&n
java的树形通讯录 g21121 java
最近用到企业通讯录，虽然以前也开发过，但是用的是jsf，拼成的树形，及其笨重和难维护。后来就想到直接生成json格式字符串，页面上也好展现。 // 首先取出每个部门的联系人 for (int i = 0; i < depList.size(); i++) { List<Contacts> list = getContactList(depList.get(i
Nginx安装部署 510888780 nginx linux
Nginx ("engine x") 是一个高性能的 HTTP 和反向代理服务器，也是一个 IMAP/POP3/SMTP 代理服务器。 Nginx 是由 Igor Sysoev 为俄罗斯访问量第二的 Rambler.ru 站点开发的，第一个公开版本0.1.0发布于2004年10月4日。其将源代码以类BSD许可证的形式发布，因它的稳定性、丰富的功能集、示例配置文件和低系统资源
java servelet异步处理请求墙头上一根草ｊａｖａ异步返回ｓｅｒｖｌｅｔ
servlet3.0以后支持异步处理请求，具体是使用AsyncContext ，包装httpservletRequest以及httpservletResponse具有异步的功能， final AsyncContext ac = request.startAsync(request, response); ac.s
我的spring学习笔记8-Spring中Bean的实例化 aijuans Spring 3
在Spring中要实例化一个Bean有几种方法： 1、最常用的（普通方法） <bean id="myBean" class="www.6e6.org.MyBean" /> 使用这样方法，按Spring就会使用Bean的默认构造方法，也就是把没有参数的构造方法来建立Bean实例。（有构造方法的下个文细说） 2、还
为Mysql创建最优的索引 annan211 mysql 索引
索引对于良好的性能非常关键，尤其是当数据规模越来越大的时候，索引的对性能的影响越发重要。索引经常会被误解甚至忽略，而且经常被糟糕的设计。索引优化应该是对查询性能优化最有效的手段了，索引能够轻易将查询性能提高几个数量级，最优的索引会比较好的索引性能要好2个数量级。 1 索引的类型 (1) B-Tree 不出意外，这里提到的索引都是指 B-
日期函数百合不是茶 oracle sql 日期函数查询
ORACLE日期时间函数大全 TO_DATE格式(以时间:2007-11-02 13:45:25为例) Year: yy two digits 两位年显示值:07 yyy three digits 三位年显示值:007
线程优先级 bijian1013 java thread 多线程 java多线程
多线程运行时需要定义线程运行的先后顺序。线程优先级是用数字表示，数字越大线程优先级越高，取值在1到10，默认优先级为5。实例： package com.bijian.study; /** * 因为在代码段当中把线程B的优先级设置高于线程A,所以运行结果先执行线程B的run()方法后再执行线程A的run()方法 * 但在实际中，JAVA的优先级不准，强烈不建议用此方法来控制执
适配器模式和代理模式的区别 bijian1013 java 设计模式
一.简介适配器模式：适配器模式（英语：adapter pattern）有时候也称包装样式或者包装。将一个类的接口转接成用户所期待的。一个适配使得因接口不兼容而不能在一起工作的类工作在一起，做法是将类别自己的接口包裹在一个已存在的类中。 &nbs
【持久化框架MyBatis3三】MyBatis3 SQL映射配置文件 bit1129 Mybatis3
SQL映射配置文件一方面类似于Hibernate的映射配置文件，通过定义实体与关系表的列之间的对应关系。另一方面使用<select>,<insert>,<delete>，<update>元素定义增删改查的SQL语句，这些元素包含三方面内容 1. 要执行的SQL语句 2. SQL语句的入参，比如查询条件 3. SQL语句的返回结果
oracle大数据表复制备份个人经验 bitcarter oracle 大表备份大表数据复制
前提：数据库仓库A（就拿oracle11g为例）中有两个用户user1和user2,现在有user1中有表ldm_table1,且表ldm_table1有数据5千万以上，ldm_table1中的数据是从其他库B（数据源）中抽取过来的，前期业务理解不够或者需求有变，数据有变动需要重新从B中抽取数据到A库表ldm_table1中。
HTTP加速器varnish安装小记 ronin47 http varnish 加速
上午共享的那个varnish安装手册，个人看了下，有点不知所云，好吧~看来还是先安装玩玩！苦逼公司服务器没法连外网，不能用什么wget或yum命令直接下载安装，每每看到别人博客贴出的在线安装代码时，总有一股羡慕嫉妒“恨”冒了出来。。。好吧，既然没法上外网，那只能麻烦点通过下载源码来编译安装了！ Varnish 3.0.4下载地址： http://repo.varnish-cache.org/
java-73-输入一个字符串，输出该字符串中对称的子字符串的最大长度 bylijinnan java
public class LongestSymmtricalLength { /* * Q75题目：输入一个字符串，输出该字符串中对称的子字符串的最大长度。 * 比如输入字符串“google”，由于该字符串里最长的对称子字符串是“goog”，因此输出4。 */ public static void main(String[] args) { Str
学习编程的一点感想 Cb123456 编程感想 Gis
写点感想，总结一些，也顺便激励一些自己.现在就是复习阶段，也做做项目. 本专业是GIS专业，当初觉得本专业太水，靠这个会活不下去的，所以就报了培训班。学习的时候，进入状态很慢，而且当初进去的时候，已经上到Java高级阶段了，所以.....，呵呵，之后有点感觉了，不过，还是不好好写代码，还眼高手低的，有
[能源与安全]美国与中国 comsci 能源
现在有一个局面：地球上的石油只剩下N桶，这些油只够让中国和美国这两个国家中的一个顺利过渡到宇宙时代，但是如果这两个国家为争夺这些石油而发生战争，其结果是两个国家都无法平稳过渡到宇宙时代。。。。而且在战争中，剩下的石油也会被快速消耗在战争中，结果是两败俱伤。。。在这个大
SEMI-JOIN执行计划突然变成HASH JOIN了的原因分析 cwqcwqmax9 oracle
甲说： A B两个表总数据量都很大，在百万以上。 idx1 idx2字段表示是索引字段 A B 两表上都有 col1字段表示普通字段 select xxx from A where A.idx1 between mmm and nnn and exists (select 1 from B where B.idx2 =
SpringMVC-ajax返回值乱码解决方案 dashuaifu Ajax springMVC response 中文乱码
SpringMVC-ajax返回值乱码解决方案一：（自己总结，测试过可行） ajax返回如果含有中文汉字，则使用：（如下例：） @RequestMapping(value="/xxx.do") public @ResponseBody void getPunishReasonB
Linux系统中查看日志的常用命令 dcj3sjt126com OS
因为在日常的工作中，出问题的时候查看日志是每个管理员的习惯，作为初学者，为了以后的需要，我今天将下面这些查看命令共享给各位 cat tail -f 日志文件说明 /var/log/message 系统启动后的信息和错误日志，是Red Hat Linux中最常用的日志之一 /var/log/secure 与安全相关的日志信息 /var/log/maillog 与邮件相关的日志信
[应用结构]应用 dcj3sjt126com PHP yii2
应用主体应用主体是管理 Yii 应用系统整体结构和生命周期的对象。每个Yii应用系统只能包含一个应用主体，应用主体在入口脚本中创建并能通过表达式 \Yii::$app 全局范围内访问。补充: 当我们说"一个应用"，它可能是一个应用主体对象，也可能是一个应用系统，是根据上下文来决定[译：中文为避免歧义，Application翻译为应
assertThat用法 eksliang JUnit assertThat
junit4.0 assertThat用法一般匹配符1、assertThat( testedNumber, allOf( greaterThan(8), lessThan(16) ) ); 注释： allOf匹配符表明如果接下来的所有条件必须都成立测试才通过，相当于“与”（&&） 2、assertThat( testedNumber, anyOf( g
android点滴2 gundumw100 应用服务器 android 网络应用 OS HTC
如何让Drawable绕着中心旋转？ Animation a = new RotateAnimation(0.0f, 360.0f, Animation.RELATIVE_TO_SELF, 0.5f, Animation.RELATIVE_TO_SELF,0.5f); a.setRepeatCount(-1); a.setDuration(1000); 如何控制Andro
超简洁的CSS下拉菜单 ini html Web 工作 html5 css
效果体验：http://hovertree.com/texiao/css/3.htmHTML文件： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>简洁的HTML+CSS下拉菜单-HoverTree</title>
kafka consumer防止数据丢失 kane_xie kafka offset commit
kafka最初是被LinkedIn设计用来处理log的分布式消息系统，因此它的着眼点不在数据的安全性（log偶尔丢几条无所谓），换句话说kafka并不能完全保证数据不丢失。尽管kafka官网声称能够保证at-least-once，但如果consumer进程数小于partition_num，这个结论不一定成立。考虑这样一个case，partiton_num=2
@Repository、@Service、@Controller 和 @Component mhtbbx DAO spring bean prototype
@Repository、@Service、@Controller 和 @Component 将类标识为Bean Spring 自 2.0 版本开始，陆续引入了一些注解用于简化 Spring 的开发。@Repository注解便属于最先引入的一批，它用于将数据访问层 (DAO 层 ) 的类标识为 Spring Bean。具体只需将该注解标注在 DAO类上即可。同时，为了让 Spring 能够扫描类
java 多线程高并发读写控制误区 qifeifei java thread
先看一下下面的错误代码，对写加了synchronized控制，保证了写的安全，但是问题在哪里呢？ public class testTh7 { private String data; public String read(){ System.out.println(Thread.currentThread().getName() + "read data "
mongodb replica set(副本集)设置步骤 tcrct java mongodb
网上已经有一大堆的设置步骤的了，根据我遇到的问题，整理一下，如下：首先先去下载一个mongodb最新版，目前最新版应该是2.6 cd /usr/local/bin wget http://fastdl.mongodb.org/linux/mongodb-linux-x86_64-2.6.0.tgz tar -zxvf mongodb-linux-x86_64-2.6.0.t
rust学习笔记 wudixiaotie 学习笔记
1.rust里绑定变量是let，默认绑定了的变量是不可更改的，所以如果想让变量可变就要加上mut。 let x = 1; let mut y = 2; 2.match 相当于erlang中的case，但是case的每一项后都是分号，但是rust的match却是逗号。 3.match 的每一项最后都要加逗号，但是最后一项不加也不会报错，所有结尾加逗号的用法都是类似。 4.每个语句结尾都要加分