暮里残阳

高级车道线检测（Apollo微信公众号）

车道线检测是无人车系统里感知模块的重要组成部分。利用视觉算法的车道线检测解决方案是一种较为常见解决方案。视觉检测方案主要基于图像算法,检测出图片中行车道路的车道线标志区域。

基于图像处理相关技术的高级车道线检测（可适用于弯道，车道线颜色不固定，路面阴影，亮光）。其操作步骤有以下几点：

校准摄像头的畸变，使拍摄照片能够较完整的反映3D世界的情况。

对每一帧图片做透视转换(perspective transform)，将摄像头的照片转换到鸟瞰图视角。

对鸟瞰图二值化，通过二值的像素点进一步区分左右两条车道线，从而拟合出车道线曲线。

用滑窗的方法检测第一帧的车道线像素点，然后拟合车道线曲线。

从第一帧的曲线周围寻找接下来的车道线像素点，然后拟合车道线曲线。

有了车道线曲线方程之后，可以计算斜率和车道线偏离中心的位置。

输入

一个连续的视频，视频中的左车道线为黄色实线，右车道线为白色虚线。无人车会经过路面颜色突变、路边树木影子干扰、车道线不清晰和急转弯的路况。（视频大小7.25M）

视频出处：https://github.com/udacity/CarND-Advanced-Lane-Lines/blob/master/project_video.mp4

输出

左、右车道线的三次曲线方程，及其有效距离。最后将车道线围成的区域显示在图像上，如下图所示。

摄像机标定

相信大家都多少听说过鱼眼相机，最常见的鱼眼相机是辅助驾驶员倒车的后向摄像头。也有很多摄影爱好者会使用鱼眼相机拍摄图像，最终会有高大上的大片效果，如下图所示。

使用鱼眼相机拍摄的图像虽然高大上，但存在一个很大的问题——畸变（Distortion）。如上图所示，走道上的栏杆应该是笔直延伸出去的。然而，栏杆在图像上的成像却是弯曲的，这就是图像畸变，畸变会导致图像失真。

使用车载摄像机拍摄出的图像，虽然没有鱼眼相机的畸变这么夸张，但是畸变是客观存在的，只是人眼难以察觉。使用有畸变的图像做车道线的检测，检测结果的精度将会受到影响，因此进行图像处理的第一步工作就是去畸变。

为了解决车载摄像机图像的畸变问题，摄像机标定技术应运而生。

摄像机标定是通过对已知的形状进行拍照，通过计算该形状在真实世界中位置与在图像中位置的偏差量（畸变系数），进而用这个偏差量去修正其他畸变图像的技术。

原则上，可以选用任何的已知形状去校准摄像机，不过业内的标定方法都是基于棋盘格的。因为它具备规则的、高对比度图案，能非常方便地自动化检测各个棋盘格的交点，十分适合标定摄像机的标定工作。如下图所示为标准的10x7（7行10列）的棋盘格。

OpenCV库为摄像机标定提供了函数cv2.findChessboardCorners()，它能自动地检测棋盘格内4个棋盘格的交点（2白2黑的交接点）。我们只需要输入摄像机拍摄的完整棋盘格图像和交点在横纵向上的数量即可。随后我们可以使用函数cv2.drawChessboardCorners()绘制出检测的结果。

原图：

角点检测图：

获取交点的检测结果后，使用函数cv2.calibrateCamera()即可得到相机的畸变系数。

为了使摄像机标定得到的畸变系数更加准确，我们使用车载摄像机从不同的角度拍摄20张棋盘格，将所有的交点检测结果保存，再进行畸变系数的的计算。

我们将读入图片、预处理图片、检测交点、标定相机的一系列操作，封装成一个函数，如下所示：

 1#################################################################
 2# Step 1 : Calculate camera distortion coefficients
 3#################################################################
 4def getCameraCalibrationCoefficients(chessboardname, nx, ny):
 5    # prepare object points, like (0,0,0), (1,0,0), (2,0,0) ....,(6,5,0)
 6    objp = np.zeros((ny * nx, 3), np.float32)
 7    objp[:,:2] = np.mgrid[0:nx, 0:ny].T.reshape(-1,2)
 8
 9    # Arrays to store object points and image points from all the images.
10    objpoints = [] # 3d points in real world space
11    imgpoints = [] # 2d points in image plane.
12
13    images = glob.glob(chessboardname)
14    if len(images) > 0:
15        print("images num for calibration : ", len(images))
16    else:
17        print("No image for calibration.")
18        return
19
20    ret_count = 0
21    for idx, fname in enumerate(images):
22        img = cv2.imread(fname)
23        gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
24        img_size = (img.shape[1], img.shape[0])
25        # Finde the chessboard corners
26        ret, corners = cv2.findChessboardCorners(gray, (nx, ny), None)
27
28        # If found, add object points, image points
29        if ret == True:
30            ret_count += 1
31            objpoints.append(objp)
32            imgpoints.append(corners)
33
34    ret, mtx, dist, rvecs, tvecs = cv2.calibrateCamera(objpoints, imgpoints, img_size, None, None)
35    print('Do calibration successfully')
36    return ret, mtx, dist, rvecs, tvecs

调用之前封装好的函数，获取畸变参数

nx = 9 
2ny = 6
3ret, mtx, dist, rvecs, tvecs = getCameraCalibrationCoefficients('camera_cal/calibration*.jpg', nx, ny)

以畸变的棋盘格图像为例，进行畸变修正处理

1# Read distorted chessboard image
2test_distort_image = cv2.imread('./camera_cal/calibration4.jpg')
3
4# Do undistortion
5test_undistort_image = undistortImage(test_distort_image, mtx, dist)

畸变图像如下图所示：

复原后的图像如下图所示：

1test_distort_image = cv2.imread('test_images/straight_lines1.jpg')
2
3# Do undistortion
4test_undistort_image = undistortImage(test_distort_image, mtx, dist)

原始畸变图像如下所示：

畸变修正后的图像如下所示：

可以看到离镜头更近的左侧、右侧和下侧的图像比远处的畸变修正更明显

筛选图像

从我们作为输入的视频可以看出，车辆会经历颠簸、车道线不清晰、路面颜色突变，路边障碍物阴影干扰等复杂工况。因此，需要将这些复杂的场景筛选出来，确保后续的算法能够在这些复杂场景中正确地检测出车道线。

使用以下代码将视频中的图像数据提取，进行畸变修正处理后，存储在名为original_image的文件夹中，以供挑选。

 1video_input = 'project_video.mp4'
 2cap = cv2.VideoCapture(video_input)
 3count = 1
 4while(True):
 5    ret, image = cap.read()
 6    if ret:
 7        undistort_image = undistortImage(image, mtx, dist)
 8        cv2.imwrite('original_image/' + str(count) + '.jpg', undistort_image)
 9        count += 1
10    else:
11        break
12cap.release()

在original_image文件夹中，挑选出以下6个场景进行检测。这6个场景既包含了视频中常见的正常直道、正常弯道工况，也包含了具有挑战性的阴影、明暗剧烈变化的工况。如下图所示：

如果后续的高级车道线检测算法能够完美处理以上六种工况，那将算法应用到视频中，也会得到完美的车道线检测效果。

透视变换

在完成图像的畸变修正后，就要将注意力转移到车道线。与《无人驾驶技术入门（十四）| 初识图像之初级车道线检测》中技术类似，这里需要定义一个感兴趣区域。很显然，我们的感兴趣区域就是车辆正前方的这个车道。为了获取感兴趣区域，我们需要对自车正前方的道路使用一种叫做透视变换的技术。

“透视”是图像成像时，物体距离摄像机越远，看起来越小的一种现象。在真实世界中，左右互相平行的车道线，会在图像的最远处交汇成一个点。这个现象就是“透视成像”的原理造成的。

以立在路边的交通标志牌为例，它在摄像机所拍摄的图像中的成像结果一般如下下图所示：

在这幅图像上，原本应该是正八边形的标志牌，成像成为一个不规则的八边形。

通过使用透视变换技术，可以将不规则的八边形投影成规则的正八边形。应用透视变换后的结果对比如下图：

透视变换的原理：首先新建一幅跟左图同样大小的右图，随后在做图中选择标志牌位于两侧的四个点（如图中的红点），记录这4个点的坐标，我们称这4个点为src_points。图中的4个点组成的是一个平行四边形。

由先验知识可知，左图中4个点所围成的平行四边形，在现实世界中是一个长方形，因此在右边的图中，选择一个合适的位置，选择一个长方形区域，这个长方形的4个端点一一对应着原图中的src_points，我们称新的这4个点为dst_points。

得到src_points，dst_points后，我们就可以使用OpenCV中计算投影矩阵的函数cv2.getPerspective Transform(src_points,dst_points)算出src_points到dst_points的投影矩阵和投影变换后的图像了。

使用OpenCV库实现透视变换的代码如下：

 1#################################################################
 2# Step 3 : Warp image based on src_points and dst_points
 3#################################################################
 4# The type of src_points & dst_points should be like
 5# np.float32([ [0,0], [100,200], [200, 300], [300,400]])
 6def warpImage(image, src_points, dst_points):
 7    image_size = (image.shape[1], image.shape[0])
 8    # rows = img.shape[0] 720
 9    # cols = img.shape[1] 1280
10    M = cv2.getPerspectiveTransform(src, dst)
11    Minv = cv2.getPerspectiveTransform(dst, src)
12    warped_image = cv2.warpPerspective(image, M,image_size, flags=cv2.INTER_LINEAR)
13
14    return warped_image, M, Minv

同理，对于畸变修正过的道路图像，我们同样使用相同的方法，将我们感兴趣的区域做透视变换。

如下图所示，我们选用一张在直线道路上行驶的图像，沿着左右车道线的边缘，选择一个梯形区域，这个区域在真实的道路中应该是一个长方形，因此我们选择将这个梯形区域投影成为一个长方形，在右图横坐标的合适位置设置长方形的4个端点。最终的投影结果就像“鸟瞰图”一样。

使用以下代码，通过不断调整src和dst的值，确保在直线道路上，能够调试出满意的透视变换图像。

 1test_distort_image = cv2.imread('test_images/test4.jpg')
 2
 3# 畸变修正
 4test_undistort_image = undistortImage(test_distort_image, mtx, dist)
 5
 6# 左图梯形区域的四个端点
 7src = np.float32([[580, 460], [700, 460], [1096, 720], [200, 720]])
 8# 右图矩形区域的四个端点
 9dst = np.float32([[300, 0], [950, 0], [950, 720], [300, 720])
10
11test_warp_image, M, Minv = warpImage(test_undistort_image, src, dst)

最终，我们把筛选出的6幅图统一应用调整好的src、dst做透视变换，结果如下：

可以看到，越靠图片下方的图像越清晰，越上方的图像越模糊。这是因为越远的地方，左图中的像素点越少。而无论是远处还是近处，需要在右图中填充的像素点数量是一样的。左图近处有足够多的点去填充右图，而左图远处的点有限，只能通过插值的方式创造“假的”像素点进行填充，所以就不那么清晰了。

提取车道线

在《无人驾驶技术入门（十四）| 初识图像之初级车道线检测》中，我们介绍了通过Canny边缘提取算法获取车道线待选点的方法，随后使用霍夫直线变换进行了车道线的检测。在这里，我们也尝试使用边缘提取的方法进行车道线提取。

需要注意的是，Canny边缘提取算法会将图像中各个方向、明暗交替位置的边缘都提取出来，很明显，Canny边缘提取算法在处理有树木阴影的道路时，会将树木影子的轮廓也提取出来，这是我们不愿意看到的。

因此我们选用Sobel边缘提取算法。Sobel相比于Canny的优秀之处在于，它可以选择横向或纵向的边缘进行提取。从投影变换后的图像可以看出，我们关心的正是车道线在横向上的边缘突变。

封装一下OpenCV提供的cv2.Sobel()函数，将进行边缘提取后的图像做二进制图的转化，即提取到边缘的像素点显示为白色（值为1），未提取到边缘的像素点显示为黑色（值为0）。

1def absSobelThreshold(img, orient='x', thresh_min=30, thresh_max=100):
 2    # Convert to grayscale
 3    gray = cv2.cvtColor(img, cv2.COLOR_RGB2GRAY)
 4    # Apply x or y gradient with the OpenCV Sobel() function
 5    # and take the absolute value
 6    if orient == 'x':
 7        abs_sobel = np.absolute(cv2.Sobel(gray, cv2.CV_64F, 1, 0))
 8    if orient == 'y':
 9        abs_sobel = np.absolute(cv2.Sobel(gray, cv2.CV_64F, 0, 1))
10    # Rescale back to 8 bit integer
11    scaled_sobel = np.uint8(255*abs_sobel/np.max(abs_sobel))
12    # Create a copy and apply the threshold
13    binary_output = np.zeros_like(scaled_sobel)
14    # Here I'm using inclusive (>=, <=) thresholds, but exclusive is ok too
15    binary_output[(scaled_sobel >= thresh_min) & (scaled_sobel <= thresh_max)] = 1
16
17    # Return the result
18    return binary_output

使用同一组阈值对以上6幅做过投影变换的图像进行x方向的边缘提取，可以得到如下结果：

由以上结果可以看出，在明暗交替明显的路面上，如图1和图2，横向的Sobel边缘提取算法在提取车道线的表现上还不错。不过一旦道路的明暗交替不那么明显了，如图3和图4的白色路面区域，很难提取到有效的车道线待选点。当面对有树木阴影覆盖的区域时，如图5和图6，虽然能提取出车道线的大致轮廓，但会同时引入的噪声，给后续处理带来麻烦。

因此，横向的Sobel边缘提取算法，无法很好地处理路面阴影、明暗交替的道路工况。

无法使用边缘提取的方法提取车道线后，我们开始将颜色空间作为突破口。

在以上6个场景中，虽然路面明暗交替，而且偶尔会有阴影覆盖，但黄色和白色的车道线是一直都存在的。因此，我们如果能将图中的黄色和白色分割出来，然后将两种颜色组合在一幅图上，就能够得到一个比较好的处理结果。

一幅图像除了用RGB（红绿蓝）三个颜色通道表示以外，还可以使用HSL（H色相、S饱和度、L亮度）和LAB（L亮度、A红绿通道、B蓝黄）模型来描述图像，三通道的值与实际的成像颜色如下图所示。

我们可以根据HSL模型中的L（亮度）通道来分割出图像中的白色车道线，同时可以根据LAB模型中的B（蓝黄）通道来分割出图像中的黄色车道线，再将两次的分割结果，去合集，叠加到一幅图上，就能得到两条完整的车道线了。

使用OpenCV提供的cv2.cntColor()接口，将RGB通道的图，转为HLS通道的图，随后对L通道进行分割处理，提取图像中白色的车道线。封装成代码如下：

1    def hlsLSelect(img, thresh=(220, 255)):
2    hls = cv2.cvtColor(img, cv2.COLOR_BGR2HLS)
3    l_channel = hls[:,:,1]
4    l_channel = l_channel*(255/np.max(l_channel))
5    binary_output = np.zeros_like(l_channel)
6    binary_output[(l_channel > thresh[0]) & (l_channel <= thresh[1])] = 1
7    return binary_output

使用同一组阈值对以上6种工况进行处理，处理结果如下图所示。

使用OpenCV提供的cv2.cvtColor()接口，将RGB通道的图，转为LAB通道的图，随后对B通道进行分割处理，提取图像中黄色的车道线。封装成代码如下：

 1def labBSelect(img, thresh=(195, 255)):
 2    # 1) Convert to LAB color space
 3    lab = cv2.cvtColor(img, cv2.COLOR_BGR2Lab)
 4    lab_b = lab[:,:,2]
 5    # don't normalize if there are no yellows in the image
 6    if np.max(lab_b) > 100:
 7        lab_b = lab_b*(255/np.max(lab_b))
 8    # 2) Apply a threshold to the L channel
 9    binary_output = np.zeros_like(lab_b)
10    binary_output[((lab_b > thresh[0]) & (lab_b <= thresh[1]))] = 1
11    # 3) Return a binary image of threshold result
12    return binary_output

使用同一组阈值对以上6种工况进行处理，处理结果如下图所示。

根据以上试验可知，L通道能够较好地分割出图像中的白色车道线，B通道能够较好地分割出图像中的黄色车道线。即使面对树木阴影和路面颜色突变的场景，也能尽可能少地引入噪声。

最后，我们使用以下代码，将两个通道分割的图像合并

1hlsL_binary = hlsLSelect(test_warp_image)
2labB_binary = labBSelect(test_warp_image)
3combined_binary = np.zeros_like(hlsL_binary)
4combined_binary[(hlsL_binary == 1) | (labB_binary == 1)] = 1

最终合并的效果如下图所示：

以上仅仅是车道线提取的方法之一。除了可以通过HSL和LAB颜色通道，这种基于规则的方法，分割出车道线外，还可以使用基于深度学习的方法。它们目的都是为了能够稳定地将车道线从图像中分割出来。

检测车道线

在检测车道线前，需要粗定位车道线的位置。为了方便理解，这里引入一个概念——直方图。

以下面这幅包含噪点的图像为例，进行直方图的介绍。

我们知道，我们处理的图像的分辨率为1280*720，即720行，1280列。如果我将每一列的白色的点数量进行统计，即可得到1280个值。将这1280个值绘制在一个坐标系中，横坐标为1-1280，纵坐标表示每列中白色点的数量，那么这幅图就是“直方图”，如下图所示：

将两幅图叠加，效果如下：

找到直方图左半边最大值所对应的列数，即为左车道线所在的大致位置；找到直方图右半边最大值所对应的列数，即为右车道线所在的大致位置。

使用直方图找左右车道线大致位置的代码如下，其中rightx_base和leftx_base即为左右车道线所在列的大致位置。

1# Take a histogram of the bottom half of the image
2histogram = np.sum(combined_binary[combined_binary.shape[0]//2:,:], axis=0)
3# Create an output image to draw on and visualize the result
4out_img = np.dstack((combined_binary, combined_binary, combined_binary))
5# Find the peak of the left and right halves of the histogram
6# These will be the starting point for the left and right lines
7midpoint = np.int(histogram.shape[0]//2)
8leftx_base = np.argmax(histogram[:midpoint])
9rightx_base = np.argmax(histogram[midpoint:]) + midpoint

确定了左右车道线的大致位置后，使用一种叫做“滑动窗口”的技术，在图中对左右车道线的点进行搜索。先看一个介绍"滑动窗口"原理的视频（视频大小1.18M）。

滑动窗口原理

首先根据前面介绍的直方图方法，找到左右车道线的大致位置，将这两个大致位置作为起始点。定义一个矩形区域，称之为“窗口”（图中棕色的部分），分别以两个起始点作为窗口的下边线中点，存储所有在方块中的白色点的横坐标。

随后对存储的横坐标取均值，将该均值所在的列以及第一个”窗口“的上边缘所在的位置，作为下一个“窗口”的下边线中点，继续搜索。

以此往复，直到把所有的行都搜索完毕

所有落在窗口（图中棕色区域）中的白点，即为左右车道线的待选点，如下图蓝色和红色所示。随后将蓝色点和红色点做三次曲线拟合，即可得到车道线的曲线方程。

使用直方图、滑动窗口检测车道线的代码如下：

  1#################################################################
  2# Step 5 : Detect lane lines through moving window
  3#################################################################
  4def find_lane_pixels(binary_warped, nwindows, margin, minpix):
  5    # Take a histogram of the bottom half of the image
  6    histogram = np.sum(binary_warped[binary_warped.shape[0]//2:,:], axis=0)
  7    # Create an output image to draw on and visualize the result
  8    out_img = np.dstack((binary_warped, binary_warped, binary_warped))
  9    # Find the peak of the left and right halves of the histogram
 10    # These will be the starting point for the left and right lines
 11    midpoint = np.int(histogram.shape[0]//2)
 12    leftx_base = np.argmax(histogram[:midpoint])
 13    rightx_base = np.argmax(histogram[midpoint:]) + midpoint
 14
 15    # Set height of windows - based on nwindows above and image shape
 16    window_height = np.int(binary_warped.shape[0]//nwindows)
 17    # Identify the x and y positions of all nonzero pixels in the image
 18    nonzero = binary_warped.nonzero()
 19    nonzeroy = np.array(nonzero[0])
 20    nonzerox = np.array(nonzero[1])
 21    # Current positions to be updated later for each window in nwindows
 22    leftx_current = leftx_base
 23    rightx_current = rightx_base
 24
 25    # Create empty lists to receive left and right lane pixel indices
 26    left_lane_inds = []
 27    right_lane_inds = []
 28
 29    # Step through the windows one by one
 30    for window in range(nwindows):
 31        # Identify window boundaries in x and y (and right and left)
 32        win_y_low = binary_warped.shape[0] - (window+1)*window_height
 33        win_y_high = binary_warped.shape[0] - window*window_height
 34        win_xleft_low = leftx_current - margin
 35        win_xleft_high = leftx_current + margin
 36        win_xright_low = rightx_current - margin
 37        win_xright_high = rightx_current + margin
 38
 39        # Draw the windows on the visualization image
 40        cv2.rectangle(out_img,(win_xleft_low,win_y_low),
 41        (win_xleft_high,win_y_high),(0,255,0), 2) 
 42        cv2.rectangle(out_img,(win_xright_low,win_y_low),
 43        (win_xright_high,win_y_high),(0,255,0), 2) 
 44
 45        # Identify the nonzero pixels in x and y within the window #
 46        good_left_inds = ((nonzeroy >= win_y_low) & (nonzeroy < win_y_high) & 
 47        (nonzerox >= win_xleft_low) &  (nonzerox < win_xleft_high)).nonzero()[0]
 48        good_right_inds = ((nonzeroy >= win_y_low) & (nonzeroy < win_y_high) & 
 49        (nonzerox >= win_xright_low) &  (nonzerox < win_xright_high)).nonzero()[0]
 50
 51        # Append these indices to the lists
 52        left_lane_inds.append(good_left_inds)
 53        right_lane_inds.append(good_right_inds)
 54
 55        # If you found > minpix pixels, recenter next window on their mean position
 56        if len(good_left_inds) > minpix:
 57            leftx_current = np.int(np.mean(nonzerox[good_left_inds]))
 58        if len(good_right_inds) > minpix:        
 59            rightx_current = np.int(np.mean(nonzerox[good_right_inds]))
 60
 61    # Concatenate the arrays of indices (previously was a list of lists of pixels)
 62    try:
 63        left_lane_inds = np.concatenate(left_lane_inds)
 64        right_lane_inds = np.concatenate(right_lane_inds)
 65    except ValueError:
 66        # Avoids an error if the above is not implemented fully
 67        pass
 68
 69    # Extract left and right line pixel positions
 70    leftx = nonzerox[left_lane_inds]
 71    lefty = nonzeroy[left_lane_inds] 
 72    rightx = nonzerox[right_lane_inds]
 73    righty = nonzeroy[right_lane_inds]
 74
 75    return leftx, lefty, rightx, righty, out_img
 76
 77def fit_polynomial(binary_warped, nwindows=9, margin=100, minpix=50):
 78    # Find our lane pixels first
 79    leftx, lefty, rightx, righty, out_img = find_lane_pixels(
 80        binary_warped, nwindows, margin, minpix)
 81
 82    # Fit a second order polynomial to each using `np.polyfit`
 83    left_fit = np.polyfit(lefty, leftx, 2)
 84    right_fit = np.polyfit(righty, rightx, 2)
 85
 86    # Generate x and y values for plotting
 87    ploty = np.linspace(0, binary_warped.shape[0]-1, binary_warped.shape[0] )
 88    try:
 89        left_fitx = left_fit[0]*ploty**2 + left_fit[1]*ploty + left_fit[2]
 90        right_fitx = right_fit[0]*ploty**2 + right_fit[1]*ploty + right_fit[2]
 91    except TypeError:
 92        # Avoids an error if `left` and `right_fit` are still none or incorrect
 93        print('The function failed to fit a line!')
 94        left_fitx = 1*ploty**2 + 1*ploty
 95        right_fitx = 1*ploty**2 + 1*ploty
 96
 97    ## Visualization ##
 98    # Colors in the left and right lane regions
 99    out_img[lefty, leftx] = [255, 0, 0]
100    out_img[righty, rightx] = [0, 0, 255]
101
102    # Plots the left and right polynomials on the lane lines
103    #plt.plot(left_fitx, ploty, color='yellow')
104    #plt.plot(right_fitx, ploty, color='yellow')
105
106    return out_img, left_fit, right_fit, ploty

对以上6种工况进行车道线检测，处理结果如下图所示。

跟踪车道线

视频数据是连续的图片，基于连续两帧图像中的车道线不会突变的先验知识，我们可以使用上一帧检测到的车道线结果，作为下一帧图像处理的输入，搜索上一帧车道线检测结果附近的点，这样不仅可以减少计算量，而且得到的车道线结果也更稳定，如下图所示。

图中的细黄线为上一帧检测到的车道线结果，绿色阴影区域为细黄线横向扩展的一个区域，通过搜索该区域内的白点坐标，即可快速确定当前帧中左右车道线的待选点。

使用上一帧的车道线检测结果进行车道线跟踪的代码如下：

 1#################################################################
 2# Step 6 : Track lane lines based the latest lane line result
 3#################################################################
 4def fit_poly(img_shape, leftx, lefty, rightx, righty):
 5     ### TO-DO: Fit a second order polynomial to each with np.polyfit() ###
 6    left_fit = np.polyfit(lefty, leftx, 2)
 7    right_fit = np.polyfit(righty, rightx, 2)
 8    # Generate x and y values for plotting
 9    ploty = np.linspace(0, img_shape[0]-1, img_shape[0])
10    ### TO-DO: Calc both polynomials using ploty, left_fit and right_fit ###
11    left_fitx = left_fit[0]*ploty**2 + left_fit[1]*ploty + left_fit[2]
12    right_fitx = right_fit[0]*ploty**2 + right_fit[1]*ploty + right_fit[2]
13
14    return left_fitx, right_fitx, ploty, left_fit, right_fit
15
16def search_around_poly(binary_warped, left_fit, right_fit):
17    # HYPERPARAMETER
18    # Choose the width of the margin around the previous polynomial to search
19    # The quiz grader expects 100 here, but feel free to tune on your own!
20    margin = 60
21
22    # Grab activated pixels
23    nonzero = binary_warped.nonzero()
24    nonzeroy = np.array(nonzero[0])
25    nonzerox = np.array(nonzero[1])
26
27    ### TO-DO: Set the area of search based on activated x-values ###
28    ### within the +/- margin of our polynomial function ###
29    ### Hint: consider the window areas for the similarly named variables ###
30    ### in the previous quiz, but change the windows to our new search area ###
31    left_lane_inds = ((nonzerox > (left_fit[0]*(nonzeroy**2) + left_fit[1]*nonzeroy + 
32                    left_fit[2] - margin)) & (nonzerox < (left_fit[0]*(nonzeroy**2) + 
33                    left_fit[1]*nonzeroy + left_fit[2] + margin)))
34    right_lane_inds = ((nonzerox > (right_fit[0]*(nonzeroy**2) + right_fit[1]*nonzeroy + 
35                    right_fit[2] - margin)) & (nonzerox < (right_fit[0]*(nonzeroy**2) + 
36                    right_fit[1]*nonzeroy + right_fit[2] + margin)))
37
38    # Again, extract left and right line pixel positions
39    leftx = nonzerox[left_lane_inds]
40    lefty = nonzeroy[left_lane_inds] 
41    rightx = nonzerox[right_lane_inds]
42    righty = nonzeroy[right_lane_inds]
43
44    # Fit new polynomials
45    left_fitx, right_fitx, ploty, left_fit, right_fit = fit_poly(binary_warped.shape, leftx, lefty, rightx, righty)
46
47    ## Visualization ##
48    # Create an image to draw on and an image to show the selection window
49    out_img = np.dstack((binary_warped, binary_warped, binary_warped))*255
50    window_img = np.zeros_like(out_img)
51    # Color in left and right line pixels
52    out_img[nonzeroy[left_lane_inds], nonzerox[left_lane_inds]] = [255, 0, 0]
53    out_img[nonzeroy[right_lane_inds], nonzerox[right_lane_inds]] = [0, 0, 255]
54
55    # Generate a polygon to illustrate the search window area
56    # And recast the x and y points into usable format for cv2.fillPoly()
57    left_line_window1 = np.array([np.transpose(np.vstack([left_fitx-margin, ploty]))])
58    left_line_window2 = np.array([np.flipud(np.transpose(np.vstack([left_fitx+margin, 
59                              ploty])))])
60    left_line_pts = np.hstack((left_line_window1, left_line_window2))
61    right_line_window1 = np.array([np.transpose(np.vstack([right_fitx-margin, ploty]))])
62    right_line_window2 = np.array([np.flipud(np.transpose(np.vstack([right_fitx+margin, 
63                              ploty])))])
64    right_line_pts = np.hstack((right_line_window1, right_line_window2))
65
66    # Draw the lane onto the warped blank image
67    cv2.fillPoly(window_img, np.int_([left_line_pts]), (0,255, 0))
68    cv2.fillPoly(window_img, np.int_([right_line_pts]), (0,255, 0))
69    result = cv2.addWeighted(out_img, 1, window_img, 0.3, 0)
70
71    # Plot the polynomial lines onto the image
72    #plt.plot(left_fitx, ploty, color='yellow')
73    #plt.plot(right_fitx, ploty, color='yellow')
74    ## End visualization steps ##
75
76    return result, left_fit, right_fit, ploty

对以上6种工况进行车道线跟踪，处理结果如下图所示。

以上，我们就完成了在透视变换结果上的车道线检测和跟踪。

逆投影到原图

我们在计算透视变换矩阵时计算了两个矩阵M和Minv，使用M能够实现透视变换，使用Minv能够实现逆透视变换。

1M = cv2.getPerspectiveTransform(src, dst)
2Minv = cv2.getPerspectiveTransform(dst, src)

我们将两条车道线所围成的区域涂成绿色，并将结果绘制在“鸟瞰图”上后，使用逆透视变换矩阵反投到原图上，即可实现在原图上的可视化效果。代码如下：

 1#################################################################
 2# Step 8 : Draw lane line result on undistorted image
 3#################################################################
 4def drawing(undist, bin_warped, color_warp, left_fitx, right_fitx):
 5    # Create an image to draw the lines on
 6    warp_zero = np.zeros_like(bin_warped).astype(np.uint8)
 7    color_warp = np.dstack((warp_zero, warp_zero, warp_zero))
 8
 9    # Recast the x and y points into usable format for cv2.fillPoly()
10    pts_left = np.array([np.transpose(np.vstack([left_fitx, ploty]))])
11    pts_right = np.array([np.flipud(np.transpose(np.vstack([right_fitx, ploty])))])
12    pts = np.hstack((pts_left, pts_right))
13
14    # Draw the lane onto the warped blank image
15    cv2.fillPoly(color_warp, np.int_([pts]), (0,255, 0))
16
17    # Warp the blank back to original image space using inverse perspective matrix (Minv)
18    newwarp = cv2.warpPerspective(color_warp, Minv, (undist.shape[1], undist.shape[0])) 
19    # Combine the result with the original image
20    result = cv2.addWeighted(undist, 1, newwarp, 0.3, 0)
21    return result

以上6个场景的左右车道线绘制结果如下所示：

处理视频

在一步步完成摄像机标定、图像畸变校正、透视变换、提取车道线、检测车道线、跟踪车道线后，我们在图像上实现了复杂环境下的车道线检测算法。现在我们将视频转化为图片，然后一帧帧地对视频数据进行处理，然后将车道线检测结果存为另一段视频。

处理代码如下：

 1nx = 9 
 2ny = 6
 3ret, mtx, dist, rvecs, tvecs = getCameraCalibrationCoefficients('camera_cal/calibration*.jpg', nx, ny)
 4
 5src = np.float32([[580, 460], [700, 460], [1096, 720], [200, 720]])
 6dst = np.float32([[300, 0], [950, 0], [950, 720], [300, 720]])
 7
 8video_input = 'project_video.mp4'
 9video_output = 'result_video.mp4'
10
11cap = cv2.VideoCapture(video_input)
12
13fourcc = cv2.VideoWriter_fourcc(*'XVID')
14out = cv2.VideoWriter(video_output, fourcc, 20.0, (1280, 720))
15
16detected = False
17
18while(True):
19    ret, image = cap.read()
20    if ret:
21        undistort_image = undistortImage(image, mtx, dist)
22        warp_image, M, Minv = warpImage(undistort_image, src, dst)
23        hlsL_binary = hlsLSelect(warp_image)
24        labB_binary = labBSelect(warp_image, (205, 255))
25        combined_binary = np.zeros_like(sx_binary)
26        combined_binary[(hlsL_binary == 1) | (labB_binary == 0)] = 1
27        left_fit = []
28        right_fit = []
29        ploty = []
30        if detected == False:
31            out_img, left_fit, right_fit, ploty = fit_polynomial(combined_binary, nwindows=9, margin=80, minpix=40)
32            if (len(left_fit) > 0 & len(right_fit) > 0) :
33                detected = True
34            else :
35                detected = False
36        else:
37            track_result, left_fit, right_fit, ploty,  = search_around_poly(combined_binary, left_fit, right_fit)
38            if (len(left_fit) > 0 & len(right_fit) > 0) :
39                detected = True
40            else :
41                detected = False
42
43        result = drawing(undistort_image, combined_binary, warp_image, left_fitx, right_fitx)
44
45        out.write(result)
46    else:
47        break
48
49cap.release()
50out.release()

最终的视频车道线检测结果如下所示（视频大小7.59M）：

视频中左上角出现的道路曲率和车道偏离量的计算都是获取车道线曲线方程后的具体应用，这里不做详细讨论

以上就是《再识图像之高级车道线检测》的全部内容，本次分享中介绍的摄像机标定、投影变换、颜色通道、滑动窗口等技术，在计算机视觉领域均得到了广泛应用。

处理复杂道路场景下的视频数据是一项极其艰巨的任务。仅以提取车道线的过程为例，使用设定规则的方式提取车道线，虽然能够处理项目视频中的场景，但面对变化更为恶劣的场景时，还是无能为力。现阶段解决该问题的方法就是通过深度学习的方法，拿足够多的标注数据去训练模型，才能尽可能多地达到稳定的检测效果。

文章中所使用的图片、视频素材，技术细节和部分代码来自《优达学城（Udacity）无人驾驶工程师学位》的第二个项目。

你可能感兴趣的:(无人驾驶图像)

ColQwen-Omni：RAG全模态检索来了，支持【文本|图像|视频|音频】四种模态！致Great 音视频
还记得ColPali、ColQwen和DSE吗？这些模型开创了视觉文档检索的新范式：无需费力地从文档中提取文本进行处理，只需将文档页面视为一系列图像（屏幕截图），然后训练视觉语言模型（VLM）直接将其内容表示为向量。ColPali的实践表明，这种策略通常比其他替代方法更快、更简单，并且能带来更好的检索性能。自发布一年以来，ColPali和ColQwen系列模型已被下载数百万次，被誉为“2024年顶
高通camera结构（第五天）
一、摄像头的结构和工作原理镜头用来拍摄景物，拍摄的图片在传感器上将光信号转换成了电信号，电信号经过AD转换器（模数转换器）转换成了数字信号，数字信号经过DSP（数字信号处理器）进行加工处理，再被送到电脑中进行处理，最终转换成了手机屏幕上我们可以看到的图像。数字信号处理器芯片（DSP）功能：主要是通过一系列数学的算法运算，对数字图像信号进行优化处理，并把处理过的信号通过USB等接口传到PC等设备。D
“空中的士”上架淘宝工业品后,要登录交个朋友淘宝直播间? 氧惠爱高省
3月20日消息，交个朋友官微发文宣布，20日晚上七点，全球首个获得适航认证的“飞行的士”将亮相交个朋友淘宝直播间。据悉，这款无人驾驶载人航空器可搭载两人，长6.05米，宽5.73米，高1.93米，由16个螺旋桨组成，为全智能无人驾驶航空器，能够垂直起降，主要在低空空域飞行。通过【氧恵】APP，可以免费领取淘宝及各大电商隐藏优惠券及返利，还能分享赚钱，与朋友一起享受购物乐趣！【氧恵邀请码：00088
高通平台camera构架sensor驱动详解 a55662551 android camera 驱动 v4l2
1.Sensor驱动的基本概念与流程Sensor驱动的作用：Sensor驱动是Camera硬件与CamX框架之间的桥梁，负责控制Sensor的启动、数据采集、寄存器配置以及与图像处理单元（如IFE、BPS）的交互。通俗理解：就像工厂的“原料采集工”，负责从摄像头传感器（如CMOS）获取原始图像数据，并将数据传递到流水线（Pipeline）中进行加工。数据流关键步骤：Sensor初始化：配置电源、时
Android 开源组件和第三方库汇总 gyyzzr Android Android 开源框架
转载1、github排名https://github.com/trending,github搜索：https://github.com/search2、https://github.com/wasabeef/awesome-android-ui目录UIUI卫星菜单节选器下拉刷新模糊效果HUD与Toast进度条UI其它动画网络相关响应式编程地图数据库图像浏览及处理视频音频处理测试及调试动态更新热更新
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）阿牛的药铺算法移植部署 fpga开发 verilog
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）引言：为什么这个FPGA入门路线能帮你快速上岗？本文设计了一条**"Verilog语法→工具链操作→光学项目实战→岗位技能对标"的阶梯式学习路径。不同于泛泛而谈的FPGA教程，我们聚焦光学类产品开发**核心能力（时序接口设计、图像处理算法移植、高速接口应用），通过3个递进式项目（从LED闪烁到图像边缘检测），
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
用OpenCV标定相机内参应用示例（C++和Python）
下面是一个完整的使用OpenCV进行相机内参标定（CameraCalibration）的示例，包括C++和Python两个版本，基于棋盘格图案标定。一、目标：相机标定通过拍摄多张带有棋盘格图案的图像，估计相机的内参：相机矩阵（内参）K畸变系数distCoeffs可选外参（R,T）标定精度指标（如重投影误差）二、棋盘格参数设置（根据自己的棋盘格设置）：棋盘格角点数：9x6（内角点，9列×6行）；每个
Shader面试题100道之（81-100）还是大剑师兰特 #Shader 综合教程100+大剑师 shader面试题 shader教程
Shader面试题（第81-100题）以下是第81到第100道Shader相关的面试题及答案：81.Unity中如何实现屏幕空间的热扭曲效果（HeatDistortion）？热扭曲效果可以通过GrabPass抓取当前屏幕图像，然后在片段着色器中使用噪声或动态UV偏移模拟空气扰动，再结合一个透明通道控制扭曲强度来实现。82.Shader中如何实现物体轮廓高亮（OutlineHighlight）？轮廓
被动降噪的概念及编程实现 CodeByte 人工智能算法 javascript 编程
被动降噪是指通过编程技术和算法，对输入的数据进行处理，以减少或消除其中的噪声。噪声可以是各种形式的干扰，例如来自传感器、通信信号或其他外部源的干扰。在本文中，我们将探讨被动降噪的意义以及如何使用编程来实现这一目标。被动降噪的意义：噪声对数据的准确性和可靠性产生负面影响。在许多应用领域，例如图像处理、音频处理和信号处理中，噪声的存在可能导致数据质量下降，使得后续的分析和处理变得困难。因此，被动降噪技
盲超分的核心概念小冷爱读书数学建模盲超分超分重建
一、盲超分的本质与数学建模1.退化过程的数学表达低分辨率图像（LR）可看作高分辨率图像（HR）经过退化模型后的结果：：观测到的低分辨率图像：待恢复的高分辨率图像：模糊核（BlurKernel）⊗：卷积操作↓：下采样（步长为）：加性噪声（如高斯噪声、泊松噪声等）盲超分的核心问题：在未知、、的情况下，从估计。2.为什么传统超分方法会失效？传统方法（如SRCNN、EDSR）假设退化是固定的（如双三次下采
AI 图像编辑提示词参考之：背景替换
在AI图像编辑中（以FluxKontext为例），“替换背景”（BackgroundReplacement）是提升图像表现力的关键手段之一。但背景更换不仅仅是简单的视觉置换，更重要的是：确保人物主体外观不变，并与新背景在色温、色调、光影等方面自然融合。只有这样，最终图像才会呈现出“原本拍摄于该背景环境”的真实感。建议使用以下结构组织提示词：Replacethebackgroundwith[新背景]
目标检测（object detection）加油吧zkf 目标检测目标检测人工智能计算机视觉
目标检测作为计算机视觉的核心技术，在自动驾驶、安防监控、医疗影像等领域发挥着不可替代的作用。本文将系统讲解目标检测的概念、原理、主流模型、常见数据集及应用场景，帮助读者构建对这一技术的完整认知。一、目标检测的核心概念目标检测（ObjectDetection）是指在图像或视频中自动定位并识别出所有感兴趣的目标的技术。它需要解决两个核心问题：分类（Classification）：确定图像中每个目标的类
模型训练与部署注意事项篇---resize Atticus-Orion 图像处理篇深度学习篇模型训练与部署注意事项篇深度学习计算机视觉人工智能
图像大小的影响在YOLOv系列模型的训练和推理部署过程中，图像大小的选择是影响模型性能（精度、速度、泛化能力）的关键因素之一。两者的关系既相互关联，又存在一定的灵活性，具体可从以下几个方面详细分析：一、核心关系：训练与推理图像大小的“基准一致性”YOLOv模型（如YOLOv5、v7、v8等）的训练和推理图像大小通常以**“基准尺寸”**为核心关联，即训练时设定的图像尺寸会作为模型设计的基础，而推理
深度学习图像分类数据集—桃子识别分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：桃子识别分类：['B1','M2','R0','S3']训练数据集总共有6637张图片，每个文件夹单独放一种数据各子文件夹图片统计:·B1:1601张图片·M2:1800张图片·R0:1601张图片·S3:
NVIDIA 系列之使用生成式 AI 增强 ROS2 机器人技术：使用 BLIP 和 Isaac Sim 进行实时图像字幕制作知识大胖 NVIDIA GPU和大语言模型开发教程人工智能机器人
简介在快速发展的机器人领域，集成先进的AI模型可以显著增强机器人系统的功能。在本博客中，我们将探讨如何在ROS2（机器人操作系统2）环境中利用BLIP（引导语言图像预训练）模型进行实时图像字幕制作，并使用NVIDIAIsaacSim进行模拟。我们将介绍如何实现一个ROS2节点，该节点订阅摄像头源、应用BLIP模型进行图像字幕制作，并实时显示结果。这种集成展示了生成式AI在增强人机交互方面的强大功能
卫星分析系列之使用卫星图像量化野火烧毁面积在 Google Colab 中使用 Python 使用 Sentinel-2 图像确定森林火灾烧毁面积知识大胖 NVIDIA GPU和大语言模型开发教程 python sentinel 开发语言
简介几年前，当大多数气候模型预测如果我们不采取必要措施，洪水、热浪和野火将会发生更多时，我没想到这些不寻常的灾难现象会成为常见事件。其中，野火每年摧毁大量森林面积。如果你搜索不同地方的重大野火表格，你会发现令人震惊的统计数据，显示由于野火，地球上有多少森林面积正在消失。在本教程中，我将结合我已经发表过的关于下载、处理卫星图像和可视化野火的故事，量化加州发生的其中一场重大野火的烧毁面积。与之前的帖子
使用NVIDIA NeRF将2D图像转换为逼真的3D模型（Python） ByteWhiz 3d python 计算机视觉 Python
使用NVIDIANeRF将2D图像转换为逼真的3D模型（Python）NeuralRadianceFields（NeRF）是一种强大的方法，可以将2D图像转换为逼真的3D模型。它使用神经网络来建模场景的辐射场，并通过渲染多个视角的图像来重建3D模型。在本文中，我们将使用Python和NVIDIANeRF库来实现这一过程。首先，我们需要安装所需的库。我们可以通过以下命令使用pip安装NVIDIANe
Android 图像处理 - Bitmap 图像处理观察记录（基本图像复制、带目录创建的图像复制、字节流处理的图像复制、并发图像复制、单线程池顺序图像复制）
Bitmap图像处理观察记录1、基本图像复制从应用内部存储目录读取test.png使用BitmapFactory解码为Bitmap对象将Bitmap重新压缩保存为newTest.png操作成功，compress返回trueFilefile=newFile(getFilesDir(),"test.png");StringabsolutePath=file.getAbsolutePath();Bitm
OpenCV图像数据处理:convertTo,normalize和scaleAdd luofeiju OpenCV函数实战 opencv
在OpenCV图像处理的世界里，有几个函数进行一些基本数据变换：cv::convertTo()：类型转换与线性缩放；cv::normalize()：归一化处理；cv::scaleAdd()：加权叠加运算。cv::addWeighted():与scaleAdd相似，进行加权叠加运算；一、cv::convertTo()：线性变换+数据类型转换voidcv::Mat::convertTo(OutputA
Gradio全解系列7——Additional Features：补充特性（上）龙焰智能 Gradio全解教程人工智能 gradio 补充特性队列输入输出流提示及进度条批处理函数
Gradio全解7——AdditionalFeatures：补充特性（上）前言第7章AdditionalFeatures：补充特性7.1队列7.1.1使用方法7.1.2配置队列演示7.2输入输出流7.2.1输出流1.生成器yield2.流媒体7.2.2输入流1.流事件2.图像滤镜7.2.3统一的输入输出流7.2.4跟踪过去的输入或输出7.3提示及进度条7.3.1提示7.3.2进度条7.4批处理函数
【前端】异步任务风控验证与轮询机制技术方案（通用笔记版）
一、背景场景在某类生成任务中，例如用户点击“执行任务”按钮后触发一个较耗时的后端操作（如生成报告、渲染图像、转码视频等），由于其调用了模型、渲染服务或需要较长处理时间，为了防止接口被频繁恶意调用，系统需要加入风控验证机制。此外，因任务处理为异步，前端无法立即获得最终结果，因此需通过轮询方式定期查询任务状态，等待任务完成后展示结果。二、整体流程说明1.用户点击“执行任务”按钮：前端调用风控接口/ap
如何将 GIF 图片从 iPhone 传输到Mac ？ Coolmuster iOS 苹果手机 iPhone iphone macos ios
随着iOS系统的不断更新，现在我们已经迎来了iOS18，它为我们带来了更多的功能和改进。在iOS10中，保存的GIF图像会转换成静态图片，但自iOS11起，用户可以在iPhone和iPad上以原始格式保存GIF。若您希望备份这些生动有趣的GIF照片，将它们从iPhone传输到Mac是一个不错的选择。本文将向您展示几种将GIF图像备份到Mac计算机的有效方法。尽管Mac无法直接播放GIF，但本文还会
Matplotlib-图像处理与可视化
Matplotlib-图像处理与可视化一、图像数据的本质：从数组到像素二、基础操作：加载与显示图像1.加载图像数据2.显示单张图像3.显示灰度图像三、进阶可视化：通道分离与色彩调整1.分离RGB通道2.调整亮度与对比度四、实用技巧：色彩映射与像素值分析1.自定义色彩映射（Colormap）2.像素值分布直方图五、多图对比与标注：算法结果可视化1.边缘检测结果对比2.图像标注：突出感兴趣区域六、注意
（一）OpenCV——噪声去除（降噪）
高斯滤波器（针对高斯噪声）高斯噪声是指它的概率密度函数服从高斯分布（即正态分布）的一类噪声。常见的高斯噪声包括起伏噪声、宇宙噪声、热噪声和散粒噪声等等。高斯滤波(Gaussianfilter)包含许多种，包括低通、带通和高通等，我们通常图像上说的高斯滤波，指的是高斯模糊(GaussianBlur)，是一种高斯低通滤波，其过滤调图像高频成分（图像细节部分），保留图像低频成分（图像平滑区域），所以对图
MATLAB实现快速非局部均值图像去噪方法一只爪子
本文还有配套的精品资源，点击获取简介：非局部均值滤波是一种先进的图像去噪技术，与传统方法相比，它利用图像的全局信息来去除噪声，同时保持图像细节。该算法通过搜索和利用整个图像中相似的像素块，对每个像素点进行去噪处理。本文提供的MATLAB代码FAST_NLM_II.m实现此算法，并包含必要的参数设置、相似性计算、加权平均和图像更新步骤。了解并应用此代码是学习和进一步改进非局部均值滤波技术的基础。1.
Python爬虫：从图片或扫描文档中提取文字数据的完整指南 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言数据挖掘 c++
1.引言随着大数据技术的不断进步，图像数据逐渐成为了许多行业中重要的数据源之一。图像中不仅包含了丰富的视觉信息，还可能蕴含着大量的文字数据。对于科研、企业、政府等多个领域而言，如何从图片或扫描文档中提取出有价值的文字信息是一个亟待解决的问题。在这一过程中，OCR（OpticalCharacterRecognition，光学字符识别）技术成为了解决这一问题的重要工具。在本文中，我们将探讨如何使用Py
前端开发常见问题
技术文章大纲性能优化问题页面加载速度慢的常见原因及解决方案渲染阻塞资源的处理方法图片与媒体文件优化策略懒加载与代码分割的实现方式浏览器兼容性问题不同浏览器对CSS特性的支持差异JavaScriptAPI的兼容性处理方案Polyfill的使用场景与实现方法自动化测试工具在兼容性测试中的应用响应式设计挑战移动端与桌面端布局适配问题媒体查询的最佳实践方案视口单位与相对单位的正确使用高DPI屏幕的图像处理
AI Agent 2025 大爆发：从 GPT-4o 到 Devin，下一代 Agent 架构与落地趋势深度解析
当大模型学会“看”“听”“点鼠标”，并且还能叫来一整个“Agent舰队”协同工作，软件开发、运营乃至个人生产力的游戏规则正在被重写。1|为什么Agent在2025重新引爆？模型升级带来实时多模态OpenAIGPT-4o把文本、语音、图像三路感知和毫秒级响应塞进同一模型，实时demo像“科幻电影走出屏幕”OpenAI。浏览器级自动操作新上线的OperatorAgent能在Web页面自主点击、滚动、填
算法单链的创建与删除换个号韩国红果果 c 算法
先创建结构体 struct student { int data; //int tag;//标记这是第几个 struct student *next; }; // addone 用于将一个数插入已从小到大排好序的链中 struct student *addone(struct student *h,int x){ if(h==NULL) //??????
《大型网站系统与Java中间件实践》第2章读后感白糖_ java中间件
断断续续花了两天时间试读了《大型网站系统与Java中间件实践》的第2章，这章总述了从一个小型单机构建的网站发展到大型网站的演化过程---整个过程会遇到很多困难，但每一个屏障都会有解决方案，最终就是依靠这些个解决方案汇聚到一起组成了一个健壮稳定高效的大型系统。看完整章内容，
zeus持久层spring事务单元测试 deng520159 java DAO spring jdbc
今天把zeus事务单元测试放出来,让大家指出他的毛病, 1.ZeusTransactionTest.java 单元测试 package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Test; import
Rss 订阅开发周凡杨 html xml 订阅 rss 规范
RSS是 Really Simple Syndication的缩写（对rss2.0而言，是这三个词的缩写，对rss1.0而言则是RDF Site Summary的缩写，1.0与2.0走的是两个体系）。 RSS
分页查询实现 g21121 分页查询
在查询列表时我们常常会用到分页，分页的好处就是减少数据交换，每次查询一定数量减少数据库压力等等。按实现形式分前台分页和服务器分页：前台分页就是一次查询出所有记录，在页面中用js进行虚拟分页，这种形式在数据量较小时优势比较明显，一次加载就不必再访问服务器了，但当数据量较大时会对页面造成压力，传输速度也会大幅下降。服务器分页就是每次请求相同数量记录，按一定规则排序，每次取一定序号直接的数据
spring jms异步消息处理 510888780 jms
spring JMS对于异步消息处理基本上只需配置下就能进行高效的处理。其核心就是消息侦听器容器，常用的类就是DefaultMessageListenerContainer。该容器可配置侦听器的并发数量，以及配合MessageListenerAdapter使用消息驱动POJO进行消息处理。且消息驱动POJO是放入TaskExecutor中进行处理，进一步提高性能，减少侦听器的阻塞。具体配置如下：
highCharts柱状图布衣凌宇 hightCharts 柱图
第一步：导入 exporting.js,grid.js,highcharts.js;第二步：写controller @Controller@RequestMapping(value="${adminPath}/statistick")public class StatistickController { private UserServi
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans spring mvc Spring 教程 spring3 教程 Spring 入门
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
TLS java简单实现 antlove java ssl keystore tls secure
1. SSLServer.java package ssl; import java.io.FileInputStream; import java.io.InputStream; import java.net.ServerSocket; import java.net.Socket; import java.security.KeyStore; import
Zip解压压缩文件百合不是茶 Zip格式解压 Zip流的使用文件解压
ZIP文件的解压缩实质上就是从输入流中读取数据。Java.util.zip包提供了类ZipInputStream来读取ZIP文件,下面的代码段创建了一个输入流来读取ZIP格式的文件; ZipInputStream in = new ZipInputStream(new FileInputStream(zipFileName)); &n
underscore.js 学习（一） bijian1013 JavaScript underscore
工作中需要用到underscore.js，发现这是一个包括了很多基本功能函数的js库，里面有很多实用的函数。而且它没有扩展 javascript的原生对象。主要涉及对Collection、Object、Array、Function的操作。学
java jvm常用命令工具——jstatd命令(Java Statistics Monitoring Daemon) bijian1013 java jvm jstatd
1.介绍 jstatd是一个基于RMI（Remove Method Invocation）的服务程序，它用于监控基于HotSpot的JVM中资源的创建及销毁，并且提供了一个远程接口允许远程的监控工具连接到本地的JVM执行命令。 jstatd是基于RMI的，所以在运行jstatd的服务
【Spring框架三】Spring常用注解之Transactional bit1129 transactional
Spring可以通过注解@Transactional来为业务逻辑层的方法(调用DAO完成持久化动作)添加事务能力，如下是@Transactional注解的定义： /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version
我(程序员)的前进方向 bitray 程序员
作为一个普通的程序员,我一直游走在java语言中,java也确实让我有了很多的体会.不过随着学习的深入,java语言的新技术产生的越来越多,从最初期的javase,我逐渐开始转变到ssh,ssi,这种主流的码农,.过了几天为了解决新问题,webservice的大旗也被我祭出来了,又过了些日子jms架构的activemq也开始必须学习了.再后来开始了一系列技术学习,osgi,restful.....
nginx lua开发经验总结 ronin47
使用nginx lua已经两三个月了，项目接开发完毕了，这几天准备上线并且跟高德地图对接。回顾下来lua在项目中占得必中还是比较大的，跟PHP的占比差不多持平了，因此在开发中遇到一些问题备忘一下 1：content_by_lua中代码容量有限制，一般不要写太多代码，正常编写代码一般在100行左右（具体容量没有细心测哈哈，在4kb左右），如果超出了则重启nginx的时候会报 too long pa
java-66-用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。颠倒之后的栈为{5,4,3,2,1}，5处在栈顶 bylijinnan java
import java.util.Stack; public class ReverseStackRecursive { /** * Q 66.颠倒栈。 * 题目：用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。 * 颠倒之后的栈为{5,4,3,2,1}，5处在栈顶。 *1. Pop the top element *2. Revers
正确理解Linux内存占用过高的问题 cfyme linux
Linux开机后，使用top命令查看，4G物理内存发现已使用的多大3.2G，占用率高达80%以上： Mem: 3889836k total, 3341868k used, 547968k free, 286044k buffers Swap: 6127608k total,&nb
[JWFD开源工作流]当前流程引擎设计的一个急需解决的问题 comsci 工作流
当我们的流程引擎进入IRC阶段的时候，当循环反馈模型出现之后，每次循环都会导致一大堆节点内存数据残留在系统内存中，循环的次数越多，这些残留数据将导致系统内存溢出，并使得引擎崩溃。。。。。。而解决办法就是利用汇编语言或者其它系统编程语言，在引擎运行时，把这些残留数据清除掉。
自定义类的equals函数 dai_lm equals
仅作笔记使用 public class VectorQueue { private final Vector<VectorItem> queue; private class VectorItem { private final Object item; private final int quantity; public VectorI
Linux下安装R语言 datageek R语言 linux
命令如下：sudo gedit /etc/apt/sources.list1、deb http://mirrors.ustc.edu.cn/CRAN/bin/linux/ubuntu/ precise/ 2、deb http://dk.archive.ubuntu.com/ubuntu hardy universesudo apt-key adv --keyserver ke
如何修改mysql 并发数(连接数)最大值 dcj3sjt126com mysql
MySQL的连接数最大值跟MySQL没关系，主要看系统和业务逻辑了方法一：进入MYSQL安装目录打开MYSQL配置文件 my.ini 或 my.cnf查找 max_connections=100 修改为 max_connections=1000 服务里重起MYSQL即可　　方法二：MySQL的最大连接数默认是100客户端登录：mysql -uusername -ppass
单一功能原则 dcj3sjt126com 面向对象的程序设计软件设计编程原则
单一功能原则[ 编辑] SOLID 原则单一功能原则开闭原则 Liskov代换原则接口隔离原则依赖反转原则查论编在面向对象编程领域中，单一功能原则（Single responsibility principle）规定每个类都应该有
POJO、VO和JavaBean区别和联系 fanmingxing VO POJO javabean
POJO和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Plain Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比POJO复杂很多，JavaBean是一种组件技术，就好像你做了一个扳子，而这个扳子会在很多地方被
SpringSecurity3.X--LDAP：AD配置 hanqunfeng SpringSecurity
前面介绍过基于本地数据库验证的方式，参考http://hanqunfeng.iteye.com/blog/1155226，这里说一下如何修改为使用AD进行身份验证【只对用户名和密码进行验证，权限依旧存储在本地数据库中】。将配置文件中的如下部分删除：
mac mysql 修改密码 IXHONG mysql
$ sudo /usr/local/mysql/bin/mysqld_safe –user=root & //启动MySQL(也可以通过偏好设置面板来启动)$ sudo /usr/local/mysql/bin/mysqladmin -uroot password yourpassword //设置MySQL密码（注意，这是第一次MySQL密码为空的时候的设置命令，如果是修改密码，还需在-
设计模式--抽象工厂模式 kerryg 设计模式
抽象工厂模式：工厂模式有一个问题就是，类的创建依赖于工厂类，也就是说，如果想要拓展程序，必须对工厂类进行修改，这违背了闭包原则。我们采用抽象工厂模式，创建多个工厂类，这样一旦需要增加新的功能，直接增加新的工厂类就可以了，不需要修改之前的代码。总结：这个模式的好处就是，如果想增加一个功能，就需要做一个实现类，
评"高中女生军训期跳楼” nannan408
首先，先抛出我的观点，各位看官少点砖头。那就是，中国的差异化教育必须做起来。孔圣人有云：有教无类。不同类型的人，都应该有对应的教育方法。目前中国的一体化教育，不知道已经扼杀了多少创造性人才。我们出不了爱迪生，出不了爱因斯坦，很大原因，是我们的培养思路错了，我们是第一要“顺从”。如果不顺从，我们的学校，就会用各种方法，罚站，罚写作业，各种罚。军
scala如何读取和写入文件内容？ qindongliang1922 java jvm scala
直接看如下代码： package file import java.io.RandomAccessFile import java.nio.charset.Charset import scala.io.Source import scala.reflect.io.{File, Path} /** * Created by qindongliang on 2015/
C语言算法之百元买百鸡 qiufeihu c 算法
中国古代数学家张丘建在他的《算经》中提出了一个著名的“百钱买百鸡问题”，鸡翁一，值钱五，鸡母一，值钱三，鸡雏三，值钱一，百钱买百鸡，问翁，母，雏各几何？代码如下： #include <stdio.h> int main() { int cock,hen,chick; /*定义变量为基本整型*/ for(coc
Hadoop集群安全性：Hadoop中Namenode单点故障的解决方案及详细介绍AvatarNode wyz2009107220 NameNode
正如大家所知，NameNode在Hadoop系统中存在单点故障问题，这个对于标榜高可用性的Hadoop来说一直是个软肋。本文讨论一下为了解决这个问题而存在的几个solution。 1. Secondary NameNode 原理：Secondary NN会定期的从NN中读取editlog，与自己存储的Image进行合并形成新的metadata image 优点：Hadoop较早的版本都自带，