小白学视觉

使用霍夫变换检测车道线

点击上方“小白学视觉”，选择加"星标"或“置顶”

重磅干货，第一时间送达

车道线检测是自动驾驶汽车的重要组成部分之一，有很多方法可以做到这一点。本文，我们将使用最简单的霍夫变换方法。

本文分为三个部分:

第一部分:高斯模糊+ Canny边缘检测
第二部分:霍夫变换
第三部分:优化+显示线条

第1部分和第3部分的重点是编码，第2部分更面向理论。接下来，让我们开始第一部分。

第一部分：高斯模糊+Canny边缘检测

导入必需的库：

import numpy as np 
import cv2 
import matplotlib.pyplot as plt

第1行:Numpy用于执行数学计算，我们要用它来创建和操作数组。
第3行:使用Matplotlib可视化图像。

接下来，让我们从集合中加载一张图片来测试算法

image_path = r"D:\users\new owner\Desktop\TKS\Article Lane 
Detection\udacity\solidWhiteCurve.jpg" 
image1 = cv2.imread(image_path) 
plt.imshow(image1)

在这里，我们在第4行将图像加载到笔记本中，然后我们将在第5行和第6行读取图像并将其可视化。现在是处理图像的时候了，主要分为以下三步:

def grey(image): 
    return cv2.cvtColor(image, cv2.COLOR_RGB2GRAY)
def gauss(image): 
    return cv2.GaussianBlur(image, (5, 5), 0)
def canny(image): 
    edges = cv2.Canny(image,50,150) 
return edges

在最后一个代码块中，我们定义了3个函数:

Greyscale the image:这有助于增加颜色的对比度，使它更容易识别像素强度的变化。

Gaussian Filter:高斯滤波器的目的是减少图像中的噪声。我们这样做是因为Canny中的梯度对噪声非常敏感，所以我们想尽可能地消除噪声。cv2.高斯模糊函数有三个参数:

img参数定义了我们要进行归一化(减少噪声)的图像。这个函数使用一个称为高斯核的核函数，用于对图像进行归一化。
sigma参数定义沿x轴的标准偏差。标准偏差衡量图像中像素的分布，我们希望像素扩散是一致的，因此标准偏差为0。

Canny:这是我们检测图像边缘的地方，它所做的是计算像素强度的变化(亮度的变化)在一个图像的特定部分。幸运的是，OpenCV使它变得非常简单。

cv2.Canny函数有3个参数，(img, threshold-1, threshold-2)。

img参数定义了我们要检测边缘的图像。
threshold-1参数过滤所有低于这个数字的梯度(它们不被认为是边缘)。
threshold-2参数决定了边缘的有效值。
如果两个阈值之间的任何梯度连接到另一个高于阈值2的梯度，则将考虑该梯度。

现在我们已经定义了图像中的所有边缘，我们需要分割与车道线相对应的边缘，操作步骤如下：

def region(image): 
    height, width = image.shape 
    triangle = np.array([ 
                       [(100, height), (475, 325), (width, height)] 
                       ]) 
    mask = np.zeros_like(image) 
    mask = cv2.fillPoly(mask, triangle, 255) 
    mask = cv2.bitwise_and(image, mask) 
return mask

这个函数将分割图像中车道线所在的某个硬编码区域，它以Canny图像为参数，输出孤立区域。

在第1行中，我们将使用numpy.shape函数提取图像的维数。

在第2-4行中，我们要定义一个三角形的尺寸，也就是我们要隔离的区域。

在第5和第6中，我们要创建一个黑色的平面，然后我们要定义一个白色的三角形，它的尺寸和第2行中定义的一样。

在第7行中，我们将执行位运算和运算，使我们能够隔离与车道线对应的边缘。

更深入的解释位运算

在我们的图像中，有两种像素强度：黑色和白色。黑色像素的值为0，白色像素的值为255。在8位二进制中，0转换为00000000，255转换为11111111。对于位运算和运算，我们将使用像素的二进制值。现在，我们将在img1和img2相同的位置上乘以两个像素(我们将img1定义为带有边缘检测的平面，img2定义为我们创建的掩码)。

左:Img1，右图:Img2。(实际上，它是白色的，但我们把它改成了黄色)

例如，img1上(0,0)处的像素将与img2上(0,0)处的像素相乘(同样地，图像上其他位置的每一个像素也是如此)。

如果img1中的(0,0)像素是白色的(意味着它是一条边)，img2中的(0,0)像素是黑色的(意味着这个点不是我们的车道线所在的孤立区域的一部分)，操作看起来像11111111* 0000000，等于0000000(一个黑色像素)。

我们将对图像上的每个像素重复这个操作，导致只输出掩码中的边缘。

其他一切都被忽略了，仅输出隔离区域中的边。

现在我们已经定义了我们想要的边，接着让我们定义一个函数把这些边变成线：

lines = cv2.HoughLinesP(isolated, rho=2, theta=np.pi/180, 
threshold=100, np.array([]), minLineLength=40, maxLineGap=5)

这一行代码是整个算法的核心，它被称为霍夫变换(Hough Transform)，将孤立区域的白色像素簇转换为实际的线条。

参数1:孤立梯度
参数5:占位符数组
参数6:最小行长
参数7:最大行间距

下面的部分将深入到算法背后的具体细节，所以在你们读完第二部分后，你们可以回到这部分，希望这部分会更有意义。

第二部分：霍夫变换

简单说明一下，这部分仅仅是理论，如果你们想跳过这一部分，可以继续阅读第3部分，但鼓励小伙伴们通读一遍。

来谈谈霍夫变换。在笛卡尔平面(x和y轴)中，直线由公式y=mx+b定义，其中x和y对应于直线上的一个特定点，m和b分别对应于斜率和y轴截距。

笛卡尔坐标空间中的直线

平面被绘制成x和y值的函数，这意味着我们显示的是这条直线有多少(x, y)对组成（有无穷多的x, y对组成任何一条线，这就是为什么线延伸到无穷远的原因）。

但是，可以用它的m和b值绘制直线，这是在一个叫做霍夫空间的平面上完成的。为了理解Hough变换算法，我们需要了解Hough空间是如何工作的。

霍夫空间的解释

在我们的用例中，我们可以将霍夫空间总结为两行：

笛卡尔平面上的点在霍夫空间中变成直线
笛卡尔平面上的直线在霍夫空间上变成点

想想线的概念，一条线基本上是由一个接一个有序排列的无穷长的点组成的。因为在笛卡尔平面上，我们画的线是x和y的函数，线被显示为无限长因为有无限多的(x, y)对组成了这条线。

现在在霍夫空间中，我们画出直线作为m和b值的函数。因为每条笛卡尔直线上只有一个m和b值，所以这条直线可以表示为一个点。

例如，方程y=2x+1表示笛卡尔平面上的一条直线。它的m和b值分别是' 2 '和' 1 '，这是这个方程唯一可能的m和b值。另一方面，这个方程可以有很多x和y的值，使得这个方程成立(左边=右边)。

如果我们要用m和b的值来画这个方程，我们只会用点(2,1)；如果我们要用x和y的值来画这个方程，我们将会有无穷多的选择因为有无穷多的(x, y)对。

把θ看成b, r看成m。稍后我们会在文章中解释θ和r的相关性。

那么为什么霍夫空间中的线在笛卡尔平面上被表示为点(如果你们从之前的解释中很好地理解了这个理论，我们希望小伙伴们在没有阅读解释的情况下就能解决这个问题)。

现在我们考虑笛卡尔平面上的一点。笛卡尔平面上的一个点只有一个可能的(x, y)对可以表示它，因此它是一个点，不是无限长。关于一个点，还有一个事实就是有无限多的可能的线可以通过这个点，换句话说，这个点可以满足无穷多个方程(y=mx + b)(LS=RS)。

目前，在笛卡尔平面中，我们根据x和y值绘制这个点。但是在霍夫空间中，我们根据它的m和b值来画这个点，因为有无限条线穿过这个点，所以在霍夫空间中会得到一条无限长的线。

以点(3,4)为例，可以通过该点的直线有:y= -4x+16, y= -8/3x + 12和y= -4/3x + 8(直线有无穷多，但为了简单起见，我们用3条直线)。

如果你们在霍夫空间中绘制每一条直线([- 4,16]，[-8/ 3,12]，[-4/ 3,8])，在笛卡尔空间中代表每条直线的点将在霍夫空间中形成一条直线(这条直线对应于点(3,4))。

每个点代表前面显示的线(匹配颜色)

现在如果我们在个笛卡尔平面上放置另一个点呢?这在霍夫空间会有什么结果呢?通过霍夫空间，我们可以找到笛卡尔平面上最适合这两点的直线。

我们可以通过在霍夫空间中绘制与笛卡尔空间中两点相对应的直线，并找到这两条直线在霍夫空间中相交的点(a.k.a它们的POI，交叉点)。

总结上述内容：

笛卡尔平面上的直线在霍夫空间中表示为点
笛卡儿平面上的点在霍夫空间中表示为直线
通过求霍夫空间中与这两个点对应的两条直线的POI的m和b坐标，可以找到笛卡尔空间中两点的最佳拟合直线，然后根据这些m和b的值组成一条直线。‍‍

回到解释:

虽然这些概念比较好，但它们为什么重要呢?还记得我们之前提到过的Canny边缘检测吗?它使用梯度来测量图像中的像素强度并输出边缘。

在其核心，梯度只是图像上的点。所以我们能做的就是找到最适合每一组点的直线(图像左边的梯度和图像右边的梯度)，这些最合适的线是我们的车道线。为了更好地理解它是如何工作的，让我们再深入了解一下!

我们只是解释了如何通过查看m和b值来找到最合适的线对应于霍夫空间中的点的两条线的POI。然而，当我们的数据集增长时，并不总是有一条线完全适合我们数据。

这就是我们不得不使用容器的原因。当合并容器时，我们将霍夫平面划分为等距部分。每个部分都称为容器，通过关注容器中POI的数量，使我们能够确定一条与我们的数据具有良好相关性的线。一旦找到有最多交集的容器，我们就可以使用m和b值，它们与该容器相对应，并在笛卡尔空间中形成一条直线，这条线就是最适合我们的数据的线。

但是在垂直线上，斜率是无穷大的，我们不能在霍夫空间中表示无穷，这将导致程序崩溃。所以我们不用y=mx+b来表示直线方程，我们用P()和θ()来定义直线，这也被称为极坐标系统。

在极坐标下，直线用方程P=xsinθ + ysinθ表示。在我们深入研究之前，让我们定义一下这些变量的含义:

P表示从原点垂直于直线的距离。
θ表示从正x轴到直线的俯角。
xcosθ表示x方向上的距离。
ysinθ表示y方向上的距离。

这是对极坐标含义的直观解释

用极坐标系统，即使有一条垂直线，也不会有任何误差。例如，取点(6,4)代入方程 P=xcosθ+ ysinθ。现在，我们取经过这个点x=6的垂直线，把它代入极坐标方程，P = 6cos(90) + 4sin(90)

θ是一条垂直线的90度，因为它从正x轴到直线本身的俯角是90度。θ的另一种表示方法是π/2(弧度)。如果你们想了解更多关于弧度的知识，以及我们为什么要使用它们，这里有一个很好的视频。然而，没有必要知道弧度是什么。
X和Y取点(6,4)的值因为这是我们在这个例子中使用的点。

现在我们把这个方程解出来:

P = 6cos(90) + 4sin(90)

P = 6(1) + 4(0)

P = 6

如我们所见，我们不会以错误结束。事实上，我们甚至不需要做这个计算，因为我们在开始之前就已经知道P是多少了。注意，这和从原点到x轴的距离是一样的。

我们想解释的东西的图像。

那么现在这已经解决了问题，我们准备好回去编码了吗?不是现在。还记得之前我们在笛卡尔平面上画点的时候吗?我们最终会得到霍夫空间中的直线?当我们使用极坐标时，我们会得到一条曲线而不是一条直线。然而，概念是一样的，我们将找到具有大多数交叉点并使用那些m和b值来确定最佳拟合线。

第三部分：优化+显示

这一节是为了优化算法，如果我们不平均这些线，它们看起来很不稳定，因为cv2.HoughLinesP输出一串小线段，而不是一条大线。

为了平均这些线，我们将定义一个“average”函数。

def average(image, lines): 
    left = [] 
    right = [] 
for line in lines:
    slope = parameters[0] 
        y_int = parameters[1] 
        if slope < 0: 
            left.append((slope, y_int)) 
        else: 
            right.append((slope, y_int))

这个函数对cv2.HoughLinesP函数中生成的行进行平均，它会找到左右两个线段的平均斜率和y轴截距，并输出两条实线(一条在左边，另一条在右边)。在cv2.HoughLinesP函数的输出中，每个线段有两个坐标:一个表示直线的开始，另一个表示直线的结束。利用这些坐标，我们要计算每条线段的斜率和y轴截距。

然后，我们将收集所有线段的斜率，并将每个线段分为与左线或右线对应的列表(负斜率=左线，正斜率=右线)。

第4行:通过直线数组进行循环。
第5行:从每个线段中提取两个点的(x, y)值。
第6-9行:确定每个线段的斜率和y轴截距。
第10-13行:将负斜率添加到左行列表中，将正斜率添加到右行列表中。

注意:通常情况下，正斜率=左直线，负斜率=右直线，但在我们的例子中，图像的y轴是反的，这就是为什么斜率是反的(OpenCV中的所有图像都是反的y轴)。

接下来，我们要从两个表中求斜率和y轴截距的平均值。

right_avg = np.average(right, axis=0) 
    left_avg = np.average(left, axis=0) 
    left_line = make_points(image, left_avg) 
    right_line = make_points(image, right_avg) 
return np.array([left_line, right_line])

第1-2行:对两个列表(左边和右边)的所有线段取平均值。
第3-4行:计算每一行的起始点和端点。(我们将在下一节定义make_points函数)
第5行:输出每一行的2个坐标。

现在我们有了两个列表的平均斜率和y轴截距，让我们定义两个列表的起点和终点。

def make_points(image, average):  
 slope, y_int = average  
 y1 = image.shape[0] 
 y2 = int(y1 * (3/5)) 
 x1 = int((y1 — y_int) // slope) 
 x2 = int((y2 — y_int) // slope) 
 return np.array([x1, y1, x2, y2])

这个函数有两个参数，一个是带有车道线的图像，另一个是有平均斜率和y_int的列表，输出每条线的起点和终点。

第1行:定义函数
第2行:得到平均斜率和y截距
第3 - 4行:定义的高度线(左右两边都一样)
第5 - 6行:通过重新排列一条线的方程计算x坐标,从y=mx+b to x = (y-b) / m
第7行:输出坐标集

为了进一步说明，在第一行，我们用y1值作为图像的高度。这是因为在OpenCV中，y轴是倒转的，所以0在顶部，而图像的高度在原点(参考下图)。同样，在第二行，y1乘以3/5，这是因为我们想让直线从原点y1开始，以图像的2/5结束。

应用于左线的make_points函数的可视化示例

但是，这个函数并不显示这些线，它只计算显示这些线所需的点。接下来，我们要创建一个函数，它取这些点，并用它们来画线。

def display_lines(image, lines): 
 lines_image = np.zeros_like(image) 
 if lines is not None: 
   for line in lines: 
     x1, y1, x2, y2 = line 
     cv2.line(lines_image, (x1, y1), (x2, y2), (255, 0, 0), 10) 
 return lines_image

这个函数有两个参数:我们想要显示线条的图像以及从平均函数输出的车道线。

第2行:创建一个与原始图像相同尺寸的黑色图像
第3行:确保包含线点的列表不是空的
第4-5行:循环遍历列表，并提取两对(x, y)坐标

我们可能会想，为什么我们不把这些线添加到真实图像上，而是黑色图像上。因为原始图像有点太亮了,所以如果我们把它调暗一点，让车道线看得更清楚一点就好了(是的,我们知道,这不是大不了的,但找到改进算法的方法总是很好的)。

左:直接添加线条到图像。右:使用cv2.addddled函数

所以我们要做的就是调用cv2.addWeighted函数：

lanes =cv2.addWeighted(copy, 0.8, black_lines, 1, 1)

这个函数为实际图像中的每个像素赋予0.8的权重，使它们稍微暗一些(每个像素乘以0.8)。同样地，我们给所有车道线的黑色图像赋予1的权重，这样所有像素都保持相同的强度，使其突出。接下来我们要做的就是调用这些函数:

copy = np.copy(image1) 
grey = grey(copy) 
gaus = gauss(grey) 
edges = canny(gaus,50,150) 
isolated = region(edges)
lines = cv2.HoughLinesP(isolated, 2, np.pi/180, 100, np.array([]), 
minLineLength=40, maxLineGap=5) 
averaged_lines = average(copy, lines) 
black_lines = display_lines(copy, averaged_lines)

在这里，我们简单地调用前面定义的所有函数，然后在第12行输出结果，cv2.waitKey函数用于告诉程序图像显示需要多长时间。我们将“0”传递给函数，这意味着它将等待，直到按下一个键关闭输出窗口。

输出结果:

我们也可以把这个算法应用到视频上。

video = r”D:\users\new owner\Desktop\TKS\Article Lane 
Detection\test2_v2_Trim.mp4" 
cap = cv2.VideoCapture(video) 
while(cap.isOpened()):  
  ret, frame = cap.read() 
  if ret == True:
#----THE PREVIOUS ALGORITHM----# 
    gaus = gauss(frame) 
    edges = cv2.Canny(gaus,50,150) 
    isolated = region(edges) 
lines = cv2.HoughLinesP(isolated, 2, np.pi/180, 50,)
  lanes = cv2.ad1dWeighted(frame, 0.8, black_lines, 1, 1) 
    cv2.imshow(“frame”, lanes) 
#----THE PREVIOUS ALGORITHM----# 
    if cv2.waitKey(10) & 0xFF == ord(‘q’):  
      break 
  else: 
    break 
cap.release()  
cv2.destroyAllWindows()

这段代码将我们为图像创建的算法应用到视频中。记住，一个视频就是一串快速出现的图片。

第1-2行:定义视频的路径。
第3-4行:捕获视频(使用cv2. videcapture)，并循环遍历所有帧。
第5-6行:读取帧，如果有帧，继续。
第10-18行:从前面的算法复制代码，并将所有使用Copy的地方替换为frame，因为我们想确保我们操作的是视频的帧，而不是前面函数中的图像。
第22-23行:显示每一帧10秒，如果按下“q”按钮，退出循环。
第24-25行:它是第5-6行if语句的延续，但它所做的只是如果没有任何帧，就退出循环。
第26-27行:关闭视频

我们刚刚建立了一个可以检测车道线的算法，希望小伙伴们喜欢构建这个算法，但不要止步于此，这只是一个关于计算机视觉世界的入门项目。

关键点：

使用高斯模糊去除图像中的所有噪声
使用canny边缘检测来分离图像中的边缘

关键字：

如果小伙伴们好奇，这里有一些与这个算法相关的关键术语，小伙伴们可以更深入地研究。

高斯模糊
位和二进制
精明的边缘检测
霍夫变换
梯度
极坐标
OpenCV车道线检测

其他需要考虑的资源：

youtube视频。

Github代码连接：

https://github.com/Nushaine/lane-detection/blob/master/Untitled33.ipynb

好消息，小白学视觉团队的知识星球开通啦，为了感谢大家的支持与厚爱，团队决定将价值149元的知识星球现时免费加入。各位小伙伴们要抓住机会哦！

下载1：OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复：扩展模块中文教程，即可下载全网第一份OpenCV扩展模块教程中文版，涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2：Python视觉实战项目52讲

在「小白学视觉」公众号后台回复：Python视觉实战项目，即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目，助力快速学校计算机视觉。

下载3：OpenCV实战项目20讲

在「小白学视觉」公众号后台回复：OpenCV实战项目20讲，即可下载含有20个基于OpenCV实现20个实战项目，实现OpenCV学习进阶。

交流群

欢迎加入公众号读者群一起和同行交流，目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群（以后会逐渐细分），请扫描下面微信号加群，备注：”昵称+学校/公司+研究方向“，例如：”张三 + 上海交大 + 视觉SLAM“。请按照格式备注，否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告，否则会请出群，谢谢理解~

你可能感兴趣的:(python,计算机视觉,人工智能,opencv,机器学习)

【详细解析！】Python语法基础小新在学习 python python 开发语言
python基础语法1.优先级：在运算代码的时候，我们优先级是先乘除后加减注意：1.1：在python中，2/3=0.666666而不是0；在python里面的相除就是数学意义上的相除1.2：某一个结果为1.666666666665，而不是667，是因为我们在编程里面是一般是没有四舍五入的概念的；这个结果我们在代码里面称之为浮点数.IEE745标准，在这套规则下，我们在内存中表示浮点数的时候，可能
信而泰×DeepSeek：AI推理引擎驱动网络智能诊断迈向 “自愈”时代
DeepSeek-R1：强大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基础技术研究有限公司开发的新一代AI大模型。其核心优势在于强大的推理引擎能力，融合了自然语言处理（NLP）、深度学习、大规模数据分析等前沿技术。DeepSeek-R1具备卓越的逻辑推理、多模态分析（文本/图像/语音）和实时交互能力，能够高效处理代码生成、复杂问题求解、跨模态学习等高阶任务。凭借其开源、高效、多模态
NLP论文速读|chameleon：一个即插即用的组合推理模块Plug-and-Play Compositional Reasoning with Large Language Models Power2024666 NLP论文速读自然语言处理人工智能机器学习深度学习 nlp 语言模型
论文速读|Chameleon:Plug-and-PlayCompositionalReasoningwithLargeLanguageModels论文信息：简介:该论文介绍了一个名为Chameleon的人工智能系统，旨在解决大型语言模型（LLMs）在处理复杂推理任务时存在的固有限制，例如无法访问最新信息、使用外部工具以及执行精确的数学和逻辑推理。Chameleon通过插入即用模块增强LLMs，使其
AI深度噪音抑制技术
这两年人工智能快速发展，AI已经渗透到了各行各业。在噪音抑制技术领域，AI也同样发挥了巨大的作用。AI深度噪音抑制技术是一种利用人工智能和深度学习算法来动态处理和减少音频信号中的噪声，从而提升音频的清晰度和质量。与传统的噪音抑制技术相比，AI深度噪音抑制能够更智能、更精准地分辨出背景噪音与有用的语音或音乐信号，尤其在复杂、多样的环境下表现尤为出色。1.工作原理AI深度噪音抑制技术基于深度神经网络（
Python 大数据分析（二）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/5058e6970bd2a8d818ecc1f7f8fef74a译者：飞龙协议：CCBY-NC-SA4.0第六章：第五章处理缺失值和相关性分析学习目标到本章结束时，你将能够：使用PySpark检测和处理数据中的缺失值描述变量之间的相关性计算PySpark中两个或多个变量之间的相关性使用PySpark创建相关矩阵在本章中，我们将使用Iris数据集处理
Python机器学习：从零基础到项目实战 Yuner2000 Python 机器学习人工智能
目录第一部分：思想与基石——万法归宗，筑基问道第1章：初探智慧之境——机器学习世界观1.1何为学习？从人类学习到机器智能1.2机器学习的“前世今生”：一部思想与技术的演进史1.3为何是Python？——数据科学的“通用语”1.4破除迷思：AI是“神”还是“器”？第2章：工欲善其事——Python环境与核心工具链2.1“乾坤在握”：Anaconda与JupyterNotebook的安装与配置2.2“
python里class转换_python实现class对象转换成json/字典的方法八决子 python里class转换
python实现class对象转换成json/字典的方法发布于2016-03-2808:05:44|153次阅读|评论:0|来源:网友投递Python编程语言Python是一种面向对象、解释型计算机程序设计语言，由GuidovanRossum于1989年底发明，第一个公开发行版发行于1991年。Python语法简洁而清晰，具有丰富和强大的类库。它常被昵称为胶水语言，它能够把用其他语言制作的各种模块
数据集标准化:软件2.0的基石工程 AI大模型应用之禅 java python javascript kotlin golang 架构人工智能
数据集标准化,软件工程,数据质量,机器学习,人工智能,数据治理,数据可信度1.背景介绍在当今数据爆炸的时代，数据已成为企业和组织的核心资产。然而，海量的原始数据往往杂乱无章，格式不统一，质量参差不齐，这严重阻碍了数据价值的挖掘和应用。数据标准化作为解决这一问题的关键技术，已成为软件2.0时代不可或缺的基石工程。软件2.0时代，人工智能、机器学习等技术蓬勃发展，对数据质量提出了更高的要求。传统的软件
李开复：AI 2.0 时代的意义 AI大模型应用之禅 java python javascript kotlin golang 架构人工智能
人工智能，深度学习，Transformer，大模型，通用人工智能，AI2.0，伦理问题，未来趋势1.背景介绍人工智能（AI）技术近年来发展迅速，从最初的局限于特定领域的应用，逐渐发展到能够处理更复杂的任务，甚至展现出一些类似人类智能的能力。2010年以来，深度学习技术的兴起，特别是Transformer模型的出现，为AI发展带来了新的突破。这些模型能够处理海量数据，学习复杂的模式，并在自然语言处理
解密 Python 的 MRO：C3 线性化如何优雅解决多重继承的菱形难题》
《解密Python的MRO：C3线性化如何优雅解决多重继承的菱形难题》引言：继承的优雅与复杂在Python的面向对象编程中，继承是一种强大的机制，它让我们能够复用代码、构建抽象层次、实现多态行为。然而，当我们引入多重继承时，继承体系的复杂性也随之而来，尤其是著名的“菱形继承问题”。Python通过一种称为C3线性化（C3Linearization）的算法来解决方法解析顺序（MethodResolu
《深入理解 Python 的对象构造机制：__new__ 与 __init__ 的本质区别与实战应用》清水白石008 开发语言学习笔记课程教程 python 开发语言
《深入理解Python的对象构造机制：new与init的本质区别与实战应用》引言：对象的诞生之谜在Python的面向对象编程中，我们习惯于使用__init__方法来初始化对象。但你是否曾注意到，还有一个鲜为人知却至关重要的魔法方法——__new__？它是对象构造过程的起点，掌控着类实例的真正创建。理解__new__与__init__的区别，不仅能帮助你掌握Python的对象模型，还能在构建不可变类
系统学习图像算法Day.9——OpenCV学习——形态学滤波敏而好学无止境 OpenCV学习图像算法
形态学滤波定义：在我们图像处理中的形态学，往往指的时数学形态学——是一门建立在格论和拓扑学基础上的图像分析学科。形态学基本操作：膨胀、腐蚀膨胀dilate介绍：膨胀就是求局部最大值的操作。从数学角度讲，膨胀就是讲图像与核进行卷积。核与图像卷积，即计算核覆盖的区域的像素点的最大值，并把这个最大值赋值给参考点指定的像素。这样会使图像中的高亮区域逐渐增长。函数调用举例：Matimage=imread("
OpenCV Mat UMat GpuMat Matx HostMem InputArray等设计哲学我是李武涯 opencv 人工智能计算机视觉 c++
一、概览：GpuMat对应于cuda；HostMem可以看作是一种特殊的Mat，其存储对应cuda在主机分配的锁页内存，可以不经显示downloadupload自动转变成GpuMat（但是和GpuMat并无继承关系）；UMat对应于opencl的存储Matx指代常量Mat，编译时即确定：InputArray则是一种代理模式。注意，InputAray和MatUMatGpuMatMatx等无继承关系！
Day9: OpenCV学习（一）—— 图像基础
系列文章目录上一篇：Day8：Python工程化——模块、包文章目录系列文章目录前言一、安装和导入1.安装二、图像认识1.图像2.图像分类三、基础图像操作1.图像读取2.图像显示3.图像裁剪4.图形尺寸修改5.图像保存6.图像绘制7.视频捕获即显示总结前言OpenCV（OpenSourceComputerVisionLibrary）是一个开源的计算机视觉和机器学习软件库。由一系列C++类和函数构成
python基础语法复习04——函数洛华363 python python
python基础语法目录python基础语法01——基本类型python基础语法02——复合类型python基础语法03——语句构成文章目录python基础语法目录一、初识函数1.定义2.调用二、函数的传参1.位置传参2.关键词传参3.参数默认值4.可变位置参数5.可变关键词参数6.参数解包7.值传递与引用传递总结一、初识函数函数是Python中可重复使用的代码块，用于执行特定任务。通过将代码封装
ubuntu18.04安装geemap 阿西是有梦想的咸鱼 python编程之路遥感影像处理可视化可视化 python ubuntu
文章目录安装测试GEE提供了JavaScript和PythonAPI，可以向EarthEngine服务器发出计算请求。与GEEJavaScriptAPI相比，PythonAPI缺乏易于理解的操作文档和交互式可视化结果的功能。由此，geemap诞生并填补了这一空白[1]。这里给大家介绍下我折腾了一晚上才搞定的geemap的安装及测试过程。这里是geemap的GitHub参考链接。安装如Github中
python进行geeMap环境安装箭梭_ python
近期需要利用geemap搭建一个界面，试了一下相应环境的配置，踏了挺多坑，下面我给大家具体介绍一下geemap的环境搭建：（1）geemap是基于googleearthengine的接口进行开发的，在安装geemap之前，需要先进行earthengie包的安装，参考链接如下：https://zhuanlan.zhihu.com/p/29186942#comment-549701602?notifi
API开发全攻略：从入门到精通的企业级API架构与实战 Android洋芋架构 API设计 RESTful API 微服务架构实战案例
简介API开发已成为现代软件架构的核心能力，掌握API设计与实现技术能显著提升开发效率和系统可扩展性。本文将从零开始，全面解析API的基础概念、架构设计、安全认证、性能优化等关键技术点，并提供完整的Python和Go语言代码实战示例，帮助开发者构建高性能、可扩展的企业级API系统。本文旨在为初学者和进阶开发者提供一份全面的API开发指南。内容涵盖API的基础概念、类型分类、架构设计、安全认证、性能
【OpenCV+Cpp】day04图像混合
【OpenCV+Cpp】day04图像混合文章目录【OpenCV+Cpp】day04图像混合前言一、理论——线性混合操作二、相关API三、代码演示前言继续记录C++图像处理的学习过程，学习课件参考B站OpenCV_C++图像处理课程。OpenCV_C++图像处理课程本文分为理论、相关API和代码实现部分。一、理论——线性混合操作图像的线性混合即将两张图像以线性方式混合为一张图像，具体公式如下。以上
2023年NOC大赛创客智慧编程赛项Python 复赛模拟题（二）青少儿编程课堂少儿编程资料大全付费专栏 python numpy 开发语言 noc大赛真题 noc试题
题目来自：NOC大赛创客智慧编程赛项Python复赛模拟题(二)NOC大赛创客智慧编程赛项Python复赛模拟题（二）第一题：编写一个成绩评价系统，当输入语文、数学和英语三门课程成绩时，输出三门课程总成绩及其等级。(1)程序提示用户输入三个数字，数字分别表示语文、数学、英语分数，对应的变量名称是Chinese、Math、English,并计算三个分数的和(score)进行输出。注：input()函
【RS】GEE(Python)：大规模分析与导出数据
在前面的章节中，我们探讨了如何在GoogleEarthEngine(GEE)上进行数据加载、处理、分析和可视化。现在，我们将进一步扩展，探索如何处理大规模的数据集和执行复杂的分析任务。通过GEE的云计算能力，用户可以在全球范围内执行大规模的时空分析，并高效地将处理结果导出为所需的格式。大规模分析的基本原则在GEE中，大规模分析是通过ImageCollection和FeatureCollection
【Python篇】Python基础——08day.面向对象编程中类和对象的基本概念及属性和方法的常见分类和使用场景 WXX_s python基础篇 python 分类开发语言学习
目录前言一、类和对象1.类→Class1.1概念1.2创建2.对象→Object2.1概念2.2创建二、属性和方法1.实例属性2.实例方法3.类属性4.类方法5.静态方法5.1综合应用6.构造方法7.初始化方法8.魔术方法8.1常用方法8.2案例参考总结前言这章讲的面向对象编程（Object-OrientedProgramming，简称OOP）是一种通过组织对象来设计程序的编程方法。为什么需要类和
【Python篇】Python基础——04day.Python中运算（简单部分，如果会的可以直接跳过）
文章目录前言一.运算符1.1算术运算符1.2比较运算符1.3逻辑运算符1.4赋值运算符1.5位运算符1.6身份运算符1.7成员运算符1.8三目运算符1.9优先级二.表达式2.1算术表达式2.2比较表达式2.3逻辑表达式2.4赋值表达式2.5成员表达式2.6身份表达式2.7三元表达式2.8函数调用表达式三.推导式3.1列表推导式3.2字典推导式3.3集合推导式总结前言这一章写的是在python中会用
Python 现代时间序列预测第二版（五）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/22eab741fce9c15dfad894ecf37bdd51译者：飞龙协议：CCBY-NC-SA4.0第十七章：概率预测及更多在整本书中，我们学习了生成预测的不同技术，包括一些经典方法，使用机器学习以及一些深度学习架构。但我们一直在关注一种典型的预测问题——为连续时间序列生成点预测，并且没有层级关系且历史数据足够丰富。我们之所以这样做，是因为这
自动化测试中，测试数据如何管理？鱼鱼说测试 java linux 服务器
今晚在某个测试群，看到有人问了一个问题：把测试数据放配置文件读取和放文件通过函数调用读取有什么区别？Python接口自动化测试零基础入门到精通（2025最新版）当时我下意识的这么回答：数据量越大，配置文件越臃肿，放在专门的数据文件（比如excel，csv），方便针对性的维护。乍看没毛病，但回头和人讨论这个问题的时候，就认真思考了一下这个问题，下面是我的一些思考和讨论的一些结果，仅供参考。。。自动化
基于selenium的pyse自动化测试框架鱼鱼说测试 selenium 测试工具
Python接口自动化测试零基础入门到精通（2025最新版）介绍：pyse基于selenium（webdriver）进行了简单的二次封装，比selenium所提供的方法操作更简洁。特点：默认使用CSS定位，同时支持多种定位方法（id\name\class\link_text\xpath\css）。本框架只是对selenium（webdriver）原生方法进行了简单的封装，精简为大约30个方法，这些
自动化测试准备鱼鱼说测试自动化测试
什么是自动化测？Python接口自动化测试零基础入门到精通（2025最新版）首先理清自动化测试的概念，广义上来讲，自动化包括一切通过工具（程序）的方式来代替或辅助手工测试的行为都可以看做自动化，包括性能测试工具（loadrunner、jmeter）,或自己所写的一段程序，用于生成1到100个测试数据。狭义上来讲，通工具记录或编写脚本的方式模拟手工测试的过程，通过回放或运行脚本来执行测试用例，从而代
重塑未来：AI如何重新定义全栈开发熊猫钓鱼>_> 人工智能
在传统认知中，全栈开发者被誉为技术界的“全能选手”。——他们需要精通前端界面构建（HTML/CSS/JavaScript）、后端业务逻辑实现（Python/Java/Node.js）、数据库设计优化（MySQL/MongoDB）以及服务器部署运维（Linux/Docker）。这种“一人包打天下”的能力模型长期被视为高效开发的黄金标准，尤其受到创业公司和小型团队的青睐，因为它能大幅减少沟通成本，加速
ChatGPT 之后的下一步是什么？四个迫在眉睫的进步 iCloudEnd
OpenAI的文本生成器ChatGPT进入公共领域已经两个半月了，该机器人令人印象深刻且深思熟虑的答案已经引起了1300万日常用户的注意，他们已经将其用于一般问题、开发想法和写作全长文章。尽管ChatGPT存在重大缺陷（例如一些事实不准确），但许多人担心这可能对劳动力、学校、新闻业等产生影响。然而，我们可能正处于一场巨大的人工智能革命的开端。OpenAI总裁兼联合创始人GregBrockman于1
OpenCV直线段检测算法类cv::line_descriptor::LSDDetector 村北头的码农 OpenCV opencv 算法人工智能
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述该类用于实现LSD(LineSegmentDetector)直线段检测算法。LSD是一种快速、准确的直线检测方法，能够在不依赖边缘检测的前提下直接从图像中提取出直线段。它是OpenCV的line_descriptor模块的一部分，常用于计算机视觉任务如图像拼接、S
java线程Thread和Runnable区别和联系 zx_code java jvm thread 多线程 Runnable
我们都晓得java实现线程2种方式，一个是继承Thread，另一个是实现Runnable。模拟窗口买票，第一例子继承thread，代码如下 package thread; public class ThreadTest { public static void main(String[] args) { Thread1 t1 = new Thread1(
【转】JSON与XML的区别比较丁_新 json xml
1.定义介绍 (1).XML定义扩展标记语言 (Extensible Markup Language, XML) ，用于标记电子文件使其具有结构性的标记语言，可以用来标记数据、定义数据类型，是一种允许用户对自己的标记语言进行定义的源语言。 XML使用DTD(document type definition)文档类型定义来组织数据;格式统一，跨平台和语言，早已成为业界公认的标准。 XML是标
c++ 实现五种基础的排序算法 CrazyMizzz C++c 算法
#include<iostream> using namespace std; //辅助函数，交换两数之值 template<class T> void mySwap(T &x, T &y){ T temp = x; x = y; y = temp; } const int size = 10; //一、用直接插入排
我的软件麦田的设计者我的软件音乐类娱乐放松
这是我写的一款app软件，耗时三个月，是一个根据央视节目开门大吉改变的，提供音调，猜歌曲名。1、手机拥有者在android手机市场下载本APP，同意权限，安装到手机上。2、游客初次进入时会有引导页面提醒用户注册。（同时软件自动播放背景音乐）。3、用户登录到主页后，会有五个模块。a、点击不胫而走，用户得到开门大吉首页部分新闻，点击进入有新闻详情。b、
linux awk命令详解被触发 linux awk
awk是行处理器: 相比较屏幕处理的优点，在处理庞大文件时不会出现内存溢出或是处理缓慢的问题，通常用来格式化文本信息 awk处理过程: 依次对每一行进行处理，然后输出 awk命令形式: awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END{}’ file [-F|-f|-v]大参数，-F指定分隔符，-f调用脚本，-v定义变量 var=val
各种语言比较 _wy_ 编程语言
Java Ruby PHP 擅长领域
oracle 中数据类型为clob的编辑知了ing oracle clob
public void updateKpiStatus(String kpiStatus,String taskId){ Connection dbc=null; Statement stmt=null; PreparedStatement ps=null; try { dbc = new DBConn().getNewConnection(); //stmt = db
分布式服务框架 Zookeeper -- 管理分布式环境中的数据矮蛋蛋 zookeeper
原文地址： http://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/ 安装和配置详解本文介绍的 Zookeeper 是以 3.2.2 这个稳定版本为基础，最新的版本可以通过官网 http://hadoop.apache.org/zookeeper/来获取，Zookeeper 的安装非常简单，下面将从单机模式和集群模式两
tomcat数据源 alafqq tomcat
数据库 JNDI(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。没有使用JNDI时我用要这样连接数据库： 03. Class.forName("com.mysql.jdbc.Driver"); 04. conn
遍历的方法百合不是茶遍历
遍历在java的泛
linux查看硬件信息的命令 bijian1013 linux
linux查看硬件信息的命令一.查看CPU： cat /proc/cpuinfo 二.查看内存： free 三.查看硬盘： df linux下查看硬件信息 1、lspci 列出所有PCI 设备； lspci - list all PCI devices:列出机器中的PCI设备（声卡、显卡、Modem、网卡、USB、主板集成设备也能
java常见的ClassNotFoundException bijian1013 java
1.java.lang.ClassNotFoundException: org.apache.commons.logging.LogFactory 添加包common-logging.jar2.java.lang.ClassNotFoundException: javax.transaction.Synchronization
【Gson五】日期对象的序列化和反序列化 bit1129 反序列化
对日期类型的数据进行序列化和反序列化时，需要考虑如下问题： 1. 序列化时，Date对象序列化的字符串日期格式如何 2. 反序列化时，把日期字符串序列化为Date对象，也需要考虑日期格式问题 3. Date A -> str -> Date B,A和B对象是否equals 默认序列化和反序列化 import com
【Spark八十六】Spark Streaming之DStream vs. InputDStream bit1129 Stream
1. DStream的类说明文档： /** * A Discretized Stream (DStream), the basic abstraction in Spark Streaming, is a continuous * sequence of RDDs (of the same type) representing a continuous st
通过nginx获取header信息 ronin47 nginx header
1. 提取整个的Cookies内容到一个变量，然后可以在需要时引用，比如记录到日志里面， if ( $http_cookie ~* "(.*)$") { set $all_cookie $1; } 变量$all_cookie就获得了cookie的值，可以用于运算了
java-65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 bylijinnan java
参考了网上的http://blog.csdn.net/peasking_dd/article/details/6342984 写了个java版的： public class Print_1_To_NDigit { /** * Q65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 * 1.使用字符串
Netty源码学习-ReplayingDecoder bylijinnan java netty
ReplayingDecoder是FrameDecoder的子类，不熟悉FrameDecoder的，可以先看看 http://bylijinnan.iteye.com/blog/1982618 API说，ReplayingDecoder简化了操作，比如： FrameDecoder在decode时，需要判断数据是否接收完全： public class IntegerH
js特殊字符过滤 cngolon js特殊字符 js特殊字符过滤
1.js中用正则表达式过滤特殊字符, 校验所有输入域是否含有特殊符号function stripscript(s) { var pattern = new RegExp("[`~!@#$^&*()=|{}':;',\\[\\].<>/?~！@#￥……&*（）——|{}【】‘；：”“'。，、？]"
hibernate使用sql查询 ctrain Hibernate
import java.util.Iterator; import java.util.List; import java.util.Map; import org.hibernate.Hibernate; import org.hibernate.SQLQuery; import org.hibernate.Session; import org.hibernate.Transa
linux shell脚本中切换用户执行命令方法 daizj linux shell 命令切换用户
经常在写shell脚本时，会碰到要以另外一个用户来执行相关命令，其方法简单记下： 1、执行单个命令：su - user -c "command" 如：下面命令是以test用户在/data目录下创建test123目录 [root@slave19 /data]# su - test -c "mkdir /data/test123"
好的代码里只要一个 return 语句 dcj3sjt126com return
别再这样写了：public boolean foo() { if (true) { return true; } else { return false;
Android动画效果学习 dcj3sjt126com android
1、透明动画效果方法一：代码实现 public View onCreateView(LayoutInflater inflater, ViewGroup container, Bundle savedInstanceState) { View rootView = inflater.inflate(R.layout.fragment_main, container, fals
linux复习笔记之bash shell (4)管道命令 eksliang linux管道命令汇总 linux管道命令 linux常用管道命令
转载请出自出处： http://eksliang.iteye.com/blog/2105461 bash命令执行的完毕以后，通常这个命令都会有返回结果，怎么对这个返回的结果做一些操作呢？那就得用管道命令‘|’。上面那段话，简单说了下管道命令的作用，那什么事管道命令呢？答：非常的经典的一句话，记住了，何为管
Android系统中自定义按键的短按、双击、长按事件 gqdy365 android
在项目中碰到这样的问题：由于系统中的按键在底层做了重新定义或者新增了按键，此时需要在APP层对按键事件（keyevent）做分解处理，模拟Android系统做法，把keyevent分解成： 1、单击事件：就是普通key的单击； 2、双击事件：500ms内同一按键单击两次； 3、长按事件：同一按键长按超过1000ms（系统中长按事件为500ms）； 4、组合按键：两个以上按键同时按住；
asp.net获取站点根目录下子目录的名称 hvt .net C#asp.net hovertree Web Forms
使用Visual Studio建立一个.aspx文件(Web Forms)，例如hovertree.aspx,在页面上加入一个ListBox代码如下： <asp:ListBox runat="server" ID="lbKeleyiFolder" /> 那么在页面上显示根目录子文件夹的代码如下： string[] m_sub
Eclipse程序员要掌握的常用快捷键 justjavac java eclipse 快捷键 ide
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。写道程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可
c++编程随记 lx.asymmetric C++笔记
为了字体更好看，改变了格式…… &&运算符： #include<iostream> using namespace std; int main(){ int a=-1,b=4,k; k=(++a<0)&&!(b--
linux标准IO缓冲机制研究音频数据 linux
一、什么是缓存I/O(Buffered I/O)缓存I/O又被称作标准I/O,大多数文件系统默认I/O操作都是缓存I/O。在Linux的缓存I/O机制中，操作系统会将I/O的数据缓存在文件系统的页缓存(page cache)中，也就是说，数据会先被拷贝到操作系统内核的缓冲区中，然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。1.缓存I/O有以下优点:A.缓存I/O使用了操作系统内核缓冲区，
随想生活暗黑小菠萝生活
其实账户之前就申请了，但是决定要自己更新一些东西看也是最近。从毕业到现在已经一年了。没有进步是假的，但是有多大的进步可能只有我自己知道。毕业的时候班里12个女生，真正最后做到软件开发的只要两个包括我，PS：我不是说测试不好。当时因为考研完全放弃找工作，考研失败，我想这只是我的借口。那个时候才想到为什么大学的时候不能好好的学习技术，增强自己的实战能力，以至于后来找工作比较费劲。我
我认为POJO是一个错误的概念 windshome java POJO 编程 J2EE 设计
这篇内容其实没有经过太多的深思熟虑，只是个人一时的感觉。从个人风格上来讲，我倾向简单质朴的设计开发理念；从方法论上，我更加倾向自顶向下的设计；从做事情的目标上来看，我追求质量优先，更愿意使用较为保守和稳妥的理念和方法。 &