woshicver

使用Python进行立体几何和立体校正的综合教程

需要多个视图

在相机的针孔模型中，光线从物体上反射出来，照射到胶片上形成图像。因此，沿着同一条光线的所有点都将对应于图像中的一个点。

因此，给定图像中的一个点，不可能确定其在世界上的准确位置，也就是说，我们无法从单个图像中恢复深度。

我们也无法从图像中恢复结构。这方面的一个例子是影子艺术，艺术家用手势制作美丽的影子。我们不可能只通过看阴影就对手势做出任何评价。

在本文中，我们将学习如何使用两个视图来处理这种歧义。

极地约束

假设我给你两张从不同角度拍摄的图像。我在其中一张图片中显示一个点，并要求你在另一张图片上找到它。你会怎么做？这里有一个想法：你可以在图像中的点周围画一个小补丁，然后在另一张图像上滑动，看看它最匹配的地方。

然而，一旦你看了几何图形，你就会意识到你不需要扫描整个图像，因为点必然位于一条线上，如下图所示。

直觉是，在现实世界中，点可以位于连接其投影和相机中心的线上的任何位置。所以我们可以推断，这一点在另一幅图像中的投影可以位于投影线上的任何位置。这条投影线称为外极线。所以现在我们的搜索空间缩小到这一行。这称为极线约束。

在本文中，我们将讨论如何用代数方法求解外极线。在此之前，让我们熟悉对极几何中的关键定义。

关键术语

基线：连接两个相机中心的线。
极线：投影点所在的线。极线成对出现，每一条都代表一幅图像。
极面：包含基线和世界上一点的平面。极面在图像平面的外极线处与图像平面相交。
极点：基线与图像平面相交的点。对应于不同点的所有外极线在极点相交。为什么？我们看到极面在外极线处与图像平面相交。现在，对应于不同点的每个极面都有共同的基线。由于极点是基线与图像平面相交的地方，这意味着所有外极线都将以极点为公共点。换句话说，所有的外极线都在极点处相交。此外，极点不必位于图像内，它可以位于扩展图像平面上。

相机矩阵

在本节中，我们将回顾我们将要使用的同质坐标和相机矩阵。如果你已经熟悉它们，或者你已经阅读了我以前关于相机校准的文章，你可以跳过这一节。

同质坐标

考虑点（u，v）。为了以其齐次形式表示它，我们简单地添加了另一个维度：（u，v，1）。这种表示的原因是因为平移和透视投影在齐次空间中成为线性操作；也就是说，它们可以通过矩阵乘法一次性计算出来。我们将在本文的后面部分详细讨论齐次变换矩阵。

齐次坐标的一个关键特性是它们是尺度不变的；意思是，（kx，ky，k）和（x，y，1）表示相同的点，其中k≠0和k∈ R、要从齐次表示转换为欧几里得表示，我们只需除以最后一个坐标，如下所示：

如果你想一想，从原点到点[x，y，1]的直线也有形式k[x，y，1]。所以我们可以说，图像空间中的一点表示为均匀空间中的光线。

线的齐次表示：考虑熟悉的方程ax+by+c=0。我们知道它表示通过点（x，y）的线的方程。现在，这个方程也可以表示为l⊺p=0，其中l为（a，b，c），l⊺ 是l的转置，p是（x，y，1）。p本质上是点（x，y）的齐次表示。

现在，l是标度不变的，因为方程l⊺如果与常数相乘，p=0不会改变。因此，我们可以说l是直线的齐次表示。

总之，给定齐次点p，方程l⊺p=0（或p⊺l=0）表示p位于l线上。记住这一点，我们将在讨论基本矩阵时重新讨论它。

外参矩阵

相机外参矩阵是将点的坐标从世界坐标系转换为相机坐标系的基矩阵的变化。它让我们从相机的角度看世界。它是旋转矩阵和平移矩阵的组合-旋转矩阵确定相机的方向，平移矩阵移动相机。方程式可以表示为：

这里的符号如下：

摄像机内参矩阵

一旦我们使用相机外参矩阵获得相机点的坐标，下一步就是将它们投影到相机的图像平面上，以形成图像。这是相机内参矩阵的工作。

相机内参矩阵在我的另一篇文章中进行了深入讨论，但总而言之，相机内参矩阵将相机坐标给定的点投影到相机的图像平面上。它基本上编码了相机胶片的属性。方程式如下：

符号为：

图像形成管道

因此，给定世界上的一个点和一个相机，我们以其齐次形式表示该点，并与外参矩阵相乘，以获得相机帧的坐标。然后我们与内参矩阵相乘，得6到其在相机像平面上的投影。最后，我们转换回欧几里得坐标，以获得点在图像中的像素位置。这是图像形成管道，如下所示：

基本矩阵

好了，我们现在讨论立体几何的基础——基本矩阵。让我们推导它，看看它做了什么。

考虑一个校准的系统，我们知道两个相机的相对位置和方向。让摄像机中心表示为Oc和Oc′。让X成为世界上的一个点。让我们将X在相机Oc的坐标表示为Xc，将在相机Oc′的坐标表示为Xc′。设Rc和Tc是基矩阵从Oc到Oc′的旋转和平移变化。这意味着给定X 在Oc的坐标，我们可以找到它们在Oc'的坐标为：

叉积矩阵

让我们绕开一小段，讨论向量叉积。两个向量a，b的叉积将是垂直于它们的向量，由a×b = [-a3b2 + a2b3, a3b1-a1b3, -a2b1 + a1b2]表示，其中a=[a1，a2，a3]和b=[b1，b2，b3]。

我们可以将其以矩阵形式表示为：

这种矩阵形式的叉积表示为[a×]b，其中[a×]是3×3矩阵，b是3×1向量。

现在，向量与自身的叉积为零。a×a＝[a×]a＝0。所以我们可以说[a×]是秩为2的斜对称矩阵。

回到我们的方程式：

同时乘以向量Tc，我们得到：

Tc×Tc=0。接下来，我们取两边的点积：

现在，向量 ×Xc′垂直于Xc′。因此，Xc′.( ×Xc′）=0。

现在，Tc和RcXc都是三维向量。因此，我们可以将它们的叉积表示为矩阵形式：

最后，我们可以将方程表示为：

矩阵E称为基本矩阵，它将两个不同相机帧的点的坐标关联起来。

寻找外极线

现在，我们如何使用基本矩阵找到外极线？让我们更深入地看看这个方程式。

这里Xc是点X相对于相机帧Oc 的坐标。这意味着我们可以将连接X和Oc的线上的任何点表示为Xc其中是一个常数。现在，如果我们将Xc替换为方程中的Xc，它仍然满足。

类似地，我们可以用Xc′其中是常数，方程保持不变。

因此，我们可以说，基本矩阵方程由任意两点满足，这两点位于连接该点及其各自相机中心的投影射线上，其中点的坐标由其相机帧表示。

让x和xc′是X点在摄像机Oc和O′ 的像平面上的投影. 它们必须满足基本矩阵方程，因为它们位于投影射线上。所以我们可以写：

现在xc是3×1向量，E是3×3矩阵，所以它们的乘积将是3×1的向量。让我们用l表示：

这个方程式你应该很熟悉。如前一节所述，该方程表示齐次点xc′位于直线l上。我们可以说，l是对应于点xc的外极线，而xc′则位于该直线上。这是极线约束的数学形式。

类似地，如上式所示，l′是对应于点xc′的外极线，xc位于该线上。

因此，给定一个点在一个视图中的投影，我们将其与基本矩阵相乘，以获得另一个视图中点的投影所在的外极线。

这在实践中实现起来有点棘手。

Python示例

这是本节的代码示例：

依赖

%matplotlib widget

import matplotlib.pyplot as plt
from utils import *
from stereo_utils import *

定义相机配置

首先，我们设置一个环境，其中有一个世界点和两个相机以一个角度面对该点

# define parameters for the image plane
f = 2
img_size = (5, 5)

# Define camera 1 configuration

# rotate the camera first at an angle of 90 along the Y axis, then rotate it
# at an angle of 30 along the negative Z-axis
angles = [np.pi/2, -np.pi/6]
order = 'yz'

# translate the camera by an offset
offset1 = np.array([0, -10, 0])

# create rotation transformation matrix
R1 = create_rotation_transformation_matrix(angles, order)
R1_ = np.identity(4)
R1_[:3, :3] = R1

# create translation transformation matrix
T1_ = create_translation_matrix(offset1)

# Define camera 2 configuration and repeat the same steps

angles = [np.pi/2, np.pi/6]
order = 'yz'
offset2 = np.array([0, 10, 0])

R2 = create_rotation_transformation_matrix(angles, order)
R2_ = np.identity(4)
R2_[:3, :3] = R2
T2_ = create_translation_matrix(offset2)

绘制环境

打印整个设置，包括相机、世界点、相机的图像平面和交点。

# define a world point
point = np.array([[-6, 5, 2]])

# create and transform camera 1
xx1, yy1, Z1 = create_image_grid(f, img_size)
pt1_h = convert_grid_to_homogeneous(xx1, yy1, Z1, img_size)
pt1_h_transformed = T1_ @ R1_ @ pt1_h
xxt1, yyt1, Zt1 = convert_homogeneous_to_grid(pt1_h_transformed, img_size)

# create and transform camera 2
xx2, yy2, Z2 = create_image_grid(f, img_size)
pt2_h = convert_grid_to_homogeneous(xx2, yy2, Z2, img_size)
pt2_h_transformed = T2_ @ R2_ @ pt2_h
xxt2, yyt2, Zt2 = convert_homogeneous_to_grid(pt2_h_transformed, img_size)

# define axis and figure
fig = plt.figure(figsize=(8, 6))
ax = fig.add_subplot(111,projection='3d')

# set limits
ax.set(xlim=(-10, 5), ylim=(-15, 15), zlim=(-3, 10))

# plot both the camera centers
ax = pr.plot_basis(ax, R1, offset1, label="camera 1")
ax = pr.plot_basis(ax, R2, offset2, label="camera 2")

# plot both the image planes
ax.plot_surface(xxt1, yyt1, Zt1, alpha=0.75)
ax.plot_surface(xxt2, yyt2, Zt2, alpha=0.75)

# plot baseline
ax.plot(*make_line(offset1, offset2), color="red", alpha=0.5, label="baseline")

# plot the world point
ax.scatter(*point[0], color="black")
ax.plot(*make_line(point, offset1), color="purple", alpha=0.25)
ax.plot(*make_line(point, offset2), color="purple", alpha=0.25)

# intersection points (manually computed with trial and error)
c1_intn_world = offset1 + (point[0] - offset1) * 0.16
ax.scatter(*c1_intn_world, color="green")
c2_intn_world = offset2 + (point[0] - offset2) * 0.26
ax.scatter(*c2_intn_world, color="green")

ax.set_title("stereo geometry")
ax.set_xlabel("X-axis")
ax.set_ylabel("Y-axis")
ax.set_zlabel("Z-axis")

plt.legend()

计算摄像机上点的投影

# create a simple camera intrinsic matrix with focal length f 
# and use it for both the cameras
K = compute_intrinsic_parameter_matrix(f, 0, 1, 0, 0)

# create the projection matrix and compute the projection of the world point for both the cameras

# compute projection for camera 1
E1 = np.linalg.inv(T1_ @ R1_)
E1_ = E1[:-1, :]
M1 = K @ E1_

proj_point1 = compute_world2img_projection(point.reshape(3, -1), M1, is_homogeneous=False)

# compute projection for camera 2
E2 = np.linalg.inv(T2_ @ R2_)
E2_ = E2[:-1, :]
M2 = K @ E2_

proj_point2 = compute_world2img_projection(point.reshape(3, -1), M2, is_homogeneous=False)

绘制两个相机的点投影

h, w = img_size
nrows = 1
ncols = 2

fig, axes = plt.subplots(nrows=nrows, ncols=ncols, figsize=(6, 4))

# plot projection for camera 1
ax1 = axes[0]
ax1.set(xlim = (-(h // 2), w // 2), ylim = (-(h // 2), w // 2))
ax1.set_title("Camera 1")
ax1.scatter(*proj_point1.reshape(-1))

# plot projection for camera 2
ax2 = axes[1]
ax2.set(xlim = (-(h // 2), w // 2), ylim = (-(h // 2), w // 2))
ax2.set_title("Camera 2")
ax2.scatter(*proj_point2.reshape(-1))

plt.tight_layout()

基本矩阵

# convert the world point to homogeneous coords
point_hg = to_hg_coords(point.T)

计算两台摄像机的世界点坐标

point_c1 = E1_ @ point_hg # coordinates of the point wrt camera 1
print("coordinates of the point wrt camera 1:", "\n", point_c1, "\n")
point_c2 = E2_ @ point_hg # coordinates of the point wrt camera 2
print("coordinates of the point wrt camera 2:", "\n", point_c2)

coordinates of the point wrt camera 1: 
 [[ 2.        ]
 [ 9.99038106]
 [12.69615242]] 

coordinates of the point wrt camera 2: 
 [[ 2.        ]
 [-1.33012702]
 [ 7.69615242]]

得到从摄像机1到摄像机2的基矩阵的变化

# compute change of basis matrix from camera 1 to camera 2
Ec = (E2 @ np.linalg.inv(E1))[:-1, :]

# extract rotation and translation matrix from the change of basis matrix
Rc = Ec[:, :-1]
Tc = Ec[:, -1]

# validate the rotation and transalation change of basis matrices
is_vectors_close(point_c2.reshape(-1), Rc @ point_c1.reshape(-1) + Tc)

# compute essential matrix
Tm = get_cross_product_matrix(Tc)
essential_matrix = Tm @ Rc

# validating the essential matrix equation
np.round(point_c2.T @ essential_matrix @ point_c1)[0][0]

-0.0

# check p2.T @ E @ p1 = 0 
is_vectors_close(point_c2.T @ essential_matrix @ point_c1, np.array([[0]]))

# convert the intersection points' coordinates from world system to camera system

# convert the intersection points to homogeneous coordinates
c1_intn_world_hg = to_hg_coords(np.expand_dims(c1_intn_world, axis=1))
c2_intn_world_hg = to_hg_coords(np.expand_dims(c2_intn_world, axis=1))

# compute the coordinates of the intersection points wrt the camera
c1_intn_hg = E1 @ c1_intn_world_hg
c2_intn_hg = E2 @ c2_intn_world_hg

# convert back to euclidean coordinates
c1_intn = c1_intn_hg[:-1, :]
c2_intn = c2_intn_hg[:-1, :]

# check p2_intn.T @ E @ p1_intn = 0 
is_vectors_close(c2_intn.T @ essential_matrix @ c1_intn, np.array([[0]]))

绘制极线

计算并绘制齐次空间中的外极线

nrows = 1
ncols = 2
h, w = img_size

fig, axes = plt.subplots(nrows=nrows, ncols=ncols, figsize=(6, 4))

# Epipolar line in camera 1 given the point wrt camera 2
ax1 = axes[0]
ax1.set_title("camera 1")
ax1.set(xlim = (-(h // 2), w // 2), ylim = (-(h // 2), w // 2))

# compute the epipolar line in camera 1
coeffs = (point_c2.T @ essential_matrix).reshape(-1)
x, y = plot_line(coeffs, (-1, 1))

# convert c2_intn from homogeneous coordinate to pixel coordinate
u, v = to_eucld_coords(c1_intn).reshape(-1)

ax1.plot(x, y, label="epipolar line")
ax1.scatter(u, v, color="orange", label="point")

# Epipolar line in camera 2 given the point wrt camera 1
ax2 = axes[1]
ax2.set_title("camera 2")
ax2.set(xlim = (-(h // 2), w // 2), ylim = (-(h // 2), w // 2))

coeffs = (essential_matrix @ point_c1).reshape(-1)
x, y = plot_line(coeffs, (-1, 1))

u, v = to_eucld_coords(c2_intn).reshape(-1)

ax2.plot(x, y, label="epipolar line")
ax2.scatter(u, v, color="orange", label="point")

plt.tight_layout()

基本矩阵

计算基本矩阵

fundamental_matrix =  np.linalg.inv(K).T @ essential_matrix @ np.linalg.inv(K)

nrows = 1
ncols = 2

fig, axes = plt.subplots(nrows=nrows, ncols=ncols, figsize=(6, 4))

# plot projection 1
ax1 = axes[0]
ax1.set(xlim = (-(h // 2), w // 2), ylim = (-(h // 2), w // 2))
ax1.set_title("Camera 1 Image")

proj_point2_hg = to_hg_coords(proj_point2)
coeffs = (proj_point2_hg.T @ fundamental_matrix).reshape(-1)
x, y = plot_line(coeffs, (-2, 2))

ax1.plot(x, y, color="orange")
ax1.scatter(*proj_point1.reshape(-1))

# plot projection 2
ax2 = axes[1]
ax2.set(xlim = (-(h // 2), w // 2), ylim = (-(h // 2), w // 2))
ax2.set_title("Camera 2 Image")

proj_point1_hg = to_hg_coords(proj_point1)
coeffs = (fundamental_matrix @ proj_point1_hg).reshape(-1)
x, y = plot_line(coeffs, (-2, 2))

ax2.plot(x, y, color="orange")
ax2.scatter(*proj_point2.reshape(-1))

plt.tight_layout()

设置环境

首先，我们为两个相机定义外部参数，使它们以一定角度相距一定距离。外部参数包括相机的位置和方向。

接下来，我们定义决定图像形成的内在参数。这里我们已经定义了图像平面的大小和焦距，这基本上是图像平面离相机中心的距离的度量。

我们还定义了世界上的一个点，以便它被两个相机捕获。在本例中，我们将找到该点投影的外极线。

两个视图中捕获的图像如下所示：

计算基本矩阵

为了找到基本矩阵，我们需要找到两个相机之间的相对几何结构，以便给定点在相机1的坐标，我们应该能够找到它在相机2的坐标。

现在，我们知道相机外参矩阵是基矩阵从世界坐标系到相机坐标系的变化。使用该信息，可以如下计算从相机1到相机2的基矩阵的变化：

从相机1到相机2的基矩阵变化=（从世界到相机2基矩阵的变化）×

⟹ 从相机1到相机2的基矩阵变化=（从世界到相机2基矩阵的变化）×

⟹ 从相机1到相机2的基矩阵的变化=（相机2的外参矩阵）×（相机1的外参矩阵的逆）

一旦我们获得了基矩阵的这种变化，我们就可以提取相机的相对方向和偏移。这个3×4矩阵的前3列将给出方向Rc，最后一列将给出偏移量Tc。

然后我们计算Tc的叉积矩阵，并将其与Rc相乘，以获得基本矩阵。

作为健全性检查，我们可以验证基本矩阵方程。

绘制极线

要找到外极线，我们首先需要找到相机图像平面上该点的投影。在这个例子中，我已经通过试错手动绘制了这些点，但我们将在后面的章节中看到更好的方法来找到它们。

一旦我们找到这些点，我们将它们与它们各自的外参矩阵相乘，得到相机帧的坐标。然后我们将它们插入基本矩阵方程，并找到相应的外极线。

例如，如果我们知道相机1中的投影点，我们将其与基本矩阵相乘，得到相机2中的外极线。然后我们在2D图像空间中绘制这条线。

为了验证相机2中的投影点位于这条线上，我们将其转换为欧几里得坐标，并将其绘制在同一空间中。我们对另一台相机重复同样的过程。

图像空间中的投影点及其对应的外极线如下所示：

平行

如果图像平面彼此平行会发生什么？在上述系统中，我们有两个相机，它们的光轴沿着Y轴彼此平行。让我们假设相机中心在X轴上，相距b。

由于相机是平行的，因此它们之间没有相对旋转。因此，Rc将是一个单位矩阵，Tc将等于[-b，0，0]。因此，我们可以将基本矩阵计算为：

让x xc′是X点在摄像机Oc和O′的像平面上的投影. 如果我们假设两个相机的焦距都是f，我们可以写xc＝[x，y，f]和xc′＝[x′，y′，f]。我们可以将它们插入基本矩阵方程中，如下所示：

我们可以看到外极线具有相同的Y坐标，这意味着它们沿着X轴平行。因此，我们可以说，如果两个相机彼此平行，那么它们的外极线也将在图像空间中平行。

如下所示：

此部分的代码可在此处找到：

https://github.com/wingedrasengan927/Stereo-Geometry/blob/master/Parallel%20Image%20Planes.ipynb

如果相机沿着Y轴平行，图像中的外极线将是水平的；如果它们沿着X轴平行，则外极线将是垂直的。

基本矩阵

在现实生活中，我们很少有关于世界上点的位置的信息。然而，我们可以在图像中找到它们的位置。因此，我们需要修改基本矩阵方程，以考虑点的图像位置。

现在，给定世界上与相机帧相关的一个点，内参矩阵负责将其投影到相机的图像平面上。

我们可以将κ发送到另一侧，并将等式改写为：

因此，给定图像中的一个点，我们将其表示为齐次形式，并与内参矩阵的逆相乘，得到该点在世界上的齐次表示。

现在，我们无法从图像中确定点在世界上的准确位置，因为齐次坐标是比例不变的，并且点可以位于射线上的任何位置。

考虑两个相机帧l和r，以及在两个图像平面上投影的点Pc。这里的基本矩阵方程为：

在这个等式中，我们可以这样替换齐次图像坐标：

这被称为基本矩阵方程。

基本矩阵将同一点的坐标关联在两个不同的视图中，而基本矩阵将它们关联在两张不同的图像中。

在前面的例子中，我们可以计算基本矩阵并绘制外极线，如下所示：

如果你观察到，外极线看起来和以前完全一样，但是，这一次它们是使用基本矩阵方程直接从图像坐标中计算出来的。

从点对应关系计算基本矩阵

在现实世界中，我们很少使用校准过的系统。然而，由于基本矩阵直接关联图像点，我们仍然可以在不了解世界和相机的情况下找到它。下面是方法。

设（u，v）和（u′，v′）表示两个不同图像中的同一点。我们可以用齐次形式表示它们，并插入基本矩阵方程：

这里f1、f2、…表示基本矩阵的未知参数。上面的等式表示一个同质系统，我在这里的另一篇文章中已经深入讨论了它们。然而，我将在这里再次讨论直觉。

第一步是将等式改写为：

改写这种方法的一个原因是，我们可以在同一个等式中堆叠许多点对应关系，如下所示：

该方程可用矩阵表示法表示为Af ⃗ = 0，其中A是点对应矩阵和向量f ⃗ 是平坦的基本矩阵。现在，f ⃗ 可以通过将方程的两边除以其大小*|f* ⃗ *|*而得到单位向量.

可以通过计算*|Ax* ⃗ |的最小值找到受约束|x ⃗ |= 1 时Ax ⃗ = 0的方程的解。.

八点算法

其思想是找到图像之间的点对应关系并计算矩阵. 然后，可以通过计算⊺ 并将其重塑为3 x 3矩阵。

计算f至少需要多少点？现在，f有9个未知数，所以你会说我们需要9个方程或9个点来求解它。但如果你观察到，f是尺度不变的，这意味着我们可以将f乘以任何常数，并且方程Af ⃗ = 0仍然满足。因此，我们可以将 f 与其值之一相除，如下所示：

现在看到有8个未知数需要解决，我们至少只需要8个点。

还有一件事我们需要解释。你看，3×3基本矩阵F的秩=2。我们这里不讨论证明，但这与叉积矩阵的秩2有关。

为此，我们对矩阵F进行奇异值分解，使其最后一个奇异值为零，然后重新组合。

八点算法的代码如下所示：

def compute_fundamental_matrix(points1, points2):
    '''
    Compute the fundamental matrix given the point correspondences
    
    Parameters
    ------------
    points1, points2 - array with shape [n, 3]
        corresponding points in images represented as 
        homogeneous coordinates
    '''
    # validate points
    assert points1.shape[0] == points2.shape[0], "no. of points don't match"
    
    u1 = points1[:, 0]
    v1 = points1[:, 1]
    u2 = points2[:, 0]
    v2 = points2[:, 1]
    one = np.ones_like(u1)
    
    # construct the matrix 
    # A = [u2.u1, u2.v1, u2, v2.u1, v2.v1, v2, u1, v1, 1] for all the points
    # stack columns
    A = np.c_[u1 * u2, v1 * u2, u2, u1 * v2, v1 * v2, v2, u1, v1, one]
    
    # peform svd on A and find the minimum value of |Af|
    U, S, V = np.linalg.svd(A, full_matrices=True)
    f = V[-1, :]
    F = f.reshape(3, 3) # reshape f as a matrix
    
    # constrain F
    # make rank 2 by zeroing out last singular value
    U, S, V = np.linalg.svd(F, full_matrices=True)
    S[-1] = 0 # zero out the last singular value
    F = U @ np.diag(S) @ V
    return F

标准化八点算法

现代图像具有约4000-6000像素的高分辨率。这会导致点对应关系中的大量差异，这可能会破坏算法。因此，为了解释这一点，我们在将这些点插入八点算法之前对它们进行了归一化。

这个想法是，对于每个图像，我们计算点对应的质心（平均值），并从每个图像中减去。接下来，我们对它们进行缩放，使其与质心的距离（方差）为√2，如下所示：

接下来，我们创建一个执行上述转换的矩阵，并使用它来转换点，如下面的代码所示：

def compute_fundamental_matrix_normalized(points1, points2):
    '''
    Normalize points by calculating the centroid, subtracting 
    it from the points and scaling the points such that the distance 
    from the origin is sqrt(2)
    
    Parameters
    ------------
    points1, points2 - array with shape [n, 3]
        corresponding points in images represented as 
        homogeneous coordinates
    '''
    # validate points
    assert points1.shape[0] == points2.shape[0], "no. of points don't match"
    
    # compute centroid of points
    c1 = np.mean(points1, axis=0)
    c2 = np.mean(points2, axis=0)
    
    # compute the scaling factor
    s1 = np.sqrt(2 / np.mean(np.sum((points1 - c1) ** 2, axis=1)))
    s2 = np.sqrt(2 / np.mean(np.sum((points2 - c2) ** 2, axis=1)))
    
    # compute the normalization matrix for both the points
    T1 = np.array([
        [s1, 0, -s1 * c1[0]],
        [0, s1, -s1 * c1[1]],
        [0, 0 ,1]
    ])
    T2 = np.array([
        [s2, 0, -s2 * c2[0]],
        [0, s2, -s2 * c2[1]],
        [0, 0, 1]
    ])
    
    # normalize the points
    points1_n = T1 @ points1.T
    points2_n = T2 @ points2.T
    
    # compute the normalized fundamental matrix
    F_n = compute_fundamental_matrix(points1_n.T, points2_n.T)
    
    # de-normalize the fundamental
    return T2.T @ F_n @ T1

寻找极点

我们知道极点是图像中所有外极线相交的点。数学上可以表示为：

其中l1，l2，…是外极线，e是极点。这可以用矩阵形式表示为：

现在这看起来像一个齐次方程组。因此，要找到极点，我们可以使用上一节中讨论的线性最小二乘估计找到Le ⃗ = 0的解。

但是等等，可以从基本矩阵计算外极线。因此，我们可以将等式改写为：

现在，为了找到这个方程的解，我们简单地计算F的线性最小二乘估计，这是它的最后一个奇异值。

计算极点的代码如下所示：

def compute_epipole(F):
    '''
    Compute epipole using the fundamental matrix.
    pass F.T as argument to compute the other epipole
    '''
    U, S, V = np.linalg.svd(F)
    e = V[-1, :]
    e = e / e[2]
    return e

为了找到另一幅图像的极点，我们找到了F转置的线性最小二乘估计。

Python示例

好吧，让我们看看基本矩阵的作用。

%matplotlib widget

import matplotlib.pyplot as plt
from skimage import io
from skimage.transform import resize
from skimage.transform import warp, ProjectiveTransform
from stereo_utils import *
from skimage.color import rgb2gray, rgba2rgb

打印图像和匹配点

# load images
im1 = io.imread("data/bench/right.png")
im1 = rgb2gray(rgba2rgb(im1))
im2 = io.imread("data/bench/left.png")
im2 = rgb2gray(rgba2rgb(im2))

# load matching points
points1 = np.load("data/bench/right_points.npy")
points2 = np.load("data/bench/left_points.npy")

assert (points1.shape == points2.shape)

绘制匹配点

show_matching_result(im1, im2, points1, points2)

基本矩阵

# compute the normalized fundamental matrix 
F = compute_fundamental_matrix_normalized(points1, points2)

# validate the fundamental matrix equation
p1 = points1.T[:, 0]
p2 = points2.T[:, 0]

np.round(p2.T @ F @ p1)

0.0

绘制极线

plot_epipolar_lines(im1, im2, points1, points2, show_epipole=False)

绘制极点

e1 = compute_epipole(F)
e2 = compute_epipole(F.T)

# validate epioles
np.round(e2.T @ F @ e1)

0.0

plot_epipolar_lines(im1, im2, points1, points2, show_epipole=True)

立体校正

H1, H2 = compute_matching_homographies(e2, F, im2, points1, points2)

# Transform points based on the homography matrix
new_points1 = H1 @ points1.T
new_points2 = H2 @ points2.T
new_points1 /= new_points1[2,:]
new_points2 /= new_points2[2,:]
new_points1 = new_points1.T
new_points2 = new_points2.T

# warp images based on the homography matrix
im1_warped = warp(im1, ProjectiveTransform(matrix=np.linalg.inv(H1)))
im2_warped = warp(im2, ProjectiveTransform(matrix=np.linalg.inv(H2)))

绘制新的外极线和匹配点

h, w = im1.shape

nrows = 2
ncols = 1
fig, axes = plt.subplots(nrows=nrows, ncols=ncols, figsize=(6, 8))

# plot image 1
ax1 = axes[0]
ax1.set_title("Image 1 warped")
ax1.imshow(im1_warped, cmap="gray")

# plot image 2
ax2 = axes[1]
ax2.set_title("Image 2 warped")
ax2.imshow(im2_warped, cmap="gray")

# plot the epipolar lines and points
n = new_points1.shape[0]
for i in range(n):
    p1 = new_points1[i]
    p2 = new_points2[i]

    ax1.hlines(p2[1], 0, w, color="orange")
    ax1.scatter(*p1[:2], color="blue")

    ax2.hlines(p1[1], 0, w, color="orange")
    ax2.scatter(*p2[:2], color="blue")

经验观察

plot_epipolar_lines(im1_warped, im2_warped, new_points1, new_points2, show_epipole=False)

我们可以看到外极线不准确

笔记本可以在这里找到：

https://github.com/wingedrasengan927/Stereo-Geometry/blob/master/Fundamental%20Matrix%20and%20Stereo%20Rectification.ipynb

首先，我们需要同一物体的两张图像。于是我打开了我的编辑器，放置了两个相机，看着同一个物体，并截屏。

接下来，我们需要两个图像之间的点对应或匹配。在这里，我手动标记了它们，但在现实世界中，我们可以使用SIFT等算法自动计算它们。

好了，现在我们可以使用归一化八点算法从点计算基本矩阵。

我们还可以使用计算的矩阵来验证基本矩阵方程。

让我们绘制两幅图像的外极线。

我们可以看到对应于一幅图像的外极线穿过另一幅图像中的点。

接下来，让我们找到并绘制外极线。

基本矩阵方程也适用于极点，因为它们也是图像平面中的点。

我们可以在这里看到，极点位于图像之外，所有外极线都在它们处相交。

立体校正

由于外极线是平行的，所以使用具有平行图像平面的图像很容易。然而，通过战略性地扭曲它们，可以使它们平行。这个过程被称为立体校正。让我们看看怎么做。

对于平行图像，外极沿水平轴位于无穷远处。所以第一步是创建变换矩阵，将点移动到无穷远。

我们需要三个变换矩阵：一个将一个点旋转到水平轴，一个将点移动到无穷远，另一个将原点平移到中心。让我们看看每一个。

将点旋转到水平轴

给定一个与X轴成角度θ的点，我们创建一个旋转矩阵，将其旋转-θ，并将其带回X轴，如下所示：

注意：如果点位于X轴的另一侧，符号将反转。

由于我们处理的是齐次坐标，我们需要考虑额外的维度。

齐次坐标的一般变换矩阵，也称为单应矩阵，如下所示：

因此，将齐次坐标旋转回X轴所需的矩阵为：

将点移到无穷远

接下来我们需要将点移到无穷远。无穷远处的点表示为(∞, 0）或(-∞, 0). 这可以用齐次坐标表示为（x，0，0），如下所示：

因此，给定一个位于X轴上的点，以其齐次形式表示为（X，0，1），我们需要一个将其转换为（X、0，0）的矩阵。

以下矩阵可完成此工作：

将原点移动到中心

默认情况下，Python假定图像的原点位于左上角，因此我们需要创建一个平移矩阵来将原点移动到中心。

应用变换后，我们可以将其移回原来的位置。

扭曲图像

因此，组合上述矩阵的总变换矩阵由下式给出：

想法是我们用上面的矩阵变换点，然后为了“撤消”效果，我们用矩阵的逆矩阵扭曲整个图像。

使用这种技术，我们可以扭曲一幅图像。现在，如何扭曲另一个图像？理查德·哈特利（Richard Hartley）在他的论文中认为，为了获得最佳结果，两个立体图像都需要对齐，这意味着变换后的点对应之间的距离应该最小。

因此，可以通过最小化变换后的点对应关系之间的平方距离之和来找到匹配单应矩阵H1：

这里我们不讨论计算H1的证明，但我已经在最后的参考资料部分将其链接起来，以供感兴趣的读者参考。

计算H1和H2的代码片段如下所示：

def compute_matching_homographies(e2, F, im2, points1, points2):
    '''
    Compute the matching homography matrices
    '''
    h, w = im2.shape
    # create the homography matrix H2 that moves the epipole to infinity
    
    # create the translation matrix to shift to the image center
    T = np.array([[1, 0, -w/2], [0, 1, -h/2], [0, 0, 1]])
    e2_p = T @ e2
    e2_p = e2_p / e2_p[2]
    e2x = e2_p[0]
    e2y = e2_p[1]
    # create the rotation matrix to rotate the epipole back to X axis
    if e2x >= 0:
        a = 1
    else:
        a = -1
    R1 = a * e2x / np.sqrt(e2x ** 2 + e2y ** 2)
    R2 = a * e2y / np.sqrt(e2x ** 2 + e2y ** 2)
    R = np.array([[R1, R2, 0], [-R2, R1, 0], [0, 0, 1]])
    e2_p = R @ e2_p
    x = e2_p[0]
    # create matrix to move the epipole to infinity
    G = np.array([[1, 0, 0], [0, 1, 0], [-1/x, 0, 1]])
    # create the overall transformation matrix
    H2 = np.linalg.inv(T) @ G @ R @ T

    # create the corresponding homography matrix for the other image
    e_x = np.array([[0, -e2[2], e2[1]], [e2[2], 0, -e2[0]], [-e2[1], e2[0], 0]])
    M = e_x @ F + e2.reshape(3,1) @ np.array([[1, 1, 1]])
    points1_t = H2 @ M @ points1.T
    points2_t = H2 @ points2.T
    points1_t /= points1_t[2, :]
    points2_t /= points2_t[2, :]
    b = points2_t[0, :]
    a = np.linalg.lstsq(points1_t.T, b, rcond=None)[0]
    H_A = np.array([a, [0, 1, 0], [0, 0, 1]])
    H1 = H_A @ H2 @ M
    return H1, H2

好吧，让我们纠正我们示例中的图像。

一旦我们计算了单应矩阵，就可以使用它们的逆来扭曲图像，如下所示：

我们现在已经用平行的图像平面校正了图像，所以外极线只是通过点的水平线。

实证观察

如果我使用归一化八点算法计算扭曲图像的基本矩阵和外极线，结果不准确，如下所示：

我们不知道确切的原因，但我们认为算法正在崩溃。

校正后的图像现在可以用于各种下游任务，如视差估计、模板匹配等。

结论

好了，我们已经到了终点。在本文中，我们研究了处理从两个视图捕获的图像的技术。我们还看到了如何使用立体校正从两张图像中估计某些模糊度，如深度。如果我们有多个视图，我们还可以使用称为“运动结构”的技术来估计场景的结构。

参考引用

cs231a Notes(https://web.stanford.edu/class/cs231a/course_notes/03-epipolar-geometry_2022.pdf)
https://github.com/chizhang529/cs231a
Theory and Practice of Stereo Rectification by Richard Hartley(https://users.cecs.anu.edu.au/~hartley/Papers/joint-epipolar/journal/joint3.pdf)

☆ END ☆

如果看到这里，说明你喜欢这篇文章，请转发、点赞。微信搜索「uncle_pn」，欢迎添加小编微信「 woshicver」，每日朋友圈更新一篇高质量博文。

↓扫描二维码添加小编↓

你可能感兴趣的:(python,人工智能,计算机视觉,开发语言,3d)

大模型——什么是 Vibe Coding？从零开始学习 AI 辅助编程不二人生大模型学习人工智能大模型辅助编程
大模型——什么是VibeCoding？从零开始学习AI辅助编程VibeCoding：代码消失，直觉驱动的软件开发新浪潮？生成式人工智能的指数级增长正不断重塑各个行业，软件开发领域也不例外。大约在2025年初，一股源自美国硅谷的新思潮开始引起关注：开发者似乎可以借助AI工具，在几乎不直接编写代码的情况下构建产品。这种依赖直觉、跳脱传统编码苦役的开发方式，被赋予了一个颇具时代感的名字——VibeCod
【无标题】Python ---Day2 复合类型之序列类型、映射类型和集合类型的学习！！！
系列文章目录文章目录系列文章目录前言一、复合类型初识1.1列表类型1.1.1列表创建1.1.2列表运算1.1.3列表访问1.1.3.1索引1.1.3.2反向索引1.1.3.3切片1.1.4列表操作1.1.4.1添加数据1.1.4.2修改数据1.1.4.3删除数据1.2元组类型1.2.1元组创建1.2.2元组操作1.2.2.2查看元组1.2.2.3解包技能1.2.3元组运算1.2.4元组不可变二、映
Python数据分析案例｜从模拟数据到可视化：零售门店客流量差异分析全流程
1.依赖库导入importmatplotlib.pyplotaspltimportnumpyasnpimportpandasaspdfrommatplotlibimportfont_managerfromdatetimeimportdatetimematplotlib.pyplot：用于绘制图表。numpy：numpy：pandas：虽然代码中未font_manager：设置datetime：生成
【机器学习-08】参数调优宝典：网格搜索与贝叶斯搜索等攻略云天徽上机器学习机器学习人工智能
博主简介：曾任某智慧城市类企业算法总监，目前在美国市场的物流公司从事高级算法工程师一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者，提供AI相关的技术咨询、项目开发和个性化解决方案等服务，如有需要请站内私信或者联系任意文章底部的的VX名片（ID：xf982831907）博主粉丝群介绍：①群内初中生、
Python中字符串的操作方法幻鸩605 python java 开发语言
字符串拼接使用+运算符将多个字符串连接起来。例如：s1="Hello"s2="World"result=s1+""+s2print(result)#输出：HelloWorld字符串重复使用*运算符重复字符串。例如：s="abc"result=s*3print(result)#输出：abcabcabc字符串长度使用len()函数获取字符串长度。例如：s="Python"length=len(s)pr
【2025B卷专题】华为OD机试2025B卷统一考试题库清单，时间紧张就刷这个（Python/JS/C/C++）哪吒搬砖工逆袭Java架构师华为od python javascript 华为OD机试 2025B卷
专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。2025年5月12日，华为官方已经将华为OD机试（A卷）切换为B卷。目前正在考的是B卷，按照华为OD往常的操作，B卷题目是由往
PyTorch 在 Python 自然语言处理中的运用 Python编程之道 Python编程之道 python pytorch 自然语言处理 ai
PyTorch在Python自然语言处理中的运用关键词：PyTorch，Python，自然语言处理，深度学习，文本分类，情感分析摘要：本文全面探讨了PyTorch在Python自然语言处理（NLP）领域的运用。首先介绍了相关背景知识，包括目的范围、预期读者等内容。接着详细阐述了核心概念，如词嵌入、循环神经网络等，并给出了相应的原理示意图和流程图。深入讲解了核心算法原理，结合Python代码进行详细
后端领域的自然语言处理技术应用大厂资深架构师 Spring Boot 开发实战自然语言处理 easyui 人工智能 ai
后端领域的自然语言处理技术应用关键词：后端领域、自然语言处理、技术应用、算法原理、实际案例摘要：本文聚焦于后端领域中自然语言处理技术的应用。首先介绍了相关背景，包括目的范围、预期读者等。接着阐述核心概念与联系，通过文本示意图和Mermaid流程图展示其原理和架构。详细讲解了核心算法原理并给出Python源代码示例，同时介绍了数学模型和公式。通过项目实战，展示代码实际案例并进行详细解释。分析了自然语
【图像处理基石】如何检测到画面中的ppt并对其进行增强？
1.入门版ppt检测增强工具我们介绍一个使用Python进行PPT检测并校正画面的实现方案。这个方案主要利用OpenCV进行图像处理，通过边缘检测和透视变换技术来识别并校正PPT画面。importcv2importnumpyasnpfromPILimportImageimportmatplotlib.pyplotaspltclassPPTDetector:def__init__(self):#初始
Python中什么时候需要返回值，什么时候不需要返回值？？？似乎很简单 Python学习日记 python 开发语言
在Python中，函数是否需要返回值取决于它的设计目的和功能需求。需要返回值的情况计算结果需要被后续代码使用当函数的主要目的是计算或生成数据，且调用方需要这些结果时：defadd(a,b):returna+b#结果需要被其他代码使用total=add(3,5)#需要返回值需要传递状态或信息如果函数执行后需要告诉调用方是否成功、返回状态码或错误信息：defvalidate_input(input):
Python中的高阶函数---便捷的语法书写！！！！，可以简化一些函数的书写！！！似乎很简单 Python学习日记 python 开发语言学习笔记
目录1.map()函数示例1：单可迭代对象（平方运算）示例2：多可迭代对象（元素相加）2.mapvs列表推导式什么是列表推导式（ListComprehension）？对比示例列表推导式的优势map的优势5.实际应用场景场景1：批量转换数据类型场景2：多列数据处理场景3：链式操作6.性能与注意事项总结3.sorted()函数1.语法：sorted(iterable,*,key=None,revers
企业内网系统：从传统开发到智能赋能的进化之路飞算JavaAI开发助手科技人工智能大数据 java
在当今数字化浪潮中，企业内网系统作为支撑日常运营的核心基础设施，其开发效率与质量直接关系到企业的竞争力。传统开发模式下，程序员需要手动完成需求分析、架构设计、代码编写、测试调试等全流程工作，不仅耗时费力，还容易因人为疏忽导致质量隐患。而随着人工智能技术的突破性进展，以飞算JavaAI为代表的智能开发工具正在重塑企业内网系统的开发范式，为程序员提供从设计到落地的全链路智能支持。一、传统企业内网系统开
京东携手HarmonyOS SDK首发家电AR高精摆放功能
在电商行业的演进中，商品的呈现方式不断升级：从文字、图片到视频，再到如今逐渐兴起的3D与AR技术。作为XR应用探索的先行者，京东正站在这场体验革新的最前沿，不断突破商品展示的边界，致力于通过创新技术让消费者的选购过程更加直观、真实和高效。“3D技术能够提供更逼真的视觉呈现、更沉浸的交互体验，让消费者"所见即所得”，帮助品牌更好实现与用户的深入连接，“3D信息流"将成为下一代内容形态的重要载体。”-
Seaborn高阶玩法全解析：从复杂图表到多图布局的可视化实战指南
数据可视化就像给数据“画肖像”——初级阶段是勾勒轮廓，高级阶段则是赋予灵魂。在Python可视化生态中，Seaborn凭借“一行代码出美图”的优雅，成为数据分析的“画笔利器”。但你是否遇到过这样的场景：想同时展示数据分布与统计量，却被基础图表限制；想批量绘制分面图，手动拼接效率低下；想让图表更具设计感，却对颜色搭配和注解技巧一知半解？本文将带你解锁Seaborn的高阶玩法，从复杂图表绘制到多图布局
scanpy保存图片的常用方法汇总 Bio Coder 空间转录组 &单细胞 scanpy 保存图片汇总
在使用Scanpy（一个用于单细胞RNA测序数据分析的Python库）时，保存图片（如可视化结果）是常见的操作。Scanpy的绘图功能主要基于Matplotlib和Seaborn，保存图片的方法也与这些库的保存机制一致。以下是Scanpy保存图片的详细方法及注意事项：1.基本保存图片的方法Scanpy的绘图函数（如sc.pl.umap、sc.pl.tsne、sc.pl.pca等）通常会返回Matp
MCP Streamable HTTP 样例（qbit） pythonagent
前言模型上下文协议（ModelContextProtocol，MCP），是由Anthropic推出的开源协议，旨在实现大语言模型与外部数据源和工具的集成，用来在大模型和数据源之间建立安全双向的连接。本文代码技术栈Python3.11.8FastMCP2.10.3MCP的传输机制StandardInput/Output(stdio)StreamableHTTPServer-SentEvents(SS
掌握变量命名与Python继承机制
掌握变量命名与Python继承机制背景简介在编程中，变量命名和继承是基础且重要的概念。良好的命名习惯可以提升代码的可读性，而继承则是一种代码复用的重要机制。本文将结合具体的书籍章节内容，深入解析变量命名规则和Python继承机制。变量命名规则变量命名是编程中最基础的部分，而正确的命名习惯能够帮助其他开发者（或未来的自己）更好地理解代码。根据书籍提供的内容，我们应当遵守以下规则：变量名只包含数字、下
从零开始：构建支持上下文窗口的AI原生应用实战指南 AI天才研究院 AI人工智能与大数据 AI-native ai
从零开始：构建支持上下文窗口的AI原生应用实战指南关键词：大语言模型（LLM）、上下文窗口、AI原生应用、token管理、对话状态保持、向量检索、记忆压缩摘要：本文从AI原生应用的核心需求出发，系统讲解支持上下文窗口的应用构建全流程。通过解析上下文窗口的技术本质、关键挑战及解决方案，结合Python代码实战和真实场景案例，帮助开发者掌握从需求分析到落地部署的完整方法。内容涵盖上下文窗口管理策略、t
学习threejs，使用自定义GLSL 着色器，生成漂流的3D能量球 gis分享者 gis工程师 threejs threejs GLSL ShaderMaterial 3D 能量球着色器
‍⚕️主页：gis分享者‍⚕️感谢各位大佬点赞收藏⭐留言加关注✅!‍⚕️收录于专栏：threejsgis工程师文章目录一、前言1.1☘️GLSL着色器1.1.1☘️着色器类型1.1.2☘️工作原理1.1.3☘️核心特点1.1.4☘️应用场景1.1.5☘️实战示例二、使用自定义GLSL着色器，生成漂流的3D能量球1.☘️实现思路2.☘️代码样例一、前言本文详细介绍如何基于threejs在三维场景中自
颠覆人机交互！多模态 AI Agents 大模型如何用 5 大模式开启智能新时代？
注：此文章内容均节选自充电了么创始人，CEO兼CTO陈敬雷老师的新书《GPT多模态大模型与AIAgent智能体》（跟我一起学人工智能）【陈敬雷编著】【清华大学出版社】GPT多模态大模型与AIAgent智能体书籍本章配套视频课程【陈敬雷】文章目录GPT多模态大模型与AIAgent智能体系列七颠覆人机交互！多模态AIAgents大模型如何用5大模式开启智能新时代？一、从“单一感知”到“多模态融合”：A
python进程线程协程区别_Python：线程、进程与协程(1)——概念 weixin_39989159 python进程线程协程区别
最近的业余时间主要放在了学习Python线程、进程和协程里，第一次用python的多线程和多进程是在两个月前，当时只是简单的看了几篇博文然后就跟着用，没有仔细去研究，第一次用的感觉它们其实挺简单的，最近这段时间通过看书，看Python中文官方文档等等相关资料，发现并没有想想中的那么简单，很多知识点需要仔细去理解，Python线程、进程和协程应该是Python的高级用法。Python的高级用法有很多
实操 SpringBoot+MCP！清风孤客 spring boot 后端 java 人工智能
引言随着人工智能的飞速发展，大语言模型(LLM)正在革命性地重塑用户与软件的交互范式。想象一下这样的场景：用户无需钻研复杂的API文档或者在繁琐的表单间来回切换，只需通过自然语言直接与系统对话——“帮我查找所有2023年出版的图书”、“创建一个新用户叫张三，邮箱是[email protected]”。这种直观、流畅的交互方式不仅能显著降低新用户的学习曲线，更能大幅削减B端系统的培训成本和实施
如何学习智能体搭建
如何学习智能体搭建前言随着人工智能的发展，智能体（Agent）成为自动化、交互式应用和自主决策系统中的核心角色。本书将从零基础出发，系统讲解智能体的基本原理、常见框架、实战搭建与进阶技巧，帮助你快速上手并应用于实际项目。目录智能体基础认知智能体的核心组成主流智能体开发框架本地智能体与云端智能体选型智能体的任务自动化与插件集成智能体的知识检索与上下文管理智能体的多模态扩展智能体安全与可控性智能体实战
全栈运维的“诅咒”与“荣光”：为什么“万金油”工程师是项目成功的隐藏MVP？云原生水神职业发展系统运维运维
大家好，今天，我们来聊一个特殊且至关重要的群体：运维工程师。特别是那些在项目制中，以一己之力扛起一个或多个产品生死的“全能战士”。你是否就是其中一员？你的技能树上点亮了：操作系统、网络协议、mysql与Redis中间件、Docker与K8s容器化、Ansible与Terraform自动化、Go/Python工具开发、Prometheus监控体系、opentelemetry可视化，甚至要负责信息安全
Python Selenium 使用指南
Selenium是一个用于自动化Web浏览器交互的强大工具，常用于网页测试、数据抓取和自动化任务。以下是Python中Selenium的详细使用说明。安装Selenium首先需要安装Selenium库和浏览器驱动：pipinstallselenium然后下载对应浏览器的驱动：Chrome:ChromeDriverFirefox:GeckoDriverEdge:EdgeDriver将驱动放在系统PA
3DXML 转换为 SOLIDWORKS 技术指南：含迪威模型网在线转换方案
在工业设计协同工作中，不同CAD软件的文件格式转换是常见需求。3DXML作为DassaultSystèmes旗下CATIA软件的轻量型三维数据格式，因体积小、便于传输，被广泛用于模型预览和跨平台共享。但当需要在SOLIDWORKS中进行深入设计或工程分析时，需将3DXML格式转换为SOLIDWORKS兼容格式。本文将为技术人员和学生详细介绍转换全流程，并推荐实用的在线转换平台——迪威模型网。一、3
【Python进阶】Python网络协议与套接字编程：构建客户端和服务器
1、网络通信基础与网络协议1.1网络通信模型概述网络通信是信息时代基石，它如同现实世界中的邮递系统，将数据从一处传递到另一处。其中，OSI七层模型与TCP/IP四层或五层模型是理解和构建网络通信的基础。1.1.1OSI七层模型与TCP/IP四层/五层模型OSI（开放系统互连）参考模型提出了七层结构，从物理层到应用层，每一层都有其特定的功能和职责，例如物理层关注的是信号如何在介质上传输，而应用层则处
Unity Demo-3DFarm详解-其一 KhalilRuan unity 游戏引擎
我们来拆解一个种田游戏，这个游戏种类内部的功能还是比较模板化的，我们来一点点说。我们大体上分为这么几个部分：农场运营玩法角色与玩家互动物品与背包存档和进度管理用户界面系统农场运营可以大体上分为：种植系统：支持种植、成长、收获等完整的植物生命周期；动物系统：包含野生动物、家畜、宠物等，支持喂养、骑乘、驯养等功能；建筑与建造：玩家可以建造、升级、摧毁建筑；采集与合成：支持采集资源、合成物品、制作工具；
更新！「3D Web轻量化引擎」HOOPS Communicator发布2025.2.0版本：全新WebViewer用户界面、工业3D_大熊 3D CAD开发工具 3d 3D建模 3D模型轻量化工业3D 3D数据格式转换 3D模型可视化 3D Web轻量化
3DWeb轻量化引擎HOOPSCommunicator此前发布2025.2.0版本！此次更新聚焦于提升用户体验和稳定性，通过引入创新的界面设计以及对若干问题的修复，确保用户能够更加高效、流畅地处理3D数据可视化任务。以下将详细阐述本次更新的核心内容。一、增强功能本次更新的重点在于对WebViewer用户界面的革新。我们精心打造了全新的WebViewerUI，其核心基于WebComponents技术
Python 网络爬虫的基本流程及 robots 协议详解女码农的重启 python 网络爬虫 JAVA 开发语言
数据驱动的时代，网络爬虫作为高效获取互联网信息的工具，其规范化开发离不开对基本流程的掌握和对robots协议的遵守。本文将系统梳理Python网络爬虫的核心流程，并深入解读robots协议的重要性及实践规范。一、Python网络爬虫的基本流程Python网络爬虫的工作过程可分为四个核心阶段，每个阶段环环相扣，共同构成数据采集的完整链路。1.1发起网络请求这是爬虫与目标服务器交互的第一步，通过发送H
插入表主键冲突做更新 a-john
有以下场景：用户下了一个订单，订单内的内容较多，且来自多表，首次下单的时候，内容可能会不全（部分内容不是必须，出现有些表根本就没有没有该订单的值）。在以后更改订单时，有些内容会更改，有些内容会新增。问题：如果在sql语句中执行update操作，在没有数据的表中会出错。如果在逻辑代码中先做查询，查询结果有做更新，没有做插入，这样会将代码复杂化。解决： mysql中提供了一个sql语
Android xml资源文件中@、@android:type、@*、？、@+含义和区别 Cb123456 @+@?@*
一.@代表引用资源 1.引用自定义资源。格式：@[package:]type/name android：text="@string/hello" 2.引用系统资源。格式：@android:type/name android:textColor="@android:color/opaque_red"
数据结构的基本介绍天子之骄数据结构散列表树、图线性结构价格标签
数据结构的基本介绍数据结构就是数据的组织形式，用一种提前设计好的框架去存取数据，以便更方便，高效的对数据进行增删查改。正确选择合适的数据结构，对软件程序的高效执行的影响作用不亚于算法的设计。此外，在计算机系统中数据结构的作用也是非同小可。例如常常在编程语言中听到的栈，堆等，就是经典的数据结构。经典的数据结构大致如下：一：线性数据结构 (1)：列表 a
通过二维码开放平台的API快速生成二维码一炮送你回车库 api
现在很多网站都有通过扫二维码用手机连接的功能，联图网(http://www.liantu.com/pingtai/)的二维码开放平台开放了一个生成二维码图片的Api,挺方便使用的。闲着无聊，写了个前台快速生成二维码的方法。 html代码如下:(二维码将生成在这div下) ? 1 &nbs
ImageIO读取一张图片改变大小 3213213333332132 java IO image BufferedImage
package com.demo; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imageio.ImageIO; /** * @Description 读取一张图片改变大小 * @author FuJianyon
myeclipse集成svn（一针见血） 7454103 eclipse SVN MyEclipse
&n
装箱与拆箱----autoboxing和unboxing darkranger J2SE
4.2　自动装箱和拆箱基本数据(Primitive)类型的自动装箱(autoboxing)、拆箱(unboxing)是自J2SE 5.0开始提供的功能。虽然为您打包基本数据类型提供了方便，但提供方便的同时表示隐藏了细节，建议在能够区分基本数据类型与对象的差别时再使用。 4.2.1　autoboxing和unboxing 在Java中，所有要处理的东西几乎都是对象(Object)
ajax传统的方式制作ajax aijuans Ajax
//这是前台的代码 <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); String basePath = request.getScheme()+
只用jre的eclipse是怎么编译java源文件的？ avords java eclipse jdk tomcat
eclipse只需要jre就可以运行开发java程序了，也能自动编译java源代码，但是jre不是java的运行环境么，难道jre中也带有编译工具？还是eclipse自己实现的？谁能给解释一下呢问题补充：假设系统中没有安装jdk or jre，只在eclipse的目录中有一个jre，那么eclipse会采用该jre，问题是eclipse照样可以编译java源文件，为什么呢？ &nb
前端模块化 bee1314 模块化
背景：前端JavaScript模块化，其实已经不是什么新鲜事了。但是很多的项目还没有真正的使用起来，还处于刀耕火种的野蛮生长阶段。 JavaScript一直缺乏有效的包管理机制，造成了大量的全局变量，大量的方法冲突。我们多么渴望有天能像Java（import），Python (import)，Ruby(require)那样写代码。在没有包管理机制的年代，我们是怎么避免所
处理百万级以上的数据处理 bijian1013 oracle sql 数据库大数据查询
一.处理百万级以上的数据提高查询速度的方法： 1.应尽量避免在 where 子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描。 2.对查询进行优化，应尽量避免全表扫描，首先应考虑在 where 及 o
mac 卸载 java 1.7 或更高版本征客丶 java OS
卸载 java 1.7 或更高 sudo rm -rf /Library/Internet\ Plug-Ins/JavaAppletPlugin.plugin 成功执行此命令后，还可以执行 java 与 javac 命令 sudo rm -rf /Library/PreferencePanes/JavaControlPanel.prefPane 成功执行此命令后，还可以执行 java
【Spark六十一】Spark Streaming结合Flume、Kafka进行日志分析 bit1129 Stream
第一步，Flume和Kakfa对接，Flume抓取日志，写到Kafka中第二部，Spark Streaming读取Kafka中的数据，进行实时分析本文首先使用Kakfa自带的消息处理（脚本）来获取消息，走通Flume和Kafka的对接 1. Flume配置 1. 下载Flume和Kafka集成的插件，下载地址：https://github.com/beyondj2ee/f
Erlang vs TNSDL bookjovi erlang
TNSDL是Nokia内部用于开发电信交换软件的私有语言，是在SDL语言的基础上加以修改而成，TNSDL需翻译成C语言得以编译执行，TNSDL语言中实现了异步并行的特点，当然要完整实现异步并行还需要运行时动态库的支持，异步并行类似于Erlang的process（轻量级进程），TNSDL中则称之为hand，Erlang是基于vm(beam)开发，
非常希望有一个预防疲劳的java软件, 预防过劳死和眼睛疲劳,大家一起努力搞一个 ljy325 企业应用
　非常希望有一个预防疲劳的java软件，我看新闻和网站，国防科技大学的科学家累死了，太疲劳，老是加班，不休息，经常吃药，吃药根本就没用，根本原因是疲劳过度。我以前做java,那会公司垃圾，老想赶快学习到东西跳槽离开，搞得超负荷，不明理。深圳做软件开发经常累死人，总有不明理的人，有个软件提醒限制很好，可以挽救很多人的生命。相关新闻：（1）IT行业成五大疾病重灾区：过劳死平均37.9岁
读《研磨设计模式》-代码笔记-原型模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * Effective Java 建议使用copy constructor or copy factory来代替clone()方法： * 1.public Product copy(Product p){} * 2.publi
配置管理---svn工具之权限配置 chenyu19891124 SVN
今天花了大半天的功夫，终于弄懂svn权限配置。下面是今天收获的战绩。安装完svn后就是在svn中建立版本库，比如我本地的是版本库路径是C:\Repositories\pepos。pepos是我的版本库。在pepos的目录结构 pepos component webapps 在conf里面的auth里赋予的权限配置为 [groups]
浅谈程序员的数学修养 comsci 设计模式编程算法面试招聘
浅谈程序员的数学修养
批量执行 bulk collect与forall用法 daizj oracle sql bulk collect forall
BULK COLLECT 子句会批量检索结果，即一次性将结果集绑定到一个集合变量中，并从SQL引擎发送到PL/SQL引擎。通常可以在SELECT INTO、 FETCH INTO以及RETURNING INTO子句中使用BULK COLLECT。本文将逐一描述BULK COLLECT在这几种情形下的用法。有关FORALL语句的用法请参考：批量SQL之 F
Linux下使用rsync最快速删除海量文件的方法 dongwei_6688 OS
1、先安装rsync：yum install rsync 2、建立一个空的文件夹：mkdir /tmp/test 3、用rsync删除目标目录：rsync --delete-before -a -H -v --progress --stats /tmp/test/ log/这样我们要删除的log目录就会被清空了，删除的速度会非常快。rsync实际上用的是替换原理，处理数十万个文件也是秒删。
Yii CModel中rules验证规格 dcj3sjt126com rules yii validate
Yii cValidator主要用法分析： yii验证rulesit 分类： Yii yii的rules验证 cValidator主要属性 attributes ,builtInValidators,enableClientValidation,message,on,safe,skipOnError
基于vagrant的redis主从实验 dcj3sjt126com vagrant
平台: Mac 工具: Vagrant 系统: Centos6.5 实验目的: Redis主从实现思路制作一个基于sentos6.5, 已经安装好reids的box, 添加一个脚本配置从机, 然后作为后面主机从机的基础box 制作sentos6.5+redis的box mkdir vagrant_redis cd vagrant_
Memcached(二)、Centos安装Memcached服务器 frank1234 centos memcached
一、安装gcc rpm和yum安装memcached服务器连接没有找到，所以我使用的是make的方式安装，由于make依赖于gcc，所以要先安装gcc 开始安装，命令如下，[color=red][b]顺序一定不能出错[/b][/color]：建议可以先切换到root用户，不然可能会遇到权限问题：su root 输入密码...... rpm -ivh kernel-head
Remove Duplicates from Sorted List hcx2013 remove
Given a sorted linked list, delete all duplicates such that each element appear only once. For example,Given 1->1->2, return 1->2.Given 1->1->2->3->3, return&
Spring4新特性——JSR310日期时间API的支持 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
浅谈enum与单例设计模式 247687009 java 单例
在JDK1.5之前的单例实现方式有两种(懒汉式和饿汉式并无设计上的区别故看做一种)，两者同是私有构造器，导出静态成员变量，以便调用者访问。第一种 package singleton; public class Singleton { //导出全局成员 public final static Singleton INSTANCE = new S
使用switch条件语句需要注意的几点 openwrt c break switch
1. 当满足条件的case中没有break，程序将依次执行其后的每种条件（包括default）直到遇到break跳出 int main() { int n = 1; switch(n) { case 1: printf("--1--\n"); default: printf("defa
配置Spring Mybatis JUnit测试环境的应用上下文 schnell18 spring mybatis JUnit
Spring-test模块中的应用上下文和web及spring boot的有很大差异。主要试下来差异有：单元测试的app context不支持从外部properties文件注入属性 @Value注解不能解析带通配符的路径字符串解决第一个问题可以配置一个PropertyPlaceholderConfigurer的bean。第二个问题的具体实例是：
Java 定时任务总结一 tuoni java spring timer quartz timertask
Java定时任务总结一.从技术上分类大概分为以下三种方式： 1.Java自带的java.util.Timer类，这个类允许你调度一个java.util.TimerTask任务; 说明： java.util.Timer定时器，实际上是个线程，定时执行TimerTask类 &
一种防止用户生成内容站点出现商业广告以及非法有害等垃圾信息的方法 yangshangchuan rank 相似度计算文本相似度词袋模型余弦相似度
本文描述了一种在ITEYE博客频道上面出现的新型的商业广告形式及其应对方法，对于其他的用户生成内容站点类型也具有同样的适用性。最近在ITEYE博客频道上面出现了一种新型的商业广告形式，方法如下： 1、注册多个账号（一般10个以上）。 2、从多个账号中选择一个账号，发表1-2篇博文