guohuang

如何使用 Python、Node.js 和 Go 创建基于 YOLOv8 的对象检测 Web 服务

1. 介绍

这是有关 YOLOv8 系列文章的第二篇。在上一篇文章中我们介绍了YOLOv8以及如何使用它，然后展示了如何使用 Python 和基于 PyTorch 的官方 YOLOv8 库创建一个 Web 服务来检测图像上的对象。
在本文中，将展示如何在不需要PyTorch和官方API的情况下使用 YOLOv8 模型，将模型部署在不同的端上，使得模型使用的资源减少十倍，并且不仅可以在 Python 上创建服务，还可以在 Node.js、Go 上创建同样的服务。

本文内容将在上一篇文章中开发的Web服务基础上做扩展，前端不做修改，仅使用不同的语言重写后端。

2. YOLOv8 部署

YOLOv8 使用 PyTorch 框架并输出为“.pt”文件。我们使用 Ultralytics API 来训练这些模型或基于它们进行预测。要运行它们，需要有一个包含 Python 和 PyTorch 的环境。
PyTorch 是一个用于设计、训练和评估神经网络模型的框架。然而，我们在应用环境中并不需要PyTorch。我们使用 YOLOv8，在应用中所做的就是把输入图像给模型，通过模型的输出计算目标的边界框、种类、置信度等。这个过程并不一定非得依靠Python，我们可以把YOLOv8训练的模型导出成其他任何类型，从而使用其他编程语言完成这个过程。

目前，我们可以把模型导出为以下格式：TorchScript, ONNX, OpenVINO, TensorRT, CoreML, TF_SavedModel, TF_GraphDef, TF_Lite, TF_Edge_TPU, TF.js, PaddlePaddle。
例如，CoreML 是可在iOS上程序使用的神经网络格式。

本文主要使用ONNX，它由 Microsoft 提出的，可在不同平台和编程语言上运行神经网络模型。它不是一个框架，而只是一个用 C 语言编写的库。对于 Linux 来说，它的大小只有 16 MB，但它提供了主要编程语言的API，包括 Python、PHP、JavaScript、 Node.js、C++、Go 和 Rust。

3. 将 YOLOv8 导出到 ONNX

首先，我们加载 YOLOv8 模型并导出为 ONNX 格式。

from ultralytics import YOLO
model = YOLO("yolov8m.pt")
model.export(format="onnx")

运行上述的代码后，会产生一个和pt模型名称一样，扩展名是.onnx 的文件。比如，上述例子产生yolov8m.onnx 文件。

4. 使用 ONNX 做对象检测

现在，使用 ONNX 来做对象检测。为简单起见，我们将从 Python 开始，因为我们已经有一个使用 PyTorch 和 Ultralytics API 的 Python Web 应用程序。因此，将其转移到 ONNX 会更容易。
通过在 Jupyter 中运行以下命令来安装适用于 Python 的 ONNX 库：

!pip install onnxruntime

导入ONNX

import onnxruntime as ort

我们把库重命名为ort 。

用下面的方式就能加载onnx的模型：

model = ort.InferenceSession("yolov8m.onnx", providers=['CPUExecutionProvider'])

在上一篇的Python版中，只需运行：outputs = model.predict("image_file") 就能获得结果。该方法会执行以下操作：

从文件中读取图像
将其转换为YOLOv8神经网络输入层的格式
通过模型传递它
接收原始模型输出
解析原始模型输出
返回有关检测到的对象及其边界框的结构化信息

ONNX 有类似的方法run，但它只实现了步骤 3 和 4。其他一切都需要开发，因为 ONNX 不知道这是 YOLOv8 模型。就 ONNX 而言，模型是一个黑匣子，它接收多维浮点数数组作为输入，并将其转换为其他多维数字数组。它不知道输入和输出的含义。那么，我们我们要怎么做呢？

模型的输入层和输出层的是固定的，它们是在模型创建时定义的，并保存于模型中。
ONNX 有一个有用的方法get_inputs() 来获取有关此模型期望接收的输入的信息，以及 get_outputs() 来获取有关的信息模型在返回的输出。

让我们首先获取输入：

inputs = model.get_inputs();
len(inputs)

输出为：

这里我们得到了输入数组并显示了该数组的长度。结果很明显：网络期望获得单个输入。让我们访问到这个输入：

input = inputs[0]

输入对象具有三个字段：name、type 和 shape。让我们获取 YOLOv8 模型的这些值：

print("Name:",input.name)
print("Type:",input.type)
print("Shape:",input.shape)

输出如下：

Name: images
Type: tensor(float)
Shape: [1, 3, 640, 640]

从中我们可以看出：

预期输入的名称是images。
输入类型为tensor(float)。我们需要将图像转换为浮点数的多维数组。
形状显示了该Tensor的维度。能看到该数组是四维的，表示输入是1个图像，包含 3 个 640x640 浮点数矩阵。每个矩阵表示红、绿、蓝的分量。每个颜色分量的值可以是 0 到 255。

5. 准备输入

我们需要把输入图像小调整为 640x640，提取有关每个像素的红色、绿色和蓝色分量的信息，并构建 3 个适当颜色分量的矩阵。
假设图像是上一篇我们用到的cat_dog.jpg

使用Pillow完成上述处理。

from PIL import Image
img = Image.open("cat_dog.jpg")
img_width, img_height = img.size
img = img.resize((640,640))

上述代码先把输入图片调整到640x640，接着需要提取每个像素的每个颜色分量并从中构造 3 个矩阵。
首先取消输入图片的Alpha通道：

img = img.convert("RGB");

构建分量数组：

import numpy as np
input = np.array(img)

我们导入了 NumPy 并将图像加载到 input 这个NumPy 数组中。现在让我们看看这个数组的形状：

input.shape

输出为：

(640, 640, 3)

根据输出发现尺寸顺序错误，我们需要将 3 放在开头。 transpose函数可以切换NumPy数组的维度：

input = input.transpose(2,0,1)
input.shape

输出为：

(3,640,640)

我们需要在开始处再添加一个维度来使其成为 (1,3,640,640)：

input = input.reshape(1,3,640,640)

现在我们有了正确的输入内容，如果查看该数组的内容，例如第一个像素的红色分量：

input[0,0,0,0]

输出为：

这里是整数，正确的输出应该是Float，我们需要对此数据做归一化处理，将其缩放到0到1的范围：

input = input/255.0
input[0,0,0,0]

输出为：

0.2784313725490196

这里显示的就是输入数据的样子。

6. 运行模型

现在，在运行推理过程之前，让我们看看 YOLOv8 模型应返回哪些输出。如上所述，这可以使用 ONNX 的 get_outputs() 方法来完成。

outputs = model.get_outputs()
output = outputs[0]
print("Name:",output.name)
print("Type:",output.type)
print("Shape:",output.shape)

输出为：

Name: output0
Type: tensor(float)
Shape: [1, 84, 8400]

从输出中可以看出，ONNX的YOLOv8 有一个输出，它是 outputs 对象的第一项，类型是tensor(float)的格式，形状为 [1,84,8400]，这意味着这是一个嵌套到单个数组的 84x8400 矩阵。实际上， YOLOv8 返回 8400 个边界框，每个边界框有 84 个参数。这里每个边界框都是列，而不是行。这是神经网络算法的要求。我认为最好将其转置为 8400x84，因此，有 8400 行与检测到的对象匹配，并且每行都是具有 84 个参数的边界框。
稍后我们将讨论为什么单个边界框有这么多参数。现在，ONNX可以用run函数来运行模型并获取输出：

model.run(output_names,inputs)

output_names：接收的输出的数组。
inputs ：输入字典，以 {name:tensor} 格式传递到网络，其中 name 是输入名称，tensor 是我们之前准备好的图像数据数组。

具体而言，代码如下：

outputs = model.run(["output0"], {"images":input})
len(outputs)

输出为：

输出表示outputs数组的长度为1，如果提示错误输入，必须采用 float 格式，可以用以下代码转换输入：

input = input.astype(np.float32)

然后再次运行run函数。

7. 处理输出

从输出中提取内容：

output = outputs[0]
output.shape

输出为：

(1, 84, 8400)

返回了正确的输出格式。由于第一个维度只有1个内容，我们可以直接获取它：

output = output[0]
output.shape

输出为：

(84, 8400)

显示是一个84 行、8400 列的矩阵。如前文讨论，我们需要把它转置一下，以方便后续计算：

output = output.transpose()

输出为：

(8400, 84)

现在更清楚了：8400 行，84列个数据。 8400 是 YOLOv8 可以检测的最大边界框数量，并且无论实际检测到多少个对象，它都会为任何图像返回 8400 行，这是因为YOLOv8的网络设计决定。因此，每次都会返回 8400 行，但其中大部分行只包含垃圾。如何检测这些行中哪些有有意义的数据，哪些是垃圾数据？可以看出每一行都有84个数据，其中前 4 个是边界框的坐标，剩余其他的80个数据是该模型可以检测到的所有对象类的置信度。如果使用的是我们自训练的模型，假设能检测到3个对象类，那么输出有 7 个数据（4+3）。

现在来看看第一行的内容：

row = output[0]
print(row)

显示为：

[     5.1182      8.9662      13.247      19.459  2.5034e-06  2.0862e-07  5.6624e-07  1.1921e-07  2.0862e-07  1.1921e-07  1.7881e-07  1.4901e-07  1.1921e-07  2.6822e-07  1.7881e-07  1.1921e-07  1.7881e-07  4.1723e-07  5.6624e-07  2.0862e-07  1.7881e-07  2.3842e-07  3.8743e-07  3.2783e-07  1.4901e-07  8.9407e-08
  3.8743e-07  2.9802e-07  2.6822e-07  2.6822e-07  2.3842e-07  2.0862e-07  5.9605e-08  2.0862e-07  1.4901e-07  1.1921e-07  4.7684e-07  2.6822e-07  1.7881e-07  1.1921e-07  8.9407e-08  1.4901e-07  1.7881e-07  2.6822e-07  8.9407e-08  2.6822e-07  3.8743e-07  1.4901e-07  2.0862e-07  4.1723e-07  1.9372e-06  6.5565e-07
  2.6822e-07  5.3644e-07  1.2815e-06  3.5763e-07  2.0862e-07  2.3842e-07  4.1723e-07  2.6822e-07  8.3447e-07  8.9407e-08  4.1723e-07  1.4901e-07  3.5763e-07  2.0862e-07  1.1921e-07  5.9605e-08  5.9605e-08  1.1921e-07  1.4901e-07  1.4901e-07  1.7881e-07  5.9605e-08  8.9407e-08  2.3842e-07  1.4901e-07  2.0862e-07
  2.9802e-07  1.7881e-07  1.1921e-07  2.3842e-07  1.1921e-07  1.1921e-07]

可以看到这一行代表一个坐标为 [5.1182, 8.9662, 13.247, 19.459] 的边界框。边框表示信息如下：

x_center = 5.1182
y_center = 8.9662
width = 13.247
height = 19.459

提取这个边框：

xc,yc,w,h = row[:4]

剩余其他数值表示检测到的对象属于 80 个类的置信度。比如：数组索引 4 的数据表示类别 0 的置信度 (2.5034e-06)，数组索引 5 的数据表示类别 1 的置信度 (2.0862e-07) ），以此类推。
现在，我们把数据解析为我们在上一篇文章中的格式：[x1, y1, x2 y2，类标签，置信度]。

计算边界框的四个角的坐标：

x1 = xc-w/2
y1 = yc-h/2
x2 = xc+w/2
y2 = yc+h/2

注意：由于输入图像尺寸是640x640，模型返回的坐标也是以640x640来输出的。为了获得原始图像的边界框的坐标，我们需要根据原始图像的尺寸按比例缩放它们。我们将原始宽度和高度保存到了img_width和img_height变量中，为了缩放边界框的角点，我们需要如下计算：

x1 = (xc - w/2) / 640 * img_width
y1 = (yc - h/2) / 640 * img_height
x2 = (xc + w/2) / 640 * img_width
y2 = (yc + h/2) / 640 * img_height

找到最大的对象置信度
我们需要在剩余的80个数据中找到数值最大的那个，在NumPy中可以通过以下方法做到：

prob = row[4:].max()
class_id = row[4:].argmax()
print(prob, class_id)

输出为：

2.503395e-06 0

第一个数据是识别对象的最大置信度。第二个数据是该对象的索引。

接着把对象类索引替换为类标签，由于此模型用的是COCO数据，它的80个数据类如下：

yolo_classes = [
    "person", "bicycle", "car", "motorcycle", "airplane", "bus", "train", 
    "truck", "boat","traffic light", "fire hydrant", "stop sign", "parking meter", 
    "bench", "bird", "cat", "dog", "horse","sheep", "cow", "elephant", "bear", 
    "zebra", "giraffe", "backpack", "umbrella", "handbag", "tie","suitcase", 
    "frisbee", "skis", "snowboard", "sports ball", "kite", "baseball bat", 
    "baseball glove","skateboard", "surfboard", "tennis racket", "bottle", 
    "wine glass", "cup", "fork", "knife", "spoon","bowl", "banana", "apple", 
    "sandwich", "orange", "broccoli", "carrot", "hot dog", "pizza", "donut","cake", 
    "chair", "couch", "potted plant", "bed", "dining table", "toilet", "tv", "laptop", 
    "mouse","remote", "keyboard", "cell phone", "microwave", "oven", "toaster", 
    "sink", "refrigerator", "book","clock", "vase", "scissors", "teddy bear", 
    "hair drier", "toothbrush"
]

接着类标签是：

label = yolo_classes[class_id]

以上就是解析 YOLOv8 输出的每一行的方式。

然而，这个置信度太低了，因为 2.503395e-06 = 2.503395 / 1000000 = 0.000002503。所以，这个边界框，也许只是应该过滤掉的垃圾。在实际中我们会滤掉所有置信度小于 0.5 的边界框。

把上述内容写成函数就是：

def parse_row(row):
    xc,yc,w,h = row[:4]
    x1 = (xc-w/2)/640*img_width
    y1 = (yc-h/2)/640*img_height
    x2 = (xc+w/2)/640*img_width
    y2 = (yc+h/2)/640*img_height
    
    prob = row[4:].max()
    class_id = row[4:].argmax()
    label = yolo_classes[class_id]
    
    return [x1,y1,x2,y2,label,prob]

接着解析模型输出的所有行：

boxes = [row for row in [parse_row(row) for row in output] if row[5] > 0.5]
len(boxes)

输出为：

这里我们解析了所有的行，并过滤掉置信度低于0.5的边框，共得到20个边框。这20个框比8400的结果更接近预期结果，但仍然太多，因为我们的图像只有一只猫和一只狗。这是为什么？让我们显示这些数据：

[261.28302669525146, 95.53291285037994, 461.15666942596437, 313.4492515325546, 'dog', 0.9220365]
[261.16701192855834, 95.61400711536407, 460.9202187538147, 314.0579136610031, 'dog', 0.92195505]
[261.0219168663025, 95.50403118133545, 460.9265221595764, 313.81584787368774, 'dog, 0.9269446]
[260.7873046875, 95.70514416694641, 461.4101188659668, 313.7423722743988, 'dog', 0.9269207]
[139.5556526184082, 169.4101345539093, 255.12585411071777, 314.7275745868683, 'cat', 0.8986903]
[139.5316062927246, 169.63674533367157, 255.05698356628417, 314.6878091096878, 'cat', 0.90628827]
[139.68495998382568, 169.5753903388977, 255.12413234710692, 315.06962299346924, 'cat', 0.88975877]
[261.1445414543152, 95.70124578475952, 461.0543995857239, 313.6095304489136, 'dog', 0.926944]
[260.9405124664307, 95.77976751327515, 460.99450263977053, 313.57664155960083, 'dog', 0.9247296]
[260.49400663375854, 95.79500484466553, 461.3895306587219, 313.5762457847595, 'dog', 0.9034922]
[139.59658827781678, 169.2822597026825, 255.2673086643219, 314.9018738269806, 'cat', 0.88215613]
[139.46405625343323, 169.3733571767807, 255.28112654685975, 314.9132820367813, 'cat', 0.8780577]
[139.633131980896, 169.65343713760376, 255.49261894226075, 314.88970375061035, 'cat', 0.8653987]
[261.18754177093507, 95.68838310241699, 461.0297842025757, 313.1688747406006, 'dog', 0.9215225]
[260.8274451255798, 95.74608707427979, 461.32597131729125, 313.3906273841858, 'dog', 0.9093932]
[260.5131794929504, 95.89693665504456, 461.3481791496277, 313.24405217170715, 'dog', 0.8848127]
[139.4986301422119, 169.38371658325195, 255.34583129882813, 314.9019331932068, 'cat', 0.836439]
[139.55282192230223, 169.58951950073242, 255.61378440856933, 314.92880630493164, 'cat', 0.87574947]
[139.65414333343506, 169.62119138240814, 255.79856758117677, 315.1192432641983, 'cat', 0.8512477]
[139.86577434539797, 169.38782274723053, 255.5904968261719, 314.77193105220795, 'cat', 0.8271704]

这些框都有很高的置信度，并且它们的坐标相互重叠。让我们在图像上画出这些框来看看：

from PIL import ImageDraw
img = Image.open("cat_dog.jpg")
draw = ImageDraw(img)

循环画出20个框

for box in boxes:
    x1,y1,x2,y2,class_id,prob = box
    draw.rectangle((x1,y1,x2,y2),None,"#00ff00")

结果如下：

所有的 20 个边界框都绘制在了一起，因此它们看起来只是 2 个边界框。对用户而言，可以看到所有的 20 个结果都属于相同的对象，但是对于程序而言，它认为它发现了 20 种不同的相互重叠的猫和狗。

我们需要从结果里过滤掉不需要的内容，这要怎么能做呢？比如：我们可以保留狗概率最高的框和猫概率最高的框，并删除其他框。但是，这并不是适用于所有的情况，比如图片上有很多不同的猫和狗。我们需要使用一些通用算法来删除所有彼此紧密重叠的框，可以使用非极大值抑制方法（简称：nms），它有以下一些步骤：

创建一个空的结果数组，其中包含要保留的框的列表。
开始循环。
从源框数组中，选择概率最高的框并将其移动到结果数组中。
将所选框与源数组中的每个其他框进行比较，并删除与所选框重叠过多的所有框。
如果源数组包含更多框，从步骤 2 重复。

循环完成后，源框数组将为空，结果数组仅包含不同的框。具体描述下如何实现步骤4，如何比较两个框并发现它们彼此重叠太多。我们使用一个叫oU的概念：

核心思想是：

计算两个边框的交集面积。
计算两个边框的并集面积。
用交集面积除以并集面积。

结果越接近 1，两个边框相互重叠的程度就越大。同时可以直观地看到这一点：两个边框的交集区域与其并集区域越接近，它看起来就越像同一个盒子。在公式下方的左侧框中，这些框彼此重叠，但不会太多，这种情况下的 IoU 可能约为 0.3。当然，这两个边框可以被视为不同的对象，即使它们重叠。在第二个例子中，很明显，交集的面积更接近它们并集的面积，也许这里的 IoU 约为 0.8。很有可能这些边框里的某一个应该被移除。最后，例子右侧上的方框代表几乎相同的区域，并且只应保留其中一个。

现在让我们在代码中实现 IoU 和非极大值抑制：

计算交集面积：

def intersection(box1,box2):
    box1_x1,box1_y1,box1_x2,box1_y2 = box1[:4]
    box2_x1,box2_y1,box2_x2,box2_y2 = box2[:4]
    x1 = max(box1_x1,box2_x1)
    y1 = max(box1_y1,box2_y1)
    x2 = min(box1_x2,box2_x2)
    y2 = min(box1_y2,box2_y2)
    
    return (x2-x1)*(y2-y1)

计算并集面积：

def union(box1,box2):
    box1_x1,box1_y1,box1_x2,box1_y2 = box1[:4]
    box2_x1,box2_y1,box2_x2,box2_y2 = box2[:4]
    box1_area = (box1_x2-box1_x1)*(box1_y2-box1_y1)
    box2_area = (box2_x2-box2_x1)*(box2_y2-box2_y1)
    
    return box1_area + box2_area - intersection(box1,box2)

用交集面积除以并集面积：

def iou(box1,box2):
    return intersection(box1,box2) / union(box1,box2)

非极大值抑制

因此，我们在变量中有一个边框数组boxes，我们只需要在其中保留不同的项目，使用创建的iou函数作为差异标准。假设如果IoU两个盒子中的一个小于 0.7，那么它们都应该留下。否则，其中一个可能性较小的应该删除。具体实现如下：

boxes.sort(key=lambda x: x[5], reverse=True)
result = []
while len(boxes) > 0:
    result.append(boxes[0])
    boxes = [box for box in boxes if iou(box,boxes[0])<0.7]

为了方便起见，在第一行中，我们按相反的顺序对所有边框进行排序，将概率最高的框移动到顶部。

然后代码定义结果框的数组。在循环中，将第一个框（概率最高的框）放入结果数组中，并在下一行中仅使用框覆盖框数组，这些框与所选框的“IoU”小于 0.7 。它继续循环执行此操作，直到boxes不包含任何内容。
运行后，可以打印result数组：

print(result)

[
[261.0219168663025, 95.50403118133545, 460.9265221595764, 313.81584787368774, 'dog', 0.9269446],
[139.5316062927246, 169.63674533367157, 255.05698356628417, 314.6878091096878, 'cat', 0.90628827]
]

现在它只有 2 个内容，IoU 发挥了作用，以最高的概率为猫和狗选择了最好的边框。

目前为止，我们已经了解了model.predict()的工作原理。现在，我们使用 ONNX 支持的任何编程语言创建使用 YOLOv8 模型的应用程序，接着我们来讨论要如何做。

在接下来的部分中，我们将重构上一篇文章中编写的对象检测 Web 服务，以使用 ONNX 而不是 PyTorch。我们将使用 Python、Node.js、Go 重写它。

8. 在 Python 上创建 Web 服务

8.1 创建项目

我们将使用上一篇文章中创建的项目作为基础。

创建一个新文件夹并将以下文件从上面的项目复制到其中：

index.html
object_detector.py
requirements.txt
yolov8m.onnx

打开requirements.txt文件并将ultralytics依赖项替换为onnxruntime. 另外，将该numpy包添加到列表中。之后，文件内容如下：

onnxruntime
flask
waitress
pillow
numpy

使用 pip 安装依赖：

pip install -r requirements.txt

我们不修改index.html，唯一要修改的文件是object_detector.py，我们将在其中重写之前使用 Ultralytics的API 来使用 ONNX 的对象检测代码。

import onnxruntime as ort
from flask import request, Flask, jsonify
from waitress import serve
from PIL import Image
import numpy as np
import json

app = Flask(__name__)

def main():
    serve(app, host='0.0.0.0', port=8080)
    
 @app.route("/")
 def root():
     with open("index.html") as file:
         return file.read()
         
@app.route("/detect", methods=["POST"])
def detect():
    buf = request.files["image_file"]
    boxes = detect_objects_on_image(buf.stream)
    return jsonify(boxes)
    
def detect_objects_on_image(buf):
    model = YOLO("best.pt")
    results = model.predict(buf)
    result = results[0]
    output = []
    for box in result.boxes:
        x1, y1, x2, y2 = [round(x) for x in box.xyxy[0].tolist()]
        class_id = box.cls[0].item()
        prob = round(box.conf[0].item(), 2)
        output.append([x1, y1, x2, y2, result.names[class_id], prob])
        return output
        
 main()

我们将仅重写detect_objects_on_image，以使用 ONNX 而不是 Ultralytics，实现会比现在更复杂。
dected_objects_on_image函数分为三个部分：

准备输入 prepare_input
运行模型 run_model
处理输出 process_output

每个阶段我们都会放入一个单独的函数，该函数detect_objects_on_image将被调用。更新后文件内容如下：

def detect_objects_on_image(buf):
    input, img_width, img_height = prepare_input(buf)
    output = run_model(input)
    return process_output(output,img_width,img_height)
    
def prepare_input(buf):
    pass
    
def run_model(input):
    pass
    
def process_output(output,img_width,img_height):
    pass

8.2 准备输入

把以下代码放入到prepare_input中：

def prepare_input(buf):
    img = Image.open(buf)
    img_width, img_height = img.size
    img = img.resize((640, 640))
    img = img.convert("RGB")
    input = np.array(img)
    input = input.transpose(2, 0, 1)
    input = input.reshape(1, 3, 640, 640) / 255.0
    return input.astype(np.float32), img_width, img_height

加载图像
调整其大小到640*640，转换为 RGB 来删除透明度。
然后，转置并重塑数组，将其从 (640,640,3) 转换为 (1,3,640,640) ，将所有值除以 255.0 以对其归一化处理。
最后，返回Float32的数组以及原始图片的宽高。

8.3 运行模型

将以下代码放入run_model中：

def run_model(input):
    model = ort.InferenceSession("yolov8m.onnx", providers=['CPUExecutionProvider'])
    outputs = model.run(["output0"], {"images":input})
    
    return outputs[0]

首先，加载模型yolov8m.onnx，然后使用run方法做模型推理。最后，返回第一个输出，它是一个 (1,84,8400) 的数组。

8.4 处理输出

将一下代码放入process_output中：

def process_output(output, img_width, img_height):
    output = output[0].astype(float)
    output = output.transpose()
    boxes = []
    
    for row in output:
        prob = row[4:].max()
        if prob < 0.5:
            continueclass_id = row[4:].argmax()
            label = yolo_classes[class_id]
            xc, yc, w, h = row[:4]
            x1 = (xc - w/2) / 640 * img_width
            y1 = (yc - h/2) / 640 * img_height
            x2 = (xc + w/2) / 640 * img_width
            y2 = (yc + h/2) / 640 * img_height
            boxes.append([x1, y1, x2, y2, label, prob])
            boxes.sort(key=lambda x: x[5], reverse=True)
            
            result = []
            while len(boxes) > 0:
                result.append(boxes[0])
                boxes = [box for box in boxes if iou(box, boxes[0]) < 0.7]
                return result

前两行将输出从 (1,84,8400) 转换为 (8400,84)。
第一个循环用于遍历行。对于每一行，计算此预测的概率，如果概率小于 0.5，则跳过所有行。
对于通过概率检查的行，确定检测到的对象和对应的class_id标签等信息。
然后它使用边界框的中心、宽和高的坐标来计算边界框的角坐标。之后，还缩放到原始图像尺寸。
然后它将计算出的边界框写入到boxes数组中。
该函数的最后一部分boxes使用“非极大值抑制”算法过滤检测到的结果，它会过滤所有与框重叠的概率最高的边界框。
最后，所有通过过滤器的框都以result数组形式返回。

其中使用到的其他相关代码如下：

def iou(box1,box2):
    return intersection(box1,box2)/union(box1,box2)
    
def union(box1,box2):
    box1_x1,box1_y1,box1_x2,box1_y2 = box1[:4]
    box2_x1,box2_y1,box2_x2,box2_y2 = box2[:4]
    box1_area = (box1_x2-box1_x1)*(box1_y2-box1_y1)
    box2_area = (box2_x2-box2_x1)*(box2_y2-box2_y1)
    return box1_area + box2_area - intersection(box1,box2)
 
def intersection(box1,box2):
    box1_x1,box1_y1,box1_x2,box1_y2 = box1[:4]
    box2_x1,box2_y1,box2_x2,box2_y2 = box2[:4]
    x1 = max(box1_x1,box2_x1)
    y1 = max(box1_y1,box2_y1)
    x2 = min(box1_x2,box2_x2)
    y2 = min(box1_y2,box2_y2)
    return (x2-x1)*(y2-y1)
    
yolo_classes = [
    "person", "bicycle", "car", "motorcycle", "airplane", 
    "bus", "train", "truck", "boat","traffic light", "fire hydrant", 
    "stop sign", "parking meter", "bench", "bird", "cat", "dog", 
    "horse","sheep", "cow", "elephant", "bear", "zebra", "giraffe", 
    "backpack", "umbrella", "handbag", "tie","suitcase", "frisbee", 
    "skis", "snowboard", "sports ball", "kite", "baseball bat", 
    "baseball glove","skateboard", "surfboard", "tennis racket", 
    "bottle", "wine glass", "cup", "fork", "knife", "spoon","bowl", 
    "banana", "apple", "sandwich", "orange", "broccoli", "carrot", 
    "hot dog", "pizza", "donut","cake", "chair", "couch", "potted plant", 
    "bed", "dining table", "toilet", "tv", "laptop", "mouse",
    "remote", "keyboard", "cell phone", "microwave", "oven", "toaster", 
    "sink", "refrigerator", "book","clock", "vase", "scissors", 
    "teddy bear", "hair drier", "toothbrush"
]

接着，我们可以通过以下命令来运行任务：

python object_detector.py

然后在浏览器中访问http://localhost:8080即可获取服务了。

Onnxruntime 是一个低级库，因此需要更多代码才能使模型工作，但是，这种方式更适合在生产中部署，因为它使用的硬盘空间减少了 10 倍。

9. 在 Node.js 上创建 Web 服务

在本节中，我将展示如何使用 onnxruntime 库时在 Node.js 上重写我们的对象检测 Web 服务。

9.1 创建项目

为项目创建新文件夹，如object_detector，在其中创建新的Node.js项目。

npm init

安装所需的依赖项：

npm i --save onnxruntime-node
npm i --save express
npm i --save multer
npm i --save sharp

同样我们不修改index.html，只修改后端文件。
创建一个object_detector.js文件，内容如下：

const ort = require("onnxruntime-node");
const express = require('express');
const multer = require("multer");
const sharp = require("sharp");
const fs = require("fs");

function main() {
    const app = express();
    const upload = multer();
    
    app.get("/", (req,res) => {
        res.end(fs.readFileSync("index.html", "utf8"))
    })
    
    app.post('/detect', upload.single('image_file'), async function (req, res) {
        const boxes = await detect_objects_on_image(req.file.buffer);
        res.json(boxes);
    });
    
    app.listen(8080, () => {
        console.log('Server is listening on port 8080')
    });
}

async function detect_objects_on_image(buf) {
    const [input,img_width,img_height] = await prepare_input(buf);
    const output = await run_model(input);
    return process_output(output,img_width,img_height);
}

async function prepare_input(buf) {
}

async function run_model(input) {
}

async function process_output(output, img_width, img_height) {
}

main()

在第一行中，require导入所有必需的外部模块：ort用于 ONNX 模型处理、express用于 Web 框架、multer支持 Express 框架中的文件上传、sharp将上传的文件作为图像加载并将其转换为像素颜色数组以及fs读取文件。
在main函数中，创建一个新的 Express Web 应用程序app。
然后定义了两个路由：根路由index.html和/detect用于上传文件的路由，将其传递给函数detect_objects_on_image并将检测到的对象的边界框返回给客户端。
看起来与Python的detect_objects_on_image逻辑几乎相同：首先它将上传的文件转换为数字数组，将其传递给模型，处理输出并返回检测到的对象的数组。
最后，main()调用该函数在端口 8080 上启动 Web 服务器。

项目已经准备好了，是时候实现prepare_input、run_model和process_output等功能了。

9.2 准备输入

使用Sharp库将图像加载为像素数组。但是，JavaScript 没有像 NumPy 这样支持多维数组的包。JavaScript 中的所有数组都是扁平的。我们可以制作“数组的数组”，但它不是真正的多维数组。例如，我们不能制作 (3,640,640) 的数组。相反，Javascript 的 onnxruntime 需要具有 3640640=1228800 个元素的平面数组，其中红色位于开头部分，绿色位于中间部分，蓝色位于末尾部分。这是函数应该返回的结果prepare_input。现在让我们一步一步来做。

首先，让我们对图像执行与其他语言中相同的操作：

function prepare_input(buf) {
    const img = sharp(buf);
    const md = await img.metadata();
    const [img_width,img_height] = [md.width, md.height];
    const pixels = await img.removeAlpha()
        .resize({width:640,height:640,fit:'fill'})
        .raw()
        .toBuffer();

使用sharp加载文件图像。
删除alpha通道。
将图像大小调整为 640x640。
将图像原始像素数组返回到缓冲区。

Sharp 也无法返回像素矩阵，因为 JavaScript 中没有矩阵。这就是为什么现在有pixels包含图像像素的一维数组，其中红色先排列，接着是绿色部分，最后是蓝色部分。其排列如图所示：

接着我们来处理像素，第一步是创建 3 个红色、绿色和蓝色数组：

const red = [], green = [], blue = [];

然后，遍历pixels数组并将数字收集到适当的数组中：

for (let index=0; index<pixels.length; index+=3) {
    red.push(pixels[index]/255.0);
    green.push(pixels[index+1]/255.0);
    blue.push(pixels[index+2]/255.0);
}

在每次迭代中，index等于当前像素的红色分量，index+1等于绿色分量，index+2等于蓝色分量。同时，将分量除以 255.0 进行归一化处理。
这是完整的prepare_input代码：

async function prepare_input(buf) {
    const img = sharp(buf);
    const md = await img.metadata();
    const [img_width,img_height] = [md.width, md.height];
    const pixels = await img.removeAlpha()
        .resize({width:640,height:640,fit:'fill'})
        .raw()
        .toBuffer();
        
   const red = [], green = [], blue = [];
   for (let index=0; index<pixels.length; index+=3) {
       red.push(pixels[index]/255.0);
       green.push(pixels[index+1]/255.0);
       blue.push(pixels[index+2]/255.0);
   }
   
   const input = [...red, ...green, ...blue];
   return [input, img_width, img_height];
}

接着让我们来运行模型。

9.3 运行模型

run_model代码如下：

async function run_model(input) {
    const model = await ort.InferenceSession.create("yolov8m.onnx");
    input = new ort.Tensor(Float32Array.from(input),[1, 3, 640, 640]);
    const outputs = await model.run({images:input});
    return outputs["output0"].data;
 }

在第一行，从文件加载模型yolov8m.onnx。
在第二行，准备输入数组。将其转换为内部ort.Tensor对象。
在第三行，运行模型并接收outputs。
最后，我们返回第一个输出的数据。在 JavaScript 版本中，我们需要指定此输出的名称，而不是索引。

结果，该函数返回形为 (1,84,8400) 的数组，或者可以将其看做 84x8400 的矩阵。然而，JavaScript 不支持矩阵，这就是为什么它以一维数组的形式返回输出。该数组中的数字按 84x8400 排序，但作为包含 705600 个数据的一维数组。因此，不能转置它，也不能在循环中按行遍历它，接着我们将学习如何处理它。

9.4 处理输出

该process_output函数的代码将使用IoU算法来过滤掉所有重叠的框。将iou、intersect 和 union 函数从 Python重写为 JavaScript 很容易。将它们包含到函数下方的代码中process_output：

function iou(box1,box2) {
    return intersection(box1,box2)/union(box1,box2);
}

function union(box1,box2) {
    const [box1_x1,box1_y1,box1_x2,box1_y2] = box1;
    const [box2_x1,box2_y1,box2_x2,box2_y2] = box2;
    const box1_area = (box1_x2-box1_x1)*(box1_y2-box1_y1);
    const box2_area = (box2_x2-box2_x1)*(box2_y2-box2_y1);
    return box1_area + box2_area - intersection(box1,box2);
}

function intersection(box1,box2) {
    const [box1_x1,box1_y1,box1_x2,box1_y2] = box1;
    const [box2_x1,box2_y1,box2_x2,box2_y2] = box2;
    const x1 = Math.max(box1_x1,box2_x1);
    const y1 = Math.max(box1_y1,box2_y1);
    const x2 = Math.min(box1_x2,box2_x2);
    const y2 = Math.min(box1_y2,box2_y2);
    return (x2-x1)*(y2-y1);
}

另外，需要通过 ID 查找 YOLO 类标签，因此将数组添加yolo_classes到代码中：

const yolo_classes = [
    'person', 'bicycle', 'car', 'motorcycle', 'airplane', 'bus', 'train', 
    'truck', 'boat','traffic light', 'fire hydrant', 'stop sign', 
    'parking meter', 'bench', 'bird', 'cat', 'dog', 'horse','sheep', 
    'cow', 'elephant', 'bear', 'zebra', 'giraffe', 'backpack', 'umbrella', 
    'handbag', 'tie', 'suitcase','frisbee', 'skis', 'snowboard', 
    'sports ball', 'kite', 'baseball bat', 'baseball glove', 'skateboard',
    'surfboard', 'tennis racket', 'bottle', 'wine glass', 'cup', 'fork', 
    'knife', 'spoon', 'bowl', 'banana', 'apple','sandwich', 'orange', 'broccoli', 
    'carrot', 'hot dog', 'pizza', 'donut', 'cake', 'chair', 'couch', 
    'potted plant','bed', 'dining table', 'toilet', 'tv', 'laptop', 'mouse', 
    'remote', 'keyboard', 'cell phone', 'microwave', 'oven','toaster', 
    'sink', 'refrigerator', 'book', 'clock', 'vase', 'scissors', 'teddy bear', 
    'hair drier', 'toothbrush'
];

现在我们来实现process_output。如上所述，该函数的输入是 84x8400 矩阵排列的一维数组。在Python中工作时，我们使用NumPy将其转换为8400x84，然后逐行循环遍历。这里，我们不能这样转换它，所以，我们需要按列遍历它。

boxes=[];
for (index=0;index<8400;index++) {

}

而且，没有行索引和列索引，只有绝对索引。只能在头脑中将这个一维数组虚拟地重塑为 84x8400 矩阵，并使用这些“虚拟行”和“虚拟列”使用此表示来计算这些绝对索引。
如下图所示：

在这里，我们实际上将output包含 705600 个项目的数组重塑为 84x8400 矩阵。它有 8400 列，索引从 0 到 8399，84 行，索引从 0 到 83。数据的绝对索引写在方框内。每个检测到的对象都由该矩阵中的一列表示。每列的前 4 行索引从 0 到 3 对应的是对象的边界框的坐标：x_center、y_center、宽、高。其他 80 行中的单元格（从 4 到 83）包含对象属于 80 个 YOLO 类中每个类的概率。

这张表是为了了解如何在知道行索引和列索引的情况下计算其中任何数据的绝对索引。例如，如何计算位于第 2 行第 2 列的第一个灰色数据的索引？要计算该数据，需要将行索引乘以行的长度 (8400)，然后再加列索引。我们来算一下：84002+2=16802，对同一对象来说，他的边界框高度是：84003+2=25202。

这样，刚才那个空循环代码如下：

boxes=[];
for (index=0;index<8400;index++) {
    const xc = output[8400*0+index];
    const yc = output[8400*1+index];
    const w = output[8400*2+index];
    const h = output[8400*3+index];
}

然后可以计算边界框并将其缩放到原始图像的大小：

const x1 = (xc-w/2)/640*img_width;
const y1 = (yc-h/2)/640*img_height;
const x2 = (xc+w/2)/640*img_width;
const y2 = (yc+h/2)/640*img_height;

现在，需要获取第 4 行到第 83 行中的对象的概率，找到其中哪一个最大以及该概率的索引，并将这些值保存起来。代码如下：

let class_id = 0, prob = 0;
for (let col=4;col<84;col++) {
    if (output[8400*col+index]prob) {
        prob = output[8400*col+index];
        class_id = col - 4;
     }
 }

换一种性能更高的写法：

const [class_id,prob] = [...Array(80).keys()]
    .map(col => [col, output[8400*(col+4)+index]])
    .reduce((accum, item) => item[1]accum[1] ? item : accum,[0,0]);

如果概率小于 0.5，您可以跳过该对象，或者找到该类的标签。
最终代码如下：

let boxes = [];
for (let index=0;index<8400;index++) {
    const [class_id,prob] = [...Array(80).keys()]
        .map(col => [col, output[8400*(col+4)+index]])
        .reduce((accum, item) => item[1]accum[1] ? item : accum,[0,0]);
    if (prob < 0.5) {
        continue;
    }
    const label = yolo_classes[class_id];
    const xc = output[index];
    const yc = output[8400+index];
    const w = output[2*8400+index];
    const h = output[3*8400+index];
    const x1 = (xc-w/2)/640*img_width;
    const y1 = (yc-h/2)/640*img_height;
    const x2 = (xc+w/2)/640*img_width;
    const y2 = (yc+h/2)/640*img_height;
    boxes.push([x1,y1,x2,y2,label,prob]);
}

boxes最后一步是使用“非极大值抑制”过滤数组，以排除其中所有重叠的框。

boxes = boxes.sort((box1,box2) => box2[5]-box1[5]);
const result = [];
while (boxes.length0) {
    result.push(boxes[0]);
    boxes = boxes.filter(box => iou(boxes[0],box)<0.7);
}

按相反的顺序对输出框进行排序，将概率最高的框放在顶部
通过一个循环，把概率最高的框放入result
然后过滤掉所有与所选框重叠过多的框（与该框IoU>0.7的所有框）

完整代码如下：

function process_output(output, img_width, img_height) {
    let boxes = [];
    for (let index=0;index<8400;index++) {
        const [class_id,prob] = [...Array(80).keys()]
            .map(col => [col, output[8400*(col+4)+index]])
            .reduce((accum, item) => item[1]accum[1] ? item : accum,[0,0]);
            
        if (prob < 0.5) {
            continue;
        }
        const label = yolo_classes[class_id];
        const xc = output[index];
        const yc = output[8400+index];
        const w = output[2*8400+index];
        const h = output[3*8400+index];
        const x1 = (xc-w/2)/640*img_width;
        const y1 = (yc-h/2)/640*img_height;
        const x2 = (xc+w/2)/640*img_width;
        const y2 = (yc+h/2)/640*img_height;
        boxes.push([x1,y1,x2,y2,label,prob]);
    }
    boxes = boxes.sort((box1,box2) => box2[5]-box1[5]);
    const result = [];
    while (boxes.length0) {
        result.push(boxes[0]);
        boxes = boxes.filter(box => iou(boxes[0],box)<0.7);
     }
     return result;
}

通过运行以下命令来启动此 Web 服务：

node object_detector.js

打开浏览器并输入http://localhost:8080即可访问服务。

10. 在 Go 上创建 Web 服务

10.1 创建项目

创建一个新项目目录，进入并初始化项目

go mod init object_detector

安装所需的外部模块：

go get github.com/yalue/onnxruntime_go
go get github.com/nfnt/resize

github.com/yalue/onnxruntime_go： Golang 的 ONNX 库。
github.com/nfnt/resize：处理图像的库。

同Python和Node.js，我们只需要修改后端程序即可。

我们创建一个main.go的文件，内容如下：

package main

import (
    "encoding/json"
    "github.com/nfnt/resize"
    ort "github.com/yalue/onnxruntime_go"
    "image"
    _ "image/gif"
    _ "image/jpeg"
    _ "image/png"
    "io"
    "math"
    "net/http"
    "os"
    "sort"
)

func main() {
    server := http.Server{Addr: "0.0.0.0:8080",}
    http.HandleFunc("/", index)
    http.HandleFunc("/detect", detect)
    server.ListenAndServe()
}

func index(w http.ResponseWriter, _ *http.Request) {
    file, _ := os.Open("index.html")
    buf, _ := io.ReadAll(file)
    w.Write(buf)
}

func detect(w http.ResponseWriter, r *http.Request) {
    r.ParseMultipartForm(0)
    file, _, _ := r.FormFile("image_file")
    boxes := detect_objects_on_image(file)
    buf, _ := json.Marshal(&boxes)
    w.Write(buf)
}

func detect_objects_on_image(buf io.Reader) [][]interface{} {
    input, img_width, img_height := prepare_input(buf)
    output := run_model(input)
    return process_output(output, img_width, img_height)
}

func prepare_input(buf io.Reader) ([]float32, int64, int64) {

}

func run_model(input []float32) []float32 {

}

func process_output(output []float32, img_width, img_height int64) [][]interface{} {

}

首先，我们导入所需的包：

encoding/json在发送响应之前将边界框编码为 JSON
github.com/nfnt/resize将图像大小调整为 640x640
ort "github.com/yalue/onnxruntime_go"ONNX 运行时库，我们将其重命名为ort
image, image/gif, image/jpeg, image/png图片库和支持不同格式图片的库
io从本地文件读取数据
math对于Max一个Min函数
net/http创建并运行网络服务器
os打开本地文件
sort对边界框进行排序

然后，该main函数定义两个 HTTP 服务，并在端口 8080 上启动Web 服务。

index函数仅返回文件的内容index.html。
detect函数接收上传的图像文件，将其传递给函数detect_objects_on_image，然后利用 YOLOv8 模型推了，获得输出的边界框，接着将它们编码为 JSON 并返回到前端。
这detect_objects_on_image与之前的语言的项目相同。唯一的区别是它返回的值的类型，即[][]interface{}，表示边界框数组。每个边界框都是一个包含 6 个项目的数组（x1，y1，x2，y2，种类标签，置信度）。

10.2 准备输入

要准备 YOLOv8 模型的输入，首先加载图像，调整其大小并转换为 (3,640,640) 的张量，其中第一项是图像像素的红色分量数组，第二项是绿色分量数组，最后一个是蓝色数组。此外，Go 的 ONNX 库要求输入这个张量作为一维数组，例如将这三个数组一个接一个地连接起来，就像下一张图像上显示的那样。

代码如下：

func prepare_input(buf io.Reader) ([]float32, int64, int64) {
    img, _, _ := image.Decode(buf)
    size := img.Bounds().Size()
    img_width, img_height := int64(size.X), int64(size.Y)
    img = resize.Resize(640, 640, img, resize.Lanczos3)

这段代码完成了加载图像，并将其大小调整为 640x640 像素。
然后将像素的颜色分到不同的数组中：

 red := []float32{}
 green := []float32{}
 blue := []float32{}

接着需要从图像中提取像素及其颜色，并把他们归一化，代码如下：

for y := 0; y < 640; y++ {
    for x := 0; x < 640; x++ {
        r, g, b, _ := img.At(x, y).RGBA()
        red = append(red, float32(r/257)/255.0)
        green = append(green, float32(g/257)/255.0)
        blue = append(blue, float32(b/257)/255.0)
    }
}

最后，以正确的顺序将这些数组连接成一个数组：

input := append(red, green...)
input = append(input, blue...)

完整的prepare_input代码如下：

func prepare_input(buf io.Reader) ([]float32, int64, int64) {
    img, _, _ := image.Decode(buf)
    size := img.Bounds().Size()
    img_width, img_height := int64(size.X), int64(size.Y)
    img = resize.Resize(640, 640, img, resize.Lanczos3)
    red := []float32{}
    green := []float32{}
    blue := []float32{}
    for y := 0; y < 640; y++ {
        for x := 0; x < 640; x++ {
            r, g, b, _ := img.At(x, y).RGBA()
            red = append(red, float32(r/257)/255.0)
            green = append(green, float32(g/257)/255.0)
            blue = append(blue, float32(b/257)/255.0)
         }
     }
     input := append(red, green...)
     input = append(input, blue...)
     return input, img_width, img_height
}

10.3 运行模型

run_model的代码如下：

func run_model(input []float32) []float32 {
    ort.SetSharedLibraryPath("./libonnxruntime.so")
    _ = ort.InitializeEnvironment()
    
    inputShape := ort.NewShape(1, 3, 640, 640)
    inputTensor, _ := ort.NewTensor(inputShape, input)
    
    outputShape := ort.NewShape(1, 84, 8400)
    outputTensor, _ := ort.NewEmptyTensor[float32](outputShape)
    
    model, _ := ort.NewSession[float32]("./yolov8m.onnx",
        []string{"images"}, 
        []string{"output0"},
        []*ort.Tensor[float32]{inputTensor},
        []*ort.Tensor[float32]{outputTensor}
    )
    _ = model.Run()
    return outputTensor.GetData()
}

我们从ONNX官网上下载了对应的库，并命名为libonnxruntime.so，在程序中加载使用。
然后，库需要将其转换input为形状为 (1,3,640,640) 的内部张量格式。
为输出创建一个空结构。ONNX 库不返回输出，而是将其写入预先定义的变量中。在这里，我们将outputTensor变量定义为形状为 (1,84,8400) 的张量，用于接收来自模型的数据。
然后我们创建一个NewSession，接收输入和输出名称数组以及输入和输出张量数组。
然后我们运行这个模型，处理输入并将输出写入变量outputTensor。
该outputTensor.GetData()方法以浮点数字的一维数组形式返回输出数据。

结果，该函数返回形状为 (1,84,8400) 的数组，可以将其视为大约 84x8400 矩阵。它以一维数组的形式返回。所以，你不能转置它。

10.4 处理输出

该process_output函数的代码将使用 IoU 算法来过滤掉所有重叠的框。将 Python 中的iou、intersect 和 union 函数重写为 Go 很容易。将它们包含到函数的代码中process_output：

func iou(box1, box2 []interface{}) float64 {
    return intersection(box1, box2) / union(box1, box2)
}

func union(box1, box2 []interface{}) float64 {
    box1_x1, box1_y1, box1_x2, box1_y2 := box1[0].(float64), box1[1].(float64), box1[2].(float64), box1[3].(float64)
    box2_x1, box2_y1, box2_x2, box2_y2 := box2[0].(float64), box2[1].(float64), box2[2].(float64), box2[3].(float64)
    box1_area := (box1_x2 - box1_x1) * (box1_y2 - box1_y1)
    box2_area := (box2_x2 - box2_x1) * (box2_y2 - box2_y1)
    
    return box1_area + box2_area - intersection(box1, box2)
}

func intersection(box1, box2 []interface{}) float64 {
    box1_x1, box1_y1, box1_x2, box1_y2 := box1[0].(float64), box1[1].(float64), box1[2].(float64), box1[3].(float64)
    box2_x1, box2_y1, box2_x2, box2_y2 := box2[0].(float64), box2[1].(float64), box2[2].(float64), box2[3].(float64)
    x1 := math.Max(box1_x1, box2_x1)y1 := math.Max(box1_y1, box2_y1)
    x2 := math.Min(box1_x2, box2_x2)y2 := math.Min(box1_y2, box2_y2)
    
    return (x2 - x1) * (y2 - y1)
}

同样创建种类标签：

var yolo_classes = []string{
    "person", "bicycle", "car", "motorcycle", "airplane", "bus", "train", 
    "truck", "boat","traffic light", "fire hydrant", "stop sign", 
    "parking meter", "bench", "bird", "cat", "dog", "horse","sheep", 
    "cow", "elephant", "bear", "zebra", "giraffe", "backpack", "umbrella", 
    "handbag", "tie","suitcase", "frisbee", "skis", "snowboard", "sports ball", 
    "kite", "baseball bat", "baseball glove","skateboard", "surfboard", 
    "tennis racket", "bottle", "wine glass", "cup", "fork", "knife", 
    "spoon","bowl", "banana", "apple", "sandwich", "orange", "broccoli", 
    "carrot", "hot dog", "pizza", "donut","cake", "chair", "couch", 
    "potted plant", "bed", "dining table", "toilet", "tv", "laptop", "mouse",
    "remote", "keyboard", "cell phone", "microwave", "oven", "toaster", "sink", 
    "refrigerator", "book","clock", "vase", "scissors", "teddy bear", 
    "hair drier", "toothbrush",
}

如上所述，该函数接收以 84x8400 矩阵排序的平面数组形式的输出。这里类同前述Node.js版本的处理。只能在头脑中将这个一维数组虚拟地重塑为 84x8400 矩阵，并使用这些“虚拟行”和“虚拟列”使用此表示来计算这些绝对索引。
如下图所示：

在这里，我们实际上将output包含 705600 个项目的数组重塑为 84x8400 矩阵。它有 8400 列，索引从 0 到 8399，84 行，索引从 0 到 83。数据的绝对索引写在方框内。每个检测到的对象都由该矩阵中的一列表示。每列的前 4 行索引从 0 到 3 对应的是对象的边界框的坐标：x_center、y_center、宽、高。其他 80 行中的单元格（从 4 到 83）包含对象属于 80 个 YOLO 类中每个类的概率。

代码如下：

boxes := [][]interface{}{}
for index := 0; index < 8400; index++ {
    xc := output[index]
    yc := output[8400+index]
    w := output[2*8400+index]
    h := output[3*8400+index]
}

然后，计算边界框的角并将其缩放到原始图像的大小：

x1 := (xc - w/2) / 640 * float32(img_width)
y1 := (yc - h/2) / 640 * float32(img_height)
x2 := (xc + w/2) / 640 * float32(img_width)
y2 := (yc + h/2) / 640 * float32(img_height)

现在，类似地，获取第 4 行到第 83 行中的对象的概率，找到其中哪一个最大以及该概率的索引，并将这些值保存到和prob变量中class_id：

class_id, prob := 0, float32(0.0)
for col := 0; col < 80; col++ {
    if output[8400*(col+4)+index] > prob {
        prob = output[8400*(col+4)+index]
        class_id = col
    }
}

然后，有了最大概率和 class_id，如果概率小于 0.5，您可以跳过该对象，找到该类的标签。

最终代码如下：

boxes := [][]interface{}{}
for index := 0; index < 8400; index++ {
    class_id, prob := 0, float32(0.0)
    for col := 0; col < 80; col++ {
        if output[8400*(col+4)+index] > prob {
            prob = output[8400*(col+4)+index]
            class_id = col
         }
    }
    if prob < 0.5 {
        continue
    }
    label := yolo_classes[class_id]
    xc := output[index]
    yc := output[8400+index]
    w := output[2*8400+index]
    h := output[3*8400+index]
    x1 := (xc - w/2) / 640 * float32(img_width)
    y1 := (yc - h/2) / 640 * float32(img_height)
    x2 := (xc + w/2) / 640 * float32(img_width)
    y2 := (yc + h/2) / 640 * float32(img_height)
    boxes = append(boxes, []interface{}{float64(x1), float64(y1), float64(x2), float64(y2), label, prob})
}

boxes最后一步是使用“非极大值抑制”过滤数组，以排除其中所有重叠的框。此代码与Python 实现相同，但由于 Go 语言的具体情况而看起来略有不同：

sort.Slice(boxes, func(i, j int) bool {
    return boxes[i][5].(float32) < boxes[j][5].(float32)
})

result := [][]interface{}{}
for len(boxes) > 0 {
    result = append(result, boxes[0])
    tmp := [][]interface{}{}
    for _, box := range boxes {
        if iou(boxes[0], box) < 0.7 {
            tmp = append(tmp, box)
        }
     }
     boxes = tmp
}

首先，我们按相反的顺序对框进行排序，将概率最高的框放在顶部。
在循环中，我们将概率最高的输入框放入数组result中
然后我们创建一个临时tmp数组，并在所有框的内部循环中，仅将不会与所选内容重叠太多的框（IoU<0.7）放入该数组中。
然后我们boxes用tmp数组覆盖数组。这样，就可以从boxes数组中过滤掉所有重叠的框。
如果过滤后存在一些框，则循环继续进行，直到boxes数组变空。

最后，该result变量包含应返回的所有边界框。

完整的代码如下：

func process_output(output []float32, img_width, img_height int64) [][]interface{} {
    boxes := [][]interface{}{}
    for index := 0; index < 8400; index++ {
        class_id, prob := 0, float32(0.0)
        for col := 0; col < 80; col++ {
            if output[8400*(col+4)+index] > prob {
                prob = output[8400*(col+4)+index]
                class_id = col
            }
         }
         if prob < 0.5 {
             continue
         }
         label := yolo_classes[class_id]
         xc := output[index]
         yc := output[8400+index]
         w := output[2*8400+index]
         h := output[3*8400+index]
         x1 := (xc - w/2) / 640 * float32(img_width)
         y1 := (yc - h/2) / 640 * float32(img_height)
         x2 := (xc + w/2) / 640 * float32(img_width)
         y2 := (yc + h/2) / 640 * float32(img_height)
         boxes = append(boxes, []interface{}{float64(x1), float64(y1), float64(x2), float64(y2), label, prob})
     }
     
     sort.Slice(boxes, func(i, j int) bool {
         return boxes[i][5].(float32) < boxes[j][5].(float32)
     })
     
     result := [][]interface{}{}
     for len(boxes) > 0 {
         result = append(result, boxes[0])
         tmp := [][]interface{}{}
         for _, box := range boxes {
             if iou(boxes[0], box) < 0.7 {
                 tmp = append(tmp, box)
              }
          }
          boxes = tmp
      }
      return result
}

通过运行以下命令来启动此 Web 服务：

go run main.go

打开浏览器并访问地址http://localhost:8080获取服务。

11. 总结

在本文中，展示了如何在不需要PyTorch和官方API的情况下使用 YOLOv8 模型，需要将模型部署在不同的端上，让模型使用的资源减少十倍，并且使用了如何在Python、 Node.js、和 Go 上创建由 YOLOv8 的 Web 服务。

12. 扩展

如果你想全面深入的学习YOLO系列，并训练自己的数据，可以进入我的录播课程《实战YOLOv5目标检测》学习，本课程教会大家如何使用YOLOv5，如何基于YOLOv5训练自己的模型。课程重点讲解YOLOv5模型，在Ubuntu系统上做项目演示。具体内容包括：环境安装、数据集的准备、模型配置修改、训练可视化工具、训练模型和性能测试等内容，并提供相应代码。期待着感兴趣的同学加入~

你可能感兴趣的:(计算机视觉,python,node.js,golang,yolov8,目标检测)

tf.Keras (tf-1.15)使用记录4-model.fit方法及其callbacks参数普通攻击往后拉 NN技巧 tf.keras keras 人工智能深度学习
model.fit()方法是TensorFlowKeras中用于训练模型的核心方法。其中里面的callbacks参数是实现模型保存、监控、以及和tensorboard联动的重要API1model.fit()方法的参数及使用必需参数x:训练数据的输入。可以是NumPy数组、TensorFlowtf.data.Dataset、Python生成器或keras.utils.Sequence实例。y:训练数
macbook自带python保存文件夹_在mac下查找python包存放路径site-packages的实现方法在Mac系统下python如何安装第三方函数库?... Charnychi
mac怎么查看python的site-package位置世界上最伤心的事，不是你爱的人不爱你，而是他爱你过后，最后却不爱你。可以通过find命令查看，参考demo如下：sudofind/-name"site-package"小编们总是对最亲近的家人视而不见，甚至还有许多抱怨，却对外人”的一点小惠感激不已。mac自带的python安装在/usr/bin/python目录下进入终端直接键入python
python exe site-package weixin_33735077 python
2019独角兽企业重金招聘Python工程师标准>>>pythonexesite-package:http://www.lfd.uci.edu/~gohlke/pythonlibs/#pillow转载于:https://my.oschina.net/zuoan001/blog/346126
python 分享site-package CbdFocus Python
导出列表pipfreeze>requirements.txt安装列表pipinstall-rrequirements.txt
Python 框架之 Anaconda 下 Django 环境的快速搭建与验证的相关说明仙魁XAN python python anaconda django
Python框架之Anaconda下Django环境的快速搭建与验证的相关说明目录Python框架之Anaconda下Django环境的快速搭建与验证的相关说明一、简单介绍二、实现原理三、环境四、涉及命令五、搭建具体步骤1、打开AnacondaNavigator2、Create构建一个环境，选择自己需要的python版本即可3、AnacondaPrompt打开命令行操作4、condainfo--e
SQLAlchemy 介绍与实践 cliffordl python python 数据库
postgresql实践pydantic实践1.SQLAlchemy介绍SQLAlchemy是一个ORM框架。SQLAlchemy是一个用于Python的SQL工具和对象关系映射（ORM）库。它允许你通过Python代码来与关系型数据库交互，而不必直接编写SQL语句。简单介绍一下对象关系映射吧，对象关系映射（英语：ObjectRelationalMapping，简称ORM，或O/RM，或O/Rma
python dist-packages 和 site-packages ECHOutopia linux python site-packages dist-packages ubuntu python
dist-packages和site-packages在我的ubuntu12上都在/usr/local/lib/python2.7目录下今天安装django时发现一个奇怪的现象：我使用pipinstallDjango==1.8.4安装的django，安装成功，直接在终端使用django-admin也成功，但是进入python：importdnango，却提示nomodulenameddjango，
编程语言“鄙视链”：为何Python会处于这样的位置？宝码香车 #话题 python 开发语言
前言：哈喽，大家好，今天给大家分享一篇文章！并提供具体代码帮助大家深入理解，彻底掌握！创作不易，如果能帮助到大家或者给大家一些灵感和启发，欢迎收藏+关注哦目录编程语言“鄙视链”：为何Python会处于这样的位置？引言一、Python被视为新手友好型语言的原因（二）丰富的学习资源（三）广泛的应用领域二、Python在某些方面被“轻视”的因素（一）性能方面的局限（二）代码的安全性与保密性（三）行业传统
python 安装包 site-packages cliffordl 综合 python python 开发语言
1.site-packages文件夹的位置当我们通过pip或其他方式安装一个Python包时，这些包的文件就会被复制到site-packages文件夹下。site-packages文件夹通常位于Python的安装目录下的Lib文件夹内。具体的路径会根据你使用的操作系统和Python版本的不同而有所不同。下面是一些常见操作系统下site-packages文件夹的默认位置：1.1.在Windows系统
基于TensorFlow 2.0的DBN故障诊断程序 ydlhnust 深度学习
以下是一个基于TensorFlow2.0的DBN故障诊断程序，包含特征可视化和结果分析。程序使用合成振动数据进行演示，可直接运行。```pythonimportnumpyasnpimportmatplotlib.pyplotaspltimporttensorflowastffromtensorflow.kerasimportlayers,modelsfromsklearn.model_select
使用PyInstaller将Python项目代码打包成exe 培根芝士 Python python 开发语言
PyInstaller是一个非常强大的工具，用于将Python脚本打包成独立的可执行文件（如.exe文件），使得Python应用程序可以在没有安装Python环境的机器上运行。工作原理PyInstaller的核心目标是将Python脚本及其依赖的模块打包成一个独立的可执行文件。它的工作原理可以分为以下几个步骤：（1）分析脚本依赖PyInstaller会分析你的Python脚本，找出所有导入的模块（
python yfinance 下载金融数据，股票数据 waterHBO python 金融开发语言 1024程序员节
起因，目的:代码比较少，但是估计很常用。需要开启全局代理:1.获取国内股票数据tushareimporttushareasts#pipinstalltushare#设置Tusharetoken，需要在Tushare官网注册并获取，免费的ts.set_token('22b5a5b550------****23f815a22c97')#初始化pro接口pro=ts.pro_api()#股票代码stoc
yfinance的使用 ilikework python 量化交易
最近想学习一下量化交易，就找了些python的库，yfinance这个是比较靠谱的库。功能有哪些还不是太清楚，似乎不支持多年的PE指标获取。下面是外汇历史数据的取得data=yf.download(tickers='USDJPY=X',#通貨ペアperiod='1d',#データ取得期間interval='1m',#データ表示間隔)下面是股票数据的取得tickers=['600875.SS']for
基于python的Kimi AI 聊天应用 hunter206206 python python 自然语言处理
因为这几天deepseek有点状况，导致apikey一直生成不了，用kimi练练手。这是一个基于MoonshotAI的Kimi接口开发的聊天应用程序，使用PythonTkinter构建图形界面。项目结构项目由三个主要Python文件组成：1.main_kimi.py主程序入口文件，继承了ChatWindow类并实现了问答逻辑：创建主应用程序窗口初始化聊天逻辑实现提交问题的处理函数2.gui.py图
Command ‘“/opt/homebrew/opt/[email protected]/bin/python3.9“ -u build.py build‘ failed with exit code 1. hunter206206 python ubuntu chrome linux
这个错误表明在安装wxPython时遇到了问题。wxPython是一个用于创建图形用户界面（GUI）的Python库，但由于其依赖的复杂性，安装时可能会失败。以下是解决此问题的几种方法：1.确保Python和pip是最新版本wxPython可能需要较新版本的Python和pip。运行以下命令更新pip：python-mpipinstall--upgradepip2.安装依赖库wxPython依赖于
从零开始构建一个简单的Python Web爬虫实战指南与技巧一键难忘 python 前端爬虫 Python Web
从零开始构建一个简单的PythonWeb爬虫实战指南与技巧随着数据科学和大数据分析的快速发展，网络爬虫（WebScraping）成为了获取互联网数据的重要工具。通过爬虫，我们可以自动化地从网页上获取各种信息，如新闻、产品价格、社交媒体内容等。本文将带您从零开始，使用Python构建一个简单的Web爬虫，抓取网页内容并保存数据。Web爬虫的基本概念什么是Web爬虫？Web爬虫（也称为网络蜘蛛或抓取器
Python面试宝典13 | Python 变量作用域，从入门到精通多森AI Python面试题 python 面试开发语言
今天，我们来深入探讨一下Python中一个非常重要的概念——变量作用域。理解变量作用域对于编写清晰、可维护、无bug的代码至关重要。什么是变量作用域？简单来说，变量作用域就是指一个变量在程序中可以被访问的范围。Python中有四种作用域：局部作用域（Local）：在函数或代码块内部定义的变量，只能在该函数或代码块内部访问。局部变量的作用域范围最小，只能在定义它们的函数或代码块内部使用。defmy_
详解python的单例模式 hunter206206 python python
单例模式是一种设计模式，它确保一个类只有一个实例，并提供一个全局访问点来获取这个实例。在Python中实现单例模式有多种方法，下面我将详细介绍几种常见的实现方式。1.使用模块Python的模块天然就是单例的，因为模块在第一次导入时会被加载到内存中，之后的导入都是直接使用内存中的模块对象。因此，你可以通过模块来实现单例模式。#singleton.pyclassSingletonClass:def__
Python数据的筛选、排序与聚合大数据张老师 Python程序设计 python 开发语言 Python数据处理
Python数据的筛选、排序与聚合在数据分析过程中，我们常常需要对数据进行筛选、排序和聚合操作，以便从数据集中提取有价值的信息。这些操作是数据预处理和分析的基础，尤其在处理大型数据集时，能够帮助我们快速定位关键数据，进行进一步的分析。Pandas提供了强大的工具来支持这些操作，主要通过对Series和DataFrame的相关方法进行操作来实现。本节将详细讲解如何使用Pandas的Series和Da
Python默认值参数橙橙的橙橙子 python
示例1：可变对象作为默认值参数defdemo(newitem,old_list=[]):old_list.append(newitem)returnold_listprint(demo('5',[1,2,3,4]))print(demo('aaa',['a','b']))print(demo('a'))print(demo('b'))[1,2,3,4,'5']['a','b','aaa']['a'
python 函数默认参数夏华东的博客 python 开发语言后端
python函数默认参数defadd(a=1,b=2):#a,b设置默认参数c=a+breturncc=add(a=2)#如果不填，就是默认参数print(c)4
弄懂这56个Python使用技巧，秒变Python大神！追梦IT男 Python Python基础数据挖掘爬虫编程语言
1.枚举-enumerate可以有参数哦之前我们这样操作：i=0foriteminiterable:printi,itemi+=1现在我们这样操作：fori,iteminenumerate(iterable):printi,itemenumerate函数还可以接收第二个参数。就像下面这样：>>>list(enumerate('abc'))[(0,'a'),(1,'b'),(2,'c')]>>>li
Python机器学习实战：人脸识别技术的实现和挑战 AI天才研究院 AI大模型企业级应用开发实战大数据AI人工智能计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Python机器学习实战：人脸识别技术的实现和挑战作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词：人脸识别技术,模型训练,多人识别,动态人脸检测,应用场景1.背景介绍1.1问题的由来随着科技的进步和互联网的普及，人脸识别技术因其在安全验证、生物特征识别、智能监控等多个领域的广泛应用而迅速崛起。从传统的门禁系统到现代的人脸支付、社交媒体的自动登
python GUI 编程 AICVer Python python 开发语言
界面程序"""测试一个经典的GUI程序的写法，使用面向对象的方式"""importtimefromtkinterimport*fromtkinterimportmessageboxfromtkinterimportfiledialogimportthreadingfromcut_brickimportcal_brickclassApplication(Frame):"""一个经典的GUI程序的类的
Python中的函数默认参数 NoABug python java 前端 Python
在Python中，函数是一种重要的编程结构，它允许我们封装一段可重复使用的代码，并通过参数来接收不同的输入。在定义函数时，我们可以为参数提供默认值，这些默认值在调用函数时可以被省略。本文将详细介绍Python中的默认参数，并提供相应的源代码示例。函数的默认参数是指在定义函数时为参数提供的预设值。当函数被调用时，如果没有为该参数提供实际值，将使用默认值来代替。这对于那些在大多数情况下都使用相同值的参
Python函数参数 - 默认参数:在Python中，可以给函数参数指定默认值，从而使其成为可选参数伯乐 IAN python java 前端
Python函数参数-默认参数在Python中，函数是一种非常重要的概念，它们可以让你封装可重复使用的代码块。函数参数是函数定义中的变量，用于接收调用函数时传递的值。Python提供了灵活的方式来定义函数参数，其中之一就是默认参数。默认参数的概念默认参数是指在定义函数时为参数指定了一个默认值。这意味着在函数调用时，如果不提供该参数的值，则会使用默认值。默认参数可以使函数更加灵活，允许用户在需要时传
blender 相机参数 AI算法网奇 3d渲染数码相机 blender
目录设置相机参数：3.设置相机参数示例4.相机透视与正交5.额外的高级设置设置相机参数：设置渲染器：设置相机参数：3.设置相机参数示例假设你有一个相机，并希望设置它的焦距和位置，可以通过Python脚本来设置这些参数：pythonimportbpy#获取当前场景中的相机camera=bpy.context.scene.camera#设置相机的位置(外参)camera.location=(0,0,1
探索神经网络的奥秘：从基础理论到Python实践仲毓俏Alanna
探索神经网络的奥秘：从基础理论到Python实践【下载地址】第一章神经网络如何工作附Python神经网络编程.pdf分享本资源文件提供了关于神经网络基础知识的详细介绍，并附带了一个Python神经网络编程的PDF文件。通过学习本资源，您将能够理解神经网络的基本工作原理，并掌握如何使用Python进行神经网络编程项目地址:https://gitcode.com/Resource-Bundle-Col
python学习(11)--python 函数默认参数程序员陈师傅 Python学习专栏 python 学习开发语言
在Python中，函数默认参数是指在函数定义中为参数指定默认值的参数。当调用函数时，如果没有为默认参数提供值，那么将使用默认值。函数默认参数的语法如下：deffunction_name(parameter1=default_value1,parameter2=default_value2,...):#函数体下面是一个使用默认参数的函数示例：defgreet(name,message="Hello"
MySQL与Python：连接与操作数据库的魔法之旅墨瑾轩一起学学数据库【一】数据库 mysql
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣开篇：数据库世界的探险️嘿，亲爱的Python小巫师们！今天我们要一起踏上一段探险之旅——连接并操作MySQL数据库。在这个数据的海洋中，MySQL是我们的宝藏库，而Python则是我们的魔法棒。准备好你的魔法帽，我们即将开始这段连接与操作数据库的魔法之旅！M
ios内付费 374016526 ios 内付费
近年来写了很多IOS的程序，内付费也用到不少，使用IOS的内付费实现起来比较麻烦，这里我写了一个简单的内付费包，希望对大家有帮助。具体使用如下: 这里的sender其实就是调用者，这里主要是为了回调使用。 [KuroStoreApi kuroStoreProductId:@"产品ID" storeSender:self storeFinishCallBa
20 款优秀的 Linux 终端仿真器 brotherlamp linux linux视频 linux资料 linux自学 linux教程
终端仿真器是一款用其它显示架构重现可视终端的计算机程序。换句话说就是终端仿真器能使哑终端看似像一台连接上了服务器的客户机。终端仿真器允许最终用户用文本用户界面和命令行来访问控制台和应用程序。（LCTT 译注：终端仿真器原意指对大型机-哑终端方式的模拟，不过在当今的 Linux 环境中，常指通过远程或本地方式连接的伪终端，俗称“终端”。）你能从开源世界中找到大量的终端仿真器，它们
Solr Deep Paging(solr 深分页) eksliang solr深分页 solr分页性能问题
转载请出自出处：http://eksliang.iteye.com/blog/2148370 作者：eksliang(ickes) blg:http://eksliang.iteye.com/ 概述长期以来，我们一直有一个深分页问题。如果直接跳到很靠后的页数，查询速度会比较慢。这是因为Solr的需要为查询从开始遍历所有数据。直到Solr的4.7这个问题一直没有一个很好的解决方案。直到solr
数据库面试题 18289753290 面试题数据库
1.union ,union all 网络搜索出的最佳答案： union和union all的区别是,union会自动压缩多个结果集合中的重复结果，而union all则将所有的结果全部显示出来，不管是不是重复。 Union：对两个结果集进行并集操作，不包括重复行，同时进行默认规则的排序； Union All：对两个结果集进行并集操作，包括重复行，不进行排序； 2.索引有哪些分类？作用是
Android TV屏幕适配酷的飞上天空 android
先说下现在市面上TV分辨率的大概情况两种分辨率为主 1.720标清，分辨率为1280x720. 屏幕尺寸以32寸为主，部分电视为42寸 2.1080p全高清，分辨率为1920x1080 屏幕尺寸以42寸为主，此分辨率电视屏幕从32寸到50寸都有适配遇到问题，已1080p尺寸为例：分辨率固定不变，屏幕尺寸变化较大。如：效果图尺寸为1920x1080，如果使用d
Timer定时器与ActionListener联合应用永夜-极光 java
功能:在控制台每秒输出一次代码: package Main; import javax.swing.Timer; import java.awt.event.*; public class T { private static int count = 0; public static void main(String[] args){
Ubuntu14.04系统Tab键不能自动补全问题解决随便小屋 Ubuntu 14.04
Unbuntu 14.4安装之后就在终端中使用Tab键不能自动补全，解决办法如下： 1、利用vi编辑器打开/etc/bash.bashrc文件（需要root权限） sudo vi /etc/bash.bashrc 接下来会提示输入密码 2、找到文件中的下列代码 #enable bash completion in interactive shells #if
学会人际关系三招轻松走职场 aijuans 职场
要想成功，仅有专业能力是不够的，处理好与老板、同事及下属的人际关系也是门大学问。如何才能在职场如鱼得水、游刃有余呢？在此，教您简单实用的三个窍门。　　第一，多汇报最近，管理学又提出了一个新名词“追随力”。它告诉我们，做下属最关键的就是要多请示汇报，让上司随时了解你的工作进度，有了新想法也要及时建议。不知不觉，你就有了“追随力”，上司会越来越了解和信任你。　　第二，勤沟通团队的力
《O2O：移动互联网时代的商业革命》读书笔记 aoyouzi 读书笔记
移动互联网的未来：碎片化内容+碎片化渠道=各式精准、互动的新型社会化营销。 O2O：Online to OffLine 线上线下活动 O2O就是在移动互联网时代，生活消费领域通过线上和线下互动的一种新型商业模式。手机二维码本质：O2O商务行为从线下现实世界到线上虚拟世界的入口。线上虚拟世界创造的本意是打破信息鸿沟，让不同地域、不同需求的人
js实现图片随鼠标滚动的效果百合不是茶 JavaScript 滚动属性的获取图片滚动属性获取页面加载
1,获取样式属性值 top 与顶部的距离 left 与左边的距离 right 与右边的距离 bottom 与下边的距离 zIndex 层叠层次例子:获取左边的宽度,当css写在body标签中时 <div id="adver" style="position:absolute;top:50px;left:1000p
ajax同步异步参数async bijian1013 jquery Ajax async
开发项目开发过程中，需要将ajax的返回值赋到全局变量中，然后在该页面其他地方引用，因为ajax异步的原因一直无法成功，需将async:false，使其变成同步的。格式： $.ajax({ type: 'POST', ur
Webx3框架（1） Bill_chen eclipse spring maven 框架 ibatis
Webx是淘宝开发的一套Web开发框架，Webx3是其第三个升级版本；采用Eclipse的开发环境，现在支持java开发；采用turbine原型的MVC框架，扩展了Spring容器，利用Maven进行项目的构建管理，灵活的ibatis持久层支持，总的来说，还是一套很不错的Web框架。 Webx3遵循turbine风格，velocity的模板被分为layout/screen/control三部
【MongoDB学习笔记五】MongoDB概述 bit1129 mongodb
MongoDB是面向文档的NoSQL数据库，尽量业界还对MongoDB存在一些质疑的声音，比如性能尤其是查询性能、数据一致性的支持没有想象的那么好，但是MongoDB用户群确实已经够多。MongoDB的亮点不在于它的性能，而是它处理非结构化数据的能力以及内置对分布式的支持(复制、分片达到的高可用、高可伸缩)，同时它提供的近似于SQL的查询能力，也是在做NoSQL技术选型时，考虑的一个重要因素。Mo
spring/hibernate/struts2常见异常总结白糖_ Hibernate
Spring ①ClassNotFoundException: org.aspectj.weaver.reflect.ReflectionWorld$ReflectionWorldException 缺少aspectjweaver.jar，该jar包常用于spring aop中 ②java.lang.ClassNotFoundException: org.sprin
jquery easyui表单重置(reset)扩展思路 bozch form jquery easyui reset
在jquery easyui表单中尚未提供表单重置的功能，这就需要自己对其进行扩展。扩展的时候要考虑的控件有： combo,combobox,combogrid,combotree,datebox,datetimebox 需要对其添加reset方法，reset方法就是把初始化的值赋值给当前的组件，这就需要在组件的初始化时将值保存下来。在所有的reset方法添加完毕之后，就需要对fo
编程之美-烙饼排序 bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; /* *《编程之美》的思路是：搜索+剪枝。有点像是写下棋程序：当前情况下，把所有可能的下一步都做一遍；在这每一遍操作里面，计算出如果按这一步走的话，能不能赢（得出最优结果）。 *《编程之美》上代码有很多错误，且每个变量的含义令人费解。因此我按我的理解写了以下代码： */
Struts1.X 源码分析之ActionForm赋值原理 chenbowen00 struts
struts1在处理请求参数之前，首先会根据配置文件action节点的name属性创建对应的ActionForm。如果配置了name属性，却找不到对应的ActionForm类也不会报错，只是不会处理本次请求的请求参数。如果找到了对应的ActionForm类，则先判断是否已经存在ActionForm的实例，如果不存在则创建实例，并将其存放在对应的作用域中。作用域由配置文件action节点的s
[空天防御与经济]在获得充足的外部资源之前,太空投资需有限度 comsci 资源
这里有一个常识性的问题: 地球的资源,人类的资金是有限的,而太空是无限的..... 就算全人类联合起来,要在太空中修建大型空间站,也不一定能够成功,因为资源和资金,技术有客观的限制.... &
ORACLE临时表—ON COMMIT PRESERVE ROWS daizj oracle 临时表
ORACLE临时表转临时表：像普通表一样，有结构，但是对数据的管理上不一样，临时表存储事务或会话的中间结果集，临时表中保存的数据只对当前会话可见，所有会话都看不到其他会话的数据，即使其他会话提交了，也看不到。临时表不存在并发行为，因为他们对于当前会话都是独立的。创建临时表时，ORACLE只创建了表的结构（在数据字典中定义），并没有初始化内存空间，当某一会话使用临时表时，ORALCE会
基于Nginx XSendfile+SpringMVC进行文件下载 denger 应用服务器 Web nginx 网络应用 lighttpd
在平常我们实现文件下载通常是通过普通 read-write方式，如下代码所示。 @RequestMapping("/courseware/{id}") public void download(@PathVariable("id") String courseID, HttpServletResp
scanf接受char类型的字符 dcj3sjt126com c
/* 2013年3月11日22:35:54 目的：学习char只接受一个字符 */ # include <stdio.h> int main(void) { int i; char ch; scanf("%d", &i); printf("i = %d\n", i); scanf("%
学编程的价值 dcj3sjt126com 编程
发一个人会编程, 想想以后可以教儿女, 是多么美好的事啊, 不管儿女将来从事什么样的职业, 教一教, 对他思维的开拓大有帮助像这位朋友学习: http://blog.sina.com.cn/s/articlelist_2584320772_0_1.html VirtualGS教程 (By @林泰前): 几十年的老程序员，资深的
二维数组（矩阵）对角线输出飞天奔月二维数组
今天在BBS里面看到这样的面试题目, 1，二维数组（N*N），沿对角线方向，从右上角打印到左下角如N=4： 4*4二维数组 { 1 2 3 4 } { 5 6 7 8 } { 9 10 11 12 } {13 14 15 16 } 打印顺序 4 3 8 2 7 12 1 6 11 16 5 10 15 9 14 13 要
Ehcache（08）——可阻塞的Cache——BlockingCache 234390216 并发 ehcache BlockingCache 阻塞
可阻塞的Cache—BlockingCache 在上一节我们提到了显示使用Ehcache锁的问题，其实我们还可以隐式的来使用Ehcache的锁，那就是通过BlockingCache。BlockingCache是Ehcache的一个封装类，可以让我们对Ehcache进行并发操作。其内部的锁机制是使用的net.
mysqldiff对数据库间进行差异比较 jackyrong mysqld
mysqldiff该工具是官方mysql-utilities工具集的一个脚本，可以用来对比不同数据库之间的表结构，或者同个数据库间的表结构如果在windows下，直接下载mysql-utilities安装就可以了，然后运行后，会跑到命令行下： 1）基本用法 mysqldiff --server1=admin:12345
spring data jpa 方法中可用的关键字 lawrence.li java spring
spring data jpa 支持以方法名进行查询/删除/统计。查询的关键字为find 删除的关键字为delete/remove (>=1.7.x) 统计的关键字为count (>=1.7.x) 修改需要使用@Modifying注解 @Modifying @Query("update User u set u.firstna
Spring的ModelAndView类 nicegege spring
项目中controller的方法跳转的到ModelAndView类，一直很好奇spring怎么实现的？ /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version 2.0 (the "License"); * yo
搭建 CentOS 6 服务器(13) - rsync、Amanda rensanning centos
（一）rsync Server端 # yum install rsync # vi /etc/xinetd.d/rsync service rsync { disable = no flags = IPv6 socket_type = stream wait
Learn Nodejs 02 toknowme nodejs
（1）npm是什么 npm is the package manager for node 官方网站：https://www.npmjs.com/ npm上有很多优秀的nodejs包，来解决常见的一些问题，比如用node-mysql，就可以方便通过nodejs链接到mysql，进行数据库的操作在开发过程往往会需要用到其他的包，使用npm就可以下载这些包来供程序调用 &nb
Spring MVC 拦截器 xp9802 spring mvc
Controller层的拦截器继承于HandlerInterceptorAdapter HandlerInterceptorAdapter.java 1 public abstract class HandlerInterceptorAdapter implements HandlerIntercep