Sonhhxg_柒

【CV with Pytorch】第 6 章：姿态估计

人体姿势估计 (HPE)是一项计算机视觉任务，它通过估计给定帧/视频中的主要关键点（例如眼睛、耳朵、手和腿）来检测人体姿势。图6-1显示了人体姿态估计的一个例子。

图 6-1 HPE示例

人体姿势检测有助于跟踪人体部位和关节。在人体中识别的一些关键点是手臂、腿、眼睛、耳朵、鼻子等，它们可以帮助我们跟踪运动。

HPE 主要广泛应用于机器人、理解人类活动和行为、运动分析等领域。

深度学习概念，尤其是 CNN 架构，专为 HPE 量身定制和设计。

有两种方法可以解决这个问题：

自上而下的方法

自下而上的方法

自上而下的方法

使用这种方法，首先通过在每个人周围绘制一个估计的边界框来识别人类。在第二步中，在特定人的每个边界框内识别人类关键点。这种方法的缺点是我们需要有一个单独的模型来进行人体识别，然后必须识别所有边界框内的关键点。这增加了计算时间和复杂性。该模型的优点是网络将识别框架中的所有人类。

自下而上的方法

使用这种方法，首先在给定的帧中识别所有人类关键点。第二阶段，将关键点连接起来形成类人骨架。这种方法的缺点是由于图像的尺度变化，它可能无法识别较小尺度的人。与自上而下的方法相比，这种方法的优点是减少了计算时间。

以下是当今使用的更常见的 HPE 模型：

OpenPose: 2019

HRNet: 2019

Higher HRNet: 2020

AlphaPose: 2018

Mask R-CNN: 2018

Dense pose: 2018

DeepCut: 2016

DeepPose: 2014

Pose Net: 2015

OpenPose

打开姿势是一种基于 VGG19 的实时、多人、多阶段姿态估计算法。该算法遵循自下而上的方法。输入图像被发送到 VGG-19 网络以提取特征图。提取的特征图被传递给多级 CNN。每个阶段包含两个并行运行的分支。

分支 1

该分支为要检测的关键点创建热图/置信度图。为所有关键点生成单独的热图。

分支 2

该分支创建部件亲和字段 (PAF)。PAF 可以识别关键点之间的连接。

两个分支的输出被映射以使用线积分识别正确的连接。L2损失是在预测结果（热图，PAF）和ground truth（热图，PAF）之间计算的。使用了两个 L2 损失函数——一个在每个分支的末尾。在训练期间，整体损失计算为这两个损失函数的总和。

第 1 阶段的输出被传递到第 2 阶段以改进结果。模型的深度随着阶段数的增加而增加。由于图像中可以有多个人，因此使用加权二分图来连接同一个人的各个部分。连接的对被合并以形成人体骨骼。该模型可以在单个图像上检测多达 135 个关键点。OpenPose的架构和流程图如图6-2和6-3所示。

图 6-2 OpenPose 架构

图 6-3 OpenPose流程图

图6-4显示了 OpenPose 运行时与其他模型的比较。默认 OpenPose 和最大精度 OpenPose 承诺更好的性能。

图 6-4 OpenPose 管道和运行时与其他模型的比较

HRNet（高分辨率网络）

这是一种自上而下的方法。它首先使用 Faster-RCNN 识别图像中的人，并在他们周围设置边界框。使用 HRNet 架构生成高质量的特征图。然后在每个边界框中识别关键点。

动机：

1.所有以前的模型（AlexNet、GoogleNet、ResNet 和 DenseNet）都是在图像分类卷积架构上开发的，使得输出分辨率低且对位置不敏感。使用空洞卷积可以在这些架构中增加低分辨率，但计算时间会增加。

2.上采样是这个问题的替代方法。U-net、SegNet、DeConvnet 和 Hourglass 模型使用上采样技术。在这种技术中，第 1 阶段的输入图像被转换为低分辨率以进行分类。在第 2 阶段，高分辨率图像将通过顺序连接的卷积从低分辨率图像中恢复。但是从 LR 完全恢复 HR 是不可能的，并且表示的位置敏感性很弱。

HRNet 是一种用于视觉识别的通用架构。它的架构不基于任何使用串联卷积的分类网络。在 HRNet 架构中，多分辨率卷积与使用上采样和下采样技术的重复融合并行连接。该网络自始至终维护 HR 表示。分辨率之间的反复融合加强了高分辨率和低分辨率的表示。使用称为“跨步卷积”的下采样技术将 HR 卷积转换为 LR 卷积。使用“双线性上采样”技术将 LR 卷积转换为 HR 卷积。HR 分支保留空间信息，LR 分支保留上下文信息。图6-5、6-6和_ _图 6-7显示了 HRNet 的详细架构。

图 6-5 HRNet 架构，第 1 部分

主要观察：

在分类中，卷积被串联放置。但在 HRNet 中，卷积是平行放置的。

对于上采样，使用双线性函数代替卷积（由于时间复杂度）。

跨步卷积用于对 HR 图像进行下采样（以避免信息丢失）。

阶段 2、3 和 4 中的块数为 1、4 和 3。这些数字没有得到很好的优化（根据作者的说法）。由于 HRNet 中的通道数量减少，参数和计算复杂度并不高于 ResNet。由于该架构是一个多分辨率网络，因此输出以所有分辨率（高、中和低）提供。对于 HPE，仅使用 HR 通道输出。对于语义分割和面部对齐，使用所有分辨率输出。

图 6-6 HRNet 架构，第 2 部分

图 6-7 HRNet 架构，第3部分

Higher HRNet

这是一种自下而上的方法，不同于原始的 HRNet 模型。以前的自下而上方法的主要问题是处理尺度变化（例如儿童或远处的人）。这个问题在Higher HRNet 模型中得到解决通过使用 HR 特征图（来自 HRNet）和 HR 热图（使用反卷积步骤）。

该网络是使用 HRNet 架构作为主干构建的。输入图像被传递到一个茎（包含两个卷积块，将分辨率降低到 ¼）。随后图像通过 HRNet 架构生成 HR 特征图。HR 特征图被馈送到反卷积块。这些反卷积块（来自 HRNet 的特征图和预测热图）作为输入，将生成两个 HR 热图，然后是四个残差块（batch norm + ReLU）以对特征图进行上采样。该模型使用高分辨率监督技术来训练模型。将地面实况关键点转换为所有分辨率热图以生成地面实况热图。预测的热图根据地面实况热图进行验证，以计算损失（均方误差）。数字图6-8显示了架构。

图 6-8 Higher HRNet架构

从理论研究来看，Higher HRNet 在解决计算时间（使用自下而上的方法）和尺度变化问题（使用多分辨率）方面显示出可喜的结果。

PoseNet

PoseNet是一个基于tensorflow.js构建的姿势估计器，可在移动设备上运行。它通过检测人体的眼睛、鼻子、嘴巴、手腕、肘部、臀部、膝盖等点来估计人体的姿势，通过将这些关键点连接起来形成姿势的骨骼状结构。

它适用于单个和多个人体姿势检测。

PoseNet 是如何工作的？

PoseNet 使用 ResNet 和 MobileNet 模型进行训练。ResNet 模型具有更高的准确性。但是它体积大，层数多，速度较慢。因此，最好使用 MobileNet 模型，因为它专为在移动设备上运行而设计。姿态估计分两个阶段进行：

输入的 RGB 图像被送入卷积神经网络。

单姿态或多姿态算法用于从模型输出中获取关键点（坐标）及其置信度分数。

PoseNet 模型的输出是一个姿势对象，其中包含每个检测到的人的关键点列表和置信度分数。图6-9显示了位姿与关键点置信度。

图 6-9 姿势与关键点置信度的图示

单人姿态估计

当输入图像或视频中只有一个人居中时就是这种情况。单姿态估计算法的输入如下：

输入图像元素：程序将为其预测姿势的输入图像元素。

图像比例因子：介于 0.2 和 1 之间的数字。默认情况下，它设置为 0.5。

水平翻转：默认情况下，此项设置为 false。如果必须水平/垂直翻转姿势，则必须将其设置为true。当视频默认水平翻转时，姿势会返回到正确的方向。

输出步幅：这应该是 32、16 或 8。默认情况下，它设置为 16。此变量影响神经网络的高度和宽度层。输出步幅的值越低，精度越高，但速度越慢，反之亦然。

单个姿势估计的输出是一个姿势，包含姿势置信度分数和 17 个关键点的数组。关键点由关键点位置（x 和 y 坐标）和关键点置信度得分组成。

图6-10、6-11、6-12展示了PoseNet的流程图。

图 6-10 PoseNet的流程图

图 6-11 PoseNet 流程图，第2部分

图 6-12 PoseNet 流程图，第 3 部分

多人姿态估计

该算法可以估计图像中的许多姿势/人。它比单姿态算法有点复杂并且稍微慢一些。但它的主要优点是，如果一张图片中有多个人，他们的关键点不太可能关联。因此，即使要求检测单个人的姿势，该算法也可能更可取。这些算法的输入如下：

输入图像元素

图像比例因子

水平翻转

输出步幅

最大姿势检测：最多可以检测五个姿势

姿势置信度阈值

非最大抑制 (NMS) 半径：这控制返回的姿势之间的最小距离。它的默认值为 20。

该算法的输出是一组姿势。每个姿势包含 17 个关键点以及每个关键点的分数。

PoseNet 的优缺点

考虑PoseNet的这些优点和缺点：

由于它是轻量级模型，因此可用于移动/边缘设备。

如果图片中不止一个人，单人姿势估计算法会将关键点与错误的人相关联。

姿态估计的应用

以下是姿态估计的常见应用：

人类活动识别

人体坠落检测

控制台的运动跟踪

训练机器人

执行的测试用例零售店视频

案例 1：使用 1 小时的 1080p 分辨率视频测试 PoseNet 模型，fps 为 2。结果：

CPU 利用率：80-90%

内存：1.2 至1.5GB

每秒帧数：15

一小时视频的处理时间和数据库插入：20 到 25 分钟

案例 2：使用 720p 和 480p 分辨率视频测试 PoseNet 模型一小时，fps 为 2。结果：

对于 720p，一小时视频的处理时间和 DB 插入：8 到 10 分钟，16 fps

对于 480p，一小时视频的处理时间和 DB 插入：4 到 5 分钟，25 fps

执行

现在我们已经涵盖了一些理论方面和模型，让我们继续使用其中一种方法和预训练模型的实现部分。以下是使用 PyTorch 检测单个图像的人体姿势的分步指南。

我们将使用“ Keypoint-RCNN Using ResNet-50 Architecture with Feature pyramid Network”解决人体姿势和关键点检测。代码分为七个块以便于理解。以下是步骤：

1.确定要跟踪的人类关键点列表。

2.识别关键点之间可能的联系。

3.从 PyTorch 库加载预训练模型。

4.输入图像预处理和建模。

5.构建自定义函数来绘制输出（关键点和骨架）。

6.在输入图像上绘制输出。

首先，让我们导入所需的库：

# 导入库
import os
import numpy as np
# 用于导入关键点RCNN预训练模型和图像预处理
import torchvision
import torch
# 用于读取图像
import cv2
# 用于可视化
import matplotlib.pyplot as plt
# 挂载谷歌驱动器
# 将目录更改为包含图像文件夹的相应文件夹
from google.colab import drive
drive.mount('/content/drive')
%cd '/content/drive/MyDrive/Colab Notebooks/Bodypose'

第 1 步：确定要跟踪的人体关键点列表

可以在图6-13中找到人类关键点列表。这些关键点是深度学习模型中的目标实体，将在步骤 3 中讨论。

图 6-13 人类关键点的插图

图6-13显示了人体关键点的图示。

# 人类关键点列表 (count=17)
human_keypoints = ['nose','left_eye','right_eye','left_ear','right_ear','left_shoulder','right_shoulder','left_elbow',
                'right_elbow','left_wrist','right_wrist','left_hip','right_hip','left_knee', 'right_knee', 'left_ankle','right_ankle']
print(human_keypoints)

＃输出

['nose', 'left_eye', 'right_eye', 'left_ear', 'right_ear', 'left_shoulder', 'right_shoulder', 'left_elbow', 'right_elbow', 'left_wrist', 'right_wrist', 'left_hip', 'right_hip', 'left_knee', 'right_knee', 'left_ankle', 'right_ankle']

第 2 步：确定关键点之间的可能连接

现在确定关键点之间可能的联系。例如，左耳与左眼相连。所有可能的连接都可以在以下代码片段中找到。

# 人类关键点之间可能的连接以形成一个结构
def possible_keypoint_connections(keypoints):
    connections = [
        [keypoints.index('right_eye'), keypoints.index('nose')],
        [keypoints.index('right_eye'), keypoints.index('right_ear')],
        [keypoints.index('left_eye'), keypoints.index('nose')],
        [keypoints.index('left_eye'), keypoints.index('left_ear')],
        [keypoints.index('right_shoulder'), keypoints.index('right_elbow')],
        [keypoints.index('right_elbow'), keypoints.index('right_wrist')],
        [keypoints.index('left_shoulder'), keypoints.index('left_elbow')],
        [keypoints.index('left_elbow'), keypoints.index('left_wrist')],
        [keypoints.index('right_hip'), keypoints.index('right_knee')],
        [keypoints.index('right_knee'), keypoints.index('right_ankle')],
        [keypoints.index('left_hip'), keypoints.index('left_knee')],
        [keypoints.index('left_knee'), keypoints.index('left_ankle')],
        [keypoints.index('right_shoulder'), keypoints.index('left_shoulder')],
        [keypoints.index('right_hip'), keypoints.index('left_hip')],
        [keypoints.index('right_shoulder'), keypoints.index('right_hip')],
        [keypoints.index('left_shoulder'), keypoints.index('left_hip')]
        ]
    return connections
connections = possible_keypoint_connections(human_keypoints)

第 3 步：从 PyTorch 库加载预训练模型

在此博客中，我们使用具有 ResNet50 架构的PyTorch预训练模型keypoint-RCNN进行关键点检测。使用此参数加载模型：(pretrained= True)。

# 从预训练的 keypointrcnn_resnet50_fpn 类创建模型
pretrained_model = torchvision.models.detection.keypointrcnn_resnet50_fpn(pretrained=True)
# 调用 eval() 方法为推理模式准备模型。
pretrained_model.eval()

＃输出

Downloading: "https://download.pytorch.org/models/keypointrcnn_resnet50_fpn_coco-fc266e95.pth" to /root/.cache/torch/hub/checkpoints/keypointrcnn_resnet50_fpn_coco-fc266e95.pth

100%

226M/226M [00:04<00:00, 15.1MB/s]

KeypointRCNN(

(transform): GeneralizedRCNNTransform(

Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])

Resize(min_size=(640, 672, 704, 736, 768, 800), max_size=1333, mode='bilinear')

)

第 4 步：输入图像预处理和建模

原始图像在传递给模型之前需要归一化。使用TorchVision 的转换模块中的transforms.Compose()和transforms.ToTensor()类执行规范化。将输入图像放入当前工作目录的图像文件夹中。

# 导入transforms模块
from torchvision import transforms as T
# 使用opencv读取图像
img_path = "images/image1.JPG"
img = cv2.imread(img_path)
# 预处理输入图像
transform = T.Compose([T.ToTensor()])
img_tensor = transform(img)
# 前向传递模型
output = pretrained_model([img_tensor])[0]
print(output.keys())

＃输出

dict_keys(['boxes', 'labels', 'scores', 'keypoints', 'keypoints_scores'])

图6-14是我们用作输入的图像。

图 6-14 输入图像

第 5 步：构建自定义函数以绘制输出

构建自定义函数来绘制预测的关键点和身体骨架（通过连接关键点）。

# 绘制输入图像的关键点和骨架的函数
def plot_keypoints(img, all_keypoints, all_scores, confs, keypoint_threshold=2, conf_threshold=0.9):
    # 从彩虹光谱中初始化一组颜色\
    cmap = plt.get_cmap('rainbow')
    # 创建图像的副本
    img_copy = img.copy()
    # 从光谱中选择一组 N 个颜色 ID
    color_id = np.arange(1,255, 255//len(all_keypoints)).tolist()[::-1]
    # 对检测到的每个人进行迭代
    for person_id in range(len(all_keypoints)):
      # 检查检测到的人的置信度分数
      if confs[person_id]>conf_threshold:
        # 抓取检测到的人的关键点位置
        keypoints = all_keypoints[person_id, ...]
        # 获取关键点的关键点分数
        scores = all_scores[person_id, ...]
        # 迭代每个关键点分数
        for kp in range(len(scores)):
            # 检查检测到的关键点的置信度分数
            if scores[kp]>keypoint_threshold:
                # 将关键点浮点数组转换为 python 整数列表
                keypoint = tuple(map(int, keypoints[kp, :2].detach().numpy().tolist()))
                # 在指定的 color-id 处选择颜色
                color = tuple(np.asarray(cmap(color_id[person_id])[:-1])*255)
                # 在关键点位置画一个圆圈
                cv2.circle(img_copy, keypoint, 30, color, -1)
    return img_copy
def plot_skeleton(img, all_keypoints, all_scores, confs, keypoint_threshold=2, conf_threshold=0.9):
    # 从彩虹光谱中初始化一组颜色
    cmap = plt.get_cmap('rainbow')
    # 创建图像的副本
    img_copy = img.copy()
    # 检查是否检测到关键点
    if len(output["keypoints"])>0:
      # 从光谱中选择一组 N 个颜色 ID
      colors = np.arange(1,255, 255//len(all_keypoints)).tolist()[::-1]
      # iterate for every person detected
      for person_id in range(len(all_keypoints)):
          # 对检测到的每个人进行迭代
          if confs[person_id]>conf_threshold:
            # 检查检测到的人的置信度分数
            keypoints = all_keypoints[person_id, ...]
            # 迭代每个肢体
            for conn_id in range(len(connections)):
              # 选择肢体的起点
              limb_loc1 = keypoints[connections[conn_id][0], :2].detach().numpy().astype(np.int32)
              # 选择肢体的起点
              limb_loc2 = keypoints[connections[conn_id][1], :2].detach().numpy().astype(np.int32)
              # 将 limb-confidence 分数视为两个关键点分数中的最小关键点分数
              limb_score = min(all_scores[person_id, connections[conn_id][0]], all_scores[person_id, connections[conn_id][1]])
              # 检查 limb-score 是否大于阈值
              if limb_score> keypoint_threshold:
                # 选择特定颜色 ID 的颜色
                color = tuple(np.asarray(cmap(colors[person_id])[:-1])*255)
                # 为肢体画线
                cv2.line(img_copy, tuple(limb_loc1), tuple(limb_loc2), color, 25)
    return img_copy

第 6 步：在输入图像上绘制输出

使用第 5 步中的自定义函数，将预测的关键点和骨架绘制到原始图像上。

＃关键点
keypoints_img = plot_keypoints(img, output["keypoints"], output["keypoints_scores"], output["scores"],keypoint_threshold=2)
cv2.imwrite("output/keypoints-img.jpg", keypoints_img)
plt.figure(figsize=(8, 8))
plt.imshow(keypoints_img[:, :, ::-1])
plt.show()

＃输出

图6-15显示了带有关键点的图像。

图 6-15 带关键点的图像

＃骨骼
skeleton_img = plot_skeleton（img，输出[“关键点”]，输出[“keypoints_scores”]，输出[“分数”]，keypoint_threshold=2）
cv2.imwrite("output/skeleton-img.jpg", skeleton_img)
plt.figure(figsize=(8, 8))
plt.imshow(skeleton_img[:, :, ::-1])
plt.show()

#plot

图6-16将图像显示为骨架。

图 6-16 图像作为骨架

以下是我们为不止一个人尝试过的其他图像的结果。您也可以在本书的 Git 链接上找到这些内容。

图 6-17 带关键点的图像

图 6-18 图像作为骨架

概括

本章探讨了开发姿势估计器模型的体系结构和代码演练。这在工业中被广泛使用。

您现在是否有信心构建一个充当“虚拟健身教练”的应用程序？考虑到有多少人想要家庭健身房，值得一试。在下一章中，我们将探讨如何对图像进行异常检测。

synchronized 的特性与机制坚持拒绝熬夜 java 开发语言笔记
目录1.synchronized的特性锁策略(1)既是乐观锁也是悲观锁(2)既是轻量级锁,也是重量级锁(3)轻量级锁基于自旋实现,重量级锁基于挂起等待实现(4)不是读写锁(5)是可重入锁(6)是非公平锁2.synchronized的使用3.synchronized的锁机制偏向锁自旋锁和重量级锁4.synchronized的优化策略1.锁的消除2.锁的粗化1.synchronized的特性(1)既是
QMap 多重嵌套金色暖阳 qt 算法 QMap 数据结构
QMap多重嵌套，通过迭代器修改内层的mapQMapmap_id;map_id.insert(1,22);map_id.insert(2,44);map_id.insert(5,55);if(map_id.contains(2)){qDebug()>map_test;map_test.insert(1,map_id);qDebug()>::iteratorit=map_test.begin();f
react-11（自定义hook、useRef）我只是想饮一杯奶茶 react JavaScript react.js javascript 前端 typescript
自定义hook主要是我们利用已有的hook,实现hook的效果，并在其他地方引用。（感觉像是封装了一个方法）//定义constfetchHook=(url)=>{const[data,setData]=useState({})const[loading,setLoading]=useState('')useEffect(()=>{setLoading('loading')axios.get(url
TCP 客户端 - 服务器通信程序搭建 Oracle_666 网络服务器 tcp/ip
一、概述本文档针对TCP客户端程序和TCP服务器程序。客户端程序会连接到服务器并发送带有自定义协议格式的数据，而服务器程序则负责监听客户端连接，接收并处理这些数据。自定义协议格式为：先发送2字节网络字节序的长度头，随后是变长的数据负载。二、客户端程序2.1代码结构#include#include#include#include#include#include#definePORT8080//定义服
高云FPGA的管脚约束文件的复制在岸上走的鱼 fpga开发嵌入式硬件硬件架构
问：Gowin里面能不能直接拷贝一个管脚约束文件进去用？答：可以直接拷贝，但是拷贝前后两个工程对应的芯片必须要是同一个芯片拷贝方法:第一步：按照被拷贝约束文件对应的芯片新建一个工程，然后将原工程文件夹“src”里面的“.cst”文件拷到新建工程的相同目录下，第二步：回到新建工程目录下，点击芯片名右击，如下图：将“.V”文件和“.cst”文件一同加入这个工程，最后综合，布局布线就可以了，注意：有时拷
区块链驱动金融第四章——比特币实用指南：存储与使用全解析小DuDu 区块链金融
在比特币的世界里，存储和使用比特币是每个参与者都必须面对的重要环节。第四章围绕这两个关键方面展开了详细的阐述，为我们提供了全面而深入的见解。现在，就让我们一起走进这一章，探索如何安全、便捷地存储和使用比特币。比特币的存储方式：多样选择，各有优劣简单本地储存：便捷与风险并存把比特币存储在本地设备上是最直接的方式，就像把钱放在钱包里一样方便。人们通常会使用比特币钱包软件来管理比特币和私钥，通过这些软件
让你的 Git 历史更直观 —— 体验 VS Code 的 Interactive Git Log 插件小DuDu 工具 git vscode
在日常开发中，我们离不开Git。但原生的gitlog命令虽然强大，却不够直观，查看历史记录时往往需要一遍遍地翻阅命令行输出，效率并不高。今天，就来介绍一款让你的Git历史更加可视化的VSCode插件——InteractiveGitLog！✨为什么选择InteractiveGitLog？Git版本管理的核心是commit记录，但传统的gitlog命令行方式过于“朴素”，让我们在查找某个特定提交时非常
FlinkCDC实战：将 MySQL 数据同步至 ES 小DuDu flink mysql
当前需要处理的业务场景:将订单表和相关联的表(比如:商品表、子订单表、物流信息表)组织成宽表,放入到ES中,加速订单数据的查询.同步数据到es.概述1.什么是CDC2.什么是FlinkCDC3.FlinkCDCConnectors和Flink的版本映射实战1.宽表查询1.1创建mysql表1.2启动Flink集群和FlinkSQLCLI1.3在FlinkSQLCLI中使用FlinkDDL创建表1.
Spring Boot 3.4.0 发布：功能概览与示例小DuDu Java spring boot java
SpringBoot3.4.0带来了许多增强功能，使现代应用开发更加高效、便捷和强大。以下是最新功能的完整概述，以及一些帮助您快速入门的代码示例。1.应用程序版本管理SpringBoot引入了spring.application.version属性，方便开发者设置和访问应用程序版本。示例在application.properties中：spring.application.version=1.2.
NLU-预训练模型-2018：Bert（二）【“Masked LM”缺点：①预训练与微调不一致；②忽略了掩码位置间的依赖关系】【复杂度：O(n^2·d)；n：输入序列长度（规定最长512）】 u013250861 #NLP/词向量_预训练模型 bert 人工智能深度学习
五、BERT中的词嵌入1、为什么要使用BERT的嵌入使用BERT从文本数据中提取特征，即单词和句子的嵌入向量。我们可以用这些词和句子的嵌入向量做什么？首先，这些嵌入对于关键字/搜索扩展、语义搜索和信息检索非常有用。例如，如果你希望将客户的问题或搜索与已经回答的问题或文档化的搜索相匹配，这些表示将帮助准确的检索匹配客户意图和上下文含义的结果，即使没有关键字或短语重叠。其次，或许更重要的是，这些向量被
洛谷每日1题-------Day25__P1424 小鱼的航程（改进版） __雨夜星辰__ 洛谷每日1题算法 c++数据结构学习笔记
题目描述有一只小鱼，它平日每天游泳250公里，周末休息（实行双休日)，假设从周x开始算起，过了n天以后，小鱼一共累计游泳了多少公里呢？输入格式输入两个正整数x,n，表示从周x算起，经过n天。输出格式输出一个整数，表示小鱼累计游泳了多少公里。输入输出样例输入#1复制310输出#1复制2000说明/提示数据保证，1≤x≤7，1≤n≤106。题解#includeusingnamespacestd;int
论文学习11：Boundary-Guided Camouflaged Object Detection zl29 学习目标检测人工智能
代码来源GitHub-thograce/BGNet:Boundary-GuidedCamouflagedObjectDetection模块作用BGNet利用额外的目标相关边缘语义信息来引导COD任务的特征学习，从而强制模型生成能够突出目标结构的特征。这一机制有助于提高目标边界的精准定位，从而提升伪装目标的检测性能。模块结构BGNet的架构基于Res2Net-50，编码器提取多级特征，解码器通过EA
MATLAB中使用fread读取二进制数据时的大端序与小端序处理知行合一←_← matlab知识 matlab 开发语言
matlab里读取二进制数据时，默认按照小端序读取，怎么按照大端序读取文章目录前言一、大端序和小端序是什么？二、实际例子1.数据文件2.fread的参数总结前言只是记录matlab使用的小知识一、大端序和小端序是什么？大端序和小端序是在多个字节存储时，指定多字节数据在内存中的存储顺序，存储顺序不同，表示的值也就不同。大端序是指高位在地址较小的位置。小端序是指高位在地址较大的位置。比如地址从左到右依
单链表的操作知行合一←_← 数据结构数据结构
单链表单链表是什么单链表是一种线性的链式存储结构，由多个节点组成（头结点，中间节点和尾结点），单链表的存储结构图如下：来源于网页单链表的节点是分散的，与数组不同，数组的存储结构是连续的，单链表的每个节点存储了本节点的数据和下一个节点的地址，只能单向的查找。单链表的操作单链表的操作主要包括，创建，增删改查，翻转，排序。单链表的创建单链表的创建就是创建一个头结点这里有两种创建方式，一种是仅仅创建一个头
react hook:useRef,forwardRef, useImperativeHandle父子通信取啥好 react react.js javascript 前端
使用场景:父组件调用子组件里的方法父组件：Father.tsximportReact,{useRef}from'react';importChildrenfrom'./children';import{Button,FormInstance}from'antd';interfaceCustomFormInstanceextendsFormInstance{reLoadPage:()=>void;}
python 数据可视化TVTK库安装与使用范哥来了信息可视化 python 开发语言
TVTK（Traits-basedVisualizationToolKit）是一个基于Python的可视化库，它为VTK（VisualizationToolkit）提供了一个更易于使用的接口。VTK本身是非常强大的可视化工具，但使用起来可能稍微复杂一些，而TVTK通过简化API来提高易用性。下面我将指导您如何安装TVTK以及一个简单的示例来展示其基本用法。安装TVTKTVTK可以通过pip轻松安装
python web开发flask库安装与使用范哥来了 python 前端 flask
要在Python中使用Flask进行Web开发，首先需要安装Flask库。Flask是一个轻量级的Web框架，它使开发者能够快速构建网站或web服务。下面是安装Flask和创建一个简单的Flask应用程序的基本步骤。安装Flask确保您的环境中已经安装了Python（推荐版本3.7或更高）。接着，您可以通过pip来安装Flask。打开命令行工具（如终端或命令提示符），然后执行以下命令：pipins
深度解析 React useRef Hook 的使用 Jason Ma丶丶前端工程师 React javascript react.js javascript 前端
useRef返回一个可变的ref对象，其.current属性被初始化为传入的参数（initialValue）。返回的ref对象在组件的整个生命周期内持续存在。命令式地获取及操作DOM：functionTextInputWithFocusButton(){ //通过useRef创建并获取Dom元素 constinputEl=useRef(null); constonButtonClick=()=
Pytorch使用手册—扩展 TorchScript 使用自定义 C++ 操作符（专题五十三） AI专题精讲 Pytorch入门到精通 pytorch c++人工智能
提示本教程自PyTorch2.4起已弃用。有关PyTorch自定义操作符的最新指南，请参阅PyTorch自定义操作符。PyTorch1.0版本引入了一种名为TorchScript的新编程模型。TorchScript是Python编程语言的一个子集，可以被TorchScript编译器解析、编译和优化。此外，编译后的TorchScript模型可以选择序列化为磁盘文件格式，随后你可以从纯C++（以及Py
大模型微调归一码字人工智能
文章目录前言一、使用的库二、数据预处理1.引入库2.读入数据3.对数据进行预处理4.转换为json格式文件三，使用算子分析数据并进行数据处理四，划分训练集和测试集五，编写训练脚本开始训练六，进行模型推理人工评估总结前言这是使用知乎评论进行模型微调，让模型输出更加通畅接近人的使用语言一、使用的库modelscope：提供模型、数据集下载能力data-juicer：提供数据集处理能力ms-swift：
Web Component 教程（六）：基于 Stencil 脚手架开发 Web Component 乐闻x Web Component 学习记录前端 web component stencli
前言在现代前端开发中，WebComponent是一种逐渐受到关注的技术，它允许我们创建可以在任何框架或库（如React,Angular,Vue等）中使用的可重用组件。而Stencil是一个强大的开发工具，它帮助我们轻松构建这些WebComponent，使开发过程更高效、更简洁。那么，究竟如何使用Stencil来开发WebComponent呢？今天，我们就来探索这一主题，从安装和设置，到创建和使用组
camera_calibration_external mm_exploration Halcon 机器人 halcon 3d 计算机视觉
目录一、计算相机的外参二、计算相机的外参第二种方法三、图像点坐标变换到世界坐标系四、图像点坐标变换到世界坐标系五、图像点坐标变换到世界坐标系六、游标卡尺转平一、计算相机的外参这是一段很通用的代码，计算相机的外参，获得PoseCalObjInCameraread_image(Image,ImgPath+'calib_11')dev_display(Image)CaltabName:='caltab_
JVM OOM问题如何排查和解决昔我往昔 jvm jvm
在Java开发中，JVMOOM（OutOfMemoryError）问题通常是指程序运行时，JVM无法为对象分配足够的内存空间，导致发生内存溢出的错误。这个问题往往和内存的配置、内存泄漏、或者资源过度使用等因素有关。1.OOM错误类型JVM中的OOM错误主要包括以下几种类型：java.lang.OutOfMemoryError:Javaheapspace：堆内存不足。堆内存用于存储对象，发生此错误时
React Material Components Web 使用教程计煦能Leanne
ReactMaterialComponentsWeb使用教程react-mdc-webMaterialDesignComponentsforReact项目地址:https://gitcode.com/gh_mirrors/re/react-mdc-web项目介绍ReactMaterialComponentsWeb（简称react-mdc-web）是一个基于Google的MaterialDesign
从0到1：小白也能轻松上手的高清电影搜索引擎网站制作指南计算机学长网站制作搜索引擎前端服务器
引言在互联网飞速发展的当下，在线观影已成为人们日常娱乐不可或缺的一部分。据相关数据显示，2024年网络视频用户规模达到了惊人的规模，如此庞大的用户群体，对电影资源的需求自然也是水涨船高。然而，面对海量的电影资源，如何快速、准确地找到自己心仪的高清电影，却成了许多影迷的一大难题。各大视频平台资源分散，想要观看不同的电影，往往需要在多个平台之间来回切换，而且还可能面临付费门槛、广告干扰等问题。这时，一
基于Wasm的边缘计算Pandas：突破端侧AI的最后一公里——让数据分析在手机、IoT设备上飞驰 Eqwaak00 Pandas 人工智能 wasm 边缘计算 pandas 架构深度学习
引言：边缘计算的算力觉醒在智能家居设备每秒产生数万条传感器数据、手机App需要实时分析用户行为的今天，传统云计算模式面临高延迟、隐私风险、带宽成本三大挑战。本文将揭示如何通过WebAssembly（Wasm）+Pandas的技术组合，在边缘设备上实现零云端依赖的实时数据分析，并通过智慧工厂设备预测性维护案例，展示从理论到工程的全链路实现。一、技术架构设计1.1边缘计算范式演进mermaid：gra
使用 MistralAI 平台进行开源模型托管与调用 VYSAHF python
MistralAI是一个提供开放源码模型托管的平台，致力于帮助开发者更轻松地使用和管理开源模型。通过该平台，你可以方便地调用强大的深度学习模型，并将其集成到你的应用中。本文将带你了解如何利用MistralAI提供的服务来进行模型的托管和调用。技术背景介绍MistralAI的服务包括了如聊天模型和嵌入模型等，这些模型适用于聊天机器人、文本嵌入等各种场景。使用这些模型需要注册并获取一个有效的API密钥
后“智驾平权”时代，谁为安全冗余和体验升级“买单” 高工智能汽车安全人工智能
线控底盘，正在成为新势力争夺下一个技术普及红利的新赛点。尤其是进入2025年，比亚迪、长安等一线传统自主品牌率先开启高阶智驾的普及战，加上此前已经普及的智能座舱，舱驾智能的「科技平权」进一步加速行业启动「线控底盘」上车窗口期。去年4月，华为数字能源率先对外发布了DriveONE纯电智动方案，并与车企在EMB线控制动领域率先展开深度合作。这套方案通过驱动和制动系统的融合控制，来大幅缩短刹车距离和高速
多家车企接入DeepSeek，AI汽车战争爆发，谁站上风口，谁会下牌桌？高工智能汽车人工智能汽车
日前，多家车企宣布接入DeepSeek。在吉利汽车、岚图汽车率先宣布后，东风汽车、零跑汽车、奇瑞、上汽集团、长城几家车企也紧随其后。其中东风汽车宣布旗下自主品牌已完成DeepSeek全系列大语言模型接入工作，并将于近期陆续搭载应用于包括东风岚图、东风猛士、东风奕派、东风风神、东风纳米在内的东风自主品牌车型。其中岚图品牌方面，岚图知音将成为汽车行业首个融合DeepSeek的量产车型，全新岚图梦想家也
职场人必存！DeepSeek提示词大合集：周报速成、爆款文案、旅行攻略一键生成阳光永恒736 AI工具人工智能 deepseek AI提示词
引言：AI时代，为什么你的提示词总“词不达意”？“同样的AI工具，同事用DeepSeek半小时写完周报还附赠数据分析图，我却只会问‘帮我总结本周工作’？”这可能是多数职场人的真实写照。AI工具的能力边界早已超越基础问答，但90%的用户仍停留在“无效提问”阶段10。而真正拉开差距的，是一套精准的提示词指令库——它能将模糊需求转化为AI可执行的“操作指南”，让效率提升10倍不止。一、职场效率：从“加班
apache 安装linux windows 墙头上一根草 apache inux windows
linux安装Apache 有两种方式一种是手动安装通过二进制的文件进行安装，另外一种就是通过yum 安装，此中安装方式，需要物理机联网。以下分别介绍两种的安装方式通过二进制文件安装Apache需要的软件有apr,apr-util,pcre 1，安装 apr 下载地址：htt
fill_parent、wrap_content和match_parent的区别 Cb123456 match_parent fill_parent
fill_parent、wrap_content和match_parent的区别: 1）fill_parent 设置一个构件的布局为fill_parent将强制性地使构件扩展，以填充布局单元内尽可能多的空间。这跟Windows控件的dockstyle属性大体一致。设置一个顶部布局或控件为fill_parent将强制性让它布满整个屏幕。 2） wrap_conte
网页自适应设计天子之骄 html css 响应式设计页面自适应
网页自适应设计网页对浏览器窗口的自适应支持变得越来越重要了。自适应响应设计更是异常火爆。再加上移动端的崛起，更是如日中天。以前为了适应不同屏幕分布率和浏览器窗口的扩大和缩小，需要设计几套css样式，用js脚本判断窗口大小，选择加载。结构臃肿，加载负担较大。现笔者经过一定时间的学习，有所心得，故分享于此，加强交流，共同进步。同时希望对大家有所
[sql server] 分组取最大最小常用sql 一炮送你回车库 SQL Server
--分组取最大最小常用sql--测试环境if OBJECT_ID('tb') is not null drop table tb;gocreate table tb( col1 int, col2 int, Fcount int)insert into tbselect 11,20,1 union allselect 11,22,1 union allselect 1
ImageIO写图片输出到硬盘 3213213333332132 java image
package awt; import java.awt.Color; import java.awt.Font; import java.awt.Graphics; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imagei
自己的String动态数组宝剑锋梅花香 java 动态数组数组
数组还是好说，学过一两门编程语言的就知道，需要注意的是数组声明时需要把大小给它定下来，比如声明一个字符串类型的数组：String str[]=new String[10]; 但是问题就来了，每次都是大小确定的数组，我需要数组大小不固定随时变化怎么办呢？动态数组就这样应运而生，龙哥给我们讲的是自己用代码写动态数组，并非用的ArrayList 看看字符
pinyin4j工具类 darkranger .net
pinyin4j工具类Java工具类 2010-04-24 00:47:00 阅读69 评论0 字号：大中小引入pinyin4j-2.5.0.jar包: pinyin4j是一个功能强悍的汉语拼音工具包，主要是从汉语获取各种格式和需求的拼音，功能强悍，下面看看如何使用pinyin4j。本人以前用AscII编码提取工具，效果不理想，现在用pinyin4j简单实现了一个。功能还不是很完美，
StarUML学习笔记----基本概念 aijuans UML建模
介绍StarUML的基本概念，这些都是有效运用StarUML?所需要的。包括对模型、视图、图、项目、单元、方法、框架、模型块及其差异以及UML轮廓。模型、视与图（Model, View and Diagram） &
Activiti最终总结 avords Activiti id 工作流
1、流程定义ID：ProcessDefinitionId，当定义一个流程就会产生。 2、流程实例ID：ProcessInstanceId，当开始一个具体的流程时就会产生，也就是不同的流程实例ID可能有相同的流程定义ID。 3、TaskId，每一个userTask都会有一个Id这个是存在于流程实例上的。 4、TaskDefinitionKey和（ActivityImpl activityId
从省市区多重级联想到的，react和jquery的差别 bee1314 jquery UI react
在我们的前端项目里经常会用到级联的select，比如省市区这样。通常这种级联大多是动态的。比如先加载了省，点击省加载市，点击市加载区。然后数据通常ajax返回。如果没有数据则说明到了叶子节点。针对这种场景，如果我们使用jquery来实现，要考虑很多的问题，数据部分，以及大量的dom操作。比如这个页面上显示了某个区，这时候我切换省，要把市重新初始化数据，然后区域的部分要从页面
Eclipse快捷键大全 bijian1013 java eclipse 快捷键
Ctrl+1 快速修复(最经典的快捷键,就不用多说了)Ctrl+D: 删除当前行 Ctrl+Alt+↓ 复制当前行到下一行(复制增加)Ctrl+Alt+↑ 复制当前行到上一行(复制增加)Alt+↓ 当前行和下面一行交互位置(特别实用,可以省去先剪切,再粘贴了)Alt+↑ 当前行和上面一行交互位置(同上)Alt+← 前一个编辑的页面Alt+→ 下一个编辑的页面(当然是针对上面那条来说了)Alt+En
js 笔记函数征客丶 JavaScript
一、函数的使用 1.1、定义函数变量 var vName = funcation(params){ } 1.2、函数的调用函数变量的调用： vName(params); 函数定义时自发调用：(function(params){})(params); 1.3、函数中变量赋值 var a = 'a'; var ff
【Scala四】分析Spark源代码总结的Scala语法二 bit1129 scala
1. Some操作在下面的代码中，使用了Some操作：if (self.partitioner == Some(partitioner))，那么Some(partitioner)表示什么含义？首先partitioner是方法combineByKey传入的变量， Some的文档说明： /** Class `Some[A]` represents existin
java 匿名内部类 BlueSkator java匿名内部类
组合优先于继承 Java的匿名类，就是提供了一个快捷方便的手段，令继承关系可以方便地变成组合关系继承只有一个时候才能用，当你要求子类的实例可以替代父类实例的位置时才可以用继承。在Java中内部类主要分为成员内部类、局部内部类、匿名内部类、静态内部类。内部类不是很好理解，但说白了其实也就是一个类中还包含着另外一个类如同一个人是由大脑、肢体、器官等身体结果组成，而内部类相
盗版win装在MAC有害发热，苹果的东西不值得买，win应该不用 ljy325 游戏 apple windows XP OS
Mac mini 型号: MC270CH-A RMB:5,688 Apple 对windows的产品支持不好,有以下问题: 1.装完了xp,发现机身很热虽然没有运行任何程序！貌似显卡跑游戏发热一样，按照那样的发热量,那部机子损耗很大,使用寿命受到严重的影响! 2.反观安装了Mac os的展示机，发热量很小，运行了1天温度也没有那么高 &nbs
读《研磨设计模式》-代码笔记-生成器模式-Builder bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 生成器模式的意图在于将一个复杂的构建与其表示相分离，使得同样的构建过程可以创建不同的表示（GoF） * 个人理解： * 构建一个复杂的对象，对于创建者（Builder）来说，一是要有数据来源(rawData)，二是要返回构
JIRA与SVN插件安装 chenyu19891124 SVN jira
JIRA安装好后提交代码并要显示在JIRA上，这得需要用SVN的插件才能看见开发人员提交的代码。 1.下载svn与jira插件安装包，解压后在安装包(atlassian-jira-subversion-plugin-0.10.1) 2.解压出来的包里下的lib文件夹下的jar拷贝到(C:\Program Files\Atlassian\JIRA 4.3.4\atlassian-jira\WEB
常用数学思想方法 comsci 工作
对于搞工程和技术的朋友来讲，在工作中常常遇到一些实际问题，而采用常规的思维方式无法很好的解决这些问题，那么这个时候我们就需要用数学语言和数学工具，而使用数学工具的前提却是用数学思想的方法来描述问题。。下面转帖几种常用的数学思想方法，仅供学习和参考函数思想　　把某一数学问题用函数表示出来，并且利用函数探究这个问题的一般规律。这是最基本、最常用的数学方法
pl/sql集合类型 daizj oracle 集合 type pl/sql
--集合类型 /* 单行单列的数据，使用标量变量单行多列数据，使用记录单列多行数据，使用集合（。。。） *集合：类似于数组也就是。pl/sql集合类型包括索引表（pl/sql table）、嵌套表（Nested Table）、变长数组（VARRAY）等 */ /* --集合方法 &n
[Ofbiz]ofbiz初用 dinguangx 电商 ofbiz
从github下载最新的ofbiz（截止2015-7-13），从源码进行ofbiz的试用 1. 加载测试库 ofbiz内置derby，通过下面的命令初始化测试库 ./ant load-demo (与load-seed有一些区别) 2. 启动内置tomcat ./ant start 或 ./startofbiz.sh 或 java -jar ofbiz.jar &
结构体中最后一个元素是长度为0的数组 dcj3sjt126com c gcc
在Linux源代码中，有很多的结构体最后都定义了一个元素个数为0个的数组，如/usr/include/linux/if_pppox.h中有这样一个结构体： struct pppoe_tag { __u16 tag_type; __u16 tag_len; &n
Linux cp 实现强行覆盖 dcj3sjt126com linux
发现在Fedora 10 /ubutun 里面用cp -fr src dest，即使加了-f也是不能强行覆盖的，这时怎么回事的呢？一两个文件还好说，就输几个yes吧，但是要是n多文件怎么办，那还不输死人呢？下面提供三种解决办法。方法一我们输入alias命令，看看系统给cp起了一个什么别名。 [root@localhost ~]# aliasalias cp=’cp -i’a
Memcached(一)、HelloWorld frank1234 memcached
一、简介高性能的架构离不开缓存，分布式缓存中的佼佼者当属memcached，它通过客户端将不同的key hash到不同的memcached服务器中，而获取的时候也到相同的服务器中获取，由于不需要做集群同步，也就省去了集群间同步的开销和延迟，所以它相对于ehcache等缓存来说能更好的支持分布式应用，具有更强的横向伸缩能力。二、客户端选择一个memcached客户端，我这里用的是memc
Search in Rotated Sorted Array II hcx2013 search
Follow up for "Search in Rotated Sorted Array":What if duplicates are allowed? Would this affect the run-time complexity? How and why? Write a function to determine if a given ta
Spring4新特性——更好的Java泛型操作API jinnianshilongnian spring4 generic type
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装JDK liuxingguome centos
1、行卸载原来的： [root@localhost opt]# rpm -qa | grep java tzdata-java-2014g-1.el6.noarch java-1.7.0-openjdk-1.7.0.65-2.5.1.2.el6_5.x86_64 java-1.6.0-openjdk-1.6.0.0-11.1.13.4.el6.x86_64 [root@localhost
二分搜索专题2-在有序二维数组中搜索一个元素 OpenMind 二维数组算法二分搜索
1,设二维数组p的每行每列都按照下标递增的顺序递增。用数学语言描述如下：p满足 (1),对任意的x1，x2，y，如果x1<x2,则p(x1,y)<p(x2,y); (2),对任意的x，y1,y2, 如果y1<y2,则p(x,y1)<p(x,y2); 2,问题：给定满足1的数组p和一个整数k，求是否存在x0,y0使得p(x0,y0)=k? 3,算法分析： (
java 随机数 Math与Random SaraWon java Math Random
今天需要在程序中产生随机数，知道有两种方法可以使用，但是使用Math和Random的区别还不是特别清楚，看到一篇文章是关于的，觉得写的还挺不错的，原文地址是 http://www.oschina.net/question/157182_45274?sort=default&p=1#answers 产生1到10之间的随机数的两种实现方式： //Math Math.roun
oracle创建表空间 tugn oracle
create temporary tablespace TXSJ_TEMP tempfile 'E:\Oracle\oradata\TXSJ_TEMP.dbf' size 32m autoextend on next 32m maxsize 2048m extent m
使用Java8实现自己的个性化搜索引擎 yangshangchuan java superword 搜索引擎 java8 全文检索
需要对249本软件著作实现句子级别全文检索，这些著作均为PDF文件，不使用现有的框架如lucene，自己实现的方法如下： 1、从PDF文件中提取文本，这里的重点是如何最大可能地还原文本。提取之后的文本，一个句子一行保存为文本文件。 2、将所有文本文件合并为一个单一的文本文件，这样，每一个句子就有一个唯一行号。 3、对每一行文本进行分词，建立倒排表，倒排表的格式为：词=包含该词的总行数N=行号

【CV with Pytorch】第 6 章 ：姿态估计