dulu_202

【论文精读】AVP-Loc: Surround View Localization and Relocalization Based on HD VectorMap for AVP

【论文精读】AVP-Loc: Surround View Localization and Relocalization Based on HD VectorMap for Automated Valet Parking

论文出处

IROS2021

摘要

定位是自动代客泊车的关键前提，汽车需要在无gps信息的停车场自动导航，传统的视觉定位方法通常会构建一个特征地图，并将其用于后边的定位。然而，特征地图对于光照、纹理和观察视角不够鲁棒。为了处理这个问题，我们需要一个更加稳定的地图。本篇文章，我们直接使用停车场的高清矢量地图进行定位，这种矢量表现形式很稳定但也在数据关联中带来了挑战。为此，我们提出了一种新的数据关联方法来匹配环视图像和高清矢量图，此外，我们还提出了一种利用矢量图中独特的道路标志组合来进行封闭形式重定位的策略，实验表明，该方法能够在多层停车场中实现厘米级的定位精度。

贡献

一种基于语义分割的环视图与高清矢量图相匹配的异构数据关联方法
一种利用分布在矢量图之间的独特道路标志组合的封闭形式重定位策略
一个基于全环绕视野的在无单独定位层停车场下实现厘米级定位精度的定位系统

高清矢量图：矢量图由一组语义交通元素的矢量化三维形状组成，如停车线、车道线、箭头和减速带。

方法

定位

A.BEV的语义分割

我们利用逆透视变换从四个环视鱼眼摄像头中构建一个BEV图像，BEV图像的像素 $\mathbf{[u, v]}^{T}$ 和它在车辆坐标系中的位置 $\mathbf{[X, Y, 0]}^{T}$ 的关系如下：

其中 $w, h$ 是图像的宽和高， $s$ 是像素比例，BEV中的每个像素在车辆坐标中占据一个 $\mathbf{2cm}^{2}$ 的空间。我们使用 $640 \times 872$ 图像大小，在真实世界中覆盖的 ROI 为 $17.44\mathbf{m}^{2}$ 。

为了关联图像和矢量图之间的异构数据，我们训练了一个卷积神经网络，将BEV图像转换为语义分割图，我们在这里使用的语义类是停车场中不同类型的道路标记，例如，车道线、停车线、箭头、文本、减速带、斑马条、仪表板段。在标签定义中，我们区分了水平和竖直的停车线w.r.t.和停车场的入口方向，这种区分使我们在横向和纵向方向上有更好的位置约束，我们使用 Pyramid scene parsing network 来训练这个网络。

B.矢量图匹配

我们现在将BEV图像的语义分割图与高清矢量图进行匹配。与AVP-SLAM中将帧中每一个特征与对应的特征地图相匹配的方法相反，我们用BEV语义分割图中的语义特征点与每个矢量段相匹配。

直接使用ICP很慢，还会带来歧义，而且直接的ICP很慢。因为前景语义特征集肯包含多达10万个点，索引很慢，而且BEV图中40cm宽的减速带在矢量图中被表示为一个线段，BEV图中箭头是一个连接区域，但矢量图只存储其边界。

在匹配前对BEV分割图像进行预处理。细线降采样，离散道路标记转换成轮廓线；减速带投射到共线点上，每个绿点代表一个与特征点匹配的矢量段。

一种类匹配策略：

对于地图中以多边形表示的离散道路标线（如斑马带，箭头），我们将多边形中的每个段与语义实例的轮廓像素进行匹配。
对于地图中以多条线段表示的连续细道路标线（例如，车道线、停车线），我们对这些类中的语义像素进行一个数量级的降采样，并将每个矢量段与降采样集进行匹配。
对于地图中以多条段线或一条线段表示的连续的粗道路标线（例如，减速带），我们将其轮廓像素投影到轮廓集的主PCA轴上，并将每个矢量段与这个投影集相匹配。

不同匹配策略的目的是为不同的语义类型提高一个更好的匹配模型，并加快匹配过程。

将矢量形状分成一组一米的分段，并将这些分段的中点与像素相匹配，使空间能够被均匀地覆盖。
最多有一个像素可以与一个给定的一米的线段相匹配。
只有具有相同语义标签的段和像素可以相互匹配。

C.ESKF状态估计

我们使用ESKF进行状态估计，旨在估计真实的IMU数据，用来替代世界坐标系下的位姿，速度，自身坐标系到世界坐标系下的四元数、加速度和陀螺仪偏差。

ESKF的更新使用了两种信息来源：

1. 矢量图的匹配
给定像素坐标系和世界坐标系中点到段的匹配 $(p, c i c i + 1)$ ，在世界坐标系下矢量图的观测模型对点到线的距离施加惩罚：

其中 $\mathbf{x}^{W}$ 和 $\mathbf{x}^{V}$ 是世界坐标系和车辆坐标系下的匹配点。 $\mathbf{T}_{V}^{I}$ 表示车辆系到 IMU系的变换，车辆坐标系下的 $\mathbf{x}^{V}$ 是使用等式1从输入像素 $(\mathbf{p}_{u},\mathbf{p}_{v})$ 计算出来的，所有点到段的匹配通过等式3的叠加来形成一个残余向量。
2. 轮速计
给定一个车辆系下记录的轮速 $\mathbf{v}^{V}$ ，并在相同的时间戳下插入一个IMU的角速度 $\omega$ ，要求在IMU状态下，车速观测模型的速度分量与车轮编码器的测量结果一致。

等式的两边都表示IMU坐标系下车辆系原点的速度，右侧来自车轮轮速的读数，左侧是由IMU状态向量计算出来的，并施加了杠杆臂补偿，其中 $\mathbf{t}_{I}^{V}$ 应解释为车辆系在IMU系下的起始位置。

重定位

A.独特的道路标记选择

我们用一个3元组 $(\mathbf{p}_{i},\mathbf{\theta}_{i},\mathbf{c}_{i})$ 来表示每个离散的道路标记实例，组内元素分别表示各自的质心位置，PCA计算出的方向和类标签。每个离散的道路标记都给出一个索引 $i\in N$ 。我们用一组道路标记索引来表示一个地标 $\alpha$ 。如果在半径 R 内没有其他类似的地标，则认为地标 $\alpha$ 在半径 R 上是独特的。如果存在一个刚体变换，使两个3元组对齐，则这两个地标相似，但是这个定义需要求解刚体变换，导致了不必要的计算。为了便于相似性检测，我们将刚性变换检测转换为“空间特征”检测。在这个检测中，地标 $\alpha$ 和地标 $\beta$ 是相似的，当且仅当

其中 $\gamma$ 是 $\beta$ 排列中的一个元素。 $n$ 是每个地标中元素指数的数量。 $\mathbf{\alpha}_{i}, \mathbf{\gamma}_{i}$ 分别表示每个地标中的第 i 个元素索引。 $\mathbf{\tau}_{p} = 0.2m$ , $\mathbf{\tau}_{\theta} = 5°$ 为相似性阈值。等式6到9表示每个地标内的相对距离和方向（即空间特征）是否相似。

我们选择减速带、箭头和仪表段作为基本的离散道路标记进行组合。仪表板段不能单独使用，但可以参与增强一个组合，以获得更好的独特性。在实践中，我们为一个地标分配至少一个和最多三个离散的标记，每个地标也与它独特的半径相关联。注意，虽然等式6-9的相似性实验涉及到排列，但不会导致任何组合爆炸问题，因为一个地标最多包含三个实例，并且只需要排列具有相同标签的实例。在实践中，一个现实世界的地标中，最多有两个实例共享相同的标签，这只会导致两个排列结果。

B.漂移检测

只有在检测到漂移时，才会触发重定位模式。

在正确的结果中，每个从BEV图像中提取的语义特征点在矢量图中都有一个相匹配的矢量段。当发生漂移时，许多语义特征点无法找到它们所匹配的向量，这种特征点被称为孤立特征点。选择孤立特征点的比值作为漂移检测度量。如果孤立比在连续几帧都低于预定义阈值，则认为发生了漂移。

一帧的孤立比 $r$ 被定义为：

其中 $S$ 是语义特征点的集合， $L$ 是参与矢量图匹配的线段的集合。 $d (s, l)$ 表示点到线的距离， $\mathbf{T}_{m}$ 是匹配距离的阈值。为了节省算力，我们将 S 设置为定位中矢量图匹配所描述的特征点降采样集。为了加速求解 $d (s, l)$ ，只保留实际找到的最接近的匹配线段。我们为这些段的中间点创建了一个八叉树索引，这样 $\mathbf{min}_{l}\in\mathbf{L}^{d(s,l)}$ 可以通过一个最近邻搜索计算。

C.封闭式的重定位初始化

重定位是通过将局部地标候选物与矢量图中的对应物进行匹配来实现的。

局部地标检测
从定位的矢量图匹配中我们已经得到了一个BEV分割的离散元素轮廓，其中每个轮廓代表离散标记的一个实例。我们在局部坐标系中使用 PCA 计算每个实例的3元组表示 $(\mathbf{p}_{i},\mathbf{\theta}_{i},\mathbf{c}_{i})$ 。在此之后，我们通过自由组合3元组形成一个地标候选集，并去除候选集中非标准大小的实例。
局部-全局地标匹配
给定一个局部地标候选集 $\mathbf{L}_{s}$ 和全局地标候选集 $\mathbf{L}_{M}$ , 返回一个正确的匹配。对于一个局部地标候选集 $\mathbf{l}_{s}$ ，我们要求地图返回与 $\mathbf{l}_{s}$ 共享相同“标签特征”的地标。一个地标的标签特征被定义为带有三个标签 {减速带、箭头、仪表板段} 的频率直方图。返回的地标集合列表 $\{\mathbf{L}_{1},...,\mathbf{L}_{n}\}$ , 它们都共享相同的标签特征且集合中的每一个元素 $\mathbf{L}_{i}\in\{\mathbf{L}_1,...,\mathbf{L}_{n}\}$ 都有自己的空间特征。显然，列表中最多有一个集合将匹配 $\mathbf{L}_{s}$ 空间特征的查询。匹配的集合被表示为 $\mathbf{L}_{*}$ ，需要确定 $\mathbf{L}_{*}$ 中的哪个地标是与 $\mathbf{L}_{s}$ 真正匹配的。如果 $\mathbf{L}_{*}$ 只包含一个地标，则完成了匹配。否则，我们就利用距离信息来区分相同的地标。
为了解决跟踪丢失，状态估计器输出不可信的问题，我们维护一个单独的卡尔曼滤波器，只使用IMU和轮速计的跟踪里程计，当没有漂移时，滤波器将定期重置，使其协方差保持较小且有界，当漂移发生时，滤波器为我们提供了一个来自其均值和协方差的不确定性椭圆。
为了解决匹配过程没有区分不同楼层停车场相似地标的问题，我们维护一个z轴估计器来判断我们处于哪个楼层。包括两种解决方案：
1.在漂移发生之前使用Z轴估计器，通过与矢量图的车道拓扑进行大致匹配，漂移发生时里程计轨迹xy方向的分量可以用来确定车辆是上楼还是下楼。
2.使用一个气压计，可以给出一个1米精度的z轴估计器。
封闭式重定位初始化
现在我们得到了两组匹配的三元组，记作 $\{\mathbf{p}_{\alpha i},\mathbf{\theta}_{\alpha i}, \mathbf{c}_{\alpha i}\}$ 和 $\{\mathbf{p}_{\beta i},\mathbf{\theta}_{\beta i}, \mathbf{c}_{\beta i}\}$ ，我们计算一个三维刚体变换来对齐两个三元组。由于只需要估计4个自由度，一个3元组就足以计算变换：

对于包含多个实例的地标，我们为每个实例计算一个单独的 R，t，并将它们的均值作为最终重新初始化的姿态。该精度足以满足以下的非线性细化。
为了解决每个实例主要方向上存在一个符号歧义的问题，我们采用之前介绍的单独的卡尔曼滤波器。该解决方案是基于在滤波器中的姿态漂移小于90°的假设。在这个假设下，我们可以将每个主方向转换为世界坐标系，如果方向点与矢量图中的对应方向相反，我们可以将其翻转。在实践中，单独的过滤器将定期重置，以保持该假设永远成立。
非线性细化
使用最后一步粗略的重新初始化姿态，然后使用等式3中的点段对齐成本对其进行细化，这是一个可以用高斯牛顿方法来解决的非线性最小二乘问题，我们使用 Ceres 求解器来实现优化。

实验

A.测试环境

测试车辆平台包括4个鱼眼摄像头，1个IMU，1个轮速计。图像流和语义分割都在10Hz下运行。IMU和轮速编码器分别运行在100Hz和50Hz下。该算法可以在机载的Xavier计算机上运行。

高清地图是基于激光雷达的方法创建的。

B.定位评估

采用两个室内停车场序列来评估定位器的性能，停车场包括地下B2，B3，B4三层。第一个序列是一个多楼层序列，它从B4层的一个停车位开始，经过了B3层，最后返回了B4层的起点。第二个序列是内楼层序列，它从B4层的一个停车位开始，来回转两圈，最后返回同一个停车位。由于实验中使用的停车场不能使用GPS，我们选择了三种方法来评估定位精度。

1.将BEV轨迹和基于NDT算法的激光雷达的定位器估计的轨迹进行比较，使用后者作为伪真值，由于NDT表示和矢量图都是从同一个底层点云创建而来的，比较起来比较合理。平均平移误差在10cm以内，大多数的旋转误差都在3°以内。 该实验表明，我们的环绕视图定位器可以实现激光雷达定位器的精度，同时使用更小的矢量图。

2.我们利用估计的姿态将HD矢量图投影到BEV图像上，并评估地图投影与图像内容之间对应关系的距离。视觉上可区分的特征，如停车位角点，箭头角点被选择作为评价条件。当没有足够的角特征时，我们选择任意的车道线点，并回退到点到线的距离度量。由于BEV图像与物理世界之间的尺度差异是已知的，因此在BEV图像上的距离测量可以作为一个合理的评价指标。但是由于接近BEV图像边界时，相机的外参误差被放大，该实验倾向于输出一个悲观的带偏见的评价。

3.我们将车停在一个停车位多次并评估车和停车线之间的距离，比较定位器输出的距离和用磁带测量的距离。本实验中，该定位器达到了 2.23 厘米的精度，由于车辆周围的两条停车线为横向定位提供了非常强有力的线索，这个实验倾向于输出一个乐观的有偏见的评价。

算法和 AVP-SLAM 在准确性和地图尺寸上的比较。AVP-SLAM 的地图大小是从内楼层序列轨迹中累积起来的语义特征图计算而来，矢量图的尺寸对应该楼层序列的所有向量元素，比特征图小一个数量级。

消融实验：仅使用IMU和轮速计得到的里程计轨迹。
没有矢量图的约束下，里程计很快发生漂移。

C.重定位评估

为了评估重定位的性能，我们在一个好的姿态周围模拟受扰动的姿态，并测试了被干扰的姿态如何被拉回原来的姿态。

算法和AVP_SLAM在重定位性能上比较。

AVP_SLAM也利用了语义分割，它通过使用 ICP 对齐两个子地图来执行回环检测（重定位）。子地图是在三维图像中对附近分割结果的累积，由于基于子地图的重定位使用了ICP，因此它在很大程度上依赖于初始姿态的接近程度，如果初值不好就会陷到局部最小值里。本算法的重定位使用减速带和箭头组合作为地标，由于重新初始化是在封闭形式下完成的，因此无论噪声如何扰动，解都会收敛到相同的最小值。

点评

相对于AVP-SLAM的语义+ICP，本篇论文是语义+新的匹配策略，在和AVP-SLAM的对比实验中，可以看到地图尺寸有所减小，但定位精度变化不大（2.36cm-2.23cm，5.23cm-5.20cm）。由于ICP匹配严重依赖于初值，初值不好很容易陷入局部最小里，本篇论文提出的封闭形式重定位方法可以做到无论噪声如何扰动，解都会收敛到相同的最小值，对应到地图上就是可以回到原来定位的姿态。

论文链接

AVP-Loc: Surround View Localization and Relocalization Based on HD Vector Map for Automated Valet Parking | IEEE Conference Publication | IEEE Xplore

蚂蚁集团可转正实习算法岗内推-自然语言飞300 业界资讯自然语言处理
具备极佳的工程实现能力，精通C/C++、Java、Pvthon、Perl等至少一门语言:对目前主流的深度学习平台:tensorflow、pytorch、mxnet等，至少对其中一个有上手经验;熟悉深度学习以及常见机器学习算法的原理与算法，能熟练运用聚类、分类、回归、排序等模型解决有挑战性的问题，有大数据处理的实战经验;有强烈求知欲，对人工智能领域相关技术有热情，内推链接：https://u.ali
（视频演示）基于OpenCV的实时视频跟踪火焰识别软件V1.0源码及exe下载是刃小木啦~ opencv 人工智能计算机视觉
本文介绍了基于OpenCV的实时视频跟踪火焰识别软件，该软件通过先进的图像处理技术实现对实时视频中火焰的检测与跟踪，同时支持导入图片进行火焰识别。主要功能包括相机选择、实时跟踪和图片模式。软件适用于多种场合，用于保障人民生命财产安全。源码及exe文件可通过蓝奏云网盘下载。软件简介《基于OpenCV的实时视频跟踪火焰识别软件》是一款创新的计算机视觉应用软件，旨在通过先进的图像处理技术实现对实时视频中
具身智能行业 [shenhonglei] 具身觉醒：智能进化的未来之路人工智能机器人
具身智能行业综合分析资源下载-具身智能导图.xmind资源下载-具身智能导图.xmind一、行业概况定义与核心特征具身智能（EmbodiedAI）指通过物理实体（如机器人、自动驾驶设备等）与环境的动态交互，实现感知、认知和行动控制的智能系统。其核心特征是“知行合一”，强调通过实际交互提升智能水平，而非仅依赖数据训练。技术融合：结合人工智能（AI）、机器人技术、多模态大模型
【AGI】中国大模型扛把子：通义家族 LeeZhao@ AIGC重塑生活神器 agi 人工智能 AIGC 面试自然语言处理语言模型
中国大模型扛把子：通义家族引言一、通义千问的技术架构与模型谱系二、技术突破与性能优势三、开源生态与行业影响四、未来展望：从“千问时代”到通用智能五、通义家族大模型列表（1）多模态大模型（2）大语言模型结语引言在人工智能大模型领域，中国科技企业正以惊人的速度突破技术边界。阿里云推出的**通义千问（Qwen）**系列大模型，凭借其多层次的技术架构、多样化的模型生态及开源战略，已成为全球AI领域的重要标
OpenCV 100道面试题及参考答案（7万字长文）大模型大数据攻城狮大厂面试大厂面经 android面试计算机视觉 opencv 实时互动 webrtc
OpenCV简介OpenCV（OpenSourceComputerVisionLibrary）是一个开源的计算机视觉库，它提供了丰富的函数和工具，用于处理图像和视频。OpenCV最初由英特尔公司开发，现在由一个开源社区维护和发展。主要功能和用途OpenCV的主要功能包括图像和视频处理、特征提取、目标检测、人脸识别、物体跟踪等。它可以用于各种领域，如机器人技术、医学影像、安全监控、自动驾驶等。在图像
面向B端程序员的逆袭：从码农到业务解决方案架构师的进阶之路 Hello kele 运维人工智能经验分享 AI编程程序员
在2B（企业服务）这个深水区，程序员已经不能只当“代码搬运工”了。现在的趋势是从单纯的技术交付，升级成帮客户创造商业价值的“大神”。客户不再只是IT部门那帮geek，连业务部门的老大们也开始掺和进来，解决方案得直击企业数字化转型的痛点。这时候，你的价值就得跟“客户成功”死磕到底。这篇文章从技术穿透力、业务理解度、客户连接力三个角度，给你画一张从码农到业务解决方案架构师的“升级地图”。一、技术穿透力
大语言模型对程序员行业的影响及未来发展走势分析 Hello kele 人工智能 java 人工智能 AI编程
随着人工智能技术的快速发展，特别是大语言模型（如DeepSeek、OpenAI、Grok等）的出现，对程序员这个行业产生了深远的影响。在这篇文章中，我们将探讨这些变化，分析影响，并展望未来的发展趋势。一、当前影响1.自动化代码生成大语言模型的一个直接影响是代码自动化的能力。这些模型可以理解代码上下文，并生成功能性代码。例如，GitHubCopilot已经成为许多开发者的辅助工具，能够根据注释或部分
DeepSeek：AI赋能的无限可能——从日常生活到职业进阶的全场景探索 Hello kele 人工智能人工智能
引言在人工智能技术飞速发展的今天，DeepSeek作为一款国产AI工具，凭借其强大的推理能力、自然语言处理效率和场景化应用潜力，正在重塑人类解决问题的方式。从撰写演讲稿到制定投资策略，从家庭教育到企业管理，DeepSeek通过“自然语言对话”的交互模式，将复杂任务简化为几步提示词的输入，真正实现了“所想即所得”。本文将从七大核心场景出发，系统解析DeepSeek如何成为个人与组织的智能助手，推动效
RAG 检索增强生成：技术详解与应用展望君君学姐 RAG检索增强生成
RAG检索增强生成：技术详解与应用展望一、引言随着人工智能技术的飞速发展，自然语言处理（NLP）领域迎来了前所未有的变革。其中，检索增强生成（Retrieval-AugmentedGeneration，简称RAG）作为一种新兴的技术框架，正逐渐成为大模型应用中的热门选择。RAG通过结合信息检索（IR）和自然语言生成（NLG）的能力，旨在提升模型在回答问题、生成文本等任务中的准确性和可靠性。本文将深
使用OpenCV和Python将图像读取为RGB UixnContext opencv python 人工智能 OpenCV
在计算机视觉和图像处理中，OpenCV是一个广泛使用的开源库，提供了许多功能强大的图像处理工具。其中一个常见的任务是将图像读取为RGB格式，以便进一步处理和分析。在本文中，我将向您展示如何使用OpenCV和Python来实现这个任务。首先，确保您已经安装了OpenCV库。您可以使用以下命令在Python中安装OpenCV：pipinstallopencv-python一旦安装完成，我们可以开始写代
——四色定理的解析与证明（完整版） 2301_81062744 拓扑学
——四色定理的解析与证明（完整版）###**引言**四色定理自1852年诞生以来，始终是图论与拓扑学领域的核心难题。其简洁的表述——“任何平面地图仅需四种颜色即可实现邻接区域异色”——与证明过程的复杂性形成鲜明对比。1976年，Appel与Haken通过计算机穷举约1500种不可约构形，首次给出确定性证明，却因依赖机器验证引发了数学哲学层面的长期争议。此后，数学家们不断寻求更直观、更具构造性的证明
人工智能开发趋势光影少年人工智能
人工智能开发趋势：未来技术的演进与创新引言人工智能（AI）正在以惊人的速度发展，并在各行各业中发挥越来越重要的作用。从自然语言处理到计算机视觉，从自动化决策到自主学习，AI的发展方向正变得更加智能化、自动化和人性化。本文将探讨当前AI开发的最新趋势，并展望未来的发展方向。1.生成式AI的崛起近年来，生成式AI（如ChatGPT、StableDiffusion、DALL·E）展现出强大的内容创作能力
【2024年华为OD机试】 (C卷,100分)- 分配土地（JavaScript&Java & Python&C/C++）妄北y 算法汇集笔记总结(保姆级)华为od c语言 javascript python java
一、问题描述题目描述从前有个村庄，村民们喜欢在各种田地上插上小旗子，旗子上标识了各种不同的数字。某天，集体村民决定将覆盖相同数字的最小矩阵形的土地分配给村里做出巨大贡献的村民。请问此次分配土地，做出贡献的村民最大会分配多大面积？输入描述第一行输入m和n：m代表村子的土地的长。n代表土地的宽。第二行开始输入地图上的具体标识：旗子上的数字为1~500，未插旗子的土地用0标识。输出描述输出此次分配土地，
大模型驱动的智能代码生成系统 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 ChatGPT java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
大模型驱动的智能代码生成系统关键词大模型智能代码生成自然语言处理计算机视觉系统设计与实现摘要本文深入探讨了基于大模型的智能代码生成系统的构建与实现。首先，我们分析了智能代码生成的背景与意义，随后介绍了大模型的基本原理及其在代码生成中的潜力。接着，我们详细阐述了智能代码生成系统的设计与实现过程，包括系统需求分析、架构设计、模型集成与优化等方面。随后，本文通过自然语言处理、计算机视觉和代码生成应用，展
LLM辅助编程：代码自动生成与优化 AI智能涌现深度研究计算机软件编程原理与应用实践 DeepSeek R1 &大数据AI人工智能 java python javascript kotlin golang 架构人工智能
LLM,代码生成,代码优化,编程辅助,AI编程,自然语言处理,深度学习1.背景介绍随着软件开发的日益复杂化，程序员面临着越来越高的开发压力和效率要求。传统的编程方式依赖于手动编写代码，这不仅耗时费力，而且容易出现错误。近年来，随着深度学习技术的快速发展，基于大型语言模型（LLM）的代码生成和优化技术逐渐成为软件开发领域的新兴热点。LLM是一种强大的人工智能模型，能够理解和生成人类语言。通过训练大量
Python图片识别脚本：从零开始实现图像识别！ Python_trys python 开发语言编程 Python入门 Python基础 Python识别 Python学习
包含编程籽料、学习路线图、爬虫代码、安装包等！【点击领取！】图像识别是计算机视觉领域的一个重要应用，Python凭借其丰富的库和工具，成为了实现图像识别的首选语言之一。本文将带你从零开始，使用Python编写一个简单的图片识别脚本。我们将使用OpenCV和TensorFlow来实现这个功能。1.环境准备在开始之前，我们需要安装一些必要的Python库。你可以使用pip来安装这些库：pipinsta
从零开始学Java Lambda表达式：一篇让你彻底理解的通俗指南 z2637305611 学习 java 开发语言
引言想象你每天点外卖要写500字的订单备注，结果有一天发现点“快速套餐”按钮就能搞定——这就是Lambda表达式的魅力！它能让你用“快餐式”代码代替冗长的写法。本文会用大白话、生活案例和代码对比，帮你彻底搞懂JavaLambda的用法！一、Lambda是什么？一句话概括：“用更短的代码，实现一个方法”——专门用来简化匿名内部类的写法！场景对比：传统写法vsLambda写法假设你有一个“点击按钮触发
数值计算模型范围的取值与思考--水泵水轮机压力脉动问题--学术论文模式--个人经验总结 lalalaO°C_m 经验分享-高效率！笔记算法数据分析经验分享信号处理
数值计算模型范围的取值与思考——水泵水轮机压力脉动问题目录数值计算模型范围的取值与思考——水泵水轮机压力脉动问题写在前面摘要1研究背景2研究现状3研究方法3.1模型结构参数的选取3.2数值计算方法和参数3.3计算工况参数3.4求解器参数4总结与思考参考文献写在前面压力脉动是引起水力机械振动进而影响水泵水轮机安全运行的重要原因，使用数值模拟模型能够实现高精度且高效的压力脉动特性的计算研究。本文是博主
Oumi ：AI开发的未来？人工智能开源
Oumi：AI开发的未来？前言在人工智能领域，开源技术正以前所未有的速度推动着创新和变革。今天，我们将聚焦一个备受瞩目的开源AI平台——Oumi。它不仅以其强大的功能和灵活的架构吸引了全球开发者和企业的目光，还通过简化AI开发的整个生命周期，为用户提供了前所未有的便利。github地址：https://github.com/oumi-ai/oumi官网地址：https://oumi.ai/什么是O
关于采用源始经为底层框架开发中文编程系统的可能性太翌修仙笔录 deepseek 超算法认知架构第三代人工智能算法人工智能
用中文写代码和Python哪个有前景在编程语言选择方面，**Python的发展前景明显优于中文编程语言**。以下是具体分析：---###一、核心结论**优先选择Python**，因为：1.**全球通用性**：Python是国际主流编程语言，适用于跨国协作和开源项目2.**就业市场需求**：Python在人工智能/大数据/Web开发等领域的岗位需求持续增长3.**技术生态优势**：拥有超过30万个第
php 常用bc函数任性不起来了 php bc函数
bcadd—加法，2个任意精度数字的加法计算bcsub—减法bcmul—乘法bcdiv—除法bcpow—乘方bcmod—取模bcsqrt—求二次方根bccomp—比较两个任意精度的数字，返回一个整数的结果：若两数相等返回0，左数大返回1，否则返回-1bcpowmod—求高精度数字乘方求模，数论里非常常用bcscale—设置所有bc数学函数的默认小数点保留位数—比较两个高精度数字，返回-1,0,1
【免费收藏】清华大学DeepSeek使用手册合集 600页完整版周师姐 AI写作学习人工智能 pdf
DeepSeek资料链接：https://pan.quark.cn/s/c927326f70c5在人工智能席卷全球的当下，DeepSeek作为前沿深度学习技术，正推动着全面AI时代的到来。今日，特别为大家推荐《DeepSeek：从入门到精通》，本书由清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室的余梦珑博士后团队精心编写。它深度解析DeepSeek的技术核心，详尽阐释其应用场景与操作方法，尤
YOLOv12改进之A2(区域注意力) 清风AI 深度学习算法详解及代码复现深度学习机器学习计算机视觉人工智能算法
注意力回顾注意力机制作为深度学习领域的核心技术，已广泛应用于自然语言处理和计算机视觉等多个领域。在YOLOv12改进之A2中，注意力机制扮演着关键角色。已有研究成果包括：Transformer架构：引入了自注意力机制，有效捕捉输入序列中的长距离依赖关系。CBAM模块：提出了通道和空间注意力的结合，显著提升了图像分类和目标检测的性能。SENet：引入了通道注意力机制，通过自适应学习特征通道的重要性，
CES Asia 2025：科技盛宴助力中国数字经济腾飞 CES_Asia 科技机器人人工智能智能音箱智能电视
备受瞩目的CESAsia2025第七届亚洲消费电子技术贸易展（赛逸展）将在首都北京盛大开幕。本届展会以“科技新视界，创新赢未来”为主题，聚焦人工智能、5G、物联网、元宇宙等前沿科技领域，集中展示全球消费电子行业的最新创新成果，为行业发展注入新动能。政策东风助力，CESAsia2025亮点纷呈近年来，中国高度重视数字经济发展，出台了一系列政策措施，为消费电子产业创造了良好的发展环境。CESAsia2
飞书多维表格+DeepSeek R1：打工人必备的AI神器，效率暴涨1000%！[特殊字符] sherlock__cc 人工智能飞书
导语当飞书多维表格遇上国产最强推理大模型DeepSeekR1，会擦出怎样的火花？本文手把手教你用「零代码」实现批量文案改写、论文精读、视频脚本生成。一、颠覆认知的三大核心优势1.批量处理的工业级效率单次处理1000+条数据，告别传统API逐条调用支持跨表格数据联动（如从CRM系统自动抓取客户需求）实时监控处理进度，失败任务自动重试2.零代码的极简交互无需Python环境配置直接输入自然语言指令（如
芯科科技通过全新并发多协议SoC重新定义智能家居连接电子科技圈 Silicon Labs 智能家居边缘计算 mcu 物联网 iot 人工智能机器学习
MG26系列SoC现已全面供货，为开发人员提供最高性能和人工智能/机器学习功能致力于以安全、智能无线连接技术，建立更互联世界的全球领导厂商SiliconLabs（亦称“芯科科技”，NASDAQ：SLAB），日前宣布其MG26系列无线片上系统（SoC）现已通过芯科科技及其分销合作伙伴全面供货。作为业界迄今为止最先进、高性能的Matter和并发多协议解决方案，MG26SoC的闪存和RAM容量是芯科科技
【大模型系列篇】Vanna-ai基于检索增强(RAG)的sql生成框架木亦汐丫大模型语言模型 sql agi ai 数据库人工智能 embedding
简介Vanna是基于检索增强(RAG)的sql生成框架Vanna使用一种称为LLM（大型语言模型）的生成式人工智能。简而言之，这些模型是在大量数据（包括一堆在线可用的SQL查询）上进行训练的，并通过预测响应提示中最有可能的下一个单词或“标记”来工作。Vanna优化了提示（通过向量数据库使用嵌入搜索）并微调LLM模型以生成更好的SQL。Vanna可以使用和试验许多不同的LLM，以获得最准确的结果。V
中国人工智能大赛成果发布会 | 代码安全智能体让研发安全又高效安全
2024年12月20日，由厦门市人民政府主办，以“融新汇智竞促发展”为主题的第五届中国人工智能大赛成果发布会在厦门成功举办。人工智能安全论坛于成果发布会期间举办，重点聚焦人工智能安全技术专家，共同探讨安全治理的实践经验，探索智能体安全、大模型安全、数据安全、内容安全等方面面临的挑战和解决方案。百度安全技术委员会主席包沉浮受邀出席，分享了智能体技术在代码安全应用上的最新实践经验。百度安全技术委员会主
重磅发现！DeepSeek R1方法成功迁移到视觉领域，多模态AI迎来新突破！ zhangjiaofa DeepSeek R1&AI人工智能大模型人工智能 DeepSeek R1 多模态
一、引言在当今人工智能飞速发展的时代，多模态AI技术正逐渐成为研究与应用的焦点。近日，一项令人瞩目的成果引发了广泛关注——VLM-R1开源项目成功将DeepSeek的R1方法从纯文本领域迁移至视觉语言领域，为多模态AI的发展开辟了新的道路，极大地拓展了多模态领域的想象空间。本文将深入探讨这一创新性成果，从其灵感来源、验证结果、实际案例、带来的新思路以及开源资源等多个方面进行剖析，带您全面了解这一前
《从信息论视角：DataWorks平台下人工智能探寻最优数据编码的深度剖析》程序猿阿伟人工智能
在数字化时代，数据如汹涌浪潮般不断涌现，其规模之大、增长速度之快超乎想象。企业和组织每天都要面对海量数据的存储与传输挑战，如何在有限的资源条件下高效处理这些数据，成为亟待解决的关键问题。此时，信息论与人工智能算法为我们开辟了一条新的探索路径，尤其在DataWorks这样强大的大数据平台上，二者的结合蕴含着巨大的潜力。信息论，作为一门研究信息的度量、传输、存储和处理的学科，为理解数据的本质提供了深刻
mondb入手木zi_鸣 mongodb
windows 启动mongodb 编写bat文件， mongod --dbpath D:\software\MongoDBDATA mongod --help 查询各种配置配置在mongob 打开批处理，即可启动，27017原生端口，shell操作监控端口扩展28017，web端操作端口启动配置文件配置，数据更灵活
大型高并发高负载网站的系统架构 bijian1013 高并发负载均衡
扩展Web应用程序一.概念简单的来说，如果一个系统可扩展，那么你可以通过扩展来提供系统的性能。这代表着系统能够容纳更高的负载、更大的数据集，并且系统是可维护的。扩展和语言、某项具体的技术都是无关的。扩展可以分为两种： 1.
DISPLAY变量和xhost(原创) czmmiao display
DISPLAY 在Linux/Unix类操作系统上, DISPLAY用来设置将图形显示到何处. 直接登陆图形界面或者登陆命令行界面后使用startx启动图形, DISPLAY环境变量将自动设置为:0:0, 此时可以打开终端, 输出图形程序的名称(比如xclock)来启动程序, 图形将显示在本地窗口上, 在终端上输入printenv查看当前环境变量, 输出结果中有如下内容:DISPLAY=:0.0
获取B/S客户端IP 周凡杨 java 编程 jsp Web 浏览器
最近想写个B/S架构的聊天系统，因为以前做过C/S架构的QQ聊天系统，所以对于Socket通信编程只是一个巩固。对于C/S架构的聊天系统，由于存在客户端Java应用，所以直接在代码中获取客户端的IP，应用的方法为： String ip = InetAddress.getLocalHost().getHostAddress(); 然而对于WEB
浅谈类和对象朱辉辉33 编程
类是对一类事物的总称，对象是描述一个物体的特征，类是对象的抽象。简单来说，类是抽象的，不占用内存，对象是具体的，占用存储空间。类是由属性和方法构成的，基本格式是public class 类名{ //定义属性 private/public 数据类型属性名； //定义方法 publ
android activity与viewpager+fragment的生命周期问题肆无忌惮_ viewpager
有一个Activity里面是ViewPager，ViewPager里面放了两个Fragment。第一次进入这个Activity。开启了服务，并在onResume方法中绑定服务后，对Service进行了一定的初始化，其中调用了Fragment中的一个属性。 super.onResume(); bindService(intent, conn, BIND_AUTO_CREATE);
base64Encode对图片进行编码 843977358 base64 图片 encoder
/** * 对图片进行base64encoder编码 * * @author mrZhang * @param path * @return */ public static String encodeImage(String path) { BASE64Encoder encoder = null; byte[] b = null; I
Request Header简介 aigo servlet
当一个客户端(通常是浏览器)向Web服务器发送一个请求是，它要发送一个请求的命令行，一般是GET或POST命令，当发送POST命令时，它还必须向服务器发送一个叫“Content-Length”的请求头(Request Header) 用以指明请求数据的长度，除了Content-Length之外，它还可以向服务器发送其它一些Headers，如：
HttpClient4.3 创建SSL协议的HttpClient对象 alleni123 httpclient 爬虫 ssl
public class HttpClientUtils { public static CloseableHttpClient createSSLClientDefault(CookieStore cookies){ SSLContext sslContext=null; try { sslContext=new SSLContextBuilder().l
java取反 -右移-左移-无符号右移的探讨百合不是茶位运算符位移
取反：在二进制中第一位，1表示符数，0表示正数 byte a = -1; 原码：10000001 反码：11111110 补码：11111111 //异或: 00000000 byte b = -2; 原码：10000010 反码：11111101 补码：11111110 //异或: 00000001
java多线程join的作用与用法 bijian1013 java 多线程
对于JAVA的join，JDK 是这样说的：join public final void join （long millis ）throws InterruptedException Waits at most millis milliseconds for this thread to die. A timeout of 0 means t
Java发送http请求(get 与post方法请求) bijian1013 java spring
PostRequest.java package com.bijian.study; import java.io.BufferedReader; import java.io.DataOutputStream; import java.io.IOException; import java.io.InputStreamReader; import java.net.HttpURL
【Struts2二】struts.xml中package下的action配置项默认值 bit1129 struts.xml
在第一部份，定义了struts.xml文件，如下所示： <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.3//EN" "http://struts.apache.org/dtds/struts
【Kafka十三】Kafka Simple Consumer bit1129 simple
代码中关于Host和Port是割裂开的，这会导致单机环境下的伪分布式Kafka集群环境下，这个例子没法运行。实际情况是需要将host和port绑定到一起， package kafka.examples.lowlevel; import kafka.api.FetchRequest; import kafka.api.FetchRequestBuilder; impo
nodejs学习api ronin47 nodejs api
NodeJS基础什么是NodeJS JS是脚本语言，脚本语言都需要一个解析器才能运行。对于写在HTML页面里的JS，浏览器充当了解析器的角色。而对于需要独立运行的JS，NodeJS就是一个解析器。每一种解析器都是一个运行环境，不但允许JS定义各种数据结构，进行各种计算，还允许JS使用运行环境提供的内置对象和方法做一些事情。例如运行在浏览器中的JS的用途是操作DOM，浏览器就提供了docum
java-64.寻找第N个丑数 bylijinnan java
public class UglyNumber { /** * 64.查找第N个丑数具体思路可参考 [url] http://zhedahht.blog.163.com/blog/static/2541117420094245366965/[/url] * 题目：我们把只包含因子 2、3和5的数称作丑数（Ugly Number）。例如6、8都是丑数，但14
二维数组（矩阵）对角线输出 bylijinnan 二维数组
/** 二维数组对角线输出两个方向例如对于数组： { 1, 2, 3, 4 }, { 5, 6, 7, 8 }, { 9, 10, 11, 12 }, { 13, 14, 15, 16 }, slash方向输出： 1 5 2 9 6 3 13 10 7 4 14 11 8 15 12 16 backslash输出： 4 3
[JWFD开源工作流设计]工作流跳跃模式开发关键点(今日更新) comsci 工作流
既然是做开源软件的,我们的宗旨就是给大家分享设计和代码,那么现在我就用很简单扼要的语言来透露这个跳跃模式的设计原理大家如果用过JWFD的ARC-自动运行控制器,或者看过代码,应该知道在ARC算法模块中有一个函数叫做SAN(),这个函数就是ARC的核心控制器,要实现跳跃模式,在SAN函数中一定要对LN链表数据结构进行操作,首先写一段代码,把
redis常见使用 cuityang redis 常见使用
redis 通常被认为是一个数据结构服务器，主要是因为其有着丰富的数据结构 strings、map、 list、sets、 sorted sets 引入jar包 jedis-2.1.0.jar (本文下方提供下载) package redistest; import redis.clients.jedis.Jedis; public class Listtest
配置多个redis dalan_123 redis
配置多个redis客户端 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&quo
attrib命令 dcj3sjt126com attr
attrib指令用于修改文件的属性.文件的常见属性有:只读.存档.隐藏和系统. 只读属性是指文件只可以做读的操作.不能对文件进行写的操作.就是文件的写保护. 存档属性是用来标记文件改动的.即在上一次备份后文件有所改动.一些备份软件在备份的时候会只去备份带有存档属性的文件.
Yii使用公共函数 dcj3sjt126com yii
在网站项目中，没必要把公用的函数写成一个工具类，有时候面向过程其实更方便。在入口文件index.php里添加 require_once('protected/function.php'); 即可对其引用，成为公用的函数集合。 function.php如下： <?php /** * This is the shortcut to D
linux 系统资源的查看（free、uname、uptime、netstat） eksliang netstat linux uname linux uptime linux free
linux 系统资源的查看转载请出自出处：http://eksliang.iteye.com/blog/2167081 http://eksliang.iteye.com 一、free查看内存的使用情况语法如下： free [-b][-k][-m][-g] [-t] 参数含义 -b:直接输入free时，显示的单位是kb我们可以使用b(bytes),m
JAVA的位操作符 greemranqq 位运算 JAVA位移 <<>>>
最近几种进制，加上各种位操作符，发现都比较模糊，不能完全掌握，这里就再熟悉熟悉。 1.按位操作符：按位操作符是用来操作基本数据类型中的单个bit,即二进制位，会对两个参数执行布尔代数运算，获得结果。与（&）运算： 1&1 = 1, 1&0 = 0, 0&0 &
Web前段学习网站 ihuning Web
Web前段学习网站菜鸟学习：http://www.w3cschool.cc/ JQuery中文网：http://www.jquerycn.cn/ 内存溢出：http://outofmemory.cn/#csdn.blog http://www.icoolxue.com/ http://www.jikexue
强强联合：FluxBB 作者加盟 Flarum justjavac r
原文：FluxBB Joins Forces With Flarum作者：Toby Zerner译文：强强联合：FluxBB 作者加盟 Flarum译者：justjavac FluxBB 是一个快速、轻量级论坛软件，它的开发者是一名德国的 PHP 天才 Franz Liedke。FluxBB 的下一个版本(2.0)将被完全重写，并已经开发了一段时间。FluxBB 看起来非常有前途的，
java统计在线人数（session存储信息的） macroli java Web
这篇日志是我写的第三次了前两次都发布失败！郁闷极了！由于在web开发中常常用到这一部分所以在此记录一下，呵呵，就到备忘录了！我对于登录信息时使用session存储的，所以我这里是通过实现HttpSessionAttributeListener这个接口完成的。 1、实现接口类，在web.xml文件中配置监听类，从而可以使该类完成其工作。 public class Ses
bootstrp carousel初体验快速构建图片播放 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
img{ border: 1px solid white; box-shadow: 2px 2px 12px #333; _width: expression(this.width > 600 ? "600px" : this.width + "px"); _height: expression(this.width &
SparkSQL读取HBase数据，通过自定义外部数据源 superlxw1234 spark sparksql sparksql读取hbase sparksql外部数据源
关键字：SparkSQL读取HBase、SparkSQL自定义外部数据源前面文章介绍了SparSQL通过Hive操作HBase表。 SparkSQL从1.2开始支持自定义外部数据源(External DataSource)，这样就可以通过API接口来实现自己的外部数据源。这里基于Spark1.4.0，简单介绍SparkSQL自定义外部数据源，访
Spring Boot 1.3.0.M1发布 wiselyman spring boot
Spring Boot 1.3.0.M1于6.12日发布，现在可以从Spring milestone repository下载。这个版本是基于Spring Framework 4.2.0.RC1,并在Spring Boot 1.2之上提供了大量的新特性improvements and new features。主要包含以下： 1.提供一个新的sprin