Travis.X

【论文解读】在复杂城市环境中基于时空语义走廊的安全轨迹生成

标题：Safe Trajectory Generation for Complex Urban Environments Using Spatio-temporal Semantic Corridor
作者：Wenchao Ding, Lu Zhang, Jing Chen, and Shaojie Shen
来源：https://arxiv.org/abs/1906.09788
代码：https://github.com/HKUST-Aerial-Robotics/EPSILON

文章目录

前言
一、简介
二、系统框架
三、多方针决策的准备
四、时空语义走廊
- 4.1 语义元素和 Frenet 坐标系
- 4.2 语义走廊的生成
五、安全可行的轨迹生成
- 5.1 贝塞尔曲线及其性质
- 5.2 分段贝塞尔曲线
- 5.3 强制安全和动态约束
六、实验结果

前言

在复杂的城市环境中自动驾驶汽车的轨迹规划是极具挑战性的，因为需要考虑到许多语义的元素，比如动态代理、交通信号灯和速度限制。这些语义元素可能有不同的数学描述，例如障碍、约束和成本。调整不同语义元素组合来获得稳定和可概述的行为并非易事。

在本文中，我们提出了一种新颖的统一时空语义走廊（SSC）结构，它为不同类型的语义元素提供了一定程度的抽象。 SSC 由一系列相互连接的无碰撞立方体组成，动态约束由时空域中的语义元素构成。轨迹生成问题归结为一般二次规划 (QP) 公式。由于统一的 SSC 表示，我们的框架可以推广到语义元素的任何组合。此外，我们的公式通过使用分段贝塞尔曲线参数化的凸包和 Hodograph 特性提供了整个轨迹安全且满足约束的理论保证。

注：凸包特性是指贝塞尔曲线被完整地限制在控制点所形成的凸包内，Hodograph特性是指Bezier曲线B()的导数曲线B’()被称为Hodograph，还是贝塞尔曲线。

一、简介

由于复杂的城市环境中包含许多语义元素（交通灯、限速标志、停车标志等等），要想为自动驾驶汽车生成安全可执行的轨迹并不是件简单的事情。不同类型的语义元素可能数学表述也是不一样，调用不同类型的语义元素来进行组合也并非易事。我们需要使用一种统一的方式来描述各种语义元素，让规划的性能不会受到语义元素的类型和组合的影响。

除了语义元素的表示问题外，另一个问题是如何保证生成轨迹的安全性和可行性。现在大多数的基于优化或者基于状态栅格图的运动规划器会尝试在一系列的采样点中检查或强制执行约束，这样可能会导致无法检测到两个采样点之间的不可行点，会为整条轨迹的生成带来安全隐患。

为了克服上述挑战，我们提出了一个具有理论安全性和可行性保证的统一轨迹生成框架。该框架的关键是一种新颖的时空语义走廊（SSC）结构。 SSC 的目的是大多数语义元素可以呈现为时空障碍或时空域特定范围内的约束。SSC 的关键特性是它对不同类型的语义元素的抽象。本质上，SSC 由一系列相互连接的无碰撞立方体组成，具有由语义元素构成的动态约束。我们提出了一个 SSC 生成过程来生成和拆分立方体，以便可以正确关联动态约束。

在给定统一的 SSC 表示下，轨迹生成问题归纳为在满足动态约束条件下在 SSC 内生成最优轨迹。在本文中，我们提供了一种二次规划（QP）公式，该公式是通过使用分段贝塞尔曲线参数化来保证生成轨迹的安全性和可行性，该公式建立在 Bezier 曲线的凸包和Hodograph特性上。

主要的贡献总结如下：

新颖的时空语义走廊结构，为复杂城市环境中的各种语义元素提供统一表示。
基于优化的轨迹生成公式，确保整个生成轨迹的安全性和可行性。
一个完整的开源轨迹生成框架，并在多智能体城市模仿真平台中实时实现，并提供了全面的实验和比较来验证性能。

二、系统框架

我们提出的轨迹生成框架属于的是自动驾驶汽车的运动规划层，它需要来自上游的必要输入，例如行为层。除了介绍轨迹生成之外，还会简单介绍下其他的系统组件，以阐明我们框架的输入和输出。

如图 2 所示，一个规划周期分为四个阶段。

第一阶段是语义地图管理器来获得对环境的理解，该管理器负责管理语义元素（例如，占用网格地图、动态代理、车道、交通规则等）用作局部规划。
第二阶段是预测，它不仅提供高级行为预测（例如，变道、保持车道等），还预测其他动态代理的轨迹。
第三阶段是行为规划，使用多策略决策 (MPDM) 方法实现。
第四阶段是我们提出的运动规划，它将行为规划器的离散未来模拟状态作为走廊生成的种子。请注意，我们的轨迹生成框架也可以与其他行为规划器共同使用，只要行为规划器能提供对未来状态的初步猜测。

要构建 SSC，需要四个要素，即由语义元素组成的语义图、动态代理的预测轨迹、前向的模拟状态和由路线信息给出的参考车道。请注意，如果前向模拟状态已经包括其他代理的状态，例如 MPDM 的情况，则轨迹预测模块可能是可选的。在这种情况下，我们可以使用其他车辆的模拟状态作为预测轨迹，这有助于将交互预期从行为规划传递到运动规划层。然而，由于这不是行为规划中的常见特征，为了通用性，我们仍然在实验中使用来自轨迹预测模块的预测轨迹，这可能会丢失行为规划中的交互信息。总而言之，种子的来源和交互的建模取决于行为规划者的选择。

三、多方针决策的准备

在本文中，我们采用 MPDM 作为行为层，轨迹生成方法也可以与其他行为规划方法一起使用。本节简单介绍下 MPDM。

MPDM 模型将行为规划问题表述为通用的多智能体部分可观察马尔可夫决策过程 (POMDP)，以对动态环境中的交互和不确定性进行建模。由于车辆数量增加时求解 POMDP 很快变得难以计算，所以 MPDM 放宽了这个问题并假设我们的车辆和其他代理都在执行一组有限的闭环离散策略（例如，变道、保持车道等等)。此外，对于每个闭环策略，通过使用简化的仿真模型对所有车辆状态进行前向模拟来预测未来情况，例如理想化的转向和速度控制器。设计了一个全面的奖励函数来评估未来的情况并选出最佳的行为。

在本文中，我们使用车辆的前向模拟状态作为走廊生成过程的种子。尽管初始种子是无碰撞的，但由于分辨率粗（实验中为 0.15 s）和简化的仿真模型（例如，实验中的分段线性控制），它们不能直接由车辆执行。

由于 MPDM 同时为多种行为（例如左变道、右变道和保持车道）提供了前向模拟状态，我们充分利用这一特性，为所有潜在的行为生成候选轨迹，以增强模型的鲁棒性。例如，在执行换道轨迹时，我们的轨迹框架总是准备切换回原始车道的轨迹，如图 3 所示。

四、时空语义走廊

4.1 语义元素和 Frenet 坐标系

我们需要用到的是一个由纵向 s、横向 l 和时间 t 组成的 slt 3-D 配置空间。纵向和横向方向是相对于 Frenet 坐标系的，它是由参考的车道线构建的动态参考框架。通常，参考车道是从路线规划器提供的路线信息中提取的，如图 2 所示。对于没有可用车道的非结构化环境，参考车道也可以由路径规划器提供。

我们不在笛卡尔坐标中生成走廊，而是采用 Frenet 框架表示，是因为大多数语义元素与车道几何相关联。例如，限速、交通灯和停车标志通常与车道的某个纵向范围相关联。此外，由于类人驾驶行为通常可以解耦为横向运动和纵向运动，因此对这两个方向的自由空间进行建模比在笛卡尔坐标中建模自由空间更自然。时间是另一个必要的维度，因为许多语义元素都是时间索引的。例如，预测轨迹是时间分布的，可以看作是一系列时空障碍。

图 1 和图 3 分别描述了将语义元素投影到 Frenet 框架的两个典型示例。多种语义元素一般可以分为两类：Obstacle-like语义元素和 Constraint-like 语义元素。

Obstacle-like：很多语义元素是具备物理意义，不允许slt域的某一部分进入。例如，静态障碍物可以被视为跨越整个时间轴的障碍物，动态障碍物可以被视为根据预测的轨迹在时域中作为一系列静态障碍物，而红灯可以渲染为占据特定纵向位置和时间段的障碍物。在将类似障碍物的语义元素渲染到 slt 域之后，配置空间是一个 3-D 占用网格。
Constraint-like ：除了 Obstacle-like 语义元素外，许多语义元素表示动态约束或时间约束。例如，速度限制和停车标志可以被视为速度限制。还有一些语义元素会造成时间限制。例如，在交叉车道时，换道的总时间不应过长。

我们为所有 Constraint-like 的语义元素提出了一个统一的表示，即语义边界。例如，可以将速度限制视为应用于纵向范围 [sbegin, send] 的速度约束，其中 sbegin 和 send 是两个语义边界。变道持续时间约束可以看作是应用于当前车道的横向范围[dbegin,dend]的时间约束。本质上，语义边界表示某个语义元素开始和停止生效的位置。

注意，在约束的“硬度”方面存在细微差别。具体来说，交通规则（例如，速度限制）带来的是硬约束，是必须遵守的。自然的类人行为需要其他约束（例如，变道持续时间约束），并且没有对此类约束的通用定量描述。我们在走廊生成过程中考虑了其中的差异。

4.2 语义走廊的生成

算法概述。如下图所示，生成过程包括种子生成、立方体膨胀、约束关联和立方体松弛。

1）种子生成：语义走廊的种子是通过将行为规划器的前向模拟状态投影到slt配置空间来生成的。由于前向模拟状态是离散化的，因此走廊生成过程的可行性取决于环境的复杂性和种子分辨率。为了保证走廊生成过程的成功，我们要求由连续种子构建的初始立方体是无碰撞的。在实践中，这个间隙要求是合理且容易实现的。

围绕种子生成走廊的动机是对拓扑等效的自由空间进行完全建模，同时保留相同的高级行为。例如，如图4（a）所示，种子的语义是在两个动态障碍物之间通过，由走廊生成保留。由于运动规划器应该使用任何给定的初始状态，初始状态也应该包含在种子中。

2）带有语义边界的立方体膨胀：走廊是通过迭代种子生成的。已经包含在最后一个膨胀的立方体中的种子会被跳过（第 4 行，算法 2），因为它们在拓扑上是等价的。初始立方体是基于两个连续种子生成的，将两个种子视为两个立方体顶点（第 5 行，算法 2）。

立方体膨胀的关键特征是考虑语义边界（第 9 行，算法 2）。立方体膨胀过程的目标是生成与语义边界匹配的立方体，以便可以方便地关联约束。具体来说，当初始立方体与某个语义边界相交时，与入口方向相反的膨胀方向被禁用，使得膨胀后的立方体几乎可以匹配语义边界。对于一个膨胀步骤，膨胀在三个 slt 方向之间交替，如果该步骤与障碍物碰撞或与某个语义边界相交，则膨胀终止。图 4 (b) 和 © 中提供了一个玩具示例。由于在优化（第 VI 节）中，每个立方体对应于轨迹的一个片段，并且为了保持凸性，我们没有显式优化片段的持续时间，当前立方体的时间上限应该与轨迹的时间下限一致下一个立方体。可以考虑优化持续时间（非凸），在这种情况下，进一步膨胀以增加 t 维度的重叠可能是有益的。

3）立方体松弛：经过立方体膨胀过程，膨胀的立方体几乎匹配语义边界，如图4（c）所示。然而，正如 V-A2 中提到的，一些约束，例如车道变换持续时间约束是软约束，应该留出额外的空间进行优化。为此，我们采用立方体松弛过程来松弛立方体边界，同时保留硬约束和无碰撞特性，如图4（d）所示。松弛允许的最大余量由应用于两个连续立方体的约束系统地确定。例如，在纵向上，可以根据速度约束通过速度匹配距离来确定边距。对于横向（即换道情况），可以通过换道持续时间的允许波动来计算余量。

五、安全可行的轨迹生成

给定 SSC 指定的约束条件，我们提出了一种基于优化的轨迹生成方法，该方法可以在 SSC 内找到最优轨迹，同时满足动态约束。优化问题也是在 Frenet 坐标系下制定的，这与 SSC表示是一致的。一般情况下根据最优控制理论对纵向和横向会使用五次多项式多项式。然而，五次多项式多项式不适用于 SSC 中的优化，原因如下：

多项式的一部分仅具有有限的表示能力，可能无法表示 SSC 所需的高度约束的机动；
多项式不太适合具有复杂配置空间障碍和动态约束的问题。在先前关于单项式多项式轨迹的工作中，约束仅在有限的一组采样点上强制执行/检查。但是，这种方法可能无法检测到采样点之间的碰撞，因此无法保证安全性和可行性。

在本文中，我们通过对沿参考车道的二维轨迹（即纵向 s(t) 和横向 l(t)）使用分段贝塞尔曲线来消除上述两个限制。使用分段贝塞尔曲线的原因是它的凸包特性和 Hodograph 特性。

5.1 贝塞尔曲线及其性质

m阶的贝塞尔曲线 $f (t)$ 由 $m + 1$ 个控制点在固定区间 $t \in [0, 1]$ 上定义如下：

其中 $p_i$ 表示控制点，用 $P$ 表示控制点集 $p_0, p_1, . . . , p_m]$ 。

凸包性质适用于将曲线约束在凸自由空间中的问题。具体来说，贝塞尔曲线 $f (t)$ 保证完全限制在由控制点 $P$ 支持的凸包中。换句话说，通过将 P约束在凸自由空间内，可以保证得到的曲线是无碰撞的。

hodograph 性质有助于约束 Bezier 曲线的高阶导数，这对于强制执行动态约束很有用。根据 hodograph 特性，贝塞尔曲线 $\over d_t}$ 的导数是另一条贝塞尔曲线，其控制点为 $^{(1)} _i$ = $m · (p_{i +1} − p_i)$ 。通过在求导后的贝塞尔曲线上应用凸包特性，可以将原始曲线 $f (t)$ 的整个动态轮廓限制在给定的动态范围内，如图 5 所示。

5.2 分段贝塞尔曲线

在本文中，我们采用分段贝塞尔曲线表示每一块都与 SSC 的一个立方体相关联。

其中 $p_j^i$ 表示第 j 段的第 i 个控制点， $t_0, t_1, . . . , t_n$ 是每个段的起点和终点的时间戳。由于贝塞尔曲线在固定间隔 [0, 1] 上定义，而每个段的轨迹持续时间可能会有所不同，因此我们根据每个段的持续时间为每个段引入比例因子 $α_j$ 。

我们最小化由 jerk 平方的时间积分给出的代价函数。具体来说，第 j 段的代价 $J_j$ 可以写作：

其中 $w_s$ 和 $w_l$ 分别表示纵向和横向控制代价的权重。由于 SSC，目标是简单且不变的，因为 SSC 使得语义元素的不同组合可以轻松适应不同的流量配置。用 $y_{j} ^σ (t)$ 表示区间 [0, 1] 中的非缩放贝塞尔曲线，以 $p_j$ 作为控制点。令 u = $t−t_{j−1} \over α_j$ 表示非缩放贝塞尔曲线的归一化时间，可以使用非缩放 $y^σ_j (t)$ 重写 σ 维上的第 j 段的代价，如下所示：
其中 Q 是非缩放贝塞尔曲线的 Hessian 矩阵。处于简洁的目的，我们省略了 Q 的详细计算。

5.3 强制安全和动态约束

在本文中，我们采用五次（m=5）分段贝塞尔曲线作为轨迹参数化。根据 hodograph 特性，非标度贝塞尔曲线的 k 阶导数 ´ d ky σ j (t) dtk 由控制点 q σ,(k) j 支持，控制点 q σ,(k) j 可以通过归纳计算如下：

六、实验结果

大语言模型原理与工程实践：大语言模型强化对齐 AGI大模型与大数据研究院 DeepSeek R1 &大数据AI人工智能计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大语言模型原理与工程实践：大语言模型强化对齐作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的迅猛发展，大语言模型（LargeLanguageModels，LLMs）如GPT-3、LaMDA等，在自然语言处理（NLP）领域取得了显著的突破。这些模型在问答、翻译、文本生成等方面展现出惊人的能力，但同时也引发了
提出机器人自主学习新范式，深大团队最新顶会论文，刷新6大复杂任务SOTA 量子位
关注前沿科技量子位让机器人轻松学习复杂技能有新框架了！深圳大学大数据系统计算技术国家工程实验室李坚强教授团队联合鹏城国家实验室、北京理工莫斯科大学，提出了奖励函数与策略协同进化框架ROSKA。在多个高维度机器人任务上，在仅使用89%训练样本的情况下，比现有SOTA方法平均性能提升95.3%。众所周知，随着机器人技术的快速发展，其应用已渗透至日常生活和工业生产场景。然而在多自由度机器人控制领域，传统
从图形处理到通用计算的进化之路绿算技术 GPU架构介绍科技 gpu算力
图形处理单元，作为现代计算机中不可或缺的一部分，已经从最初的图形渲染专用处理器，发展成为强大的并行计算引擎，广泛应用于人工智能、科学计算、游戏娱乐等领域。本文将深入探讨GPU架构的演变历程、核心组件以及其在不同应用场景中的优势。GPU架构的演变：从固定功能到可编程流水线早期的GPU采用固定功能流水线架构，专为图形渲染任务而设计。这种架构将图形渲染流程划分为一系列固定的阶段，例如顶点处理、光栅化、纹
高效快速教你deepseek如何进行本地部署并且可视化对话 chatgpt
随着最近一个新的人工智能deepseek的爆火，很多大佬都开始了在本地进行deepseek的部署操作，并且离线也可以使用，这里的话我就一步一步带你们部署本地的deepseek,说实话这个人工智能的实力不亚于openai的gpt安装ollama我们需要先安装ollama，安装地址ollama,我们直接点击下载，我们在下载的时候尽量使用我们的谷歌浏览器，有魔法的最好带上魔法，不然安装的时候可能会出问题
基于asp.NET的病历管理系统 (源码+net+vue+部署文档+讲解等) qq_1406299528 计算机毕业设计 asp asp.net vue.js 后端
收藏关注不迷路！！文末获取源码+数据库感兴趣的可以先收藏起来，还有大家在毕设选题（免费咨询指导选题），项目以及论文编写等相关问题都可以给我留言咨询，希望帮助更多的人文章目录前言程序资料获取一、项目技术二、项目内容和功能介绍三、核心代码数据库参考四、效果图五、资料获取前言博主介绍：✨全网粉丝10W+,CSDN特邀作者、博客专家、CSDN新星计划导师，专注于Java/Python/小程序app/深度学
useblackbox黑箱AI编码助理百态老人 python 开发语言
黑箱AI是一个人工智能的编码助理可以让代码快10倍。它使您能够把任何问题变成代码和功能,如从任何视频提取代码和代码自动完成。它有以下几个特点：可以从视频、图片、PDF等格式中复制代码。可以将任何问题转换成代码。可以快速找到任何代码片段，并开始编码。支持20多种编程语言的代码自动补全。有Chrome扩展和VSCode扩展。这个网站有不同的收费方案，根据你需要的功能和使用量而定。它有以下几种选择：好开
大模型火爆 2025：LLaMA、Qwen、DeepSeek 核心原理+就业秘籍，快速入门 AI 工程师 weixin_40941102 llama 人工智能
1.大模型核心原理：从零开始理解AI模型这些是大型语言模型（LLMs）的核心技术，适合初学者逐步深入学习。以下是详细拆解，让小白也能掌握：LLaMA系列模型核心原理详解：什么是LLaMA？：LLaMA是一个基于人工智能的语言模型，像一个超级聪明的聊天机器人，能理解和生成人类语言。它由Meta公司开发，类似ChatGPT，但更开源、灵活。核心原理：Transformer架构：想象一个工厂流水线，LL
【AI热点】MCP协议深度洞察报告碣石潇湘无限路人工智能 php 开发语言
摘要人工智能技术飞速发展，大型语言模型（LLM）如何高效、安全地利用外部数据和工具成为关键问题。模型上下文协议（ModelContextProtocol，简称MCP）是一种由Anthropic于2024年底提出的开放标准协议。它通过统一的客户端-服务器架构，为AI应用与文件系统、数据库、第三方API等外部资源之间提供标准化、安全的双向通信接口。本文将深入解析MCP协议的基本概念和背景、架构设计（通
使用agent搭建一个简易的ai论文写作程序喂喂喂喂位 langChain手搓AI Agent记录人工智能 langchain 深度学习 python AIGC
本程序能够自动化完成从规划、研究、撰写到修改的整个论文创作流程。基于LangGraph和LangChain框架构建，利用大型语言模型和搜索工具协同工作，形成了一个完整的论文写作流水线。核心功能分析计划生成功能(plan_node)这个node将接收状态，然后创建一个消息列表。其中一个将是PLAN_PROMPT，那将是SystemMessage。然后创建HumanMessage，传入我们要做的tas
NPU的应用场景：从云端到边缘绿算技术 NPU架构介绍缓存人工智能科技深度学习
NPU的应用场景非常广泛，主要包括以下几个方面：1.云计算与数据中心AI推理服务：在云端提供高效的AI推理服务，例如图像识别、语音识别。模型训练加速：在大规模训练任务中，NPU可以作为加速单元，提升训练效率。2.边缘计算智能摄像头：在安防监控中，NPU可以实时处理视频流，实现目标检测和跟踪。智能音箱：在语音助手中，NPU可以加速语音识别和自然语言处理任务。3.自动驾驶实时感知：NPU可以加速自动驾
必看！一文读懂知识蒸馏技术小天才学习机打游戏人工智能知识图谱神经网络 langchain windows
导读最近，DeepSeek的爆火让大家对人工智能领域的技术发展又有了新的关注。而知识蒸馏作为深度学习中一项重要的技术，也在背后默默地发挥着作用，今天就来给大家详细介绍一下知识蒸馏及其相关原理。1.知识蒸馏是什么在深度学习领域，大型模型（如DeepSeek）通常具有强大的性能，但它们的计算量和参数量都非常庞大，这使得它们难以在资源受限的设备（如移动设备或嵌入式设备）上部署。例如，GPT-3在570G
AI大模型学习路线及相关资源推荐 python游乐园学习资源学习 Python AI AI编程人工智能
哈喽，大家好！本文为大家带来AI大模型学习路线及相关资源推荐，这对于学习掌握AI大模型很有帮助呦，希望大家多多点赞收藏～感谢～～1AI大模型的基础信息1.1什么是AI大模型AI大模型，即人工智能大型模型，是一种基于深度学习技术，具有海量参数、强大算力支持、能够处理和生成复杂数据的人工智能模型。1.2AI大模型的主要特点规模庞大：AI大模型通常包含海量的参数。例如，谷歌的BERT模型在最初发布时就有
模型蒸馏：从复杂到精简，AI技术的“瘦身”秘籍 lmtealily 人工智能
引言在人工智能的浪潮中，大型模型如BERT、GPT系列等在自然语言处理（NLP）、计算机视觉（CV）等领域取得了显著的成果。然而，这些“庞然大物”通常拥有数十亿甚至数千亿个参数，计算和存储成本极高，难以部署到资源受限的设备上。为了解决这一问题，模型蒸馏技术应运而生。模型蒸馏是一种将大型复杂模型的知识迁移到小型简单模型的技术，旨在保持高性能的同时大幅减少模型的参数量和计算复杂度。本文将带你深入了解模
AI人工智能对前端的冲击？理想不理想v 人工智能前端
‌AI人工智能对前端开发的冲击主要体现在以下几个方面‌：‌代码生成与自动化‌：AI工具如GPT-4和GitHubCopilot能够自动生成高质量的前端代码，从简单的组件到复杂的应用程序，这不仅提高了开发效率，还降低了人为错误的可能性。自动化代码生成工具可以显著减少开发者编写重复性代码的时间，使他们能够专注于创新和解决复杂问题‌。‌跨平台开发支持‌：AI可以帮助生成适用于不同平台的代码，简化跨平台开
从人工智能窥见网络安全的重要性 He_Donglin 人工智能 web安全网络
“人工智能”一词在上世纪五十年代被提出，在当时，计算机正处于萌芽阶段，同时期的人类第一台电子计算机“ENIAC”诞生了，但是埃尼亚克有很多缺点：庞大的占地面积、庞大的质量、单一的功能、较小的内存等，这主要受制于其他领域的发展，但当时的人们对计算机寄予厚望，希望在未来某一天它能够拥有足够强大的“power”，帮助人们解决诸多问题。于是乎，经过无数科学家数十年来的努力，计算机“长大了”，它的功能不再单
《今日AI-人工智能-编程日报》-源自2025年2月28日小亦编辑部每日AI-人工智能-编程日报人工智能
技术突破OpenAI发布GPT-4.5：OpenAI正式推出新一代大模型GPT-4.5，语言理解、情商及逻辑推理能力显著增强，幻觉问题大幅减少，计算效率较GPT-4提升超10倍，已逐步向用户开放试用。国产模型Kimi发布k1.6版本：国产模型Kimi发布的k1.6版本，在编程任务评测中超越GPTo3-mini，首次登顶榜首。其“快思考”架构使响应速度提升至秒级，部署成本下降40%。企业动态贵州广电
《今日AI-人工智能-编程日报》-源于2025年3月11日小亦编辑部每日AI-人工智能-编程日报人工智能
1.AI行业动态1.1Manus通用智能体初成型，开启AIAgent新时代中泰证券发布研报称，首款通用型AI智能体Manus已问世，能够将复杂任务拆解为可执行的步骤链，并在虚拟环境中灵活调用工具，标志着AI从“Reasoner”走向“Agent”阶段。Manus的成功引发了开源复现潮，DeepSeek模型已被整合到OWL项目中，并在GAIA基准测试中表现接近Manus。1.2DeepSeek-R2
DeepSeek多语言智能创作引擎解析智能计算研究中心其他
内容概要在人工智能技术加速演进的背景下，DeepSeek系列产品通过混合专家架构（MoE）与670亿参数的协同设计，构建了多模态智能创作引擎的核心竞争力。该系统依托动态路由机制，将视觉语言理解模块与多语言处理单元进行深度耦合，使模型在解析图文混合信息时展现出超越单一模态的认知能力。尤为突出的是，其分层参数激活策略将推理成本降低至传统密集模型的38%，同时维持了95%以上的任务完成精度。行业分析机构
通义千问：阿里巴巴的AI大模型深度解析俊星学长人工智能
通义千问：阿里巴巴的AI大模型深度解析在人工智能（AI）技术日新月异的今天，大型语言模型作为其中的佼佼者，正逐步改变着我们的生活与工作方式。阿里巴巴推出的通义千问，作为这一领域的佼佼者，以其卓越的性能和广泛的应用场景，引起了业界的广泛关注。本文将从通义千问的简介、模型架构、技术特点与优势、应用场景以及未来发展等多个方面，对其进行全面解析。一、通义千问简介通义千问是由阿里云开发的一款大型语言模型，旨
【系统架构设计师】论文：论软件产品线技术数据知道系统架构中间件论文系统架构设计师软考高级软件产品线
论文：论软件产品线技术文章目录摘要正文总结摘要根据“十五”国防科技重点实验室—“机载XXPD火控雷达性能开发与评估实验室”的建设需求。我所在的中国x集团公司x所电子对抗研究部组织了用于该实验室目布式联网试验，主要任务是试验机载雷达的各项技术指标，模拟较逼真的雷达信号环境和其他电磁信号环境，检查机载雷达工作性能、探测和跟踪精度及飞机综合火控系统性能。我担任了该软件系统负责人。我成功的将软件产品线技术
Java：AI 浪潮中的隐形支柱 —— 探秘 Java 在人工智能领域的独特地位琢磨先生David 人工智能
引言在人工智能技术席卷全球的今天，当人们谈论AI开发时，Python、R语言、C++等工具总是最先被提及。然而在这个充满创新的领域，有一个"老兵"正悄然发挥着不可替代的作用——自1995年诞生至今的Java语言，凭借其独特的工程化基因，正在构建起AI世界的底层基础设施。本文将揭示Java如何在大数据、机器学习、企业级AI系统等领域持续创造价值。一、Java的AI基因解码跨平台优势的现代意义"一次编
谷歌Gemini 3大模型发布，AI领域再掀波澜！广拓科技人工智能
在人工智能的浩瀚宇宙中，每一次重大突破都如同一颗璀璨的新星，照亮我们对未来的想象。而近期，谷歌发布的Gemini3大模型，无疑是其中最为耀眼的存在，它在AI领域激起的波澜，迅速蔓延至全球科技圈，引发了广泛关注与热烈讨论。随着AI技术的迅猛发展，我们已经见证了众多令人惊叹的创新成果。从智能语音助手到图像识别技术，从自动驾驶汽车到医疗诊断辅助系统，AI正以前所未有的速度改变着我们的生活和工作方式。在这
【大一新生必收藏系列】❤机器学习7大方面，30个数据集。纯干货分享❤ .Boss. 机器学习人工智能 python 算法开发语言笔记 #大一新生
.记住了就可以跟同学装起来了嗷....目录.纯干货回归问题分类问题图像分类文本情感分析自然语言处理自动驾驶金融类...........纯干货..................在刚刚开始学习算法的时候，大家有没有过这种感觉，最最重要的那必须是算法本身！其实在一定程度上忽略了数据的重要性。而事实上一定是，质量高的数据集可能是最重要的！数据集在机器学习算法项目中具有非常关键的重要性，数据集的大小、质量
使用DeepSeek自动生成PPT：高效办公的终极指南点我头像干啥 Ai 人工智能信息可视化深度学习
引言在现代职场中，PPT（PowerPoint演示文稿）已经成为沟通、展示和分享想法的重要工具。然而，制作一份高质量的PPT往往需要耗费大量时间和精力，尤其是在内容整理、排版设计和样式调整方面。幸运的是，随着人工智能技术的发展，像DeepSeek这样的工具可以帮助我们自动化生成PPT，极大地提升工作效率。本文将详细介绍如何使用DeepSeek自动生成PPT，并分享一些实用技巧，帮助你快速上手。一、
（大模型微调大模型学习路线大模型入门）_大模型学习，吹爆！2025最详细的大模型学习路线已整理！手把手带你高效入门，大模型论文全打通！大模型老炮学习人工智能大模型学习 AI 大模型大模型微调大模型教程
一、初聊大模型1、什么是大模型？大模型，通常指的是在人工智能领域中的大型预训练模型。你可以把它们想象成非常聪明的大脑，这些大脑通过阅读大量的文本、图片、声音等信息，学习到了世界的知识。这些大脑（模型）非常大，有的甚至有几千亿个参数，这些参数就像是大脑中的神经元，它们通过复杂的计算来理解和生成语言、图片等。举个例子，你可能听说过GPT-3，它就是一个非常著名的大模型。GPT-3可以通过理解你提出的问
国产 DeepSeek V3 被秒成“前浪“？谷歌开放最强 Gemini 2.0 全家桶：速度快60倍，上下文还长16倍！ Bryan Ding 人工智能深度学习
谷歌向所有人发布了Gemini2.0——迄今为止谷歌“功能最强大”的人工智能模型套件。1谷歌Gemini2.0向所有人开放去年12月，谷歌发布Gemini2.0Flash的实验版本，正式开启了代理型AI的新时代。Gemini2.0Flash是谷歌为开发者群体打造的高效主力模型，具有低延迟、高性能等优势。今年早些时候，谷歌在GoogleAIStudio中更新了2.0FlashThinkingExpe
python 基于混合式推荐算法的学术论文投稿系统 mosquito_lover1 python 知识图谱
基于混合式推荐算法的学术论文投稿系统是一个结合多种推荐技术（如基于内容的推荐、协同过滤、知识图谱等）来为研究者推荐合适期刊或会议投稿的系统。以下是实现该系统的关键步骤和Python代码示例。系统设计思路1.数据收集与预处理：-收集论文数据（标题、摘要、关键词、作者信息等）。-收集期刊/会议数据（领域、主题、影响因子、投稿要求等）。-对文本数据进行预处理（分词、去停用词、向量化等）。2.推荐算法设计
L1-5 别再来这么多猫娘了！云格～团队天梯赛算法 c++
以GPT技术为核心的人工智能系统出现后迅速引领了行业的变革，不仅用于大量的语言工作（如邮件编写或文章生成等工作），还被应用在一些较特殊的领域——例如去年就有同学尝试使用ChatGPT作弊并被当场逮捕（全校被取消成绩）。相信聪明的你一定不会犯一样的错误！言归正传，对于GPT类的AI，一个使用方式受到不少年轻用户的欢迎——将AI变成猫娘：当然，由于训练数据里并不区分道德或伦理倾向，因此如果不加审查，A
Gemini 2.0 Flash 新加坡内哥谈技术人工智能大数据语言模型
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/过去一年，人工智能领域取得了令人瞩目的进展。如今，备受期待的Gemini2.0系列首款模
OpenAI 团队组织架构和研发技术栈 AI天才研究院 ChatGPT 人工智能
OpenAI是一家致力于推动人工智能技术发展的公司，成立于2015年。其目标是确保人工智能技术造福全人类。为了实现这一目标，OpenAI采用了多种先进的技术和组织架构来推动其研发工作。目录OpenAI组织架构和研发技术栈概述1OpenAI团队的世界顶尖科学家IlyaSutskever：Ilya是OpenAI的联合创始人之一，也是深度学习领域的先驱。他在神经网络和深度学习方面的研究具有重要影响，曾与
java线程Thread和Runnable区别和联系 zx_code java jvm thread 多线程 Runnable
我们都晓得java实现线程2种方式，一个是继承Thread，另一个是实现Runnable。模拟窗口买票，第一例子继承thread，代码如下 package thread; public class ThreadTest { public static void main(String[] args) { Thread1 t1 = new Thread1(
【转】JSON与XML的区别比较丁_新 json xml
1.定义介绍 (1).XML定义扩展标记语言 (Extensible Markup Language, XML) ，用于标记电子文件使其具有结构性的标记语言，可以用来标记数据、定义数据类型，是一种允许用户对自己的标记语言进行定义的源语言。 XML使用DTD(document type definition)文档类型定义来组织数据;格式统一，跨平台和语言，早已成为业界公认的标准。 XML是标
c++ 实现五种基础的排序算法 CrazyMizzz C++c 算法
#include<iostream> using namespace std; //辅助函数，交换两数之值 template<class T> void mySwap(T &x, T &y){ T temp = x; x = y; y = temp; } const int size = 10; //一、用直接插入排
我的软件麦田的设计者我的软件音乐类娱乐放松
这是我写的一款app软件，耗时三个月，是一个根据央视节目开门大吉改变的，提供音调，猜歌曲名。1、手机拥有者在android手机市场下载本APP，同意权限，安装到手机上。2、游客初次进入时会有引导页面提醒用户注册。（同时软件自动播放背景音乐）。3、用户登录到主页后，会有五个模块。a、点击不胫而走，用户得到开门大吉首页部分新闻，点击进入有新闻详情。b、
linux awk命令详解被触发 linux awk
awk是行处理器: 相比较屏幕处理的优点，在处理庞大文件时不会出现内存溢出或是处理缓慢的问题，通常用来格式化文本信息 awk处理过程: 依次对每一行进行处理，然后输出 awk命令形式: awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END{}’ file [-F|-f|-v]大参数，-F指定分隔符，-f调用脚本，-v定义变量 var=val
各种语言比较 _wy_ 编程语言
Java Ruby PHP 擅长领域
oracle 中数据类型为clob的编辑知了ing oracle clob
public void updateKpiStatus(String kpiStatus,String taskId){ Connection dbc=null; Statement stmt=null; PreparedStatement ps=null; try { dbc = new DBConn().getNewConnection(); //stmt = db
分布式服务框架 Zookeeper -- 管理分布式环境中的数据矮蛋蛋 zookeeper
原文地址： http://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/ 安装和配置详解本文介绍的 Zookeeper 是以 3.2.2 这个稳定版本为基础，最新的版本可以通过官网 http://hadoop.apache.org/zookeeper/来获取，Zookeeper 的安装非常简单，下面将从单机模式和集群模式两
tomcat数据源 alafqq tomcat
数据库 JNDI(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。没有使用JNDI时我用要这样连接数据库： 03. Class.forName("com.mysql.jdbc.Driver"); 04. conn
遍历的方法百合不是茶遍历
遍历在java的泛
linux查看硬件信息的命令 bijian1013 linux
linux查看硬件信息的命令一.查看CPU： cat /proc/cpuinfo 二.查看内存： free 三.查看硬盘： df linux下查看硬件信息 1、lspci 列出所有PCI 设备； lspci - list all PCI devices:列出机器中的PCI设备（声卡、显卡、Modem、网卡、USB、主板集成设备也能
java常见的ClassNotFoundException bijian1013 java
1.java.lang.ClassNotFoundException: org.apache.commons.logging.LogFactory 添加包common-logging.jar2.java.lang.ClassNotFoundException: javax.transaction.Synchronization
【Gson五】日期对象的序列化和反序列化 bit1129 反序列化
对日期类型的数据进行序列化和反序列化时，需要考虑如下问题： 1. 序列化时，Date对象序列化的字符串日期格式如何 2. 反序列化时，把日期字符串序列化为Date对象，也需要考虑日期格式问题 3. Date A -> str -> Date B,A和B对象是否equals 默认序列化和反序列化 import com
【Spark八十六】Spark Streaming之DStream vs. InputDStream bit1129 Stream
1. DStream的类说明文档： /** * A Discretized Stream (DStream), the basic abstraction in Spark Streaming, is a continuous * sequence of RDDs (of the same type) representing a continuous st
通过nginx获取header信息 ronin47 nginx header
1. 提取整个的Cookies内容到一个变量，然后可以在需要时引用，比如记录到日志里面， if ( $http_cookie ~* "(.*)$") { set $all_cookie $1; } 变量$all_cookie就获得了cookie的值，可以用于运算了
java-65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 bylijinnan java
参考了网上的http://blog.csdn.net/peasking_dd/article/details/6342984 写了个java版的： public class Print_1_To_NDigit { /** * Q65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 * 1.使用字符串
Netty源码学习-ReplayingDecoder bylijinnan java netty
ReplayingDecoder是FrameDecoder的子类，不熟悉FrameDecoder的，可以先看看 http://bylijinnan.iteye.com/blog/1982618 API说，ReplayingDecoder简化了操作，比如： FrameDecoder在decode时，需要判断数据是否接收完全： public class IntegerH
js特殊字符过滤 cngolon js特殊字符 js特殊字符过滤
1.js中用正则表达式过滤特殊字符, 校验所有输入域是否含有特殊符号function stripscript(s) { var pattern = new RegExp("[`~!@#$^&*()=|{}':;',\\[\\].<>/?~！@#￥……&*（）——|{}【】‘；：”“'。，、？]"
hibernate使用sql查询 ctrain Hibernate
import java.util.Iterator; import java.util.List; import java.util.Map; import org.hibernate.Hibernate; import org.hibernate.SQLQuery; import org.hibernate.Session; import org.hibernate.Transa
linux shell脚本中切换用户执行命令方法 daizj linux shell 命令切换用户
经常在写shell脚本时，会碰到要以另外一个用户来执行相关命令，其方法简单记下： 1、执行单个命令：su - user -c "command" 如：下面命令是以test用户在/data目录下创建test123目录 [root@slave19 /data]# su - test -c "mkdir /data/test123"
好的代码里只要一个 return 语句 dcj3sjt126com return
别再这样写了：public boolean foo() { if (true) { return true; } else { return false;
Android动画效果学习 dcj3sjt126com android
1、透明动画效果方法一：代码实现 public View onCreateView(LayoutInflater inflater, ViewGroup container, Bundle savedInstanceState) { View rootView = inflater.inflate(R.layout.fragment_main, container, fals
linux复习笔记之bash shell (4)管道命令 eksliang linux管道命令汇总 linux管道命令 linux常用管道命令
转载请出自出处： http://eksliang.iteye.com/blog/2105461 bash命令执行的完毕以后，通常这个命令都会有返回结果，怎么对这个返回的结果做一些操作呢？那就得用管道命令‘|’。上面那段话，简单说了下管道命令的作用，那什么事管道命令呢？答：非常的经典的一句话，记住了，何为管
Android系统中自定义按键的短按、双击、长按事件 gqdy365 android
在项目中碰到这样的问题：由于系统中的按键在底层做了重新定义或者新增了按键，此时需要在APP层对按键事件（keyevent）做分解处理，模拟Android系统做法，把keyevent分解成： 1、单击事件：就是普通key的单击； 2、双击事件：500ms内同一按键单击两次； 3、长按事件：同一按键长按超过1000ms（系统中长按事件为500ms）； 4、组合按键：两个以上按键同时按住；
asp.net获取站点根目录下子目录的名称 hvt .net C#asp.net hovertree Web Forms
使用Visual Studio建立一个.aspx文件(Web Forms)，例如hovertree.aspx,在页面上加入一个ListBox代码如下： <asp:ListBox runat="server" ID="lbKeleyiFolder" /> 那么在页面上显示根目录子文件夹的代码如下： string[] m_sub
Eclipse程序员要掌握的常用快捷键 justjavac java eclipse 快捷键 ide
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。写道程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可
c++编程随记 lx.asymmetric C++笔记
为了字体更好看，改变了格式…… &&运算符： #include<iostream> using namespace std; int main(){ int a=-1,b=4,k; k=(++a<0)&&!(b--
linux标准IO缓冲机制研究音频数据 linux
一、什么是缓存I/O(Buffered I/O)缓存I/O又被称作标准I/O,大多数文件系统默认I/O操作都是缓存I/O。在Linux的缓存I/O机制中，操作系统会将I/O的数据缓存在文件系统的页缓存(page cache)中，也就是说，数据会先被拷贝到操作系统内核的缓冲区中，然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。1.缓存I/O有以下优点:A.缓存I/O使用了操作系统内核缓冲区，
随想生活暗黑小菠萝生活
其实账户之前就申请了，但是决定要自己更新一些东西看也是最近。从毕业到现在已经一年了。没有进步是假的，但是有多大的进步可能只有我自己知道。毕业的时候班里12个女生，真正最后做到软件开发的只要两个包括我，PS：我不是说测试不好。当时因为考研完全放弃找工作，考研失败，我想这只是我的借口。那个时候才想到为什么大学的时候不能好好的学习技术，增强自己的实战能力，以至于后来找工作比较费劲。我
我认为POJO是一个错误的概念 windshome java POJO 编程 J2EE 设计
这篇内容其实没有经过太多的深思熟虑，只是个人一时的感觉。从个人风格上来讲，我倾向简单质朴的设计开发理念；从方法论上，我更加倾向自顶向下的设计；从做事情的目标上来看，我追求质量优先，更愿意使用较为保守和稳妥的理念和方法。 &