PilviMannis

《Towards Optimally Decentralized Multi-Robot Collision Avoidance via Deep Reinforcement Learning》译文

原文链接 https://arxiv.org/pdf/1709.10082v1.pdf

Towards Optimally Decentralized Multi-Robot Collision Avoidance via Deep Reinforcement Learning

这个上面图片好像是传失败了，可以去这个链接下载，包含了论文原文、翻译、以及实现代码

https://download.csdn.net/download/circleyuanquan/12423287?spm=1001.2014.3001.5501

翻译：

摘要-在分散的场景中，为多个机器人开发一个安全有效的碰撞避免策略是一个挑战，在这种场景中，每个机器人生成其路径而不观察其他机器人的状态和意图。当其他分布式多机器人避碰系统存在时，往往需要提取代理级特征来规划局部无碰撞动作，这在计算上是令人望而却步的，而且不具有鲁棒性。更重要的是，在实践中，这些方法的性能远远低于它们的集中式方法。针对多机器人系统，提出了一种分散的传感器级碰撞避免策略，该策略将原始传感器测量值直接映射到代理的运动速度方向指令。作为减少分散和集中方法之间性能差距的第一步，我们提出了一个多场景多阶段训练框架来学习最优策略。利用基于策略梯度的强化学习算法，在丰富复杂的环境下对大量机器人同时进行策略训练。通过深入的性能评估，验证了所学习的传感器级碰撞避免策略在各种模拟场景中的有效性，并证明了所学习的策略能够为大型机器人系统找到时间效率高、无碰撞的路径。我们还证明了所学习的策略可以很好地推广到新的场景中，这些场景在整个训练期间不会出现，包括导航一组异构的机器人和一个包含100个机器人的大规模场景。视频可在https://sites.google.com/view/drlmaca上获取。

I. INTRODUCTION

近来，多机器人导航已引起人们对机器人技术和人工智能的极大兴趣，并具有许多实际应用，包括多机器人搜索和救援，人群中的导航以及自动仓库。多机器人导航的主要挑战之一是为每个从起始位置导航到期望目标的机器人制定安全可靠的防撞策略。

先前的一些工作（称为集中式方法）假设为中央服务器提供了有关所有座席意图（例如初始状态和目标）及其工作区（例如2D网格图）的全面知识，以控制座席的行为。这些方法可以通过同时计划所有机器人的最佳路径来生成防撞动作。但是，这些集中式方法很难扩展到具有许多机器人的大型系统，并且当需要频繁地重新分配任务/目标时，它们的性能可能会很差。此外，实际上，它们严重依赖机器人与中央服务器之间的可靠通信网络。因此，一旦中央服务器和/或通信网络发生故障，多机器人系统将崩溃。此外，当在未知且非结构化的环境中部署多个机器人时，这些集中式方法将不适用。

与集中式方法相比，一些现有的工作提出了代理级分散式冲突避免策略，其中每个代理独立考虑其他代理的可观察状态（例如形状，速度和位置）作为输入来做出决策。大多数座席级策略基于速度障碍（VO）[1] – [5]，并且它们可以为杂乱工作区中的多个座席有效地计算局部无碰撞动作。但是，一些限制极大地限制了它们的应用。首先，基于仿真的工作[1]，[6]假设每个代理对周围环境都有完美的感知，由于无处不在的感知不确定性，在现实世界中这种情况并不成立。为了缓解完美感测的局限性，以前的方法使用全球定位系统来跟踪所有机器人的位置和速度[2]，[5]，或设计一种智能体间通信协议以在附近的智能体之间共享位置和速度信息[3]。 ]，[4]，[7]。但是，这些方法将外部工具或通信协议引入到多机器人系统中，这可能不够鲁棒。其次，基于VO的策略具有许多对方案设置敏感的可调参数，因此必须离线仔细地设置参数以实现令人满意的性能。最后，就导航速度和导航时间而言，以前的分散方法的性能明显低于集中式方法。

受基于VO的方法启发，Chen等人。 [8]运用深度强化学习训练了一个Agent级别的避免冲突策略，该策略学习了一个两Agent值函数，该函数将Agent的自身状态及其邻居的状态显式映射到无碰撞行为，而它仍然需要完美的感知。在他们的后续工作[9]中，部署了多个传感器来执行分割，识别和跟踪的任务，以便估计附近人员和移动障碍物的状态。但是，这种复杂的管道不仅需要昂贵的在线计算，而且会使整个系统对感知不确定性的鲁棒性降低。

在本文中，我们专注于传感器级别的分散式碰撞避免策略，这些策略直接将原始传感器数据映射到所需的无碰撞转向命令。与代理程序级策略相比，不需要对相邻代理程序和障碍物进行完美感知，也不需要针对不同情况进行离线参数调整。传感器级别的冲突避免策略通常由深度神经网络（DNN）[10]，[11]建模，并在大型数据集上使用监督学习进行训练。但是，在监督下学习策略存在一些局限性。首先，它需要大量的训练数据，这些数据应涵盖多个机器人的不同种类的交互情况。其次，在交互场景中不能保证数据集中的专家轨迹是最优的，这使得训练很难收敛到一个可靠的解决方案。第三，难以手动设计适当的损失函数来训练鲁棒的碰撞避免策略。为了克服这些缺点，我们提出了一种多场景多阶段深度强化学习框架，以使用策略梯度法学习最优的避免碰撞策略。

主要结果：在本文中，我们解决了在完全分散的框架中避免多个机器人发生碰撞的问题，在该框架中，仅从机载传感器收集输入数据。为了学习最佳的避免碰撞策略，我们提出了一种新颖的多场景多阶段训练框架，该框架利用了在一组复杂环境中在大型机器人系统中训练的基于鲁棒策略梯度的强化学习算法。我们证明，从所提出的方法中学到的避免碰撞策略能够为大型非完整机器人系统找到时间高效，无碰撞的路径，并且可以很好地推广到看不见的场景。它的性能也比以前的分散方法好得多，并且可以作为缩小集中式和分散式导航策略之间差距的第一步。

正在上传…重新上传取消

图1：使用我们学习到的策略的圆形场景中的机器人轨迹。注意，机器人是方形的。在这种情况下，直接对圆盘机器人训练的策略进行测试，表明所学习的策略具有良好的泛化能力。

II. RELATED WORK

基于学习的碰撞避免技术已经被广泛地研究于一种避免静态障碍的机器人。许多方法都采用有监督的学习范例，通过模仿传感器输入和运动命令的数据集来训练碰撞避免策略。穆勒等。文献[12]通过训练6层卷积网络将监督的基于视觉的静态障碍物避免系统训练为移动机器人，该6层卷积网络将原始输入图像映射到转向角。张等。 [13]利用基于后继特征的深度强化学习算法将先前掌握的导航任务中学习的深度信息传输到新的问题实例。警长等。 [14]提出了一种基于多模式深度自动编码器的移动机器人控制系统。罗斯等。 [15]用模仿学习技术训练了一个小型四旋翼直升机的离散控制器。四旋翼机仅使用一台廉价摄像机就能成功避免与环境中的静态障碍物发生碰撞。是，仅需学习离散运动（左/右），并且仅在静态障碍物内训练机器人。注意，上述方法仅考虑了静态障碍物，并且要求驾驶员在各种各样的环境中收集训练数据。 Pfeiffer等人提出了另一种数据驱动的端到端运动计划器。 [11]。他们使用ROS导航软件包生成的专家演示训练了模型，将激光测距结果和目标位置映射到运动命令。该模型可以在以前看不见的环境中导航机器人，并成功地应对突然的变化。但是，类似于其他监督学习方法，学习策略的性能受到标记训练集质量的严重限制。为了克服这个限制，Tai等。 [16]提出了一种通过深度强化学习方法训练的无地图运动计划器。卡恩等。 [17]提出了一种基于不确定性模型的增强学习算法来估计先验未知环境中的碰撞概率。但是，测试环境相对简单且结构化，学习过的计划人员很难将其推广到具有动态障碍和其他主动代理的场景。

关于多智能体碰撞避免，最优交互碰撞避免（ORCA）框架[1]在人群仿真和多智能体系统中很流行。 ORCA为多个机器人提供了充分的条件，可以避免在短时间内相互碰撞，并且可以轻松扩展以应对具有多个机器人的大型系统。 ORCA及其扩展[2]，[5]使用启发式或第一性原理构建了避免碰撞策略的复杂模型，该模型具有许多繁琐且难以正确调整的参数。此外，这些方法对现实世界中普遍存在的不确定性很敏感，因为它们假定每个机器人都具有对周围特工的位置，速度和形状的完美感知。为了减轻对完美感知的需求，[3]，[4]，[7]引入了通信协议以共享状态信息，包括组中特工的位置和速度。而且，ORCA的原始公式是基于完整的机器人，在现实世界中这种机器人比非完整的机器人要少见。为了在最常见的差动驱动机器人上部署ORCA，已经提出了几种方法来解决非完整机器人运动学的难题。 ORCADD [18]将机器人扩大到原始尺寸半径的两倍，以确保在不同约束条件下机器人的碰撞路径畅通无阻。但是，这种扩大的虚拟机器人尺寸可能导致狭窄通道或非结构化环境中的问题。 NH-ORCA [19]使差动驱动机器人以一定的跟踪误差ε跟踪完整的速度矢量。它比ORCA-DD更可取，因为机器人半径的虚拟增加仅是ε的大小，而不是半径的两倍。

在本文中，我们专注于学习一种避免碰撞的策略，该策略可以使多个非完整的移动机器人导航到其目标位置，而不会在复杂复杂的环境中发生碰撞。

正在上传…重新上传取消

图2：我们方法的概述。在每一个时间步，每个机器人从环境中接收其对地面的观察和回报，并在遵循策略π时生成一个动作。策略π在所有机器人之间共享，并通过基于策略梯度的强化学习算法进行更新。

III. PROBLEM FORMULATION（问题表述）

多机器人避碰问题主要是在欧氏平面上有障碍物的非完整差分驱动机器人和其他决策机器人的背景下定义的。在训练过程中，N个机器人都被建模为半径R相同的圆盘，即所有机器人都是齐次的。

在每个时间步t，第i个机器人（1≤i≤N）有权访问地面观测，并在其处计算无碰撞转向命令，驱动其从当前位置pt i接近目标gi。观测值从概率分布w.r.t.到基本系统状态st i，ot i∼O（st i），仅提供部分状态信息，因为第i个机器人对其他机器人的状态和意图没有明确的了解。与以往方法（如[1]、[3]、[4]、[6]、[8]、[9]）中应用的完美传感假设不同，我们基于部分观测的公式使得我们的方法在实际应用中更适用和更稳健。每个机器人的观测矢量可分为三个部分：ot=[ot z，ot g，ot v]（这里为了易读性我们忽略机器人ID i），ot z表示其周围环境的原始二维激光测量值，ot g表示其相对目标位置（即机器人局部极坐标系中目标的坐标），ot v是指它的流速。给定部分观测ot，每个机器人独立计算从所有机器人共享的随机策略π中采样的动作或转向命令at：

转存失败重新上传取消

其中θ表示策略参数。计算出的动作实际上是一个速度vt，它引导机器人接近目标，同时避免在∆t时间范围内与其他机器人和障碍物Bk（0≤k≤M）发生碰撞，直到接收到下一次ot+1观测。

因此，多机器人碰撞避免问题可以表述为一个部分可观测的顺序决策问题。由机器人i的观察和动作（速度）正在上传…重新上传取消组成的顺序决策可视为从起始位置正在上传…重新上传取消提升到期望目标正在上传…重新上传取消的轨迹，其中tg是行进时间。为了总结上述公式，我们将正在上传…重新上传取消定义为所有机器人的轨迹集，这些机器人受机器人运动学（例如非完整）约束，即：

正在上传…重新上传取消

为了找到一个所有机器人共享的最优策略，我们采用了一个目标，即在相同的场景中，最小化所有机器人的平均到达时间的期望，定义为：

正在上传…重新上传取消最小化同一场景中所有机器人的平均到达时间

式中，tg是由共享策略πθ控制的轨迹li in L的行进时间

在第五节中，平均到达时间也将被用作评估学习策略的一个重要指标。我们通过基于策略梯度的强化学习方法来解决这个优化问题，该方法将策略参数更新限制在信任区域内以确保稳定性。

IV. APPROACH

本节首先介绍强化学习框架的关键要素。接下来，我们用一个深神经网络来描述避碰策略的结构细节。最后，我们阐述了用于优化策略的训练协议。

A、强化学习设置

第三节定义的部分可观测序贯决策问题可以表示为一个部分可观测马尔可夫决策过程（POMDP），通过强化学习求解。形式上，POMDP可以描述为6元组（S，a，P，R，Ω，O），其中S是状态空间，a是动作空间，P是状态转移模型，R是报酬函数，Ω是观测空间（O∈Ω），O是给定系统状态的观测概率分布（O∼O（S））。在我们的公式中，每个机器人只能访问从底层系统状态采样的观测值。此外，由于每个机器人以完全分散的方式规划其运动，因此不需要由机器人的运动学和动力学确定的多机器人状态转移模型P。下面我们将详细介绍观察空间、动作空间和奖励函数。

1）观察空间：如第三节所述，观察时间由二维激光测距仪ot z的读数、相对目标位置和机器人当前速度ot v组成，ot z包括180度激光扫描仪的最后三个连续帧的测量，该扫描仪的最大范围为4米，每次扫描提供512个距离值（即ot z∈R3×512）。实际上，扫描器安装在机器人的前部，而不是中心（参见图1中的左图），以获得大的未包含视图。相对目标位置是以极坐标（距离和角度）表示目标相对于机器人当前位置的二维矢量。观测到的速度包括差动驱动机器人当前的平移和旋转速度。通过减去平均值并除以标准差，利用整个培训过程中汇总的统计数据，将观察值标准化。

2）动作空间：作用空间是连续空间中的一组容许速度。差动机器人的动作包括平移和旋转速度，即at=[vt，wt]。在本研究中，考虑到实际机器人的运动学和实际应用，我们设定了平移速度v∈（0.0,1.0）和旋转速度w∈（1.0,1.0）的范围。注意，不允许向后移动（即v<0.0），因为激光测距仪无法覆盖机器人的后部区域。

3）奖赏设计：我们的目标是避免导航过程中的碰撞，并最小化所有机器人的平均到达时间。奖励功能旨在指导机器人团队实现这一目标：

正在上传…重新上传取消

机器人i在时间步骤t时收到的奖励r是gr、cr和wr三个项的总和。特别是，机器人达到其目标所获得的奖励正在上传…重新上传取消：

正在上传…重新上传取消

当机器人与环境中的其他机器人或障碍物碰撞时，会受到正在上传…重新上传取消的惩罚：

正在上传…重新上传取消

为了鼓励机器人平稳移动，引入了一个小惩罚正在上传…重新上传取消来惩罚大转速：

正在上传…重新上传取消

在训练过程中，我们设置rarritival=15，ωg=2.5，rcollision=-15和ωw=-0.1。

B、网络结构

在给定输入（观测正在上传…重新上传取消）和输出（动作正在上传…重新上传取消）的情况下，详细阐述了正在上传…重新上传取消和正在上传…重新上传取消的策略网络映射，设计了一个四隐层神经网络作为策略πθ的非线性函数逼近器。它的架构如图3所示。我们利用前三个隐藏层有效地处理激光测量。第一个隐藏层在三个输入扫描上卷积32个核大小为5、步长为2的一维滤波器，并应用ReLU非线性[20]。第二个隐藏层卷积32个一维过滤器，内核大小为3，步幅为2，然后是ReLU非线性。第三个隐藏层是具有256个整流单元的完全连接层。第三层的输出与另外两个输入（ot和ot v）相连，然后馈入最后一个隐藏层，这是一个具有128个整流单元的完全连接层。输出层是一个具有两种不同激活的完全连接层：通过双曲正切函数（tanh），使用一个sigmoid函数来约束平动速度vtin（0.0,1.0）的平均值和旋转速度wtin（1.0,1.0）的平均值。

正在上传…重新上传取消

图3：避碰神经网络的结构。该网络具有扫描测量正在上传…重新上传取消、相对目标位置正在上传…重新上传取消和当前速度正在上传…重新上传取消输入，并输出速度正在上传…重新上传取消。最后一个动作正在上传…重新上传取消是用分离的对数标准差向量正在上传…重新上传取消从转存失败重新上传取消构造的高斯分布中采样。

总的来说，神经网络将输入观测向量ott映射为向量转存失败重新上传取消。从高斯分布转存失败重新上传取消中采样的最后动作转存失败重新上传取消，其中转存失败重新上传取消用作平均值，转存失败重新上传取消表示日志标准偏差，仅在训练期间更新。

C. 多场景多阶段训练

1）训练算法：即使深度强化学习算法已经成功地应用于移动机器人的运动规划中，它们也主要集中在离散的动作空间[13]、[21]或小规模的问题[8]、[9]、[16]、[17]。在这里，我们重点学习一种避免碰撞的策略，该策略能够在有障碍物的复杂场景（如走廊和迷宫）中，对大量机器人执行稳健而有效的操作。我们将最近提出的鲁棒策略梯度算法，近端策略优化（PPO）[22]-[24]扩展到我们的多机器人系统。我们的方法适应了集中学习、分散执行的模式。特别是，每个机器人在每个时间步都接收自己的观测值o，并执行共享策略πθ产生的动作；该策略由所有机器人同时收集的经验进行训练。

如算法1（改编自[22]、[23]）中总结的，训练过程通过并行执行策略和用采样数据更新策略来在采样轨迹之间进行交替。在数据收集过程中，每个机器人使用相同的策略来生成轨迹，直到它们收集到转存失败重新上传取消以上的一批数据。然后利用采样轨迹构造代换损失转存失败重新上传取消，并在Kullback-Leiber（KL）散度约束下，用Adam优化器[25]对Eπ周期的代换损失进行优化。以状态值函数转存失败重新上传取消为基线估计i处的优势，并用采样轨迹上参数为φ的神经网络逼近。Vφ的网络结构与策略网络πθ的网络结构相同，只是它的最后一层只有一个具有线性激活的单元。我们构造了Vφ的平方误差损失LV（φ），并用Adam优化器对其进行了优化。我们独立地更新πθ和Vφ，并且它们的参数是不共享的，因为我们发现在实际应用中使用两个分离的网络将获得更好的结果。

由于团队中的每个机器人都是一个独立的数据采集员，因此这种并行PPO算法可以很容易地扩展到一个大型的多机器人系统中，该系统由100个机器人以分散的方式组成。分散执行不仅大大减少了样本采集的时间，而且使算法适用于多种场景下的多机器人训练。

2）训练场景：为了让我们的机器人暴露在不同的环境中，我们使用场景移动机器人模拟器（如图4所示）创建不同的场景，并同时移动所有机器人。在图4中的场景1、2、3、5和6中（黑色实线是障碍物），我们首先从可用的工作区中选择合理的开始和到达区域，然后在相应区域中随机抽样每个机器人的开始和目标位置。场景4中的机器人被随机初始化成一个半径不同的圆圈，它们的目标是通过穿过中心区域到达它们的对端位置。对于场景7，我们在每集开始时为机器人和障碍物（以黑色显示）生成随机位置；并且机器人的目标位置也是随机选择的。这些丰富、复杂的训练场景使机器人能够探索其高维观测空间，并有可能提高学习策略的质量和鲁棒性。结合集中式学习、分散式执行机制，有效地优化了各种环境下的每次迭代冲突避免策略。

3）培训阶段：虽然在多个环境中进行的培训在不同的测试用例中同时带来了健壮的性能（见V-C节），但它使培训过程更加困难。在课程学习范式[27]的启发下，我们提出了一个两阶段的培训过程，它加速了政策收敛到一个满意的解决方案，并且获得了比相同历元数的白手起家的政策更高的回报（如图5所示）。在第一阶段，我们只训练20个随机场景（图4中的场景7）的机器人，没有任何障碍，这使得我们的机器人能够快速学习相对简单的避碰任务。一旦机器人达到可靠的性能，我们就停止第1阶段并保存训练策略。此策略将在阶段2中继续更新，机器人的数量增加到58个，他们在图4所示的更丰富和更复杂的场景中接受训练。

转存失败重新上传取消

图4：用于训练碰撞避免策略的场景。所有机器人都被模拟成半径相同的圆盘。障碍物显示为黑色。

V. 实验和结果

翻译：

在这一部分中，我们首先描述了训练过程的超参数和计算复杂性。然后，在不同的模拟场景下，将我们的策略与其他方法进行了定量比较。最后，我们证明了所学习的策略在一些具有挑战性和复杂性的环境中具有良好的泛化能力。

A、训练结构与计算复杂度

我们的算法是在TensorFlow中实现的，并在场景模拟器中对带有激光扫描仪的大型机器人组进行了仿真。我们在一台带有i7-7700 CPU和Nvidia GTX 1080 GPU的计算机上训练多机器人避免碰撞的策略。离线训练需要12个小时（算法1中约600次迭代）才能训练出在所有场景中收敛到稳定性能的策略。表1总结了算法1中的超参数，特别是策略网络的学习率lrθ在第一阶段被设置为5e-5，然后在第二阶段训练阶段被降低为2e-5。对于10个机器人的在线分散控制，策略网络在CPU上计算新动作需要3ms，在GPU上计算新动作需要约1.3ms。

转存失败重新上传取消

图5：在训练过程中，平均奖励以墙时间表示。

B、各种情景的定量比较

1）性能度量：为了在不同的测试用例中比较策略和其他方法的性能，我们使用以下性能指标。对于每个方法，每个测试用例都要评估50次重复。

表1：算法1中描述的训练算法的超参数

转存失败重新上传取消

•成功率是指在一定时间内，机器人在不发生碰撞的情况下达到目标的数量与机器人总数的比率。

•额外时间？tem测量所有机器人的平均行程时间与行程时间下限之间的差异（即，机器人以最大速度[7]、[8]直向目标的平均成本时间）。

•额外距离∏测量机器人的平均行进轨迹长度与机器人行进距离下限之间的差异（即机器人沿着最短路径朝目标行进的平均行进距离）。

•平均速度v测量机器人团队在导航过程中的平均速度。

请注意，在评估过程中，将对所有机器人的额外时间和额外距离进行测量，以消除由于代理数量的差异和与目标的距离不同而产生的影响。

2）循环场景：我们首先比较了我们的多场景多阶段学习策略和NH-ORCA策略[19]，以及在不同机器人数量的循环场景中使用监督学习（SL策略，变量[10]，详见下文）训练的策略。圆圈场景与图4所示的场景4相似，只是我们在圆圈上统一设置了机器人。我们使用来自[3]，[4]的开源NH-ORCA实现，并在模拟中共享所有机器人的地面真实位置和速度。在监督模式下学习的策略具有与我们的策略相同的体系结构（在第IV B节中描述），使用来自[10]，[11]的方法在大约800000个样本上进行训练。

与NH-ORCA策略相比，我们的学习策略在成功率、平均额外时间和旅行速度方面都有显著提高。虽然在机器人数量超过15的情况下（表二第三行），我们学习的策略比NHORCA策略的行程稍长，但更大的速度（表二第四行）有助于我们的机器人更快地达到目标。实际上，稍微长一点的路径是更高速度的副产品，因为机器人在停在目标前需要更多的空间减速。

表二：针对不同机器人数量的圆形场景，评估不同方法的性能指标（平均值/标准差）。

转存失败重新上传取消

3）随机场景：随机场景是评价多机器人避碰性能的常用场景。为了测量我们的方法在随机场景中的性能（如图4中的第7个场景所示），我们首先创建5个不同的随机场景，每个场景中有15个机器人。对于每个随机场景，我们重复评估50次。结果如图6所示，它将我们的最终政策与仅在第1阶段（第IV-C.1节）和NHORCA政策中培训的政策进行了比较。我们可以观察到，使用深度强化学习训练的两种策略的成功率都高于NH-ORCA策略（图6a）。还可以看出，使用学习策略的机器人（在阶段1和阶段2）能够比NH-ORCA（图6b）更快到达目标。虽然学习到的策略具有较长的轨迹长度（图6c），但较高的平均速度（图6d）和成功率表明，我们的策略使机器人能够更好地预测其他机器人的运动。与上面的圆形场景类似，稍微长一点的路径是由于机器人在到达目标前需要减速。此外，第一阶段策略在随机场景中的高性能部分是由于过度拟合造成的，因为它是在类似的随机场景中训练的，而第二阶段策略是在多个场景中训练的。

转存失败重新上传取消

（a）成功率 (b)耗时

转存失败重新上传取消

（c）额外距离（d）平均速度

图6：随机场景下，为我们学习的策略和NH-ORCA策略评估的性能指标。

4）小组场景：为了评估机器人之间的合作，我们希望在更具挑战性的场景中测试我们的训练策略，例如小组交换、小组交叉和在走廊中移动的小组。在组交换场景中，我们导航两组机器人（每组有6个机器人）朝相反方向移动以交换位置。对于群组交叉场景，机器人被分成两组，其路径将在场景中心相交。我们通过测量50次试验的平均额外时间，将我们的方法与NH-ORCA在这两个病例上进行比较。从图8可以看出，我们的策略在这两种情况下的性能都比NH-ORCA好得多。较短的目标间隔时间表明，我们的政策已学会产生比基于反应的方法（NH-ORCA）更多的合作行为。然后我们评估了走廊场景，两组人员在有两个障碍物的狭窄走廊内交换位置，如图7a所示，只有第二阶段策略才能完成这项具有挑战性的任务（路径如图7b所示）。第一阶段策略的失败表明，在各种场景下进行联合训练，可以在不同的情况下获得稳健的性能。NH-ORCA策略在这种情况下失败，因为它依赖于全球规划者来指导机器人在复杂环境中导航。如第一节所述，agentlevel碰撞避免策略（如NH-ORCA）需要额外的管道（如指示障碍物的栅格地图）来明确识别和处理静态障碍物，而我们的方法（传感器级策略）则从原始传感器读数隐式推断障碍物，而无需任何额外处理。

转存失败重新上传取消

（a）走廊场景（b）机器人轨迹

图7：两组机器人在有障碍物的走廊中移动。（a）显示走廊方案。（b）显示由我们的第二阶段政策产生的轨迹。

转存失败重新上传取消

图8：我们的策略（阶段1和阶段2）和NH-ORCA策略在两个组场景中的耗时情况。

转存失败重新上传取消

（a）异构机器人（b）非合作机器人

图9：在异构机器人团队（a）中，只有两个圆盘形机器人用于训练。（b）显示6个机器人在两个非合作机器人（矩形）周围移动，这两个机器人以直线快速移动。

转存失败重新上传取消

图10：模拟100个机器人试图通过圆心移动到相反的位置。

C、概括

翻译：

多场景训练的一个显著特点是学习策略（第二阶段策略）具有良好的泛化能力。如第三节所述，我们的策略是在一个机器人团队中进行训练，所有机器人共享相同的碰撞避免策略。在整个训练过程中不引入非合作机器人。有趣的是，图9b所示的结果表明，所学习的策略可以很好地直接推广以避免非合作代理（即图9b中的矩形机器人以固定速度直线行进）。回想一下，我们的策略是在具有相同形状和固定半径的机器人上进行训练。图9a显示，学习的策略还可以有效地导航由不同大小和形状的机器人组成的异构机器人组，以在不发生任何碰撞的情况下实现其目标。为了测试我们的方法在大规模场景中的性能，我们模拟了100个机器人在一个大圆圈中移动到对端位置，如图10所示。这表明我们所学习的策略可以直接推广到大规模环境中，而无需任何微调。

VI 结论

翻译：

本文提出了一个多场景多阶段训练框架，利用稳健的策略梯度算法来优化完全分散的传感器级碰撞避免策略。所学习的策略在广泛评估ART NH-ORCA策略的状态时，在成功率、避免碰撞性能和泛化能力方面显示了一些优势。我们的工作可以作为减少集中式和分散式方法之间导航性能差距的第一步，尽管我们充分意识到，当调度多个机器人在障碍物密集的复杂环境中导航时，以局部避免碰撞为重点的学习策略无法取代全局路径规划器。

你可能感兴趣的:(论文翻译,tensorflow,机器学习,深度学习,机器人避障)

【机器学习笔记 Ⅲ】3 异常检测算法巴伦是只猫机器学习机器学习笔记算法
异常检测算法（AnomalyDetection）详解异常检测是识别数据中显著偏离正常模式的样本（离群点）的技术，广泛应用于欺诈检测、故障诊断、网络安全等领域。以下是系统化的解析：1.异常类型类型描述示例点异常单个样本明显异常信用卡交易中的天价消费上下文异常在特定上下文中异常（如时间序列）夏季气温突降至零下集体异常一组相关样本联合表现为异常网络流量中突然的DDOS攻击流量2.常用算法(1)基于统计的
【机器学习笔记 Ⅲ】4 特征选择巴伦是只猫机器学习机器学习笔记人工智能
特征选择（FeatureSelection）系统指南特征选择是机器学习中优化模型性能的关键步骤，通过筛选最相关、信息量最大的特征，提高模型精度、降低过拟合风险并加速训练。以下是完整的特征选择方法论：1.特征选择的核心目标提升模型性能：去除噪声和冗余特征，增强泛化能力。降低计算成本：减少训练和预测时间。增强可解释性：简化模型，便于业务理解。2.特征选择方法分类(1)过滤法（FilterMethods
机器学习笔记二-回归
回归是统计学和机器学习中的一种基本方法，用于建模变量之间的关系，特别是用一个或多个自变量（输入变量）来预测一个因变量（输出变量）的值。回归分析广泛应用于预测、趋势分析和关联研究中。根据目标和数据的性质，可以使用不同类型的回归方法。1.回归的基本概念：自变量（IndependentVariable）:也称为预测变量、解释变量，是模型中的输入变量，用于预测或解释因变量的变化。因变量（Dependent
深度学习微调中的优化器全景解析：从理论到实践北辰alk AI 深度学习人工智能
文章目录一、基础优化器：深度学习微调的基石1.1随机梯度下降（SGD）1.2AdaGrad（自适应梯度算法）二、自适应优化器：现代深度学习的标配2.1RMSProp2.2Adam（自适应矩估计）三、大模型微调专用优化器3.1LAMB（Layer-wiseAdaptiveMoments）3.2Sophia（二阶优化启发）四、优化器性能对比研究4.1在GLUE基准上的表现（BERT-base微调）4.
PyTorch 详细安装教程及核心API使用指南慕婉0307 pytorch pytorch 人工智能 python
一、PyTorch简介PyTorch是由FacebookAIResearch(FAIR)于2016年开发的开源深度学习框架，现已成为学术界和工业界最受欢迎的深度学习工具之一。其核心优势在于采用了动态计算图（DynamicComputationGraph，又称"define-by-run"机制），这使得开发者能够像编写普通Python代码一样构建神经网络，并在运行时动态调整计算图结构，大大提高了研究
“解锁自动化新可能：使用Robocorp构建Python机器人“ sjufgwgfhoia 自动化 python 服务器
在这个快速变化的技术时代，自动化已经成为提高生产力和效率的关键驱动力。Robocorp提供了一种强大且灵活的平台，帮助开发者构建和运行Python机器人，以满足各类业务需求。引言在本文中，我们将深入探讨如何使用Robocorp构建和操作可以运行在任何地方且具备任意规模的Python工作器。本文旨在帮助你快速上手Robocorp平台的安装和设置，并分享如何在实践中应用它。主要内容1.Robocorp
什么是深度学习框架中的计算图？杰瑞学AI Computer knowledge NLP/LLMs AI/AGI 深度学习人工智能 pytorch
在深度学习框架中，计算图是核心的数据结构和抽象概念，它用来表示和定义深度学习模型的计算过程。我们可以把它想象成一个描述数学运算如何组合和执行的有向图。以下是计算图的关键要素和作用：节点：代表操作或变量。操作：数学运算，如加法(+)、乘法(*)、矩阵乘法(matmul)、激活函数(ReLU,sigmoid)、卷积(conv2d)、损失函数(cross_entropy)等。变量：通常是张量，即存储数据
蛋白质结构预测/功能注释/交互识别/按需设计，中国海洋大学张树刚团队直击蛋白质智能计算核心任务 hyperai
蛋白质作为生命活动的主要承担者，在人体生理功能中扮演关键角色。然而传统研究面临结构解析成本高昂、功能注释严重滞后、新型蛋白质设计效率低下等挑战。近年来，生命科学对蛋白质复杂特性解析的需求日益迫切，大数据、深度学习、多模态计算等技术的突破性发展，为构建蛋白质智能计算体系提供了全新的发展契机。蛋白质智能计算体系的构建，使得蛋白质在大规模功能注释、交互预测及三维结构建模等领域取得显著成果，为药物发现与生
【心灵鸡汤】深度学习技能形成树：从零基础到AI专家的成长路径全解析智算菩萨人工智能深度学习
引言：技能树的生长哲学在这个人工智能浪潮汹涌的时代，深度学习犹如一棵参天大树，其根系深深扎入数学与计算科学的沃土，主干挺拔地承载着机器学习的核心理念，而枝叶则繁茂地延伸至计算机视觉、自然语言处理、强化学习等各个应用领域。对于初入此领域的新手而言，理解这棵技能树的生长规律，掌握其形成过程中的关键节点和发展阶段，将直接决定其在人工智能道路上能够走多远、攀多高。技能树的概念源于游戏设计，但在学习深度学习
【计算机毕业设计】基于Springboot的办公用品管理系统+LW 枫叶学长(专业接毕设) Java毕业设计实战案例课程设计 spring boot 后端
博主介绍：✌全网粉丝3W+,csdn特邀作者、CSDN新星计划导师、Java领域优质创作者,掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流✌技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、安卓app、大数据、物联网、机器学习等设计与开发。主要内容：
【TVM 教程】如何处理 TVM 报错
ApacheTVM是一个深度的深度学习编译框架，适用于CPU、GPU和各种机器学习加速芯片。更多TVM中文文档可访问→https://tvm.hyper.ai/运行TVM时，可能会遇到如下报错：---------------------------------------------------------------AnerroroccurredduringtheexecutionofTVM.F
【PaddleOCR】OCR文本检测与文本识别数据集整理，持续更新......
博主简介：曾任某智慧城市类企业算法总监，目前在美国市场的物流公司从事高级算法工程师一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者，提供AI相关的技术咨询、项目开发和个性化解决方案等服务，如有需要请站内私信或者联系任意文章底部的的VX名片（ID：xf982831907）博主粉丝群介绍：①群内初中生、
多模态大模型的技术应用与未来展望：重构AI交互范式的新引擎 zhaoyi_he 重构人工智能
一、引言：为什么多模态是AI发展的下一场革命？过去十年，深度学习推动了计算机视觉和自然语言处理的飞跃，但两者的发展路径长期割裂。随着生成式AI和大模型时代的到来，**多模态大模型（MultimodalFoundationModels）**以统一的建模方式处理图像、文本、音频、视频等多源数据，重塑了“感知-认知-决策”链条，为AGI迈出关键一步。OpenAI的GPT-4o、Google的Gemini
MyChrome.exe与Selenium联动避坑指南：User Data目录冲突解决方案龙潜月七 selenium 测试工具
在自动化测试与网络数据采集场景中，MyChrome.exe与Selenium的联动能发挥强大作用，但二者的UserData目录配置若处理不当，易引发冲突。下面我将重点围绕该问题，详细阐述联动的注意事项。MyChrome.exe与Selenium联动避坑指南：UserData目录冲突解决方案在自动化测试与网络数据采集的领域中，MyChrome.exe与Selenium的组合常常是开发者的得力助手。M
ImportError: /nvidia/cusparse/lib/libcusparse.so.12: undefined symbol: __nvJitLinkComplete_12_4 爱编程的喵喵 Python基础课程 python ImportError torch nvJitLink 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了ImportError:/home/
机器人动力学模型及其线性化阻抗控制模型
机器人动力学模型机器人动力学模型描述了机器人的运动与所受力和力矩之间的关系。这个模型考虑了机器人的质量、惯性、关节摩擦、重力等多种因素，用于预测和解释机器人在给定输入下的动态行为。动力学模型是设计机器人控制器的基础，它可以帮助我们理解机器人如何响应控制指令，并优化机器人的运动性能。具体来说，机器人动力学模型通常由一组微分方程组成，这些方程描述了机器人各关节的加速度、速度和位置与施加在关节上的力和力
【机器学习笔记 Ⅱ】11 决策树模型巴伦是只猫机器学习机器学习笔记决策树
决策树模型（DecisionTree）详解决策树是一种树形结构的监督学习模型，通过一系列规则对数据进行分类或回归。其核心思想是模仿人类决策过程，通过不断提问（基于特征划分）逐步逼近答案。1.核心概念节点类型：根节点：起始问题（最佳特征划分点）。内部节点：中间决策步骤（特征判断）。叶节点：最终预测结果（类别或数值）。分支：对应特征的取值或条件判断（如“年龄≥30？”）。2.构建决策树的关键步骤(1)
【机器学习笔记 Ⅱ】10 完整周期
机器学习的完整生命周期（End-to-EndPipeline）机器学习的完整周期涵盖从问题定义到模型部署的全过程，以下是系统化的步骤分解和关键要点：1.问题定义（ProblemDefinition）目标：明确业务需求与机器学习任务的匹配性。关键问题：这是分类、回归、聚类还是强化学习问题？成功的标准是什么？（如准确率>90%、降低10%成本）输出：项目目标文档（含评估指标）。2.数据收集（DataC
【机器学习笔记Ⅰ】13 正则化代价函数
正则化代价函数（RegularizedCostFunction）详解正则化代价函数是机器学习中用于防止模型过拟合的核心技术，通过在原始代价函数中添加惩罚项，约束模型参数的大小，从而提高泛化能力。以下是系统化的解析：1.为什么需要正则化？过拟合问题：当模型过于复杂（如高阶多项式回归、深度神经网络）时，可能完美拟合训练数据但泛化性能差。解决方案：在代价函数中增加对参数的惩罚，抑制不重要的特征权重。2.
【机器学习笔记Ⅰ】6 多类特征巴伦是只猫机器学习机器学习笔记人工智能
多类特征（Multi-classFeatures）详解多类特征是指一个特征（变量）可以取多个离散的类别值，且这些类别之间没有内在的顺序关系。这类特征是机器学习中常见的数据类型，尤其在分类和回归问题中需要特殊处理。1.核心概念(1)什么是多类特征？定义：特征是离散的、有限的类别，且类别之间无大小或顺序关系。示例：颜色：红、绿、蓝（无顺序）。城市：北京、上海、广州（无数学意义的大小关系）。动物类别：猫
图像分割技术详解：从原理到实践 lanjieying
本文还有配套的精品资源，点击获取简介：图像分割是图像处理领域将图像分解为多个区域的过程，用于图像分析、特征提取等。文章介绍了图像分割的原理，并通过一个将图像划分为2*4子块的示例，展示了如何使用Python和matplotlib库中的tight_subplot函数进行图像分割和展示。文章还探讨了图像分割在不同领域的应用，以及如何在机器学习项目中作为数据预处理步骤。1.图像分割基本概念在图像处理领域
机器学习笔记——支持向量机 star_and_sun 机器学习笔记支持向量机
支持向量机参数模型对分布需要假设（这也是与非参数模型的区别之一）间隔最大化，形式转化为凸二次规划问题最大化间隔间隔最大化是意思：对训练集有着充分大的确信度来分类训练数据，最难以分的点也有足够大的信度将其分开间隔最大化的分离超平面的的求解怎么求呢？最终的方法如下1.线性可分的支持向量机的优化目标其实就是找得到分离的的超平面求得参数w和b的值就可以了注意，最大间隔分离超平面是唯一的，间隔叫硬间隔1.1
【机器学习&深度学习】多分类评估策略一叶千舟深度学习【理论】深度学习【应用必备常识】大数据人工智能
目录前言一、多分类3大策略✅宏平均（MacroAverage）✅加权平均（WeightedAverage）✅微平均（MicroAverage）二、类比理解2.1宏平均（MacroAverage）2.1.1计算方式2.1.2适合场景2.1.3宏平均不适用的场景2.1.4宏平均一般用在哪些指标上？2.1.5怎么看macroavg指标？2.1.6宏平均值低说明了什么？2.1.7从宏平均指标中定位模型短板
【机器学习笔记Ⅰ】7 向量化巴伦是只猫机器学习机器学习笔记人工智能
向量化（Vectorization）详解向量化是将数据或操作转换为向量（或矩阵）形式，并利用并行计算高效处理的技术。它是机器学习和数值计算中的核心优化手段，能显著提升代码运行效率（尤其在Python中避免显式循环）。1.为什么需要向量化？(1)传统循环的缺陷低效：Python的for循环逐元素操作，速度慢。代码冗长：需手动处理每个元素。示例：计算两个数组的点积（非向量化）a=[1,2,3]b=[4
大语言模型应用指南：ReAct 框架 AI大模型应用实战 java python javascript kotlin golang 架构人工智能
大语言模型应用指南：ReAct框架关键词：大语言模型,ReAct框架,自然语言处理(NLP),模型融合,多模态学习,深度学习,深度学习框架1.背景介绍1.1问题由来近年来，深度学习技术在自然语言处理(NLP)领域取得了显著进展。尤其是大语言模型(LargeLanguageModels,LLMs)，如BERT、GPT系列等，通过在大规模无标签数据上进行预训练，获得了强大的语言理解和生成能力。然而，预
大语言模型原理基础与前沿基于语言反馈进行微调 AI天才研究院计算 AI大模型企业级应用开发实战 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大语言模型原理基础与前沿基于语言反馈进行微调作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着深度学习技术的飞速发展，自然语言处理（NLP）领域取得了显著的进展。大语言模型（LargeLanguageModels，LLMs）如GPT-3、BERT等在各项NLP任务上取得了令人瞩目的成绩。然而，如何进一步提高大语言模型的理
李宏毅2025《机器学习》第四讲-Transformer架构的演进
Transformer架构的演进与替代方案：从RNN到Mamba的技术思辨Transformer作为当前AI领域的标准架构，其设计并非凭空而来，也并非没有缺点。本次讨论的核心便是：新兴的架构，如MAMA，是如何针对Transformer的弱点进行改进，并试图提供一个更优的解决方案的。要理解架构的演进，我们必须首先明确一个核心原则：每一种神经网络架构，都有其存在的技术理由。CNN（卷积神经网络）：为
Go 语言实现本地大模型聊天机器人：从推理到 Web UI 的全流程雷羿 LexChien Go golang 机器人前端
接续Go-LLM-CPP专案，继续扩充前端聊天室功能一.专案目录架构：go-llm-cpp/├──bin/#第三方依赖│├──go-llama.cpp/#封裝GGUF模型推理（CGo）│└──llm-go/#prompt构建+回合管理（Go）│├──cmd/#可执行应用│└──main.go#CLI/HTTPserver入口点│├──config/│└──persona.yaml#人格模板（系统p
条件概率：不确定性决策的基石大千AI助手人工智能 Python #OTHER 决策树算法机器学习人工智能条件概率概率论
条件概率是概率论中的核心概念，用于描述在已知某一事件发生的条件下，另一事件发生的概率。它量化了事件之间的关联性，是贝叶斯推理、统计建模和机器学习的基础。本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！一、定义与公式设(A)和(B)是两个随机事件，且(P(B)>0)：条件概率(P(A\midB))表示
探索AI人工智能医疗NLP实体识别系统的架构设计 AI学长带你学AI 人工智能自然语言处理 easyui ai
探索AI人工智能医疗NLP实体识别系统的架构设计关键词：人工智能、医疗NLP、实体识别、系统架构、深度学习、自然语言处理、医疗信息化摘要：本文将深入探讨医疗领域NLP实体识别系统的架构设计。我们将从基础概念出发，逐步解析医疗文本处理的特殊性，详细介绍实体识别技术的核心原理，并通过实际案例展示如何构建一个高效可靠的医疗实体识别系统。文章还将探讨当前技术面临的挑战和未来发展方向，为医疗AI领域的从业者
辗转相处求最大公约数沐刃青蛟 C++漏洞
无言面对”江东父老“了，接触编程一年了，今天发现还不会辗转相除法求最大公约数。惭愧惭愧！为此，总结一下以方便日后忘了好查找。 1.输入要比较的两个数a,b 忽略：2.比较大小（因为后面要的是大的数对小的数做%操作） 3.辗转相除（用循环不停的取余，如a%b,直至b=0） 4.最后的a为两数的最大公约数 &
F5负载均衡会话保持技术及原理技术白皮书 bijian1013 F5 负载均衡
一.什么是会话保持？在大多数电子商务的应用系统或者需要进行用户身份认证的在线系统中，一个客户与服务器经常经过好几次的交互过程才能完成一笔交易或者是一个请求的完成。由于这几次交互过程是密切相关的，服务器在进行这些交互过程的某一个交互步骤时，往往需要了解上一次交互过程的处理结果，或者上几步的交互过程结果，服务器进行下
Object.equals方法：重载还是覆盖 Cwind java generics override overload
本文译自StackOverflow上对此问题的讨论。原问题链接在阅读Joshua Bloch的《Effective Java（第二版）》第8条“覆盖equals时请遵守通用约定”时对如下论述有疑问： “不要将equals声明中的Object对象替换为其他的类型。程序员编写出下面这样的equals方法并不鲜见，这会使程序员花上数个小时都搞不清它为什么不能正常工作：” pu
初始线程 15700786134
暑假学习的第一课是讲线程，任务是是界面上的一条线运动起来。既然是在界面上，那必定得先有一个界面，所以第一步就是，自己的类继承JAVA中的JFrame，在新建的类中写一个界面，代码如下： public class ShapeFr
Linux的tcpdump 被触发 tcpdump
用简单的话来定义tcpdump，就是：dump the traffic on a network，根据使用者的定义对网络上的数据包进行截获的包分析工具。 tcpdump可以将网络中传送的数据包的“头”完全截获下来提供分析。它支持针对网络层、协议、主机、网络或端口的过滤，并提供and、or、not等逻辑语句来帮助你去掉无用的信息。实用命令实例默认启动 tcpdump 普通情况下，直
安卓程序listview优化后还是卡顿肆无忌惮_ ListView
最近用eclipse开发一个安卓app，listview使用baseadapter，里面有一个ImageView和两个TextView。使用了Holder内部类进行优化了还是很卡顿。后来发现是图片资源的问题。把一张分辨率高的图片放在了drawable-mdpi文件夹下，当我在每个item中显示，他都要进行缩放，导致很卡顿。解决办法是把这个高分辨率图片放到drawable-xxhdpi下。 &nb
扩展easyUI tab控件，添加加载遮罩效果知了ing jquery
(function () { $.extend($.fn.tabs.methods, { //显示遮罩 loading: function (jq, msg) { return jq.each(function () { var panel = $(this).tabs(&
gradle上传jar到nexus 矮蛋蛋 gradle
原文地址： https://docs.gradle.org/current/userguide/maven_plugin.html configurations { deployerJars } dependencies { deployerJars "org.apache.maven.wagon
千万条数据外网导入数据库的解决方案。 alleni123 sql mysql
从某网上爬了数千万的数据，存在文本中。然后要导入mysql数据库。悲剧的是数据库和我存数据的服务器不在一个内网里面。。 ping了一下， 19ms的延迟。于是下面的代码是没用的。 ps = con.prepareStatement(sql); ps.setString(1, info.getYear())............; ps.exec
JAVA IO InputStreamReader和OutputStreamReader 百合不是茶 JAVA.io操作字符流
这是第三篇关于java.io的文章了，从开始对io的不了解-->熟悉--->模糊，是这几天来对文件操作中最大的感受，本来自己认为的熟悉了的，刚刚在回想起前面学的好像又不是很清晰了，模糊对我现在或许是最好的鼓励我会更加的去学加油！： JAVA的API提供了另外一种数据保存途径，使用字符流来保存的，字符流只能保存字符形式的流字节流和字符的难点：a,怎么将读到的数据
MO、MT解读 bijian1013 GSM
MO= Mobile originate，上行，即用户上发给SP的信息。MT= Mobile Terminate，下行，即SP端下发给用户的信息；上行:mo提交短信到短信中心下行:mt短信中心向特定的用户转发短信，你的短信是这样的，你所提交的短信，投递的地址是短信中心。短信中心收到你的短信后，存储转发，转发的时候就会根据你填写的接收方号码寻找路由，下发。在彩信领域是一样的道理。下行业务：由SP
五个JavaScript基础问题 bijian1013 JavaScript call apply this Hoisting
下面是五个关于前端相关的基础问题，但却很能体现JavaScript的基本功底。问题1：Scope作用范围考虑下面的代码： (function() { var a = b = 5; })(); console.log(b); 什么会被打印在控制台上？回答：上面的代码会打印 5。 &nbs
【Thrift二】Thrift Hello World bit1129 Hello world
本篇，不考虑细节问题和为什么，先照葫芦画瓢写一个Thrift版本的Hello World，了解Thrift RPC服务开发的基本流程 1. 在Intellij中创建一个Maven模块，加入对Thrift的依赖，同时还要加上slf4j依赖，如果不加slf4j依赖，在后面启动Thrift Server时会报错 <dependency>
【Avro一】Avro入门 bit1129 入门
本文的目的主要是总结下基于Avro Schema代码生成，然后进行序列化和反序列化开发的基本流程。需要指出的是，Avro并不要求一定得根据Schema文件生成代码，这对于动态类型语言很有用。 1. 添加Maven依赖 <?xml version="1.0" encoding="UTF-8"?> <proj
安装nginx+ngx_lua支持WAF防护功能 ronin47
需要的软件:LuaJIT-2.0.0.tar.gz nginx-1.4.4.tar.gz &nb
java-5.查找最小的K个元素-使用最大堆 bylijinnan java
import java.util.Arrays; import java.util.Random; public class MinKElement { /** * 5.最小的K个元素 * I would like to use MaxHeap. * using QuickSort is also OK */ public static void
TCP的TIME-WAIT bylijinnan socket
原文连接： http://vincent.bernat.im/en/blog/2014-tcp-time-wait-state-linux.html 以下为对原文的阅读笔记说明：主动关闭的一方称为local end，被动关闭的一方称为remote end 本地IP、本地端口、远端IP、远端端口这一“四元组”称为quadruplet，也称为socket 1、TIME_WA
jquery ajax 序列化表单 coder_xpf Jquery ajax 序列化
checkbox 如果不设定值，默认选中值为on；设定值之后，选中则为设定的值 <input type="checkbox" name="favor" id="favor" checked="checked"/> $("#favor&quo
Apache集群乱码和最高并发控制 cuisuqiang apache tomcat 并发集群乱码
都知道如果使用Http访问，那么在Connector中增加URIEncoding即可，其实使用AJP时也一样，增加useBodyEncodingForURI和URIEncoding即可。最大连接数也是一样的，增加maxThreads属性即可，如下，配置如下： <Connector maxThreads="300" port="8019" prot
websocket dalan_123 websocket
一、低延迟的客户端-服务器和服务器-客户端的连接很多时候所谓的http的请求、响应的模式，都是客户端加载一个网页，直到用户在进行下一次点击的时候，什么都不会发生。并且所有的http的通信都是客户端控制的，这时候就需要用户的互动或定期轮训的，以便从服务器端加载新的数据。通常采用的技术比如推送和comet（使用http长连接、无需安装浏览器安装插件的两种方式：基于ajax的长
菜鸟分析网络执法官 dcj3sjt126com 网络
最近在论坛上看到很多贴子在讨论网络执法官的问题。菜鸟我正好知道这回事情.人道"人之患好为人师" 手里忍不住,就写点东西吧. 我也很忙.又没有MM,又没有MONEY....晕倒有点跑题. OK,闲话少说,切如正题. 要了解网络执法官的原理. 就要先了解局域网的通信的原理. 前面我们看到了.在以太网上传输的都是具有以太网头的数据包.
Android相对布局属性全集 dcj3sjt126com android
RelativeLayout布局android:layout_marginTop="25dip" //顶部距离android:gravity="left" //空间布局位置android:layout_marginLeft="15dip //距离左边距 // 相对于给定ID控件android:layout_above 将该控件的底部置于给定ID的
Tomcat内存设置详解 eksliang jvm tomcat tomcat内存设置
Java内存溢出详解一、常见的Java内存溢出有以下三种： 1. java.lang.OutOfMemoryError: Java heap space ----JVM Heap（堆）溢出JVM在启动的时候会自动设置JVM Heap的值，其初始空间(即-Xms)是物理内存的1/64，最大空间(-Xmx)不可超过物理内存。可以利用JVM提
Java6 JVM参数选项 greatwqs java HotSpot jvm jvm参数 JVM Options
Java 6 JVM参数选项大全（中文版）作者：Ken Wu Email: [email protected] 转载本文档请注明原文链接 http://kenwublog.com/docs/java6-jvm-options-chinese-edition.htm！本文是基于最新的SUN官方文档Java SE 6 Hotspot VM Opt
weblogic创建JMC i5land weblogic jms
进入 weblogic控制太 1.创建持久化存储 --Services--Persistant Stores--new--Create FileStores--name随便起--target默认--Directory写入在本机建立的文件夹的路径--ok 2.创建JMS服务器 --Services--Messaging--JMS Servers--new--name随便起--Pers
基于 DHT 网络的磁力链接和BT种子的搜索引擎架构 justjavac DHT
上周开发了一个磁力链接和 BT 种子的搜索引擎 {Magnet & Torrent}，本文简单介绍一下主要的系统功能和用到的技术。系统包括几个独立的部分：使用 Python 的 Scrapy 框架开发的网络爬虫，用来爬取磁力链接和种子；使用 PHP CI 框架开发的简易网站；搜索引擎目前直接使用的 MySQL，将来可以考虑使
sql添加、删除表中的列 macroli sql
添加没有默认值：alter table Test add BazaarType char(1) 有默认值的添加列：alter table Test add BazaarType char(1) default(0) 删除没有默认值的列：alter table Test drop COLUMN BazaarType 删除有默认值的列：先删除约束（默认值）alter table Test DRO
PHP中二维数组的排序方法 abc123456789cba 排序二维数组 PHP
<?php/*** @package BugFree* @version $Id: FunctionsMain.inc.php,v 1.32 2005/09/24 11:38:37 wwccss Exp $*** Sort an two-dimension array by some level
hive优化之------控制hive任务中的map数和reduce数 superlxw1234 hive hive优化
一、控制hive任务中的map数: 1. 通常情况下，作业会通过input的目录产生一个或者多个map任务。主要的决定因素有： input的文件总个数，input的文件大小，集群设置的文件块大小(目前为128M, 可在hive中通过set dfs.block.size;命令查看到，该参数不能自定义修改)；2.
Spring Boot 1.2.4 发布 wiselyman spring boot
Spring Boot 1.2.4已于6.4日发布，repo.spring.io and Maven Central可以下载(推荐使用maven或者gradle构建下载)。这是一个维护版本，包含了一些修复small number of fixes,建议所有的用户升级。 Spring Boot 1.3的第一个里程碑版本将在几天后发布，包含许多