Moresweet猫甜

基于深度强化学习的目标驱动型视觉导航泛化模型

深度强化学习在目标驱动型视觉导航的泛化

参考论文《Towards Generalization in Target-Driven Visual Navigation by Using Deep Reinforcement Learning》

文章目录

深度强化学习在目标驱动型视觉导航的泛化
- 1. 目标驱动型视觉导航问题
- 2. 创新点和解决的问题
- - 2.1 创新点
  - 2.2 解决的问题
- 3. 设计框架
- - 3.1 整体设计
  - 3.2 网络架构
  - - 3.2.1 目标定位网络
    - 3.2.2 导航网络
  - 3.3 训练
  - - 3.3.1 目标定位训练阶段
    - 3.3.2 导航训练阶段
  - 3.4 环境
  - - 3.4.1 迷宫关卡
    - 3.4.2 捕获关卡
- 4. 实验
- - 4.1 训练相关
  - 4.2 仿真实验
  - 4.3 真实实验
- 5. 主要代码
- - 5.1 目标定位网络
  - 5.2 导航网络
  - 5.3 Learner
  - 5.4 Agent

1. 目标驱动型视觉导航问题

目标是仅使用视觉输入就能导航并到达用户指定目标的机器人，对于此类问题的解决办法一般有两种。

将经典导航系统与目标检测模块结合起来。
基于地图的导航算法或者SLAM系统与最先进的物体检测或图像识别模型
无地图方法
深度卷积神经网络(cnn)与强化学习(RL)相结合

基于地图的导航算法或者SLAM系统与最先进的物体检测或图像识别模型的局限性

基于地图的方法假设环境的全局地图可用，而SLAM算法仍然不是专门为目标驱动的视觉导航设计的。
几何映射以及映射和规划之间的区别在这个任务中是不必要的，并且会使整个系统不必要地脆弱。
深度学习对象检测模型和经典导航算法最初并不是为了一起工作而开发的，将它们结合起来并不是微不足道的。

深度卷积神经网络(cnn)与强化学习(RL)相结合的方法

优势

深度强化学习(DRL)确实允许以自然的方式管理视觉和运动之间的关系，并且它在无地图视觉导航和许多其他机器人任务中显示出令人印象深刻的结果。

局限

在目标驱动的视觉导航中，算法的每次运行都可能指定不同的目标。

强化学习不同目标点解决方案

在策略中嵌入目标目标和当前状态。
优点

训练一个算法就可以找到多个目标，而不需要为每个可能的目标学习新的模型参数。

局限性
1. 目前的方法仅限于将训练模型的特定场景或对象作为目标
2. 对于智能体必须找到的每个特定对象和必须探索的每个新环境，仍然有必要对其进行训练，或者至少对其进行微调。
3. 环境是真实的，那么这种DRL代理的训练过程可能非常复杂
由两个网络组成的新框架，第一个目标是在未知环境中制定探索策略，而另一个目标是在图像中定位目标物体。域转移技术分别应用于两个网络，并根据各自的任务控制它们的复杂性

2. 创新点和解决的问题

2.1 创新点

设计了双DNN网络组合的架构，第一个是导航网络，其目标是探索环境并接近目标;第二部分是目标定位网络，目的是识别机器人视野中的指定目标。

2.2 解决的问题

强化学习的方法生成的模型泛化能力不强，面对新环境总是需要重新训练和微调，低效、成本高

3. 设计框架

3.1 整体设计

问题建模

系统输入：视觉信息

系统输出：最短动作序列

环境交互：建模为一个POMDP，在离散的时间步长上与环境交互，找到一个策略π，使得折扣奖励的期望最大化
$V_{\pi}(x)=\mathbb{E}_{\pi}[\sum_{t=0}^{\infin}\gamma^{t}r_t]$
其中 $\gamma \in[0,1)$ 是奖励的折扣系数， $r_t=r(x_t,a_t)$ 是 $t$ 时刻的奖励， $x_t$ 代表 $t$ 时刻的状态， $a_t\sim\pi (\cdot |x_t)$ 是策略函数 $\pi$ 产生的动作。MDP（马尔可夫过程）是部分可观察的，智能体不能获取环境的真实状态 $x_t$ ，智能体只能获取到环境的观测值 $o_t$ 。 $o_t$ 由RGB相机当前帧和目标点图像组成。

网络设计思路

$o_t$ 作为输入输入到处理网络中，处理网络由两个分支网络组成：

目标定位网络

比较两帧图像并定位目标
导航网络

用于学习探索策略以解决复杂的迷宫
注：实验环境基于迷宫，所以这里说是迷宫

输入都由目标定位网络进行处理，输出为在智能体的视野中的相对位置的相对位置向量，将这个向量和当前的RGB帧输入导航网络产生下一个动作。

由于导航任务和目标定位任务的侧重不同，所以在导航任务方面使用轻量级的CNN，而目标定位任务需要更加强的特征提取模型，这样目标定位网络可以通过监督训练的方法离线训练，导航网络可以使用强化学习的方式快速训练。

作者在DRL算法的选择中，使用了IMPALA(Importance Wrighed Actor-Learner Architecture)，此算法被用于同时学习大量复杂的视觉任务。其主要优势有两点：

利用并行CPU计算实现高效的轨迹生成，并利用gpu实现更快的反向计算。
实现了V-trace目标，以取代标准值函数，从而允许样本效率的非策略学习。

关于IMPALA参考【强化学习 44】IMPALA/V-trace - 知乎 (zhihu.com)

3.2 网络架构

能够看出，整体网络由目标定位网络和导航网络组成。

3.2.1 目标定位网络

对于目标在当前智能体视野中的情况考虑为5+1种，示例如下图：

极右
右
中
左
极左
无目标

网络接收两张 $224\times 224$ 的RGB图像作为输入，一个为当前图像帧，另外一个为目标图像帧。

网络结构由ResNet-50网络进行预处理，网络结构在ImageNet上预训练，去掉了最后的两个全连接层，特征提取后，将输出馈送到5个卷积层，每一层的卷积都经过 $3\times 3$ 的卷积核进行步长为1的卷积，通道数分别为512、128、16、16、16。每一层都将RelU作为激活函数，并随后跟一个GroupNorm层。最后使用concat的方式连接两个向量，经过256个隐单元和一个ReLU激活处理，输出为6维的分类结果，对应上述情况。

3.2.2 导航网络

导航网络的主要目标是探索环境，输入为当前视觉RGB帧( $84\times 84$ )以及3.2.1所得到的预测结果作为位置估计。RGB帧输入后经过16个 $8\times 8$ 的滤波器(stride=4)，再经过一层用32个 $4\times 4$ 的滤波器（stride=2）进行处理，处理后经过ReLU激活函数激活和一个GroupNorm层处理，处理后将输出向量与3.2.1节所输出分类向量进行连接（concat），然后通过一个LSTM网络处理，每层有256个隐单元和ReLU激活函数。

在训练结局按CNN提取的特征也会馈送到反卷积层，其设计为CNN的反向过程，用于估计深度信息。

最终的输出是一个三元素的向量，元素值代表了左转、前进、右转的概率，同时还有一个标量值作为未来的折扣奖励。

3.3 训练

3.3.1 目标定位训练阶段

作者将目标定位网络的训练作为了一个相似性度量学习的问题，使用Capture-Level的数据集进行训练，Capture-Level的数据集的样本由三个一组的图像集组成，三元组包括目标的图片、仿真环境中目标可见的图片、仿真环境中目标不可见的图片。这三张 $224\times 224$ 的图片首先通过ResNet-50的网络结构进行预处理，然后输入到三个卷积层，图像三元组损失函数定义：
$l_t=\frac{1}{2}max(0,m+||g-f^+||^2-||g-f^-||^2)$
$m$ 为边界控制常数， $g$ 代表从目标图像中提取的特征， $f^+$ 和 $f^-$ 分别表示目标可见图像与目标不可见图像中提取的特征。 $g$ 与 $f^-$ 、 $f^+$ 两两组合定义为
$r_1=[f^+,g]\\r_2=[f^-,g]$
最后， $r_1$ 和 $r_2$ 分别由最后的两个卷积层和两个全连接层接收处理，产生两个概率向量 $p_1$ 、 $p_2$ 。

向量 $p_1$ 、 $p_2$ 的加权交叉熵损失函数定义为
$\mathscr{l}_l(p_*)=\left\{ \begin{array}{lc} -d\cdot log(p_{*n}),&1\leq n,k\leq5\\ -log(p_{*n}),&n=0\vee k=0 \end{array} \right.$
其中 $d = ∣ n - k ∣$ ， $n$ 代表元素目标的真实位置， $k$ 代表网络中最可能的位置。 $p_{*n}$ 概率向量 $p_1$ 或者 $p_2$ 的第 $n$ 个元素。
$KaTeX parse error: Expected group after '_' at position 21: …g\ \mathop{max}_̲\limits{i}\ p_{…$
综上，总体损失定义为
$\mathscr{l}_{obj}=\mathscr{l}_l(p_1)+\mathscr{l}_l(p_2)$

3.3.2 导航训练阶段

导航训练通过强化学习IMPALA训练。其包括两个实体：

Actor，运行在CPU
Learner，运行在GPU

这两个实体共享网络参数，actor通过与环境交互收集经验轨迹。learner对收集到的经验轨迹进行处理更新网络参数。作者使用16个actor和1个learner。

Actor设计

在学习阶段，导航网络与目标检测网络完全分离。每个IMPALA actor都被放置在不同的迷宫中，对于每个在迷宫中的动作 $a_t$ ，它都会从环境中获得奖励 $r_t$ 和新的观测 $o_t$ 。 $r_t$ 总是0，除非agent到达目标 $r_t$ +1。观测 $o_t$ 由目标位置和当前RGB帧组成，在学习过程中，它们都是由游戏引擎本身生成的。

一旦actor完成预定迭代步数，就将轨迹发送给learner，learner对其进行重新处理以更新网络。

Learner设计

Learner的主要作用是负责损失计算和参数更新，损失 $\mathscr{l}_{obj}$ 与深度估计有关，其与策略函数共享模型参数，为加速性能，计算深度损失时仅取中间 $80\times 40$ 个像素的帧，设预测的深度为 $d_p$ ，虚幻引擎提供的深度为 $d_e$ ，那么损失 $l_d$ 设计为均方误差的形式：
$l_d=\frac{1}{80\times 40}\sum (d_p-d_e)^2$

在得到的图像帧中，上边缘和下边缘一般对应场景中的天花板和地板，不具备实际计算参数更新意义，故而取中间 $80\times 40$ 的像素区域。

为了加速学习的收敛，作者采用了经验重放机制，将轨迹在Actor之间共享，在每次计算的过程中，从经验回放中随机选择两条轨迹经验，与Actor中的当前一个成批并在单个通道中并行处理。

Actor生成轨迹的时间和Learner估计梯度的时间存在滞后性，遵循的策略分别是 $\mu$ （行为策略）和 $\pi$ （目标策略）。策略学习阶段使用off-policy方法，IMPALA为此使用V-trace的目标 $v_t$ ，目标是对Bellman方程的泛化，定义拟合V-trace目标 $v_t$ 的损失：
$l_v=\frac{1}{2}(v_t-V_{\theta}(o_t))^2$
$V_{\theta}$ 是 $\theta$ 参数化的估计值，基于观测 $o_t$ ，损失 $l_p$ 定义为策略 $\pi$ 的相关：
$l_p=\rho_{t}\ log\ \pi_{\theta}(a_t|o_t)(r_t+\gamma v_{t+1}-V_{\theta}(o_t))$
其中 $\rho_{t}=min(\overline{\rho},\frac{\pi(a_t,|x_t)}{\mu(a_t|x_t)})$ 是有下界的重要性采样权值之一，根据重要性采样的性质，其在不同的分布中去产生样本，极端情况下会使得策略彼此偏离，从而导致极高的权重 $\frac{\pi (a_t|x_t)}{\mu(a_t|x_t)}$ ，为了减少梯度估计的方差，在 $\overline{\rho}=1$ 处对权重进行裁剪。

对于off-policy和重要性采样参考强化学习中的奇怪概念(一)——On-policy与off-policy - 知乎 (zhihu.com)

一般 $\pi_{\theta}$ 和 $V_{\theta}$ 的参数 $\theta$ 是不同的，但是作者设计的结构中两者的参数是相同的。action选择熵的奖励损失 $l_c$ 的定义如下，其用于避免过早收敛的问题。 $l_c$ 平衡了探索和利用，能够保证智能体收敛之前充分探索MDP也即马尔可夫过程。
$KaTeX parse error: Expected group after '_' at position 20: …=-\mathop{\sum}_̲\limits{a}\ \pi…$
总体损失的参数更新建模为：
$l_{nav}=l_d+bl_v+l_p+cl_c$
$b$ 为baselin， $c$ 为熵代价，新的权重会传递到actor，从而开启新的轨迹。

3.4 环境

使用UE4图形引擎三维虚拟环境。目的是设计泛化性高、能够推广到现实世界场景的算法。

作者设置了两个关卡：

迷宫关卡：训练导航网络的关卡
捕获关卡：捕获图像并训练目标定位网络的关卡

3.4.1 迷宫关卡

迷宫由自顶而下如下视角的三维模型组成，其包含16个 $3\times 3$ 的迷宫，蓝色球点为actor（来自IMPALA）的放置位置，其目标也被放置。

每当Actor到达目标或者最大步长时，相应的迷宫会进行重新生成，Actor和目标也会重新生成，为了避免过度拟合迷宫和角色到目标路径的特定配置，完全随机地生成迷宫和角色/目标。

环境采用导航与目标定位解耦的方式，在导航网络中使用一个不可见目标。其必须到达目标的唯一方法是遵循UE4自己生成的表征相对位置的UE4 one-hot 6元素向量。

为了使导航网络能够从模拟环境直接转移到真实环境，使用了域随机化的方式，为了使得系统对域变化更加有鲁棒性，在每次一个Actor达到目标时，随机改变以下参数:“迷宫墙高度”、“迷宫墙纹理”、“迷宫地板纹理”、“光线颜色”、“光线强度”、“光源角度”。

依赖于两个完全可分离的组件(即导航和目标识别网络)。因此，导航网络可以更小，大大减少了训练时间，提高了其有效性。同样重要的是要强调，这不会损害定位对象的准确性，因为对象识别网络可以任意复杂

DR参考( CV中，域随机化 (Domain Randomization) 与数据增广有何异同？ - 知乎 (zhihu.com)

Actor的可能动作有三种：向右转”、“向前移动”、“向左转”。为了模拟真实机器人运动的不确定性，Actor运动的速度和角度中注入均匀噪声，由于两个网络的训练是分开进行的，所以导航网络的输入向量不是目标定位网络产生的输入向量，而是由UE4自身产生的输入向量。为了使导航网络对定位网络可能出现的分类错误具有更强的鲁棒性，我们保证由UE4生成的 one-hot 向量有10%的错误概率(在这种情况下，从所有类中统一选取)。

3.4.2 捕获关卡

目标定位网络以监督方式训练。将摄像机放置在固定位置，并在其视野中随机生成物体。每次相机拍照时，当前的对象都会被随机生成的对象替换。对于每个图像，我们从引擎获得每个物体相对于相机的相对位置。我们将位置离散为五类:“极右”、“右”、“中”、“左”和“极左”。然后，我们从网络上下载描绘目标物体的图片，并将它们与两个图像相关联。然后，数据集的每个条目由以下部分组成:目标的图像、目标不存在的捕获、目标存在的捕获以及目标在该捕获中的相对位置。

该数据集统计了9类物体的63万个样本，分别是:“椅子”、“监视器”、“垃圾”、“微波炉”、“瓶子”、“球”、“灯”、“植物”和“罐子”。在模拟器中，对于每个对象，我们使用4到10个不同的网格。

4. 实验

在实验中，我们测试了目标驱动视觉导航系统在不可见环境下的性能。特别地，我们分析了代理探索周围环境和到达指定目标的能力。为此，我们设计了三种测试，将在下面的部分中进行描述。此外，我们提出了一项消融研究，以检验辅助深度估计损失对助剂性能的好处。最后，为了验证算法的泛化能力，我们在一个复杂的真实环境中使用了一个真实的机器人。

4.1 训练相关

训练导航网络

使用无动量的SGD训练具有16个actor的导航网络，训练了7000万步，学习率为0.0005，批处理大小为8。目标定位网络使用合成数据集的前54万个样本进行50次epoch的训练，学习率为0.0025，批大小为128，边际常数m = 0.1。使用另外90000个样本来实现早期停止和选择最佳模型参数。

训练相关开源项目地址isarlab-department-engineering/DRL4TargetDrivenVN: Repository with the code of the paper Towards Generalization in Target-Driven Visual Navigation by Using Deep Reinforcement Learning (github.com)

4.2 仿真实验

为了衡量我们的目标驱动视觉导航系统在未知环境下的性能，设计了三种类型的测试：一种是检查周围环境的探测能力，另外两种是验证它是否能够定位并到达指定的目标。对目标驱动任务的验证是通过将我们的方法与不同策略进行比较来实现的。分别与随机智能体（RA）、目标驱动导航模型（TDNM）与主动对象感知器（AOP）进行比较，TDNM与AOP考虑了其两版的SOTA基线，其区别为是否具备域随机化（DR）。

TDNM参考Target-driven visual navigation in indoor scenes using deep reinforcement learning | IEEE Conference Publication | IEEE Xplore

AOP参考Active Object Perceiver: Recognition-Guided Policy Learning for Object Searching on Mobile Robots | IEEE Conference Publication | IEEE Xplore

对于不具备域随机化的实验，直接评估了TDNM和AOP的性能，在16个3 × 3的迷宫中训练两个模型，但是没有域随机化(即迷宫的配置、纹理、灯光、目标等从训练开始就都是固定的)。根据作者提出的训练协议，对16个迷宫中的每一个都使用了不同的特定层
具备域随机化的实验并不能直接应用，因为上述方法需要特定层，每个场景特定层在单个固定场景中进行训练，每一代的训练，16个迷宫都会发生变化，在整个训练过程中会产生大量的场景特定层，每个场景特定层只会在一集中进行训练，从而阻碍了整个网络的正确学习。

为了考虑平衡和通用，直接使用引擎提供的基础真值边界框为其提供信息，而不是从头开始训练AOP的对象识别网络(包括带DR和不带DR)

探索实验：

将智能体放置在一个20 × 20迷宫的中心，这个迷宫比训练agent的3 × 3迷宫要大得多。我们给它180秒，尽可能多地探索它。一代结束后测量其发现迷宫的百分比。（实际证明当前条件不可能探索整个迷宫）

智能体只有在到达目标(在探索开始时，智能体是未知的)时才会得到积极的奖励。因此，鼓励尽可能快地探索迷宫。这意味着应该避免重访已经检查过的地点，这正是wall-following政策所做的。

wall follower是一种著名的解迷宫算法，特别是对于单连通的迷宫，它是一种保证agent不会迷路，不会走同一条路径两次以上的技术。

使用Grad-CAM++中的可视化显著性图的方法，智能体倾向于对右边的墙体以及边缘区域感兴趣。

参考Grad-CAM++: Generalized Gradient-Based Visual Explanations for Deep Convolutional Networks | IEEE Conference Publication | IEEE Xplore

通过对价值函数的分析，也发现可以转弯的角落和死角的转弯价值函数的表现是不同的，死角处明显急剧下降。

对于不同光照强度的考量，用四个级别的光照强度，对于每个迷宫的光照设置，我们随机选择三个地板和墙壁纹理。对于48种可能的组合中的每一种，我们对3次运行的结果取平均值。在暗框中区分墙壁轮廓的困难。

智能体的得分为蓝色，人类专家的表现得分为红色线，迷宫生成种子:(a) 2， (b) 3， ©， 4， (d) 5。智能体可以在良好的光强值下获得高分。然而，当亮度降低时，性能会迅速下降。在所有图形中可以看到的广泛得分范围是由特定的墙壁纹理引起的，我们的代理产生了较差的性能。每个光强水平对应的分数范围非常大。代理的性能波动很大，对于某些特定的墙壁纹理，它会达到相当低的水平。然而，在同一张图中，我们还可以看到，在其他一些设置中，智能体可以接近人类专家的表现，考虑到它只是在非常小的3 × 3随机迷宫中训练这种效果令人震惊。

RA的影响如下表所示

目标驱动实验

将智能体放置在一个5 × 5的迷宫中，在一个有三个不同物体的房间结束，包括目标。对于智能体来说，这个实验自然分为两个阶段:它首先要探索迷宫以找到房间，然后它必须将目标与其他物体区分开来，定位并接近它。当代理到达目标时(即，当它们碰撞时)或90秒过去时，事件结束。图例中目标是红色椅子。

我们尝试使用用于训练对象定位网络的所有九个不同对象，以及其他三个以前未见过的对象类(“Can”，“Extinguisher”和“Boot”)，平均每个运行六次。为了测量代理性能，使用三个指标:目标到达所需的时间(以秒为单位)、成功率（百分比）、（归一化逆）路径长度（SPL）加权成功率。

SPL定义如下：
$SPL=\frac{1}{N}\mathop{\sum}_{i=1}^{N}S_i\frac{\mathscr{l}_i}{max(p_i,l_i)}$
其中， $N$ 是测试代数， $\mathscr{l}_i$ 是第 $i$ 代的智能体从起点到终点的最短路径长度， $p_i$ 是第 $i$ 代的智能体实际路径长度。

实验结果表明，两个SOTA基线确实存在泛化能力不足的情况，测试环境比训练场景要困难得多，因此一个适当的探索策略对于完成任务至关重要。如果没有这样的策略，就极不可能到达有物体的房间，正如RA结果所证实的那样。

即使SOTA的两个baseline使用领域随机化训练，也不能有效的探索整个迷宫，因为其过度依赖特定的场景层，所以在推广到新场景的问题上会出现之前分析过的特定层过多等问题，单一的复杂架构来同时处理探索和目标识别。因此，它们的优化更加困难，并且更难实现导航功能，这些功能可以在比用于训练的测试场景更广泛和更复杂的测试场景中进行推广。

跟两个baseline相比平均奖励也更高，而且训练时间显著减少，作者的模型大约156小时内完成7000万步的训练，而TDVN和AOP需要超过380小时才能完成大约4000万步的训练(我们决定不再继续下去，因为曲线在数百万步内没有显示出任何改善的迹象)。

目标驱动实验（20 $\times$ 20）

测试迷宫是一个更大的20 × 20迷宫，时间限制增加到300秒。目的是评估目标定位网络和导航网络在距离较长的情况下的协作能力。

可以注意到到达目标所需的时间显着增加，而成功率和SPL都显着降低。迷宫的大小也意味着一个相当低的SPL，对于代理和人类。事实上，虽然从起始位置到目标的最短路径并不是特别长，但智能体/人所覆盖的实际距离可能非常大。

消融实验

作者使用了不具备深度估计辅助信息和具备深度估计辅助信息的两种实验进行对比，研究结果表明，深度估计有助于制定稳健的导航策略。由于主要任务是导航，我们的目标是教它深度的基本概念，产生的图像精度很差。然而，可以清楚地看到，它能够从图像的其余部分区分出正确的墙，我们认为这可能鼓励了跟随墙策略函数的发展。每个图右侧的小图为反卷积图。

4.3 真实实验

作者构建了几个4 × 4的室内和室外迷宫。

用于前两种类型测试的六种迷宫配置。(a) - (d)在第一行中，用灰色的地板描绘了室内的迷宫。(e) - (h)第二行用绿色地板表示的是室外使用的配置。

第三类测试中使用的四种组合。我们总是使用相同的迷宫，我们将机器人(右下角的红色圆圈)和五个可能的物体:“监视器”(Mo)，“垃圾”(T)，“微波炉”(Mi)，“瓶子”(B)和“灯”(L)。我们形成四个组合，每个组合有三个不同的物体:(a) C1， (B) C2， © C3， (d) C4。然后，对于每个组合，我们对每个目标执行一次运行。

(a)同一迷宫在室内的两个不同方向:0°(左)和180°(右)。(b)室外迷宫举例。在这种设置中，背景是完全不同的。特别是，它的特点是存在大量行人，这是智能体在训练过程中从未看到的动态元素。

在真实实验中，采用三种方式进行测试：

机器人和目标都被随机放置在迷宫中，agent的目标是尽可能快地到达目标。当机器人接近目标物或最大步数达到1000步时，运行结束;
机器人被随机放置在迷宫中，它的目标只是尽可能多地探索。在这种情况下，当达到最大1000步数时，一代结束;
机器人被放置在一个简单的迷宫中，与包括目标在内的三个物体一起。本实验的目的是验证agent区分部分遮挡物体、定位目标并接近目标的能力。对于第一种，当机器人到达目标或经过1000步后，运行结束。

作者考虑到所有的迷宫配置、位置、机器人目标定位和测试类型，我们总共运行了84个实验。

所有实验中使用的机器人与训练中使用的角色有着本质上不同的形状，但执行与模拟实验中的智能体相同的动作:“向右转”，“向前移动”，“向左转”。

室内实验效果

机器人在探索了大约一半的迷宫后，平均成功率为46%。作者期望第一次实验的成功率与勘探效果之间有很强的相关性。但结果表明，前者略逊于后者。这可能是由机器人/目标定位引起的。事实上，我们确保代理和目标处于合理的距离，特别是后者被放置在不太可能被探索的区域。

为了验证智能体对背景和光线变化的敏感性，对一个迷宫配置以两种不同的方式将其定向上面的图中有体现，实验结果可以明显看出，算法更倾向于第一个方向。这表明，虽然它可以导航，但它对迷宫周围的环境很敏感。

在第三个实验中，我们考虑一个迷宫配置和五个目标:“监视器”，“垃圾”，“微波炉”，“瓶子”和“灯”。我们制作了四种不同的配置，每种配置三个对象。每一个一代，总共12代。

从表X中报告的结果来看，可以说智能体能够识别并到达75%的对象。值得注意的是，模型从未见过任何真实的物体，即使是我们在实验中使用的物体。有趣的是，每次它被指定为目标时，它都能够接近“微波”，这与模拟中发生的情况相反，它总是失败。在这方面，我们认为使用预训练的ResNet-50起着重要的作用。

室外实验效果

重复第1类和第2类测试，同样在室外迷宫中测量agent的性能。

实验结果结果中可以看出（参考表VIII和IX），第一类测试的性能略有下降。另一方面，智能体的勘探能力实际上保持不变。尽管室内和室外的照明和背景差异很大，但算法的性能是一致的。

5. 主要代码

作者公开代码地址

isarlab-department-engineering/DRL4TargetDrivenVN: Repository with the code of the paper Towards Generalization in Target-Driven Visual Navigation by Using Deep Reinforcement Learning (github.com)

5.1 目标定位网络

class ObjNet(nn.Module):
	def __init__(self):
		super(ObjNet, self).__init__()

		self.resnet = nn.Sequential(*list(models.resnet50(pretrained=True).children())[:-2])
		for p in self.resnet.parameters():
			p.requires_grad = False

		self.conv_1 = nn.Conv2d(in_channels=RESNET_SIZE, out_channels=D1, kernel_size=3, padding=1)
		self.bnc1 = nn.GroupNorm(int(D1 / 2), D1)
		self.conv_2 = nn.Conv2d(in_channels=D1, out_channels=D2, kernel_size=3, padding=1)
		self.bnc2 = nn.GroupNorm(int(D2 / 2), D2)
		self.conv_3 = nn.Conv2d(in_channels=D2, out_channels=D3, kernel_size=3, padding=1)
		self.bnc3 = nn.GroupNorm(int(D3 / 2), D3)

		self.conv_4 = nn.Conv2d(in_channels=D3, out_channels=D3, kernel_size=3, padding=1)
		self.bnc4 = nn.GroupNorm(int(D3 / 2), D3)
		self.conv_5 = nn.Conv2d(in_channels=D3, out_channels=D3, kernel_size=3, padding=0)
		self.bnc5 = nn.GroupNorm(int(D3 / 2), D3)

		self.lin_match = nn.Linear(D3 * 5 * 5 * 2, DL)
		self.match_softmax = nn.Linear(DL, 6)

	def forward(self, x1, goal):

		self.resnet.eval()

		x_ = torch.cat([x1, goal], dim=0)

		x3_r = self.resnet(x_)
		x3_act = self.bnc1(F.relu(self.conv_1(x3_r)))
		x3_act = self.bnc2(F.relu(self.conv_2(x3_act)))
		x3_act = self.bnc3(F.relu(self.conv_3(x3_act)))

		x_1g = x3_act[:x1.shape[0] + goal.shape[0]]
		x_1g = self.bnc4(F.relu(self.conv_4(x_1g)))
		x_1g = self.bnc5(F.relu(self.conv_5(x_1g)))

		x_1 = x_1g[:x1.shape[0]].view(x1.shape[0], D3 * 5 * 5)
		x_g = x_1g[x1.shape[0]:].view(goal.shape[0], D3 * 5 * 5)
		x_1g = torch.cat([x_1, x_g], dim=1)

		x_1g = F.relu(self.lin_match(x_1g))

		vis_match_1g = torch.clamp(F.softmax(self.match_softmax(x_1g), dim=-1), 0.00001, 0.99999)

		return vis_match_1g

	@staticmethod
	def get_weights(layer):
		tot = 0
		for p in layer.parameters():
			tot += p.sum()
		return tot.item()

5.2 导航网络

class Net(nn.Module):
	def __init__(self, a_dim):
		super(Net, self).__init__()

		self.a_dim = a_dim
		self.goal = None

		self.conv1 = nn.Conv2d(in_channels=CHANNELS, out_channels=D1, kernel_size=8, stride=4, padding=0)
		self.bnc1 = torch.nn.GroupNorm(int(D1 / 2), D1)

		self.conv2 = nn.Conv2d(in_channels=D1, out_channels=D2, kernel_size=4, stride=2, padding=0)
		self.bnc2 = torch.nn.GroupNorm(int(D2 / 2), D2)

		self.deconv1 = nn.ConvTranspose2d(in_channels=D2, out_channels=D1, kernel_size=4, stride=2, padding=0)
		self.debnc1 = torch.nn.GroupNorm(int(D1 / 2), D1)

		self.deconv2 = nn.ConvTranspose2d(in_channels=D1, out_channels=1, kernel_size=8, stride=4, padding=0)

		self.lin = nn.Linear(NEW_SIZE * D2 + 5, DL)

		self.lstm = nn.LSTM(DL, DR)

		self.p = nn.Linear(DR, a_dim)
		self.v = nn.Linear(DR, 1)

		self.distribution = torch.distributions.Categorical

	def forward(self, x, hc, vis_match):

		x_84 = F.adaptive_avg_pool2d(x.view(-1, CHANNELS, x.shape[-2], x.shape[-1]), 84)

		x1 = self.bnc1(F.relu(self.conv1(x_84)))

		x2 = self.bnc2(F.relu(self.conv2(x1)))

		x2_ = x2.view(-1, D2 * NEW_SIZE)

		x3 = F.relu(self.lin(torch.cat([x2_, vis_match.view(-1, 5)], dim=1)))

		x4, hc = self.lstm(x3.view(-1, x.shape[-4], DL), hc)

		s0 = x4.shape[0]
		s1 = x4.shape[1]

		x4 = F.relu(x4.view(-1, DR))

		logits = self.p(x4).view(s0, s1, self.a_dim)
		values = self.v(x4).view(s0, s1)

		x1_depth = self.debnc1(F.relu(self.deconv1(x2)))
		x2_depth = F.relu(self.deconv2(x1_depth))
		depth_pred = torch.clamp(x2_depth[:, :, 22:62, 2:82], min=0, max=1)

		return logits.squeeze(), values, hc, depth_pred

	def set_goal(self, goal):
		self.goal = goal

	def choose_action(self, s, hc, vis_match, train=False):
		if not train:
			self.eval()
		logits, values, hc, depth_pred = self.forward(s, hc, vis_match)
		probs = torch.clamp(F.softmax(logits, dim=-1), 0.00001, 0.99999).data
		m = self.distribution(probs)
		action = m.sample().type(torch.IntTensor)

		return action, (hc[0].data, hc[1].data), logits, values, depth_pred

	def choose_action1(self, s, hc, vis_match):
		self.eval()
		logits, values, hc, _ = self.forward(s, hc, vis_match)
		probs = torch.clamp(F.softmax(logits, dim=-1), 0.00001, 0.99999).data
		return torch.argmax(probs, -1), (hc[0].data, hc[1].data), logits, values

	def get_weights(self):
		layers = [self.conv1, self.bnc1, self.conv2, self.bnc2, self.deconv1, self.debnc1, self.deconv2, self.lin_match, self.match_softmax, self.lin, self.lstm, self.p, self.v]
		weigths = []
		for layer in layers:
			tot = 0
			for p in layer.parameters():
				tot += p.sum()
			weigths.append(tot.item())
		return weigths

5.3 Learner

class Learner(mp.Process):
	def __init__(self, g_n, que_i, que_o, n, global_ep, gamma, lr, up_step, length, bs, entropy_cost, baseline_cost):
		super(Learner, self).__init__()
		self.daemon = True
		self.gnet = g_n
		self.queue_i = que_i
		self.queue_o = que_o
		self.n = n
		self.global_ep = global_ep
		self.gamma = gamma
		self.lr = lr
		self.up_step = up_step
		self.length = length
		self.bs = bs
		self.entropy_cost, self.baseline_cost = entropy_cost, baseline_cost

	def run(self):
		count = 0
		n = 0
		if torch.cuda.is_available():
			self.gnet.cuda()
		params = self.gnet.parameters()
		opt = torch.optim.SGD(params, lr=self.lr, momentum=0, weight_decay=0)

		n_iterations = 3

		torch.manual_seed(0)
		torch.cuda.manual_seed(0)
		np.random.seed(0)
		random.seed(0)
		torch.backends.cudnn.deterministic = True

		while True:
			n += self.bs
			opt.zero_grad()
			pl, vl, cl, dl, loss = 0, 0, 0, 0, 0
			for i in range(n_iterations * self.bs):
				rg = self.queue_i.get()
				if rg is None:
					count += 1
					if count == self.n:
						torch.save(self.gnet.state_dict(), 'path_to_model')
						break
				else:
					if torch.cuda.is_available():
						self.gnet.cuda()
						s = rg[0].unsqueeze(1).cuda()
						a = rg[1].unsqueeze(1).type(torch.IntTensor)
						s_ = rg[2].unsqueeze(0).cuda()
						d = torch.tensor(rg[3]).unsqueeze(1).type(torch.FloatTensor)
						h = rg[4][0].cuda()
						c = rg[4][0].cuda()
						r = rg[5].type(torch.FloatTensor)
						r = Learner.clip_rewards(r)
						l = rg[6].unsqueeze(1)
						depth = rg[7].cuda()
						vis_match = rg[8].cuda()
						vis_match_ = rg[9].cuda()
					else:
						s = rg[0].unsqueeze(1)
						a = rg[1].unsqueeze(1).type(torch.IntTensor)
						s_ = rg[2].unsqueeze(0)
						d = torch.tensor(rg[3]).unsqueeze(1).type(torch.FloatTensor)
						h = rg[4][0]
						c = rg[4][0]
						r = rg[5].type(torch.FloatTensor)
						r = Learner.clip_rewards(r)
						l = rg[6].unsqueeze(1)
						depth = rg[7]
						vis_match = rg[8]
						vis_match_ = rg[9]

					self.gnet.train()
					logits, values, (h, c), d_pred = self.gnet(s, (h, c), vis_match)
					logits = logits.view(-1, h.shape[1], logits.shape[-1])
					hc = (h, c)

					self.gnet.eval()
					_, bootstrap_value, _, _ = self.gnet(s_, hc, vis_match_)
					bootstrap_value = bootstrap_value.squeeze().cpu() * (1 - d[-1])

					probs = torch.clamp(F.softmax(logits, dim=-1), 0.000001, 0.999999)
					m = torch.distributions.Categorical(probs)

					discounts = (1 - d) * self.gamma

					vs, pg_advantages = Learner.v_trace(probs.cpu(), l, a, bootstrap_value, values.cpu(), r, discounts)

					p_, v_, c_, l_ = self.get_loss(a, pg_advantages, m, vs, values, probs)

					d_ = (d_pred - depth).pow(2).mean()
					dl += d_

					l_ += d_
					pl += p_
					vl += v_
					cl += c_
					loss += l_

					lr = self.lr
					l_.backward()
					l_.detach_()

					torch.nn.utils.clip_grad_norm_(self.gnet.parameters(), 400)
					grad_norm = 0
					for gp in self.gnet.parameters():
						if gp.grad is not None:
							grad_norm += gp.grad.pow(2).sum()
					grad_norm = math.sqrt(grad_norm)

					if grad_norm != grad_norm:
						opt.zero_grad()
						print('grad_norm nan')

			opt.step()

			loss = loss.cpu() / n_iterations
			vl, pl, cl, dl = vl.cpu() / n_iterations, pl.cpu() / n_iterations, cl.cpu() / n_iterations, dl.cpu() / n_iterations
			loss.detach_(), vl.detach_(), pl.detach_(), cl.detach_(), dl.detach_()

			g = self.gnet.cpu()
			while not self.queue_o.empty():
				try:
					self.queue_o.get(timeout=0.01)
				except:
					pass

			for b in range(self.bs):
				self.queue_o.put([g.state_dict(), loss, vl, pl, cl, dl, grad_norm, lr])

			if n % (10000 * self.bs / self.up_step) == 0:
				torch.save(self.gnet.state_dict(), 'path_to_model')

	@staticmethod
	def v_trace(probs, bl, ba, bootstrap_value, values, br, discounts):

		m = torch.distributions.Categorical(probs)

		clip_rho_threshold = 1
		clip_pg_rho_threshold = 1

		b_probs = torch.clamp(F.softmax(bl, dim=-1), 0.000001, 0.999999)
		b_m = torch.distributions.Categorical(b_probs)

		target_action_log_probs = m.log_prob(ba)
		behaviour_action_log_probs = b_m.log_prob(ba)

		log_rhos = target_action_log_probs - behaviour_action_log_probs
		rhos = torch.exp(log_rhos)
		clipped_rhos = torch.clamp(rhos, 0, clip_rho_threshold)
		clipped_pg_rhos = torch.clamp(rhos, 0, clip_pg_rho_threshold)

		values_t_plus_1 = torch.cat((values[1:], bootstrap_value.unsqueeze(0)))

		deltas = clipped_rhos * (br + discounts * values_t_plus_1 - values)

		acc = 0
		dt = []
		for i in reversed(range(len(deltas))):
			acc = deltas[i] + discounts[i]*clipped_rhos[i]*acc
			dt.append(acc)

		vs_minus_v_xs = torch.stack(dt).flip(0)
		vs = (vs_minus_v_xs + values)

		vs_t_plus_1 = torch.cat((vs[1:], bootstrap_value.unsqueeze(0)))
		pg_advantages = clipped_pg_rhos * (br + discounts * vs_t_plus_1 - values)

		return vs.detach(), pg_advantages.detach()

	def get_loss(self, ba, pg_advantages, m, vs, values, probs):
		if torch.cuda.is_available():
			pl = (-m.log_prob(ba.cuda()) * pg_advantages.cuda()).sum()
			vl = 0.5 * (vs.cuda() - values).pow(2).sum()
		else:
			pl = (-m.log_prob(ba) * pg_advantages).sum()
			vl = 0.5 * (vs - values).pow(2).sum()
		cl = (probs * - torch.log(probs)).sum()
		return pl, vl, cl, pl + self.baseline_cost * vl - self.entropy_cost * cl

	@staticmethod
	def clip_rewards(br):
		squeezed = torch.tanh(br / 5.0)
		squeezed = torch.where(br < 0, .3 * squeezed, squeezed) * 5.
		return squeezed

5.4 Agent

class MyAgent(mp.Process):

	def __init__(self, gnet, idx, global_ep, wins, total_rewards, res_queue, queue, g_que, gamma, up_step, bs, n_actions):
		super(MyAgent, self).__init__()
		self.daemon = True
		self.idx = idx
		self.global_ep, self.res_queue, self.queue, self.g_que, self.gamma, self.up_step, self.wins = global_ep, res_queue, queue, g_que, gamma, up_step, wins
		self.loss, self.vl, self.pl, self.cl, self.dl, self.grad_norm = 0, 0, 0, 0, 0, 0
		self.lnet = copy.deepcopy(gnet)
		self.rewards, self.personal_reward = 0, 0
		self.bs = bs
		self.n_actions = n_actions
		self.total_rewards = total_rewards
		self.lr = 0

	def step(self, reward, image, hc, vis_match):
		with self.total_rewards.get_lock():
			self.total_rewards.value += reward
		with self.global_ep.get_lock():
			self.global_ep.value += 1
		action, hc, logits, _, _ = self.lnet.choose_action(image, hc, vis_match)
		self.rewards += reward
		self.personal_reward += reward
		return action, hc, logits

	def push_and_pull(self, bd, s_, bs, ba, br, hc, bl, b_depth, b_match, vis_match_):
		self.queue.put([torch.cat(bs), torch.tensor(ba), s_, bd, hc, torch.tensor(br).unsqueeze(1), torch.stack(bl), torch.cat(b_depth), torch.stack(b_match), vis_match_])
		g_dict, self.loss, self.vl, self.pl, self.cl, self.dl, self.grad_norm, self.lr = self.g_que.get()
		self.lnet.load_state_dict(g_dict)

	def run(self):

		torch.manual_seed(self.idx)
		torch.cuda.manual_seed(self.idx)
		np.random.seed(self.idx)
		random.seed(self.idx)
		torch.backends.cudnn.deterministic = True

		env = Environment(9734 + self.idx)

		reward = 0
		sample_count = 0
		d = 0
		buffer_a, buffer_r, buffer_l, buffer_d, buffer_obs, buffer_i, buffer_hc, buffer_depth, buffer_match = (), (), (), (), (), (), (), (), ()
		(h, c) = init_hidden()
		hc = (h, c)
		n_step = 0
		obs, depth, vis_match = env.reset()		# RGB image, Depth image, visibility one-hot vector

		for p in self.lnet.parameters():
			p.requires_grad = False

		while self.global_ep.value < 1000000000:
			n_step += 1
			sample_count += 1

			action, hc, logits = self.step(reward, obs, hc, vis_match)
			reward, obs_, depth_, vis_match_ = env.env_step(action)		# reward, RGB image, Depth image, visibility one-hot vector

			if n_step % 900 == 0:
				d = True
				obs_, depth_, vis_match_ = env.reset()		# RGB image, Depth image, visibility one-hot vector

			if len(buffer_obs) < 500:
				buffer_obs += (obs,)
				buffer_depth += (depth,)
				buffer_a += (action,)
				buffer_r += (reward,)
				buffer_match += (vis_match,)
				buffer_l += (logits,)
				buffer_d += (d,)
				buffer_hc += (hc,)
			else:
				buffer_obs = buffer_obs[1:] + (obs,)
				buffer_depth = buffer_depth[1:] + (depth,)
				buffer_match = buffer_match[1:] + (vis_match,)
				buffer_a = buffer_a[1:] + (action,)
				buffer_r = buffer_r[1:] + (reward,)
				buffer_l = buffer_l[1:] + (logits,)
				buffer_d = buffer_d[1:] + (d,)
				buffer_hc = buffer_hc[1:] + (hc,)

			if sample_count == self.up_step or d:
				for _ in range(2):
					if len(buffer_obs) == 100:
						self.queue.put([torch.cat(buffer_obs), torch.tensor(buffer_a), obs_, buffer_d, buffer_hc[-100], torch.tensor(buffer_r).unsqueeze(1), torch.stack(buffer_l), torch.cat(buffer_depth), torch.stack(buffer_match), vis_match_])
					else:
						replay_index = torch.randint(101, len(buffer_obs), (1,))
						self.queue.put([torch.cat(buffer_obs[-replay_index: -replay_index + 100]), torch.tensor(buffer_a[-replay_index: -replay_index + 100]), buffer_obs[-replay_index + 101], buffer_d[-replay_index: -replay_index + 100], buffer_hc[-replay_index], torch.tensor(buffer_r[-replay_index: -replay_index + 100]).unsqueeze(1), torch.stack(buffer_l[-replay_index: -replay_index + 100]), torch.cat(buffer_depth[-replay_index: -replay_index + 100]), torch.stack(buffer_match[-replay_index: -replay_index + 100]), buffer_match[-replay_index + 101]])
				self.push_and_pull(buffer_d[-100:], obs_, buffer_obs[-100:], buffer_a[-100:], buffer_r[-100:], (h, c), buffer_l[-100:], buffer_depth[-100:], buffer_match[-100:], vis_match_)
				sample_count = 0
				if d:
					print('Agent %i, step %i' % (self.idx, n_step))
					self.res_queue.put([self.rewards, self.global_ep.value, self.loss / self.bs, self.vl / self.bs, self.pl / self.bs, self.cl / (self.bs * self.n_actions * self.up_step), self.dl / self.bs, self.grad_norm, self.lnet, self.total_rewards.value, self.wins.value, self.lr, self.personal_reward, self.idx])
					self.rewards, self.personal_reward = 0, 0
					hc = init_hidden()
					d = 0
				(h, c) = hc

			obs = obs_
			vis_match = vis_match_
			depth = depth_

		self.res_queue.put(None)
		self.queue.put(None)
		time.sleep(1)
		env.close_connection()
		print('Agent %i finished after %i steps.' % (self.idx, n_step))

你可能感兴趣的:(科研,深度学习,计算机视觉,人工智能,机器人,强化学习)

自动控制原理研究南风过闲庭 ai 人工智能科技大数据硬件工程自动化
1.1定义与研究对象自动控制理论是研究自动控制共同规律的技术科学。其核心在于利用物理装置或控制算法，在无人直接干预的情况下，对被控对象进行合理的控制，使被控量保持恒定或按照预定规律变化。例如在工业生产中，通过自动控制系统可以精确控制温度、压力、流量等参数，确保生产过程的稳定性和产品质量的一致性。自动控制理论的研究对象涵盖了广泛的领域，包括工业自动化、航空航天、交通运输、机器人技术等。在工业自动化中
【Swift 算法实战】利用 KMP 算法高效求解最短回文串网罗开发 Swift vue.js leetcode 算法
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
大模型学习完整路径（一站式汇总），从零基础到精通！新手友好级指南 Python程序员罗宾学习语言模型知识图谱人工智能数据库 java
如果读者朋友不想深入学习大模型，则了解提示词的使用原则也可以了。要是既不想深入学习，又要做大模型相关的项目，则对于工程同学来说，学习RAG也能把大模型玩转起来。前排提示，文末有大模型AGI-CSDN独家资料包哦！先来一张整体结构图，越是下面部分，越是基础：可以按以下步骤学习：1.理解基础概念需要了解深度学习的基本原理和常见术语，如神经网络、梯度下降、反向传播、监督学习、无监督学习、分类、回归、聚类
基于STM32L4XX、HAL库的DRV91680RGZR 驱动程序设计 July工作室 STM32 外设驱动程序设计 stm32 嵌入式硬件单片机
一、简介：DRV91680RGZR是德州仪器（TexasInstruments,TI）推出的一款高性能、高集成度的三相无刷直流（BLDC）电机驱动芯片。它集成了MOSFET驱动器、电流检测、保护功能和控制逻辑，适用于各种无刷直流电机驱动应用，如家电、工业自动化、机器人、电动工具等。二、主要特性：高集成度：集成了三相MOSFET驱动器、电流检测放大器和保护电路，减少外部元件数量。宽电压范围：工作电压
一文讲清楚 AI Agent（智能体）网络风云人工智能
AIAgent（人工智能代理，一般直接叫做智能体）以各种形态存在于我们生活的方方面面，大家比较熟知的有Siri、小爱同学等虚拟助手，但其实在自动驾驶、教育、娱乐、医疗、科研、智能家居等等到处都有它们的身影。它是能够感知环境、做出决策并执行行动以实现特定目标的智能实体。AIAgent的核心特点是自主性、适应性和交互性，它可以在复杂的环境中独立完成任务，并根据环境变化调整策略。AIAgent广泛应用于
2025年计算机工程与3D技术国际会议（ICCEDT 2025） s_academic 理科会议 3d 计算机网络
2025年计算机工程与3D技术国际会议（ICCEDT2025）2025InternationalConferenceonComputerEngineeringand3DTechnology会议将聚焦计算机工程与3D技术在各个领域的深度融合与创新应用。在主题演讲环节，行业领军人物将分享他们对未来发展的前瞻性见解，探讨如何利用3D技术为计算机工程领域带来新的突破和机遇。如在人工智能与3D技术的结合方面
能力模型迁移：专业教育从「知识掌握度」转向「提示工程能力」由数入道 AI辅助教学提示词工程人工智能
概念：“能力模型迁移：专业教育从「知识掌握度」转向「提示工程能力」”这句话深刻地揭示了在人工智能（AI）技术飞速发展的时代背景下，专业教育领域正在经历一场重要的范式转变。它指出，传统的专业教育模式主要关注学生对知识的掌握程度，例如事实、理论、概念等，并通过考试和评估来衡量。然而，随着以大型语言模型（LLMs）为代表的生成式AI技术的崛起，仅仅掌握知识已经远远不够，提示工程能力逐渐成为更核心、更关键
在 Centos7 上部署 ASP.NET 8.0 + YOLOv11 的踩坑实录桑榆肖物 ASP.NET 运维 asp.net YOLO 后端
本文将详细记录我在CentOS7上部署ASP.NET8.0结合YOLOv11目标检测项目过程中遇到的问题及解决方案，旨在为有类似需求的开发者提供参考。1.背景随着人工智能技术的迅猛发展，目标检测成为了众多应用场景中的核心技术之一。YOLO（YouOnlyLookOnce）系列作为实时目标检测领域的代表，已经发展到了YOLOv11版本。同时，.NET平台也在不断迭代升级，最新版本已发布至.NET9。
安全见闻笔记 freesec 安全笔记
安全见闻包含了网络安全，网络技术，拓展知识面“不识庐山真面目，只缘身在此山中”编程语言:C语言：一种通用的、面向过程的编程语言，广泛应用于系统软件和嵌入式开发。C++：在C语言基础上发展而来，支持面向对象编程，常用于游戏开发、高性能计算等领域。Java：一种广泛使用的面向对象编程语言，具有跨平台性，应用于企业级应用开发等。Python：简洁易学，拥有丰富的库，适用于数据分析、人工智能、Web开发等
使用 Python 和 OpenCV 检测人体皮肤颜色变化计算心率爱搬砖的程序猿. python opencv 开发语言
一、引言心率是反映人体健康状况的重要生理指标之一。传统的心率检测方法通常需要使用专业的医疗设备，如心电图仪、心率带等。而随着计算机视觉技术的发展，我们可以利用摄像头捕捉人体皮肤的颜色变化，通过分析这些变化来计算心率。本文将介绍如何使用Python和OpenCV实现这一功能。二、原理概述当心脏跳动时，血液会在血管中流动，导致皮肤表面的颜色发生微小的变化。这种颜色变化主要体现在皮肤的红色通道上。我们可
基于YOLOv5、FaceNet与KNN的人脸识别系统 reset2021 人脸识别系统 YOLO facenet knn 人脸检测
步骤1：环境配置安装依赖库：安装Python3.x安装TensorFlow、Keras、OpenCV等深度学习库获取数据集：收集训练用的多个人脸图像（每个用户至少几十张）将图像按用户分类存放在data/train/user1,user2等文件夹中步骤2：训练YOLO模型配置YOLO数据集：创建一个data.yaml文件，配置您的数据集路径和标签train:./data/train/images/v
小米、小鹏、蔚来等宣布切入「人形机器人」赛道，车企为什么纷纷下场造机器人？有哪些新机会？日记成书热门实事机器人
车企集体跨界人形机器人赛道的核心逻辑与机遇一、车企“造人”的底层驱动力技术复用与降维打击车企在电动化与智能化领域积累的核心技术（如电机、传感器、AI算法、动力电池等）可直接迁移至人形机器人研发，形成“技术溢出”效应。例如：小鹏Iron的端到端大模型与自动驾驶算法同源，触控反馈技术源自智能座舱交互系统；广汽GoMate的“可变轮足移动结构”基于汽车底盘技术优化，实现高速运动与精细操作；特斯拉Opti
巴西动态IP池：Free Fire多开账号的“零延迟”生存法则 http
当你的五个FreeFire账号同时卡在跳伞界面，不是因为手机性能拉胯，而是圣保罗和里约的IP地址在服务器里挤成了沙丁鱼罐头。本文将拆解如何用巴西动态IP池打造多开账号的“无感网络”，让你在热带雨林战场丝滑收割人头。一、为什么多开账号总变“PPT”？某电竞战队的血泪史：他们用同一组IP管理8个账号，结果决赛圈集体掉线。技术复盘发现两大致命伤：IP轨迹暴露机器人特征：所有账号每天固定时段登录，且IP切
零基础学习Python之保留字_我的学习Python记录3 灏瀚星空人工智能 python 学习经验分享笔记
零基础学习Python之保留字_我的学习Python记录3学习背景在ChatGPT引爆AI革命的今天，Python以"人工智能第一语言"的身份成为技术圈宠儿。作为零基础小白，我决定用CSDN博客记录学习历程，通过输出倒逼输入，与广大网友共同成长！今日重点攻克——Python保留字。一、Python保留字速查表（共35个）以下为Python3.10版本所有保留字及简明释义：保留字释义基础用法示例（新
从嵌入式到 AI：如何从零开始进入人工智能行业嵌入式Jerry AI 人工智能嵌入式硬件物联网 YOLO 数据挖掘
你是否在嵌入式开发中遇到了瓶颈？是否希望结合AI技术提升自己的竞争力？本篇博文将从零开始，详细讲解如何从嵌入式软件工程转向AI，并提供实战建议，让你更顺畅地进入AI领域。1.为什么嵌入式开发者适合进入AI领域？随着人工智能（AI）的快速发展，智能设备、物联网（IoT）、自动驾驶、机器人等领域对AI结合嵌入式系统的需求越来越大。那么，为什么嵌入式开发者适合进入AI领域呢？✅硬件和软件结合能力：嵌入式
Meta官宣Llama3：迄今为止最强大的开源大模型人工智能开源
4月18日，Meta在官方博客官宣了Llama3，标志着人工智能领域迈向了一个重要的飞跃。此版本具有经过预训练和指令微调的语言模型，具有8B(80亿)和70B(700亿)参数，可以支持广泛的用例。Llama3在各种行业基准上展示了最先进的性能，并提供了新功能，包括改进的推理能力。领先的性能新的8B和70B参数Llama3模型是Llama2模型的重大飞跃，为这些规模的LLM模型确立了新的先进水平。得
实现简单的离线人脸识别：C# 结合 OpenCvSharp 和 Emgu CV 墨夶 C#学习资料2 c#开发语言
嘿，小伙伴们！今天我们要一起动手实现一个简单的离线人脸识别系统。想象一下，你的应用程序能够识别用户面部并进行身份验证，是不是超酷的？别急，让我们借助OpenCvSharp和EmguCV这两个强大的计算机视觉库，一步一步实现这一目标！引言在现代应用中，人脸识别技术越来越普及，从智能手机解锁到门禁系统，再到安全监控。然而，许多应用场景需要离线处理以保护隐私和减少延迟。今天，我们将使用C#结合OpenC
[15] 使用Opencv_CUDA 模块实现基本计算机视觉程序明月醉窗台 CUDA -Opencv 计算机视觉 opencv 人工智能图像处理 CUDA
使用Opencv_CUDA模块实现基本计算机视觉程序CUDA提供了出色的接口，发挥GPU的并行计算能力来加速复杂的计算应用程序利用CUDA和Opencv的功能实现计算机视觉应用1.对图像的算术和逻辑运算两个图像相加#include#include"opencv2/opencv.hpp"#include
第G9周：ACGAN理论与实战 OreoCC GAN
>-**本文为[365天深度学习训练营]中的学习记录博客**>-**原作者：[K同学啊]**本人往期文章可查阅：深度学习总结我的环境：语言环境：Python3.11编译器：PyCharm深度学习环境：Pytorchtorch==2.0.0+cu118torchvision==0.18.1+cu118显卡：NVIDIAGeForceGTX1660论文地址：ConditionalImageSynthe
【带你 langchain 双排系列教程】0. 走进大模型与 LangChain 的奇妙世界夜里慢慢行456 双排人工智能 python langchain
文章目录引言大模型的发展历史当前最火热的大模型技术LangChain架构及学习其的重要意义结语引言在当今数字化时代，人工智能技术飞速发展，大模型更是成为了科技领域的热门话题。它们正在改变着我们的生活和工作方式，从智能聊天机器人到自动文本生成，从图像识别到语音助手，大模型的应用无处不在。而LangChain作为构建大模型应用的强大框架，为我们打开了通往这一奇妙世界的大门。本文将带领初学者了解大模型的
【DeepSeek零基础入门】从零开始：如何训练自己的AI模型 Evaporator Core DeepSeek进阶开发与应用 #DeepSeek快速入门 deepseek应用开发实例 deepseek
从零开始：如何训练自己的AI模型在人工智能的世界里，训练一个属于自己的AI模型，就像是在培养一个新生儿。你需要耐心、技巧，以及对数据的深刻理解。今天，我们将一起探索如何从零开始，训练一个AI模型，并通过一个具体的案例来加深理解。第一步：明确目标与选择框架在开始之前，首先要明确你的AI模型需要解决什么问题。是图像识别、自然语言处理，还是预测分析？明确目标后，选择一个合适的机器学习框架至关重要。Ten
智启未来：影刀RPA携手钉钉云文档，重塑企业办公自动化与数字化管理新高度 enter回车键影刀RPA
影刀RPA（RoboticProcessAutomation，机器人流程自动化）与钉钉云文档的配合，能够实现企业办公自动化和数字化管理的提升。以下是影刀RPA与钉钉云文档结合后，可以实现的一些主要功能：自动化数据录入与同步：影刀RPA可以自动从各种数据源（如数据库、Excel文件等）中提取数据，并自动填充到钉钉云文档中，实现数据的快速录入和同步。流程自动化处理：通过影刀RPA，可以自动化处理一些常
DeepSeek 和 Qwen 模型快速部署指南 moton2017 深度学习运维模型部署 DeepSeek Qwen 大型语言模型 LLM 人工智能 AI
导读：DeepSeek-V3&DeepSeek-R1模型对比特性DeepSeek-V3DeepSeek-R1模型大小总参数量6710亿(671B),MoE架构,每个token激活370亿参数总参数量与V3相当,基于DeepSeek-V3-Base,采用类似的MoE架构训练方法包含预训练、监督微调(SFT)和强化学习(RL),使用14.8兆高品质文本进行预训练引入多阶段训练流程,冷启动微调后进行推理
【OpenCV】OpenCV 中各模块及其算子的详细分类 de之梦-御风 OpenCV4Net .net 技术 opencv 分类人工智能
OpenCV的最新版本包含了500多个算子，这些算子覆盖了图像处理、计算机视觉、机器学习、深度学习、视频分析等多个领域。为了方便使用，OpenCV将这些算子分为多个模块，每个模块承担特定的功能。以下是OpenCV中各模块及其算子的详细分类：1.核心模块（Core）功能：提供基础数据结构（如Mat）、数学运算、内存管理、输入输出等基本操作。常用算子：数学运算：cv::add,cv::subtract
RAG+Agent人工智能平台：RAGflow实现GraphRAG知识库问答，打造极致多模态问答与AI编排流体验汀、人工智能 AI Agent LLM工业级落地实践人工智能 ragflow GraphRAG 多智能体 AI Agent 智能编排
RAG+Agent人工智能平台：RAGflow实现GraphRAG知识库问答，打造极致多模态问答与AI编排流体验1.RAGflow简介最近更新：2024-09-13增加知识库问答搜索模式。2024-09-09在Agent中加入医疗问诊模板。2024-08-22支持用RAG技术实现从自然语言到SQL语句的转换。2024-08-02支持GraphRAG启发于graphrag和思维导图。2024-07-
秒杀ChatGPT ？国产之光DeepSeek探究南风过闲庭搜索引擎 ai 科技人工智能大数据 chatgpt
1.DeepSeek公司概况1.1成立背景与发展历程DeepSeek，全称杭州深度求索人工智能基础技术研究有限公司，成立于2023年7月17日，由知名量化资管巨头幻方量化创立。幻方量化为DeepSeek的技术研发提供了强大的硬件支持，使其成为大厂外唯一一家储备万张A100芯片的公司。自成立以来，DeepSeek专注于开发先进的大语言模型（LLM）和相关技术，取得了显著的成果。2023年11月2日，
word流程图两条线的端点连接_word实战技能！技术大神教你如何利用Word来画技术路线图！... weixin_39574287 word流程图两条线的端点连接
大家好，我是爱踢汪，今天要给大家分享如何用Word来画技术路线图。对于科研工作者，实验流程图画的好不好，反映出实验设计思路清晰不清晰。在设计毕业答辩，求职简历PPT时，也可以选择流程图来介绍自己的求学经历，获奖情况等等，避免使用冗长的文字。在申请国自然基金时，清晰的实验技术路线可以让大家对你想要表达的内容一目了然。想不想跟着爱踢汪去了解下呢，废话不多说直接上图。一般的实验流程图的绘制选择Micro
DeepSeek赋能学术论文写作 CodeJourney. 人工智能数据库算法架构
在学术研究领域，论文写作是一项至关重要且复杂的任务，它贯穿了从选题构思到最终答辩的漫长过程，每个环节都需要严谨对待和精心雕琢。随着人工智能技术的飞速发展，大语言模型如DeepSeek为学术论文写作带来了全新的机遇和变革。本文将深入剖析借助DeepSeek完成论文写作各关键环节的方法，详细解读文中提供的16个指令，并探讨其在实际应用中的优势、挑战及未来发展趋势。一、DeepSeek助力学术论文写作的
DeepSeek在MATLAB上的部署与应用 CodeJourney. 数据库人工智能算法架构
在科技飞速发展的当下，人工智能与编程语言的融合不断拓展着创新边界。DeepSeek作为一款备受瞩目的大语言模型，其在自然语言处理领域展现出强大的能力。而MATLAB，作为科学计算和工程领域广泛应用的专业软件，拥有丰富的工具包和高效的算法环境。将DeepSeek部署在MATLAB上，能够充分发挥两者的优势，为众多领域带来全新的解决方案和无限可能。本文将深入探讨如何在MATLAB上部署DeepSeek
DeepSeek混合精度训练核心技术解析与实践指南燃灯工作室 Deepseek 数据挖掘语音识别计算机视觉目标检测机器学习人工智能
1.主题背景1.1Why混合精度训练（价值）混合精度训练通过结合FP16和FP32数据格式，在保证模型精度的前提下实现：40-60%显存占用降低（ResNet50案例：从7.8GB降至4.2GB）1.5-3倍训练速度提升（BERT-Large案例：从8h缩短至5h）突破大模型训练显存瓶颈（GPT-3训练显存需求从3TB降至1.8TB）1.2行业定位属于深度学习基础设施层的训练优化技术，处于模型开发
iOS http封装 374016526 ios 服务器交互 http 网络请求
程序开发避免不了与服务器的交互，这里打包了一个自己写的http交互库。希望可以帮到大家。内置一个basehttp，当我们创建自己的service可以继承实现。 KuroAppBaseHttp *baseHttp = [[KuroAppBaseHttp alloc] init]; [baseHttp setDelegate:self]; [baseHttp
lolcat ：一个在 Linux 终端中输出彩虹特效的命令行工具 brotherlamp linux linux教程 linux视频 linux自学 linux资料
那些相信 Linux 命令行是单调无聊且没有任何乐趣的人们，你们错了，这里有一些有关 Linux 的文章，它们展示着 Linux 是如何的有趣和“淘气” 。在本文中，我将讨论一个名为“lolcat”的小工具 – 它可以在终端中生成彩虹般的颜色。何为 lolcat ? Lolcat 是一个针对 Linux，BSD 和 OSX 平台的工具，它类似于 cat 命令，并为 cat
MongoDB索引管理（1）——[九] eksliang mongodb MongoDB管理索引
转载请出自出处：http://eksliang.iteye.com/blog/2178427 一、概述数据库的索引与书籍的索引类似，有了索引就不需要翻转整本书。数据库的索引跟这个原理一样，首先在索引中找，在索引中找到条目以后，就可以直接跳转到目标文档的位置，从而使查询速度提高几个数据量级。不使用索引的查询称
Informatica参数及变量 18289753290 Informatica 参数变量
下面是本人通俗的理解，如有不对之处，希望指正 info参数的设置：在info中用到的参数都在server的专门的配置文件中（最好以parma）结尾下面的GLOBAl就是全局的，$开头的是系统级变量，$$开头的变量是自定义变量。如果是在session中或者mapping中用到的变量就是局部变量，那就把global换成对应的session或者mapping名字。 [GLOBAL] $Par
python 解析unicode字符串为utf8编码字符串酷的飞上天空 unicode
php返回的json字符串如果包含中文，则会被转换成\uxx格式的unicode编码字符串返回。在浏览器中能正常识别这种编码，但是后台程序却不能识别，直接输出显示的是\uxx的字符，并未进行转码。转换方式如下 >>> import json >>> q = '{"text":"\u4
Hibernate的总结永夜-极光 Hibernate
1.hibernate的作用,简化对数据库的编码,使开发人员不必再与复杂的sql语句打交道做项目大部分都需要用JAVA来链接数据库，比如你要做一个会员注册的页面，那么获取到用户填写的基本信后，你要把这些基本信息存入数据库对应的表中，不用hibernate还有mybatis之类的框架，都不用的话就得用JDBC，也就是JAVA自己的，用这个东西你要写很多的代码，比如保存注册信
SyntaxError: Non-UTF-8 code starting with '\xc4' 随便小屋 python
刚开始看一下Python语言，传说听强大的，但我感觉还是没Java强吧！写Hello World的时候就遇到一个问题，在Eclipse中写的，代码如下 ''' Created on 2014年10月27日 @author: Logic ''' print("Hello World!"); 运行结果 SyntaxError: Non-UTF-8
学会敬酒礼仪不做酒席菜鸟 aijuans 菜鸟
俗话说，酒是越喝越厚，但在酒桌上也有很多学问讲究，以下总结了一些酒桌上的你不得不注意的小细节。细节一：领导相互喝完才轮到自己敬酒。敬酒一定要站起来，双手举杯。细节二：可以多人敬一人，决不可一人敬多人，除非你是领导。细节三：自己敬别人，如果不碰杯，自己喝多少可视乎情况而定，比如对方酒量，对方喝酒态度，切不可比对方喝得少，要知道是自己敬人。细节四：自己敬别人，如果碰杯，一
《创新者的基因》读书笔记 aoyouzi 读书笔记《创新者的基因》
创新者的基因创新者的“基因”，即最具创意的企业家具备的五种“发现技能”：联想，观察，实验，发问，建立人脉。第一部分破坏性创新，从你开始第一章破坏性创新者的基因如何获得启示：发现以下的因素起到了催化剂的作用：(1) -个挑战现状的问题；(2)对某项技术、某个公司或顾客的观察；(3) -次尝试新鲜事物的经验或实验；(4)与某人进行了一次交谈，为他点醒
表单验证技术百合不是茶 JavaScript DOM对象 String对象事件
js最主要的功能就是验证表单,下面是我对表单验证的一些理解,贴出来与大家交流交流 ,数显我们要知道表单验证需要的技术点, String对象,事件,函数一:String对象;通常是对字符串的操作; 1,String的属性; 字符串.length;表示该字符串的长度; var str= "java"
web.xml配置详解之context-param bijian1013 java servlet web.xml context-param
一.格式定义： <context-param> <param-name>contextConfigLocation</param-name> <param-value>contextConfigLocationValue></param-value> </context-param> 作用：该元
Web系统常见编码漏洞（开发工程师知晓） Bill_chen sql PHP Web fckeditor 脚本
1.头号大敌：SQL Injection 原因：程序中对用户输入检查不严格，用户可以提交一段数据库查询代码，根据程序返回的结果，获得某些他想得知的数据，这就是所谓的SQL Injection，即SQL注入。本质: 对于输入检查不充分，导致SQL语句将用户提交的非法数据当作语句的一部分来执行。示例： String query = "SELECT id FROM users
【MongoDB学习笔记六】MongoDB修改器 bit1129 mongodb
本文首先介绍下MongoDB的基本的增删改查操作，然后，详细介绍MongoDB提供的修改器，以完成各种各样的文档更新操作 MongoDB的主要操作 show dbs 显示当前用户能看到哪些数据库 use foobar 将数据库切换到foobar show collections 显示当前数据库有哪些集合 db.people.update，update不带参数，可
提高职业素养，做好人生规划白糖_ 人生
培训讲师是成都著名的企业培训讲师，他在讲课中提出的一些观点很新颖，在此我收录了一些分享一下。注：讲师的观点不代表本人的观点，这些东西大家自己揣摩。 1、什么是职业规划：职业规划并不完全代表你到什么阶段要当什么官要拿多少钱，这些都只是梦想。职业规划是清楚的认识自己现在缺什么，这个阶段该学习什么，下个阶段缺什么，又应该怎么去规划学习，这样才算是规划。
国外的网站你都到哪边看？ bozch 技术网站国外
学习软件开发技术，如果没有什么英文基础，最好还是看国内的一些技术网站，例如：开源OSchina，csdn，iteye,51cto等等。个人感觉如果英语基础能力不错的话，可以浏览国外的网站来进行软件技术基础的学习，例如java开发中常用的到的网站有apache.org 里面有apache的很多Projects,springframework.org是spring相关的项目网站,还有几个感觉不错的
编程之美-光影切割问题 bylijinnan 编程之美
package a; public class DisorderCount { /**《编程之美》“光影切割问题” * 主要是两个问题： * 1.数学公式（设定没有三条以上的直线交于同一点）： * 两条直线最多一个交点，将平面分成了4个区域； * 三条直线最多三个交点，将平面分成了7个区域； * 可以推出：N条直线 M个交点，区域数为N+M+1。
关于Web跨站执行脚本概念 chenbowen00 Web 安全跨站执行脚本
跨站脚本攻击(XSS)是web应用程序中最危险和最常见的安全漏洞之一。安全研究人员发现这个漏洞在最受欢迎的网站,包括谷歌、Facebook、亚马逊、PayPal,和许多其他网站。如果你看看bug赏金计划,大多数报告的问题属于 XSS。为了防止跨站脚本攻击,浏览器也有自己的过滤器,但安全研究人员总是想方设法绕过这些过滤器。这个漏洞是通常用于执行cookie窃取、恶意软件传播,会话劫持,恶意重定向。在
[开源项目与投资]投资开源项目之前需要统计该项目已有的用户数 comsci 开源项目
现在国内和国外,特别是美国那边,突然出现很多开源项目,但是这些项目的用户有多少,有多少忠诚的粉丝,对于投资者来讲,完全是一个未知数,那么要投资开源项目,我们投资者必须准确无误的知道该项目的全部情况,包括项目发起人的情况,项目的维持时间..项目的技术水平,项目的参与者的势力,项目投入产出的效益.....
oracle alert log file（告警日志文件） daizj oracle 告警日志文件 alert log file
The alert log is a chronological log of messages and errors, and includes the following items: All internal errors (ORA-00600), block corruption errors (ORA-01578), and deadlock errors (ORA-00060)
关于 CAS SSO 文章声明 denger SSO
由于几年前写了几篇 CAS 系列的文章，之后陆续有人参照文章去实现，可都遇到了各种问题，同时经常或多或少的收到不少人的求助。现在这时特此说明几点： 1. 那些文章发表于好几年前了，CAS 已经更新几个很多版本了，由于近年已经没有做该领域方面的事情，所有文章也没有持续更新。 2. 文章只是提供思路，尽管 CAS 版本已经发生变化，但原理和流程仍然一致。最重要的是明白原理，然后
初二上学期难记单词 dcj3sjt126com english word
lesson 课 traffic 交通 matter 要紧；事物 happy 快乐的，幸福的 second 第二的 idea 主意；想法；意见 mean 意味着 important 重要的，重大的 never 从来，决不 afraid 害怕的 fifth 第五的 hometown 故乡，家乡 discuss 讨论；议论 east 东方的 agree 同意；赞成 bo
uicollectionview 纯代码布局, 添加头部视图 dcj3sjt126com Collection
#import <UIKit/UIKit.h> @interface myHeadView : UICollectionReusableView { UILabel *TitleLable; } -(void)setTextTitle; @end #import "myHeadView.h" @implementation m
N 位随机数字串的 JAVA 生成实现 FX夜归人 java Math 随机数 Random
/** * 功能描述随机数工具类<br /> * @author FengXueYeGuiRen * 创建时间 2014-7-25<br /> */ public class RandomUtil { // 随机数生成器 private static java.util.Random random = new java.util.R
Ehcache（09）——缓存Web页面 234390216 ehcache 页面缓存
页面缓存目录 1 SimplePageCachingFilter 1.1 calculateKey 1.2 可配置的初始化参数 1.2.1 cach
spring中少用的注解@primary解析 jackyrong primary
这次看下spring中少见的注解@primary注解，例子 @Component public class MetalSinger implements Singer{ @Override public String sing(String lyrics) { return "I am singing with DIO voice
Java几款性能分析工具的对比 lbwahoo java
Java几款性能分析工具的对比摘自：http://my.oschina.net/liux/blog/51800 在给客户的应用程序维护的过程中，我注意到在高负载下的一些性能问题。理论上，增加对应用程序的负载会使性能等比率的下降。然而，我认为性能下降的比率远远高于负载的增加。我也发现，性能可以通过改变应用程序的逻辑来提升，甚至达到极限。为了更详细的了解这一点，我们需要做一些性能
JVM参数配置大全 nickys jvm 应用服务器
JVM参数配置大全 /usr/local/jdk/bin/java -Dresin.home=/usr/local/resin -server -Xms1800M -Xmx1800M -Xmn300M -Xss512K -XX:PermSize=300M -XX:MaxPermSize=300M -XX:SurvivorRatio=8 -XX:MaxTenuringThreshold=5 -
搭建 CentOS 6 服务器(14) - squid、Varnish rensanning varnish
（一）squid 安装 # yum install httpd-tools -y # htpasswd -c -b /etc/squid/passwords squiduser 123456 # yum install squid -y 设置 # cp /etc/squid/squid.conf /etc/squid/squid.conf.bak # vi /etc/
Spring缓存注解@Cache使用 tom_seed spring
参考资料 http://www.ibm.com/developerworks/cn/opensource/os-cn-spring-cache/ http://swiftlet.net/archives/774 缓存注解有以下三个： @Cacheable @CacheEvict @CachePut
dom4j解析XML时出现"java.lang.noclassdeffounderror: org/jaxen/jaxenexception"错误 xp9802
java.lang.NoClassDefFoundError: org/jaxen/JaxenExc 关键字: java.lang.noclassdeffounderror: org/jaxen/jaxenexception 使用dom4j解析XML时，要快速获取某个节点的数据，使用XPath是个不错的方法，dom4j的快速手册里也建议使用这种方式执行时却抛出以下异常： Exceptio