逯小蓝

考虑实时安全优化的自学习自适应交通信号控制

文章简介
1.文章标题
Self-learning adaptive traffic signal control for real-time safety optimization
2.所属期刊
Accident Analysis and Prevention （业内简称AAP，SSCI 一区，交通安全领域大牛级期刊）
3.文章作者
Mohamed Essa和Tarek Sayed（https://publons.com/researcher/4099489/tarek-sayed/publications/）
4.作者单位
英属哥伦比亚大学（QS 47 2019）
文章结构

本文的摘要非常经典，层次和逻辑十分清晰。作者在背景介绍中用了大量笔墨来引出创新点，而创新点则用一句话总结概括。而后介绍了使用算法，验证过程和验证数据，这三个要素。结果部分展示了关键数据，这些数据为总体数据，一眼能看到算法对交叉口的优化效果，而不是一些推断性的数据，比如下文提出的冲突率。

引言部分能看出作者的功力，本文第一段介绍了大方向，这一方向与摘要开头呼应。并指出现有研究的贡献，然后再第二段，接着前一段的贡献来说其不足。第三段的递进是在问题1的基础上，推导的更深层次的问题，这也是本文主要要做的内容，为下文埋下了伏笔。如果只介绍问题1，那只能让问题流于表面，由问题1引入问题2让整个逻辑清晰，给人以思考。
说完了自己要做什么，作者在第四段介绍了创新点。其中第一句话承上启下，强调安全是重要的但是被研究人员忽略，并指出原因。这个原因才是作者的工作。一句话概括了上文所提的两个问题。然后，作者找到了现有的关于安全的研究，并在这一段落脚在这些模型可以作为研究的策略。
内容简介部分，第一句话，本文提出了什么。然后分几点介绍闪光点，最后一点的帽子，与摘要呼应。
至此，摘要的两个帽子在引言中都被提及。

先前工作其实是对引言的扩充，我认为和引言合在一起写也可以。

算法设计部分，作者在开头分别用一句话来描述各个部分。而后由安全模型——强化学习——Q学习引出文章内容。层层递进，由大到小，本部分讲的都是干货，算法设计逻辑严谨。

本文的数据验证部分其实就是结果与讨论。结果部分介绍对比了安全性和效率，讨论部分主要考虑渗透率。

重点词汇
accommodate 适应
vehicle throughput 车辆吞吐量
traffic mobility 交通机动性（我个人认为是交通运行效率）
shock wave characteristics 车流波特性
primary objective 重要目标（我觉得初始目标更合适）
offset 相位差
crash-free 无碰撞
near-misses 未遂事故
Rather 更准确的说
the intersection clearance time 交叉口清尾时间
bidirectional 双向的
elaborated 精雕细琢的
transferability 可移植性
iteratively 迭代
paradigm 范式
infinite 无限的
generalization 一般化
discretize 离散化
domain 域
convergence 收敛
perform 执行
penalty 惩罚
reciprocal 倒数
assumes 认为
through lanes 直行车道
virtually 差不多
varying 不同的
loop detectors 地感线圈
left-turn bay 左转弯展宽段
account for 原因，理由
correspond to 符合
feasible 可行的
benchmark 基准
traffic composition 交通构成
inspection 检测
precisely 准确地
filtered 过滤
diagram 图
aforementioned 前述
deteriorate 恶化
deployed 部署
the transition period 过渡期
predates 提早

重点句型
However, recent research has developed various real-time safety models for signalized intersections.（开发模型或算法用developed）
Evaluating safety in real time can enable developing ATSC strategies for real-time safety optimization.
The algorithm was developed using the Reinforcement Learning (RL) approach and was trained using the simulation platform VISSIM.（用VISSIM仿真放在句尾可以扩充句子，显得高档）
The trained algorithm was then validated using real-world traffic data obtained from two signalized intersections in the city of Surrey, British Columbia.（还是using用的好）
The results showed that 90 % and 50 % of the algorithm’s safety benefits can be achieved at MPR values of 50 % and 30 %, respectively.（介绍结果）
However, despite the aforementioned mobility benefits, the safety impact of the existing ATSC algorithms remains unclear.（过渡句）
The SSAM results can vary significantly depending on the assumed values of the simulation model parameters and the approach used in modelling.（什么什么受什么的限制）
Unrealistic crashes and unusual movements are often recorded in traffic simulations, most likely due to an insufficient minimum gap size, a failure to yield to a priority rule, an abrupt lane change of a vehicle, or an irregular queuing up at left/right turn bay tapers.（原因）
The algorithm is referred to as RS-ATSC (Real-time Safety-optimized Adaptive Traffic Signal Control). (给自己的算法命名）
Some algorithms, however, optimize both the traffic signal timing and vehicle trajectories, assuming a specific percentage of autonomous vehicles and bidirectional V2I communications.
RL is an area of machine learning that has widely been applied in the literature for self-learning ATSC algorithms (括号里就可以写一些参考文献啦)
In other words, RL is a goal-directed learning, in which, the agent learns how to map states and actions to achieve a specific goal.（map是映射）
The minimum conflict rate was set to zero. （设置参数为0）
The simulation was run for 420 episodes. （关于运行算法的表述）
Compared to pre-timed signal controllers, actuated signal controllers can better accommodate widely fluctuating volumes, decrease delays, reduce driver frustration and red-light running, and improve safety.
Thus, in this study, the actuated signal controller (i.e., the state-of-art controller) was used as a benchmark to validate the performance of the proposed RS-ATSC algorithm.
Lastly, the estimated cycle-related parameters were inputted into a real-time safety model (i.e., model 6 in Table 1) to predict the number of rear-end conflicts at the cycle level.（周期级）
The conflict rate (conflict/second) was then estimated by dividing the number of conflicts at each cycle by the cycle length. Figs. 7 and 8 show the real-time variation of the conflict rate for each approach at the first and the second intersection, respectively.（实时变化）
The proposed algorithm also improved the operational performance of the analyzed intersections.（运行表现）
The number of stops, the maximum queue length, and the 95th percentile of queue length were also reduced by 47 %, 23 %, and 51 % at the first intersection; and by 27 %, 17 %, and 28 % at the second intersection, respectively.（结果）
In other words, the algorithm optimizes safety without deteriorating mobility.
The estimated traffic volume per cycle per lane (V) was corrected (multiplied by a magnification factor) before be inputted in the real-time safety model.（修正）
However, it should be noted that 90 % of these benefits can be achieved when the MPR is 50 %.（值得注意的是）
On the other hand, the results of the average delay time (Fig. 12) emphasize that the RSATSC algorithm has a positive mobility impact.（强调积极影响）

有意思的结论

For example, an ATSC algorithm might tend to minimize the total delay by generating many stops, each with a short duration.
这个可以作为一个伏笔。停车次数多了，延误反倒小了。（也就是说，我要用停车次数来验证一下延误减少的原因，到底是不是因为增加停车次数）
However, it is generally recommended to prohibit ATSC systems from changing the phase sequence (NCHRP, 2015) for several safety and mobility concerns.
出于安全考虑，不应该改变相位。（动态相位不可取，会让驾驶人困惑）
Furthermore, having only two possible actions in the fixed phasing sequence.
只有两个动作，要么延长单位绿灯时间，要么转换相位。
A typical value of 70 s is assumed for the maximum green time.（最大绿灯时间是假设的）

文章翻译
摘要：自适应交通信号控制（ATSC）是一项有前景的提高交叉口信号控制效率的技术。尤其是在能够获取车辆位置和轨迹实时信息的车联网（CVs）时代。大量的ATSC算法被提出来适应实时交通条件和优化交通效率。这些算法共同的目标是减少总延误、排队长度或者最大化车辆吞吐量。尽管这些算法积极地影响着交通流量，但是现存的ATSC算法并没有考虑优化交通安全。这很可能是因为缺少实时估计安全性的工具。然而，近期的研究提出了很多信号交叉口的实时安全模型。这些模型可以根据动态交通参数来估计实时安全性，比如交通量，车流波特征和排比率。实时估计安全性可以完善ATSC算法来优化实时的安全性。本文中，我们提出一种新的自学习ATSC算法来优化信号交叉口的安全性。本算法采用强化学习方法并通过VISSIM仿真平台进行训练。而后，用加拿大两个交叉口的真是数据来验证训练后的算法。与传统的感应式控制系统相比，交通冲突减少了近40%。并且，用各种不同的CVs的渗透率来验证该算法。结果显示，在50%和30%的渗透率下，安全性分别提高了50%和30%。据作者所知，这是第一次将自学习ATSC算法用于实时交通安全优化。
关键词：自适应信号控制，实时安全性优化，车联网，强化学习，交通仿真，实时安全模型
1.引言
近年来，学者们对交通信号的实时优化研究兴趣浓厚，尤其是对从新兴技术中获取的实时交通数据，如车联网和创新的视频检测技术。近十年，自适应交通信号控制系统（ATSC）已经取得了相当的进展。已经开发并应用了大量的ATSC算法。这些算法的共同目标是适应实时交通情况并且通过最大化通行能力，最小化延误，或者减少排队长度来优化交通效率。在信号交叉口中，与传统的固定配时和感应配时相比，ATSC在提升交通效率方面展现了明显的提升。
然而，尽管存在着上述机动性的优势，但是现存的ATSC算法的安全性影响并不清晰。一些研究显示，基于机动性的ATSC算法可以提高安全性并且明显的减少交通碰撞或交通冲突。同时，一些研究发现应用ATSC算法既不能减少交通碰撞，也不能提升交通冲突并使交通完全更差。这种在现存ATSC算法的安全影响的矛盾是因为其并没有把优化交通安全作为初始目标。更重要的是，优化机动性并不意味着优化安全性。例如，某种ATSC算法可能是通过产生许多短时停车来最小化总延误。通过这种算法提高机动性，产生的许多停车会增加潜在的碰撞风险，并恶化安全性。
一些研究尝试用交通仿真和SSAM来优化信号交叉口的交通安全。安全优化过程包括调整各种信号配时参数（周期长度，相位差和相位间隔时间等）来最小化交通冲突数。离线测试多个信号设计及其相应使用SSAM评估安全水平。然而，这些研究中的优化算法并没有自学习ATSC算法那么有效。他们并没有能够理解响应实时交通改变和考虑所有可能的交通条件。此外，用SSAM来估计交通安全已经受到了如下几点批评。1、仿真模型中的车辆跟驰规则的目的是建立各个无碰撞的环境。用这些安全移动的车辆去估计冲突和未遂的事故会产生不精确的结果。2，SSAM的结果随仿真模型参数值和模型方法的变化而改变。3，交通仿真中经常记录了不切实际的碰撞和非常规的运动，这些有可能是因为不足的最小间距，服从于优先规则，突然变道的车辆或是在左/右转弯时不规则的队列。
尽管实时安全优化是重要的，但是却在现存的ATSC算法中被忽略，这可能是因为缺乏实时估计信号交叉口安全的工具。与车辆延误和旅行时间不同，信号交叉口的安全级别不能直接从实时交通数据中估计出来。然而，近年来开发和证实了各种各样的信号交叉口实时安全模型。这些研究模型的交通冲突数和碰撞风险与各种动态短时交通参数相关（例如，几秒）。动态交通参数包括交通量，波动区域，波动速度，排队长度和队列比。这些模型可以用来估计实时安全；而后，他们可以开发出为了优化实时安全的ATSC策略。
本文提出了一种新的自适应交通信号控制算法来通过车联网数据优化实时安全。该算法被称为RS-ATSC（实时安全优化自适应交通信号控制）。该算法有如下几点优势。1，安全估计不是基于不能很好代表实地冲突和碰撞的仿真。更准确地说，优化基于实时交通数据开发和验证的实时安全模型。2，该算法基于强化学习技术作为一个高效的方法来解决考虑实时和随机交通改变的ATSC问题。3，该算法是特别的，因为它包含了所有交通运行标准，包括相位顺序，最小/最大绿灯时间，交叉口清尾时间。4，算法通过两个信号交叉口的实时交通数据进行验证。5，算法在低渗透率的情况下是高效和可行的。6，据作者所知，这是首次用自学习ATSC算法来实时优化交通安全（安全评价和优化在一个非常短的时间段，几秒钟）。
2.先前工作
2.1． ATSC算法的应用
过去几十年，ATSC算法已经在全球范围内使用。最早的两种算法是SCATS和SCOOT。随后，FHWA自适应控制系统被开发和使用，包括OPAC，RHODES，和，更近的，ACS Lite。这些算法在运行上是不同的，但是他们都以最大化通行能力和最小化延误为目标来适应当前的交通需求。然而，这些ATSC系统存在着一些限制，比如同时处理几个交叉口，集中控制系统，依赖地感线圈来检测和估计。更重要的是，这些系统没有考虑将优化交通安全作为目标。
2.2 使用车联网数据的交通信号控制算法
随着车联网技术的发展，越来越多的交通信号控制算法被提出来使用车联网实时数据优化交通效率。例如，一些研究提出各种各样的算法假设所有车辆都是联网和无人驾驶的并通过无信号控制来优化和协调交叉口道路上的交通流向。更实际的，其他一些研究假设各种车联网渗透率来开发和测试ATSC算法。已经开发的算法普遍以最小化总延误为目标。一些研究也考虑多目标，如最小化总延误和停车数，或最小化总延误和排队长度。大多数现存算法基于实时车辆信息来优化交通信号配时，这些算法假设单向车辆路边设备协同（V2I）。一些算法假设特定比例的自动驾驶和双向V2I来优化交通信号配时和车辆轨迹。之前大量的研究主要关注于适应交通信号来提高机动性，有限数量的研究考虑优化交通信号来减少交通排放和燃料消费。另一方面，优化交通安全被普遍忽视。更系统详细的城市交通信号控制车联网实时数据的研究综述见Guo等人。
2.3 自学习ATSC算法
自学习ATSC算法是一种依赖于学习于交通环境直接交互的控制政策的新兴方法。它不需要对环境提前预设模型或人工干预。很多研究都以使用实时数据来提高交通效率和优化机动性为目的去设计自学习ATSC算法。在开发自学习ATSC算法的文献中，强化学习看起来是最具吸引力的。一些强化学习方法已经被应用了，包括基于Q学习的模型，Q学习，SARSA，多强化学习，和最近的深度q网络（DQN）。优化机动性时，各种各样的目标被考虑进去，如最小化排队长度，最小化旅行时间，最小化总延误，最大化通行能力。
尽管这些基于强化学习的ATSC算法在交通机动性上展现了明显的进步，但是他们没考虑评估和优化交通安全。这些研究的安全评估被限制于仿真车辆间避免碰撞，在标准的信号时间条件下，运行的同时禁止冲突信号相位。
2.4 信号交叉口实时安全评价
信号交叉口的安全常常被评估为以年交通碰撞量和交叉口的几何特征相关的总体级别。然而，对于很多安全问题来说，了解交通参数的实时改变和信号控制是如何影响安全的是非常重要的。因此，一些研究考虑了信号交叉口和城市主干路的实时安全分析。这些研究大部分研究了在一小时之内（通常是5到15分钟）的潜在碰撞风险和实时交通，天气特点的关系。尽管这个时间段已经比传统的安全表现公式需要的时间短了，但是以5分钟为间隔评估安全也是不能捕捉到交通条件实时变化和信号配时对安全的影响的。很多近期研究考虑在小于5分钟的时间里评估交通安全。具体而言，是以信号周期时长为单位。一些实时安全模型的开发是将交通冲突数或碰撞风险和各种动态交通特征如交通量，车流波特征，队列率等联系起来考虑的。
6. RS-ATSC算法
本节包括RS-ATSC算法的设计方法。1，描述实时安全模型。2，介绍强化学习技术的概述和选择解决强化学习问题的方法。3，给出了RS-ATSC的强化学习问题的表达式。本节包括了state，action和reward的定义；学习和折扣率；勘探和开发之间的权衡。4，介绍了模型环境的细节和算法的训练。
3.1 实时安全模型
本文中，RS-ATSC算法基于Essa提出的实时安全模型。这些模型将各种动态交通参数与信号周期长度级别的追尾冲突联系起来。以TTC作为交通冲突的指标。交通参数包括交通量（V），波动区（A），车流波速度（S12），排队长度（Q）和队列率（P）。该模型基于几个信号交叉口的实际交通数据开发。模型具有很好的拟合性并且所有的解释变量具有统计学意义。值得注意的是，这些模型被进一步证明并且后续的研究也证明了其具有可移植性。
3.2 强化学习
强化学习技术被用来开发RS-ATSC算法。强化学习是机器学习的一种，被广泛的应用于自学习ATSC算法。在强化学习中，智能体或决策者与周围环境（交通网络）动态交互。智能体迭代观察环境的状态并选择与之协调的动作（决定哪个相位变成绿灯），从中获得回报或估计的反馈。与监督学习的范式不同，强化学习的智能体并没有被告知选择哪个动作。随着时间的推移，它学习并发现哪个动作可以获得最大的回报。换言之，强化学习是一种目标导向的学习，智能体学习如何映射状态和动作来达到特殊的目的（如最大化总累积回报）。状态和动作的映射被称之为控制策略。智能体通过迭代来尝试学习最优的控制策略。还需要注意的是动作不只是影响既得回报，还影响下一个状态后未来的回报。因此，强化学习有2个特点：试错搜索和延迟回报。
3.3 Q学习
求解强化学习问题需要计算优化控制策略。然而，需要注意的是从强化学习的理论定义来表达优化控制策略。实际上，在所有情况下的优化解释不存在的，并且优化情况是不能被定义的。因此，本研究中控制策略是优化的，但是不一定是最优的。
有大量的方法来求解强化学习问题。总的来说，强化学习方法可以分成三大类：动态规划方法，蒙特卡洛技术和时差学习法。大多数与ATSC相关的算法都是用的时差学习法。时差学习法比动态规划法多了一个优势。与动态规划法不同，时差法不需要环境动态模型。智能体直接与环境交互学习。时差法也比蒙特卡洛法多了一个优势。蒙特卡洛法需要等到一个场景结束后才能寻找回报，而时差法只需要等一个时间步长。
时差法有很多种，包括SARSA法，Q学习法，和n步差分学习法。一项研究比较了这些算法在解决ATSC问题的表现。结果显示SARSA和Q学习得到了相同的结果而且比n步差法表现得好。这些表现可能是由ATSC算法的属性造成的。ATSC算法的控制任务是一种连续的折扣回报任务，它认为远期的步骤没有近期的不打折的回报重要。大量研究用q学习法成功地解决了ATSC问题。因此，本研究选择该方法来开发所提出的RS-ATSC算法。
Q学习是一种无策略时差法，它用每一个状态转换的经验来更新Q表中的一个元素。Q表是一个矩阵，它的每一行代表着具体的状态，每一列代表着具体的动作。矩阵中的每个元素代表不同状态-动作组合的Q值。总的来说，Q值是用来比较各种某一特殊转态下的动作。考虑到特殊状态（特殊行），最好的动作（列）有着最高的Q值。为了训练算法，Q表将所有值初始化为0.然后这些值通过贝尔曼方程来逐步更新。在特殊的状态下选择的动作的回报决定着Q值的大小。Q值更新时还有两个需要考虑的因素：折扣率和学习率。Q值的单位与回报是相同的，因为所有其他的因素是无单位的。动作在状态下的表现导致一个新的状态和回报，Q学习算法通过如下贝尔曼方程来更新Q表以此提高它的策略。
3.4 状态表现
Q学习中的一个主要的挑战是用Q矩阵的标签形式来表示拥有大量或无限状态的现实环境。包含大量状态的Q矩阵会导致大多数的状态不会被智能体经历。这个问题存在于ATSC问题中，交通的连续随机属性导致无限种可能的状态（各种车辆的位置和速度）。为了克服这些问题，有两种典型的方法。第一种是通过把Q值用一种可训练方程代替，而非表的形式，来一般化状态。这种一般化被称作方程近似，因为其以近似方程为例并一般化他们组成近似的完整方程。有很多方法来近似方程，如人工神经网络和统计曲线拟合。然而，因为其不完美的估值，方程近似产生很多影响解的质量的后果，如Q估计的离散。另一个更简单的方法是将所有可能的状态离散成范围并在Q矩阵中只定义这些范围。因为，离散化状态范围的Q矩阵成功的应用于之前关于ATSC问题的研究中。本文中所提的RS-ATSC采用该方法。
本文所提的RS-ATSC方法，状态是当前绿灯相位和每个车道中停止线上游现存V2IDSRC车辆的情况。特别地，假设在四路交叉口中，状态由5个矢量元素组成。第一个元素是相位指数（不包括当前相位的长度）代表的当前绿灯相位。剩下的4个元素代表每个进口的当前交通情况。
代表每个进口的当前交通情况有很多种方法。包括现有车辆，排队长度，当前绿灯相位到达车辆数和红灯相位排队长度，累积延误，相对延误和检测器状态。本文中，RS-ATSC算法的目标是通过最小化交叉口各进口的追尾冲突率以提高安全性。因此，每个进口的当前交通情况由该进口的每秒追尾冲突数表示。
表1中给出使用不同动态交通变量的实时安全模型来估计每个车道的信号周期级的追尾冲突数。表1中有6个实时安全模型，本文采用model 6，因为其与所有变量有最好的拟合性。每个车道的周期级预测冲突数要用周期长度标准化来获得冲突率。因为信号周期可能有不同的长度，周期长度在算法中是动态更新的。最后，每个车道的冲突率要相加成所有车道的冲突率之和，如下公式：
为了获得所有可能状态的离散化Q矩阵，把计算得到的每车道的冲突率离散成具体的范围。离散方法包括决定最小和最大冲突率的值并且分成具体的宽度。最小冲突率设置为0（没有车辆存在在周期）。另一方面，最大冲突率的计算要考虑：1，存在于停车线上游的最大V2I DSRC车辆数。2，每进口道的车道数。3，最小周期长度。最小周期长度等于最小绿灯时长加黄灯时间和全红时长。范围宽度被设置为随范围数均匀增加的。这意味着第一个范围（从最小冲突率开始的范围）有最小的宽度，最后的范围（最大冲突率结束的范围）有最大的宽度。在训练Q学习算法前，运行几小时假设性仿真来验证离散化范围在不同场景（各种交通量和各种周期长度）的合理性。
3.5 动作表示
在基于强化学习的ATSC算法中，智能体在每个决策点选择的动作会决定下一个绿灯相位。动作集的大小由后续相位决定。如果后续相位是个变量，那么动作集就包括n个动作，其中n是相位数。如果相位数是固定的，动作集只有两个动作：1，延长绿灯相位。2.将绿灯转换成下一个相位。有些研究使用可变相位，也有些研究使用固定相位。
理论上讲，可变相位的表现更好，因为它可以给强化学习更多的动作进行研究。然而，从安全和机动性方面考虑，ATSC系统一般不采用可变相位。可变相位可能迷惑道路使用者从而导致不安全的交通活动。例如，在带有左转保护/许可相位的4路交叉口，可变相位可能会造成黄灯陷阱（如，引导左转车进入交叉口的条件是让其相信对面车辆看到黄灯）。此外，当下一个相位不可预测时，道路使用者就不能在绿灯阶段快速反应。这会增加启动损失时间从而造成额外的延误。另一方面，固定相位符合道路使用者的期望，并提供一个没有不必要启动延误的安全交通环境。进一步地，在固定配时中只有两个可能的动作，与n个动作不同，这大幅度减少了Q矩阵的大小。这有助于强化学习算法快速收敛来优化策略。
因此，我们采用固定相位来设计RS-ATSC算法。RS-ATSC智能体执行下列两个动作之一：1，延长当前绿灯相位（A1）。2，将绿灯转换为下一相位（A2）。如果动作A（1）被选中了，当前绿灯相位将会被延长到一个特定的时间间隔（假设5s）。另一方面，如果动作A（2）被选中了，黄灯和全红时间将在绿灯转换为下一相位和应用最小绿灯时间前被使用。因此，RS-ATSC的更新时间（决策点间的时间）可以用下列公式表示。
本文所提出的RS-ATSC算法同样要使用最大绿灯时间来作为一个基本的限制。这个限制定义为出现冲突调用时，一个相位可以显示的最大绿灯时间。当达到最大绿灯时间时，RS-ATSC智能体会禁止当前相位的绿灯时间继续延长。典型的值——70s被假设为最大绿灯时间。
3.6 回报表示
因为本文所提RS-ATSC算法主要的目标是优化交通安全，算法中的每一对状态-动作的回报由追尾冲突率来确定。追尾冲突率以所有进口作为惩罚来估计。在每个决策点上估计每个进口道的每个车道的冲突率。公式如下。
3.7 学习率和折扣率
公式1中的学习率是智能体访问状态-动作的次数的倒数。
此外折扣率考虑长期运行，假设为0.5.
3.8 探索VS开发
探索和开发是强化学习的一个重要挑战之一。在智能体开发最高效的动作来获得大量回报的同时，也必须探索新的动作来在未来做出更好的选择。要想得到优化的策略，不是探索或开发单独能做到的。动作选择的策略应该去平衡开发和探索。典型的动作选择策略是贪吃函数和柔性最大函数。
本文中，动作选择策略采用贪吃算法。这就意味着RS-ATSC算法在每一次迭代的过程中，贪吃动作在除了**的大部分时间都和随机动作选择一致。探索率随着迭代次数的增加而减少。最高的探索发生在学习之前，因为智能体并没有经验。学习的最后，最低的探索出现了，更多的开发让智能体收敛得到最优策略。探索的逐渐减少率如下公式。
3.9 环境建模
本文采用交通微观仿真软件Vissim。Vissim是时间步长和基于行为模型的交通仿真软件并依赖基于Wiedemann模型的心理生理跟驰模型。Wiedemann模型假设认为驾驶员会有如下四种假设模型之一：自由驾驶，侵入，跟驰和制动。
在Vissim中建立单个交叉口来代表所提算法中的车联网环境。构建的交叉口为四进口，并且每个进口有2个直行车道和一个单独的左转车道。智能体控制单元接收从存在于停止线前特定距离的联网车辆获取的V2I信息。这个距离基本上代表着V2I的标准范围。因为标准的V2I DSRC范围大致为150m到300m，本文中的距离认为是225m。进一步的，在Vissim中通过创建新的车辆类“connected vehicle”并在每个交通输入点设置不同的交通构成率来实现不同的联网车辆渗透率。除了联网车辆外，地感线圈安放在各车道用来将实时交通数据传输到交通控制器中。本文考虑两种类型的地感线圈：在直行和左转车道开始位置的交通计数器和左转弯展宽段的末尾。
为了仿真车联网环境和RS-ATSC算法，一个matlab程序通过com接口来控制Vissim模型。Matlab代码可以在任何时候用“sim-break-at”函数开始或者暂停仿真，记录交通信号和车辆的详细信息（车辆数，类型，位置和速度），并把任何需要的实时改变应用到Vissim中的交通信号机头上。这个程序代表Q学习的动作（交通控制器），因为它可以接受环境状态并选择不同的动作。
3.10 训练算法
RS-ATSC算法在图3描述的单个交叉口的Vissim模型中运行训练。仿真运行了420个场景。每一个场景将20000个仿真秒分为1500s的热身阶段，500s的冷却阶段和18000（5h）的训练阶段。在每个训练场景中，仿真每隔t秒暂停，定义状态，选择并应用下一个动作，计算回报，最后更新Q矩阵。由于交通的随机属性，Vissim中考虑了各种随机种子。此外，为了让算法遇到尽可能多的状态，每个进口的交通量统一在200veh/h到1600/h之间随机选取。交通量依据通行能力率的随机值，从0.1到1确定。这些值符合表一所示实时交通安全模型的应用条件——非饱和流。
如强化学习模型的训练，观测智能体的学习过程和保证算法收敛来得到最优策略是非常重要的。总的来说，收敛获得最优策略的定义是智能体遇到每个状态-动作对时的一个无限的次数。因为这是不可能的，我们用两种方法观测智能体在每一个场景下的学习过程：1，遇到状态-动作对的数量。2，所有场景下的最小冲突率。图4展示了将冲突数通过交通量标准化以后的动作学习过程的表现。200个场景以后，大多数状态-动作对被智能体遇到过好多次，并且最小的冲突率也没在接下来的几个场景内改变。因此，我们认为智能体收敛到最优的策略。当到达收敛时，冲突率从0.18下降到0.11.
4.实时数据验证
本文所提出的RS-ATSC算法通过加拿大一个城市的两个交叉口的实时数据进行验证。两个交叉口的实际信号控制都是典型的感应控制，在停车线和延伸的位置安装了检测器。实际的感应控制设置了一个基准来估计RS-ATSC算法的效率。每个交叉口中，训练RS-ATSC和实际基准感应信号控制都在Vissim中进行标定。随后得到并比较每个信号控制器的安全和运行表现。
最近10年的研究结果显示，感应式控制要比固定信号控制在安全和效率表现得好，尤其是，当交通量不可预测并且变化很大。与固定信号控制器相比，感应式信号控制可以更好的适应明显波动的交通量，减少延误，降低驾驶员的困惑和闯红灯的现象，进而提升安全性。这就是为什么最近要把固定配时换成感应配时作为一个提升信号交叉口表现的常规方法的原因。因此，本文中用感应控制作为对照来验证所提RS-ATSC算法的表现。
4.1真实交通数据
第一个选择的交叉口是128街与72大道交叉口，第二个交叉口是138街和72大道。每个交叉口，用分布并覆盖了4个进口的8个高清摄像机来采集得到的视频数据。数据包含了高峰和非高峰时段，从早上9点到下午6点。因此，总时长为144小时。图5所示为所选交叉口的位置，选择的进口和记录的视频场景。从数据中提取了每个进口每小时的详细的真是交通数据。这些数据包括感应信号程序，所有运动的交通量，绿灯车辆到达数，平均队列率，平均延误时间，期望车速分布，和交通构成。交通构成包括客车，卡车和公交车的百分比。摩托车被忽略了，因为他们很少出现在视频里。
4.2 仿真模型标定
Vissim模型中的2个选定的交叉口来自之前的研究。通过对交叉口几何结构，交通量，交通构成，交通信号的设置来匹配真实情况。现实的ASC用RBC在Vissim中标定。目视检查也用来确定仿真中没有不正常的车辆。此外，Vissim模型也在此前的研究中用综合两步标定法进行精确标定。第一步标定目的是将仿真延误时间与现场观测到的延误时间进行匹配。这是通过将到达模式和期望车速与现场情况匹配。第二步标定目的是通过Vissim参数的标定来使现场观测的和仿真的交通冲突相协调。首先，通过敏感性分析确定对仿真冲突有重要影响的Vissim关键参数。然后，用遗传算法来估计能够提高现场观测和仿真冲突协调性的参数。表2展示了每个交叉口所选Vissim参数及其标定值。
4.3 安全和运行表现
为了验证所提算法，要与ASC为基准进行比较。交叉口的追尾冲突数是安全表现的评价指标。运行效率的表现指标包括最大排队长度，95位排队长度，车辆平均延误。为了估计这些指标，每个交叉口标定后的Vissim模型运行9h。每小时在Vissim中的两个信号控制器分别仿真：1，代表实际基准ASC的RBC模型，2，扩展的MATLAB代码代表训练后的RS-ATSC。每个信号控制器采用10个不同的随机种子，然后将所得结果平均。最小的随机种子依据如下方法估计。统计分析显示，在95%置信度的情况下，10次仿真是足以拒绝零假设的。这就意味着指标表现的不同是因为2种不同的方法而非使用不同的随机种子。
在每次仿真运行中，细节的仿真数据会以很短的时间步长被记录下来（如，每个仿真秒）。这些数据包括位置和平均车辆速度，车辆类型，所有信号机头的状态。数据的获得采用外接程序通过Vissim COM接口来控制仿真模型。仿真和细节交通数据记录结束后，一些步骤将用于估计动态交通参数和安全。1，交叉口每个进口的信号周期由每个进口的信号机头的状态确定。2，记录的车辆轨迹需要进行时间和空间的过滤来对每个信号周期的每个车道的车辆轨迹进行分类。3，对于每个车道，每个信号周期的空间-时间图是用过滤轨迹和周期时间得到的。这个空间-时间图随后被用来计算各种信号周期级别的交通参数，包括交通量，波动区域，车流波速度，队列率。最后，估计得到的周期相关参数被输入到实时安全模型来预测周期级冲突率。模型采用交通量，车流波区域，车流波速度和队列率来预测每个周期的冲突数。
4.4验证结果
从被选择的每个交叉口的仿真中提取9小时分析区间的前述动态交通参数也就是追尾冲突数。训练好的RS-ATSC的安全表现与现实中的对照ASC进行对比。总体上，RS-ATSC会减少追尾冲突以带来积极的安全影响。图6展示了2个被选中的交叉口ASC和RS-ATSC的每小时的冲突率。如图所示，当RS-ATSC取代ASC时，第一个交叉口的平均冲突率从0.165下降到0.08，第二个交叉口的平均冲突率从0.17下降到0.11.
每个交叉口的每个进口的实时交通冲突变化也被研究了。每个信号周期的每个车道的追尾冲突数采用表1中的model 6来进行估计。冲突率等于每个周期的冲突数除以周期长度。图7和图8分别展示了第一个和第二个交叉口的冲突率的实时变化。两个交叉口的9小时分析时段的累积追尾冲突数在图9和图10中展示。与ASC相比，所提出的RS-ATSC在两个交叉口中都有明显的减少追尾冲突数的效果。大量减少追尾冲突的情况在所有进口中不尽相同。一些进口的冲突数有着很大程度的减少，如第一个交叉口南行进口（图7和图9），第二个交叉口的西行进口（图8和图10）。同时，一些进口的冲突数减少的比较少，如第二个交叉口的南行进口（图8和图10）。更重要的是，结果并没有在任何进口的累积冲突数显示出增加的状态。这就意味着RS-ATSC不仅仅提升了每个交叉口整体的安全级别，也没有恶化任何一个单独进口的安全级别。RS-ATSC与ASC的总体对比如表3所示。在9小时的分析时段，RS-ATSC提升了每个交叉口的安全级别。总体的追尾冲突在第一个交叉口和第二个交叉口分别减少了49%和37%。所提算法还提升了被分析交叉口的运行效率。与ASC相比，在第一个交叉口和第二个交叉口中平均延误时间分别减少了12%和23%。停车次数，最大排队长度，95位排队长度在第一个交叉口分别减少了47%，23%和51%，在第二个交叉口分别减少了27%，17%和28%。
值得注意的是表3中的表现结果基于所选交叉口的几何何交通特征。如果该算法应用到不同特征的交叉口可能会得到不同的结果。还需要注意的是，V2I DSRC区域假设为225m。用更高的阈值可能潜在地提升算法的表现。此外，算法的表现是在假定V2X通信系统在理想条件下。实际上，一些错误的来源可能存在于联网系统，包括位置错误，库延误，库丢失。这些连接错误源可能影响算法表现。
冲突率的减少证实了所提RS-ATSC算法在安全性上的积极影响。此外，平均延误时间，停车数，排队长度的减少说明了算法在机动性上的积极影响。因此，所提算法同时提升了被分析交叉口安全性和机动性。换言之，算法在未恶化机动性的同时优化了安全性。
按照前述检验的结果，所提RS-ATSC算法可以使用车联网实时数据应用于实际来优化交叉口的安全。当应用于具体交叉口时，RS-ATSC算法可以被设计来用真实交通和几何数据来持续的自学习。Q表的重新训练应该在考虑设置特征的同时考虑本地驾驶行为。要适应交叉口的特征，应该对算法进行一些微小的调整，如进口数，车道数，相位数，后续相位和信号配时限制（最小/最大绿灯时间，黄灯和全红时间）。考虑到这些特殊设定的数据可能潜在地导致更好的安全和机动性表现。
4.5 联网车辆渗透率的影响
车联网技术应该是逐步部署的。在车联网技术完全部署之前的过渡期，路网上存在着联网车辆和传统车辆的混合流。然后，假设所有车辆都是联网车辆来验证任何ATSC算法是不可能的。然而，联网车辆的各种渗透率应该被考虑。因此，本文中，我们研究了所提RS-ATSC算法在两个交叉口中的各种车联网渗透率下的表现，范围从10%到100%。
各种联网车辆渗透率通过在Vissim中设定新的“connected vehicle”类和每个交通输入点的不同交通构成百分比来表现。在不完美的渗透率中，详细的轨迹只有联网车辆。因此，当在一个特殊的渗透率下应用RS-ATSC算法时，算法只捕捉到“connected vehicle”类中的瞬时车辆信息。为了定义实时状态和选择最好的动作，周期相关的参数V,A，S12和P用捕捉到的联网车辆轨迹估计，并将它们输入到实时安全模型中。每车道每周期的估计交通量在输入到实时安全模型中是被修正的（乘以修正系数）。这个值等于渗透率值的倒数。实时提取渗透率的值，考虑V2I通讯的联网车的数量和交叉口每个进口上游检测器检测的交通计数。与交通量不同，每车道每周期的A，S12和P与渗透率并不是线性关系。因此，这些值应该直接应用于实时安全模型来估计冲突率。然而，值得注意的是低渗透率，这些与周期相关的参数估计就不实际了。在9小时的分析时段仿真完成后，分析所有车辆的轨迹来评估算法表现。车辆冲突率和平均延误都是在每个渗透率下得到的，并且与ASC比较。
图11和图12展示了应用了RS-ATSC算法后各种渗透率下交叉口的平均冲突率和平均延误时间。对照组的ASC也被展示用于对比。如图11，RS-ATSC最大的安全性是在渗透率为100%时。在这个渗透率下，第一个交叉口的冲突率从0.165减少到0.084，第二个交叉口从0.173减少到0.109.然而，值得注意的是，当渗透率为50%时可以得到90%的回报。而且，30%的渗透率下似乎可以满足达到最大安全回报的50%。另一方面，平均延误的结果强调了RS-ATSC算法对机动性有积极影响。这意味着算法优化安全的同时并没有损失机动性。
总体来说，当联网车渗透率大于等于30%时，RS-ATSC算法是高效的。渗透率的值越大，算法对安全的优化就越有效。渗透率小于20%时，算法的优化不明显，因为算法不能合理精确的根据缺乏实时车辆位置和速度的信息来定义环境状态。
7. 摘要和结论
本文中，我们提出一种新的自适应控制算法，通过车联网实时数据来优化信号交叉口的安全。算法基于此前研究的实时安全模型。模型使用动态交通参数如队列率和车流波特征，来预测交通冲突并估计信号交叉口实时的安全。据我们所知，所提出的RS-ATSC是首个使用车联网数据来实时优化交通安全的自学习自适应算法。
RS-ATSC算法使用了强化学习技术。具体而言，是q学习无监督时间步长方法。在q学习中，状态用每个特殊的V2I DSRC域进口的追尾冲突率来定义。动作空间只包括两个代表固定相位的动作。因此，每个时间步长，强化学习智能体决定是否延长当前绿灯时间或转换到下一相位。回报函数定义为以每个进口的冲突率估计值的和为惩罚。此外，一些限制考虑了再实际条件下运用算法的可行性，包括适应黄灯时间，全红时间和最大最小绿灯时间，无论这些是否是必须的。
为了训练RS-ATSC算法，在Vissim平台上建立了一个单个交叉口。Vissim被外接程序控制来估计联网车环境和实时信号改变。学习过程中，仿真模型在随机交通量条件下运行了420个场景，每个包含20000s。RS-ATSC智能体在大约200个场景后获得最优策略。
训练后的RS-ATSC算法用加拿大一个城市的两个交叉口的真是交通数据验证。算法与现存的全感应式信号控制进行对比。总体来说，验证结果显示，所提算法要比实际中的ASC表现好。当应用RS-ATSC时，总体的追尾冲突率在第一个和第二个交叉口分别减少了49%和37%。此外对与这些安全的回报，RS-ATSC对机动性也有积极影响。与ASC相比，RS-ATSC分别在第一个和第二个交叉口的延误减少了12%和23%。停车数，最大排队长度和95位排队长度在第一个交叉口和第二个交叉口分别减少了47%，23%，51%和27%，17%和28%。
总之，RS-ATSC是有前途并且可行的算法，它可以在智能网联环境中优化实时安全。算法在追尾冲突数上要优于传统感应式信号控制。所提RS-ATSC算法在渗透率大于等于30%时表现特别高效。渗透率越大，安全效率越高。更重要的是，当应用在具体交叉口时，RS-ATSC算法可以被设计用这个交叉口的真实交通和几何数据来持续自学习。Q表考虑设置特征和本地驾驶行为来重新训练。为了匹配交叉口的特点，算法中还需要进行微调，如进口数，车道数，相位数，后续相位，信号配时限制。考虑这些特殊设置的数据可以更好的提升安全和机动性。
需要注意的是，通过RS-ATSC算法减少了延误时间，这个机动性表现并不能认为是优化。原因是RS-ATSC是以安全建模的算法，它的优化策略是基于最小交通冲突数来优化安全。其他自适应算法考虑以最小化延误时间作为首要目标，这样可以使机动性得到更好的优化。事实上，交通延误是交通经常拥堵最重要的原因并且导致严重的环境和经济成本。同时，交通安全也是导致高碰撞频率和信号交叉口严重的社会和经济成本。因此，自适应算法应该以安全和机动性为基本优化目标。因为之前的研究主要关注优化延误，本研究的主要贡献是提出了一种优化安全而不恶化机动性的新算法。基于本研究的结果，信号交叉口的安全和机动性不是冲突的目标，尽管他们的优化设计是不同的。本文所提RS-ATSC算法还可以进一步修改，将安全和机动性作为多目标优化问题。这种问题中，可以根据每个目标的成本来制定权重。这些权重在不同地区和管辖区是不同的。
本算法未来需要解决一些算法的限制。1，算法需要在非理想V2X通讯系统中进行测试。需要研究结果对联网系统的几个误差源的灵敏性。2，算法需要扩展到对多个交叉口的建模而非单个交叉口。在这种情况下，必须考虑到信号协调。3，算法应该在极度过饱和的条件下验证，这种条件下的排队长度超过了V2I DSRC域。4，算法的状态空间可以被扩展到将Q矩阵转换为神经网络。5，建议研究不同参数的结果的灵敏度，如折扣因素，更新时间间隔，V2I DSRC域。6，要结合其他冲突类型，如交叉和融入冲突。此外，RS-ATSC的回报函数和实时交通安全的表现可以考虑其他的交通冲突指标，如碰撞风险和碰撞预测数。7，需要开发多目标强化学习自适应算法将安全和机动性作为实时信号优化的两个重要的目标。

你可能感兴趣的:(交通文献阅读（英文）,安全)

为什么会出现“与此站点的连接不安全”警告？
当浏览器弹出“与此站点的连接不安全”的红色警告时，不仅会让访客感到不安，还可能直接导致用户流失、品牌信誉受损，甚至引发数据泄露风险。作为网站运营者，如何快速解决这一问题？一、为什么会出现“与此站点的连接不安全”警告？浏览器提示“不安全连接”，本质上是检测到当前网站与用户之间的数据传输未经过加密保护。以下是触发警告的常见原因：1.未安装SSL证书SSL（SecureSocketsLayer）证书是网
什么是证书吊销列表？CRL 解释 WoTrusSSL ssl https
数字证书是安全在线互动的支柱，用于验证身份和确保加密通信。但是，当这些证书被盗用或滥用时，必须立即撤销它们以维持信任。这就是证书撤销列表(CRL)的作用所在。CRL由证书颁发机构(CA)维护，对于识别和撤销已撤销的证书，防止其造成危害至关重要。在本指南中，我们将探讨什么是CRL、它们如何运作以及为什么它们对网络安全至关重要。什么是证书吊销列表(CRL)？证书吊销列表(CRL)是证书颁发机构(CA)
驱动程序为什么要做 WHQL 认证? GDCA SSL证书网络协议网络
驱动程序进行WHQL（WindowsHardwareQualityLabs）认证的核心价值在于解决兼容性、安全性和市场准入三大关键问题，具体必要性如下：️‌一、规避系统拦截，保障驱动可用性‌消除安装警告‌未认证的驱动在安装时会触发Windows的‌红色安全警告‌（如“无法验证发布者”），甚至被系统强制拦截。通过WHQL认证的驱动获得微软数字签名，用户可无阻安装‌。满足系统强制要求‌Windows1
Guava LoadingCache sqyaa. java并发编程 Java知识 jvm 缓存 guava
LoadingCache是GoogleGuava库提供的一个高级缓存实现，它通过自动加载机制简化了缓存使用模式。核心特性自动加载机制当缓存未命中时，自动调用指定的CacheLoader加载数据线程安全：并发请求下，相同key只会加载一次灵活的过期策略支持基于写入时间(expireAfterWrite)和访问时间(expireAfterAccess)的过期可设置最大缓存大小，基于LRU策略淘汰丰富的
Android ViewBinding 使用与封装教程积跬步DEV Android 开发实战大全 android
AndroidViewBinding使用与封装教程：一、ViewBinding是什么？核心功能：为每个XML布局文件自动生成一个绑定类（如ActivityMainBinding），直接暴露所有带ID的视图引用。优点：避免繁琐的findViewById()，类型安全且编译时检查。对比DataBinding：ViewBinding仅处理视图引用，无数据绑定功能。DataBinding支持双向数据绑定，
Python多版本管理与pip升级全攻略：解决冲突与高效实践码界奇点 Python python pip 开发语言 python3.11 源代码管理虚拟现实依赖倒置原则
引言Python作为最流行的编程语言之一，其版本迭代速度与生态碎片化给开发者带来了巨大挑战。据统计，超过60%的Python开发者需要同时维护基于Python3.6+和Python2.7的项目。本文将系统解决以下核心痛点：如何安全地在同一台机器上管理多个Python版本pip依赖冲突的根治方案符合PEP标准的生产环境最佳实践第一部分：Python多版本管理核心方案1.1系统级多版本共存方案Wind
OpenWebUI(12)源码学习-后端constants.py常量定义文件青苔猿猿 AI大模型 openwebui constants常量定义
目录文件名：`constants.py`功能概述：主要功能点详解1.**MESSAGES枚举类**2.**WEBHOOK_MESSAGES枚举类**3.**ERROR_MESSAGES枚举类**✅默认错误模板✅认证与用户相关错误✅资源冲突与重复错误✅验证失败类错误✅权限限制类错误✅文件上传与格式错误✅模型与API错误✅请求频率与安全限制✅数据库与配置错误4.**TASKS枚举类**✅总结实际应用场
Kafka系列之：Dead Letter Queue死信队列DLQ 快乐骑行^_^ Kafka Kafka系列 Dead Letter Queue 死信队列 DLQ
Kafka系列之：DeadLetterQueue死信队列DLQ一、死信队列二、参数errors.tolerance三、创建死信队列主题四、在启用安全性的情况下使用死信队列更多内容请阅读博主这篇博客：Kafka系列之：KafkaConnect深入探讨-错误处理和死信队列一、死信队列死信队列（DLQ）仅适用于接收器连接器。当一条记录以JSON格式到达接收器连接器时，但接收器连接器配置期望另一种格式，如
玩转Docker | 使用Docker部署gopeed下载工具心随_风动玩转Docker docker 容器运维
玩转Docker|使用Docker部署gopeed下载工具前言一、gopeed介绍Gopeed简介主要特点二、系统要求环境要求环境检查Docker版本检查检查操作系统版本三、部署gopeed服务下载镜像创建容器检查容器状态检查服务端口安全设置四、访问gopeed应用五、测试与下载六、总结前言在当今信息爆炸的时代，高效地获取和管理网络资源变得尤为重要。无论是下载大型文件还是进行日常的数据传输，一个稳
零信任落地难题：安全性与用户体验如何两全？粤海科技君安全零信任终端安全网络安全 iOA
在零信任架构的实施过程中，平衡安全性与用户体验是企业数字化转型的核心命题。这一挑战的本质在于：既要通过「永不信任，持续验证」的安全机制抵御新型攻击，又要避免过度验证导致的效率损耗。一、矛盾根源：安全与体验的天然张力零信任的“永不信任”原则，本质上要求对每一次访问都进行动态评估，但这与用户对“便捷、流畅”的诉求存在天然冲突。例如：频繁的身份验证（如每次登录都需短信验证码）会打断工作节奏，某制造企业统
等保测评中的物联网设备安全评估亿林数据物联网安全网络安全等保测评
随着物联网（IoT）技术的飞速发展，物联网设备已经广泛应用于智能家居、智慧城市、工业自动化等多个领域，极大地提升了社会生产力和生活便利性。然而，随着IoT设备数量的激增，其安全性问题也日益凸显，成为我们必须面对的重要课题。在这一背景下，等级保护（等保）测评中的物联网设备安全评估显得尤为重要，它为我们提供了一个有效的安全评估和管理机制。一、物联网设备安全评估的重要性物联网设备的核心理念是实现物物相连
传统检测响应慢？陌讯多模态引擎提速90+FPS实战 2501_92473147 算法计算机视觉目标检测
开篇痛点：实时目标检测在安防监控中的核心挑战在安防监控领域，实时目标检测是保障公共安全的关键技术。然而，传统算法如YOLOv5或开源框架MMDetection常面临两大痛点：误报率高（复杂光照或遮挡场景下检测不稳定）和响应延迟（高分辨率视频流处理FPS低于30）。实测数据显示，城市交通监控系统误报率达15%，导致安保资源浪费；客户反馈表明，延迟超100ms时，目标跟踪可能失效。这些问题源于算法泛化
反光衣识别漏检率 30%？陌讯多尺度模型实测优化
在建筑工地、交通指挥等场景中，反光衣是保障作业人员安全的重要装备，对其进行精准识别是智能监控系统的核心功能之一。但传统视觉算法在实际应用中却屡屡碰壁：强光下反光衣易与背景混淆、远距离小目标漏检率高达30%、复杂场景下模型泛化能力不足[实测数据来源：某智慧工地项目2024年Q1日志]。这些问题直接导致安全监控系统预警滞后，给安全生产埋下隐患。一、技术解析：反光衣识别的核心难点与陌讯算法创新反光衣识别
系统迁移从CentOS7.9到Rocky8.9
我有两台阿里云上的服务器是CentOS7.9，由于CentOS7已经停止支持，后续使用的话会有安全漏洞，所以需要尽快迁移，个人使用的话目前兼容性好的还是RockyLinux8，很多脚本改改就能用了。一、盘点系统和迁移应用查看当前系统发行版版本cat/etc/os-release盘点迁移清单服务器应用部署方式docker镜像来源v1wordpressdockerdockerhubv1zdirdock
.NET中的强名称和签名机制
.NET中的强名称（StrongName）和签名机制是.NETFramework引入的一种安全性和版本控制机制。以下是关于.NET中强名称和签名机制的详细解释：强名称定义：强名称是由程序集的标识加上公钥和数字签名组成的。程序集的标识包括简单文本名称、版本号和区域性信息（如果提供的话）。作用：强名称主要用于确保程序集的唯一性和完整性。通过签发具有强名称的程序集，可以确保名称的全局唯一性，防止名称冲突
.NET中的安全性之数字签名、数字证书、强签名程序集、反编译 hezudao25 NET .net assembly 加密算法 reference header
本文将探讨数字签名、数字证书、强签名程序集、反编译等以及它们在.NET中的运用（一些概念并不局限于.NET在其它技术、平台中也存在）。1.数字签名数字签名又称为公钥数字签名，或者电子签章等，它借助公钥加密技术实现。数字签名技术主要涉及公钥、私钥、非对称加密算法。1.1公钥与私钥公钥是公开的钥匙，私钥则是与公钥匹配的严格保护的私有密钥；私钥加密的信息只有公钥可以解开，反之亦然。在VisualStud
.NET 一款基于BGInfo的红队内网渗透工具 dot.Net安全矩阵网络 .net 安全 .netcore web安全矩阵
01阅读须知此文所提供的信息只为网络安全人员对自己所负责的网站、服务器等（包括但不限于）进行检测或维护参考，未经授权请勿利用文章中的技术资料对任何计算机系统进行入侵操作。利用此文所提供的信息而造成的直接或间接后果和损失，均由使用者本人负责。本文所提供的工具仅用于学习，禁止用于其他方面02基本介绍在内网渗透过程中，白名单绕过是红队常见的技术需求。Sharp4Bginfo.exe是一款基于微软签名工具
程序员必看！如何破解数据篡改与逆向工程的双重困境深盾科技程序员创富 c#
作为一名程序员，你是否曾遇到过这样的噩梦？辛苦开发的程序，数据被篡改，代码被轻易破解，所有的努力瞬间化为泡影！别怕，今天就来教你如何绝地反击，让黑客们望而却步！数据篡改：黑客的“拿手好戏”在程序开发中，数据安全性是重中之重。然而，黑客们却总能找到漏洞，篡改传输中的数据，导致程序运行出错，甚至引发严重的安全问题。那么，如何才能防止数据被篡改呢？数字签名：数据安全的“守护神”数字签名是一种基于密码学的
如何为加壳保护后的程序提供调试支持深盾科技安全开发语言
在软件开发领域，加壳保护是一种常见的安全手段，用于防止程序被逆向分析。然而，当程序崩溃时，开发人员需要定位原始错误位置，这就与加壳保护产生了天然的矛盾。本文将从加壳原理出发，为大家介绍兼容调试的解决方案。一、加壳的基本功能1.加密/压缩加壳最常见的功能就是对程序的整个代码段和数据段进行压缩或加密。这样做的目的是防止静态反编译，但在程序运行过程中，代码段和数据段是明文状态，所以不会对调试造成影响。2
.NET nupkg包的深度解析与安全防护指南深盾科技 .net
在.NET开发领域，nupkg包是开发者们不可或缺的工具。它不仅是代码分发和资源共享的核心载体，还贯穿了开发、构建、部署的全流程。今天，我们将深入探讨nupkg包的核心功能、打包发布流程以及安全防护措施，帮助你在.NET开发中更加得心应手。nupkg包的核心功能nupkg是NuGet包的文件格式，本质上是一个ZIP压缩包，包含编译后的程序集（.dll文件）、调试符号（.pdb文件）、描述文件（.n
HashMap的Get(),Put()源码解析 Ttang23 哈希算法散列表算法
1、什么是HashMap？HashMap是Java中用于存储键值对（Key-Value）的集合类，它实现了Map接口。其核心特点是：无序性：不保证元素的存储顺序，也不保证顺序恒定不变。唯一性：键（Key）不能重复，若插入重复键会覆盖原有值。允许null：允许一个null键和任意数量的null值。非线程安全：相比HashTable，HashMap不支持同步，性能更高。2.核心数据结构：哈希表（Has
Flutter——数据库Drift开发详细教程之迁移(九) 怀君 flutter flutter 数据库
迁移入门引导式迁移配置用法例子切换到make-migrations开发过程中手动迁移迁移后回调导出模式导出架构下一步是什么？调试导出架构的问题修复这个问题架构迁移助手自定义分步迁移转向逐步迁移手动生成测试迁移编写测试验证数据完整性在运行时验证数据库模式迁移器API一般提示迁移视图、触发器和索引复杂的迁移更改列的类型更改列约束删除列重命名列合并列添加新列入门Drift通过严格的架构确保查询类型安全。
.NET 程序的强名称签名与安全防护技术干货深盾科技安全
在.NET开发领域，保障程序的安全性和完整性至关重要。强名称签名和有效的安全防护措施是实现这一目标的关键手段。下面将详细介绍.NET程序的强名称签名以及相关的安全防护方法。一、什么是强名称签名强名称签名是.NET框架提供的一种安全机制，其主要作用是唯一标识程序集、验证程序集的完整性以及解决版本冲突问题。它本质上是通过加密技术为程序集创建数字签名，确保程序集在分发和运行过程中的安全性。二、签名文件要
什么是RFM模型走过冬季学习笔记大数据数据分析
RFM模型是客户价值分析中一种经典且实用的量化模型，它通过三个关键维度评估用户价值，帮助企业识别最有价值的客户群体。名称RFM由三个核心指标的英文首字母组成：R（Recency）-最近一次消费时间定义：用户上一次发生交易行为距今的时间长度（如多少天前）。意义：衡量用户的活跃度和流失风险。R值越小（最近有消费），说明用户越活跃，流失风险越低；R值越大（很久没消费），用户流失风险越高。母婴场景示例：一
iOS 多个线程对数组操作（遍历，插入，删除),实现一个线程安全的NSMutabeArray
//联系人:石虎QQ:1224614774昵称:嗡嘛呢叭咪哄一、概念1.含义:@synchronized(self){}//这个其实就是一个加锁。如果self其他线程访问，则会阻塞。这样做一般是用来对单2.重写构造方法@interfaceSHSafetyArray:NSObject{@privateNSMutableArray*_mutableArray;//声明数组}//遍历加锁-(void)m
2025年渗透测试面试题总结-2025年HW(护网面试) 43（题目+回答）独行soc 2025年护网面试职场和发展 linux 科技渗透测试安全护网
安全领域各种资源，学习文档，以及工具分享、前沿信息分享、POC、EXP分享。不定期分享各种好玩的项目及好用的工具，欢迎关注。目录2025年HW(护网面试)431.自我介绍与职业规划2.Webshell源码级检测方案3.2025年新型Web漏洞TOP54.渗透中的高价值攻击点5.智能Fuzz平台架构设计6.堆栈溢出攻防演进7.插桩技术实战应用8.二进制安全能力矩阵9.C语言内存管理精要10.Pyth
iOS线程安全数组
iOS-SDK只提供了非线程安全的数组。如果要多线程并发的使用一个数组对象就必须要加锁，平凡的加锁使得代码的调用非常的麻烦。我们需要多线程的读写锁在类的内部实现，所以需要对NSMutableArray进行封装，封装后的对象负责接受所有事件并将其转发给真正的NSMutableArrayiOS-SDK只提供了非线程安全的数组。如果要多线程并发的使用一个数组对象就必须要加锁，平凡的加锁使得代码的调用非常
【个人笔记】负载均衡撰卢笔记负载均衡运维
文章目录nginx反向代理的好处负载均衡负载均很的配置方式均衡负载的方式nginx反向代理的好处提高访问速度进行负载均衡保证后端服务安全负载均衡负载均衡，就是把大量的请求按照我们指定的方式均衡的分配给集群中的每台服务器负载均很的配置方式upstreamwebservers{server192.168.100.128:8080server192.168.100.129:8080}server{lis
不同行业的 AI 数据安全与合规实践：7 大核心要点全解析观熵人工智能 DeepSeek 私有化部署
不同行业的AI数据安全与合规实践：7大核心要点全解析关键词AI数据安全、行业合规、私有化部署、数据分类分级、国产大模型、隐私保护、DeepSeek部署摘要随着国产大模型在金融、医疗、政务、教育等关键领域的深入部署，AI系统对数据安全与行业合规提出了更高要求。本文结合DeepSeek私有化部署实战，系统梳理当前各行业主流的数据安全合规标准与落地策略，从数据分类分级、访问控制、审计追踪到敏感信息识别与
计算机科学与技术柳依依@ 学习前端 c4前端后端
计算机科学是一个庞大且关联性强的学科体系，初学者常面临以下痛点：-**知识点零散**：容易陷入"只见树木不见森林"的学习困境-**方向不明确**：面对海量技术栈不知从何入手-**体系缺失**：难以建立完整的知识网络1.计算机基础-计算机组成原理-冯·诺依曼体系-CPU/内存/IO设备-操作系统-进程与线程-内存管理-文件系统-计算机网络-TCP/IP模型-HTTP/HTTPS-网络安全2.编程能力
ViewController添加button按钮解析。（翻译）张亚雄 c
<div class="it610-blog-content-contain" style="font-size: 14px"></div>// ViewController.m // Reservation software // // Created by 张亚雄 on 15/6/2.
mongoDB 简单的增删改查开窍的石头 mongodb
在上一篇文章中我们已经讲了mongodb怎么安装和数据库/表的创建。在这里我们讲mongoDB的数据库操作在mongo中对于不存在的表当你用db.表名他会自动统计下边用到的user是表明，db代表的是数据库添加(insert):
log4j配置 0624chenhong log4j
1) 新建java项目 2) 导入jar包，项目右击，properties—java build path—libraries—Add External jar，加入log4j.jar包。 3) 新建一个类com.hand.Log4jTest package com.hand; import org.apache.log4j.Logger; public class
多点触摸(图片缩放为例) 不懂事的小屁孩多点触摸
多点触摸的事件跟单点是大同小异的，上个图片缩放的代码，供大家参考一下 import android.app.Activity; import android.os.Bundle; import android.view.MotionEvent; import android.view.View; import android.view.View.OnTouchListener
有关浏览器窗口宽度高度几个值的解析换个号韩国红果果 JavaScript html
1 元素的 offsetWidth 包括border padding content 整体的宽度。 clientWidth 只包括内容区 padding 不包括border。 clientLeft = offsetWidth -clientWidth 即这个元素border的值 offsetLeft 若无已定位的包裹元素
数据库产品巡礼：IBM DB2概览蓝儿唯美 db2
IBM DB2是一个支持了NoSQL功能的关系数据库管理系统，其包含了对XML，图像存储和Java脚本对象表示（JSON）的支持。DB2可被各种类型的企业使用，它提供了一个数据平台，同时支持事务和分析操作，通过提供持续的数据流来保持事务工作流和分析操作的高效性。 DB2支持的操作系统 DB2可应用于以下三个主要的平台: 工作站，DB2可在Linus、Unix、Windo
java笔记5 a-john java
控制执行流程： 1，true和false 利用条件表达式的真或假来决定执行路径。例：（a==b）。它利用条件操作符“==”来判断a值是否等于b值，返回true或false。java不允许我们将一个数字作为布尔值使用，虽然这在C和C++里是允许的。如果想在布尔测试中使用一个非布尔值，那么首先必须用一个条件表达式将其转化成布尔值，例如if(a!=0)。 2，if-els
Web开发常用手册汇总 aijuans PHP
一门技术，如果没有好的参考手册指导,很难普及大众。这其实就是为什么很多技术，非常好，却得不到普遍运用的原因。正如我们学习一门技术，过程大概是这个样子： ①我们日常工作中，遇到了问题，困难。寻找解决方案，即寻找新的技术； ②为什么要学习这门技术？这门技术是不是很好的解决了我们遇到的难题，困惑。这个问题，非常重要，我们不是为了学习技术而学习技术，而是为了更好的处理我们遇到的问题，才需要学习新的
今天帮助人解决的一个sql问题 asialee sql
今天有个人问了一个问题，如下： type AD value A
意图对象传递数据百合不是茶 android 意图Intent Bundle对象数据的传递
学习意图将数据传递给目标活动; 初学者需要好好研究的 1,将下面的代码添加到main.xml中 <?xml version="1.0" encoding="utf-8"?> <LinearLayout xmlns:android="http:/
oracle查询锁表解锁语句 bijian1013 oracle object session kill
一.查询锁定的表如下语句，都可以查询锁定的表语句一： select a.sid, a.serial#, p.spid, c.object_name, b.session_id, b.oracle_username, b.os_user_name from v$process p, v$s
mac osx 10.10 下安装 mysql 5.6 二进制文件［tar.gz］征客丶 mysql osx
场景：在 mac osx 10.10 下安装 mysql 5.6 的二进制文件。环境：mac osx 10.10、mysql 5.6 的二进制文件步骤：[所有目录请从根“/”目录开始取，以免层级弄错导致找不到目录] 1、下载 mysql 5.6 的二进制文件，下载目录下面称之为 mysql5.6SourceDir；下载地址：http://dev.mysql.com/downl
分布式系统与框架 bit1129 分布式
RPC框架 Dubbo 什么是Dubbo Dubbo是一个分布式服务框架，致力于提供高性能和透明化的RPC远程服务调用方案，以及SOA服务治理方案。其核心部分包含: 远程通讯: 提供对多种基于长连接的NIO框架抽象封装，包括多种线程模型，序列化，以及“请求-响应”模式的信息交换方式。集群容错: 提供基于接
那些令人蛋痛的专业术语白糖_ spring Web SSO IOC
spring 【控制反转(IOC)/依赖注入(DI)】：由容器控制程序之间的关系，而非传统实现中，由程序代码直接操控。这也就是所谓“控制反转”的概念所在：控制权由应用代码中转到了外部容器，控制权的转移，是所谓反转。简单的说：对象的创建又容器(比如spring容器)来执行，程序里不直接new对象。 Web 【单点登录(SSO)】：SSO的定义是在多个应用系统中，用户
《给大忙人看的java8》摘抄 braveCS java8
函数式接口：只包含一个抽象方法的接口 lambda表达式：是一段可以传递的代码你最好将一个lambda表达式想象成一个函数，而不是一个对象，并记住它可以被转换为一个函数式接口。事实上，函数式接口的转换是你在Java中使用lambda表达式能做的唯一一件事。方法引用：又是要传递给其他代码的操作已经有实现的方法了，这时可以使
编程之美-计算字符串的相似度 bylijinnan java 算法编程之美
public class StringDistance { /** * 编程之美计算字符串的相似度 * 我们定义一套操作方法来把两个不相同的字符串变得相同，具体的操作方法为： * 1.修改一个字符（如把“a”替换为“b”）; * 2.增加一个字符（如把“abdd”变为“aebdd”）; * 3.删除一个字符（如把“travelling”变为“trav
上传、下载压缩图片 chengxuyuancsdn 下载
/** * * @param uploadImage --本地路径(tomacat路径) * @param serverDir --服务器路径 * @param imageType --文件或图片类型 * 此方法可以上传文件或图片.txt,.jpg,.gif等 */ public void upload(String uploadImage,Str
bellman-ford(贝尔曼-福特)算法 comsci 算法 F#
Bellman-Ford算法(根据发明者 Richard Bellman 和 Lester Ford 命名)是求解单源最短路径问题的一种算法。单源点的最短路径问题是指：给定一个加权有向图G和源点s，对于图G中的任意一点v，求从s到v的最短路径。有时候这种算法也被称为 Moore-Bellman-Ford 算法，因为 Edward F. Moore zu 也为这个算法的发展做出了贡献。与迪科
oracle ASM中ASM_POWER_LIMIT参数 daizj ASM oracle ASM_POWER_LIMIT 磁盘平衡
ASM_POWER_LIMIT 该初始化参数用于指定ASM例程平衡磁盘所用的最大权值，其数值范围为0~11，默认值为1。该初始化参数是动态参数，可以使用ALTER SESSION或ALTER SYSTEM命令进行修改。示例如下： SQL>ALTER SESSION SET Asm_power_limit=2;
高级排序:快速排序 dieslrae 快速排序
public void quickSort(int[] array){ this.quickSort(array, 0, array.length - 1); } public void quickSort(int[] array,int left,int right){ if(right - left <= 0
C语言学习六指针_何谓变量的地址一个指针变量到底占几个字节 dcj3sjt126com C语言
# include <stdio.h> int main(void) { /* 1、一个变量的地址只用第一个字节表示 2、虽然他只使用了第一个字节表示，但是他本身指针变量类型就可以确定出他指向的指针变量占几个字节了 3、他都只存了第一个字节地址，为什么只需要存一个字节的地址，却占了4个字节，虽然只有一个字节，但是这些字节比较多，所以编号就比较大，
phpize使用方法 dcj3sjt126com PHP
phpize是用来扩展php扩展模块的，通过phpize可以建立php的外挂模块,下面介绍一个它的使用方法,需要的朋友可以参考下安装（fastcgi模式）的时候，常常有这样一句命令：代码如下: /usr/local/webserver/php/bin/phpize 一、phpize是干嘛的？ phpize是什么？ phpize是用来扩展php扩展模块的，通过phpi
Java虚拟机学习 - 对象引用强度 shuizhaosi888 JAVA虚拟机
本文原文链接：http://blog.csdn.net/java2000_wl/article/details/8090276 转载请注明出处！无论是通过计数算法判断对象的引用数量，还是通过根搜索算法判断对象引用链是否可达，判定对象是否存活都与“引用”相关。引用主要分为：强引用(Strong Reference)、软引用(Soft Reference)、弱引用(Wea
.NET Framework 3.5 Service Pack 1（完整软件包）下载地址 happyqing .net 下载 framework
Microsoft .NET Framework 3.5 Service Pack 1（完整软件包） http://www.microsoft.com/zh-cn/download/details.aspx?id=25150 Microsoft .NET Framework 3.5 Service Pack 1 是一个累积更新，包含很多基于 .NET Framewo
JAVA定时器的使用 jingjing0907 java timer 线程定时器
1、在应用开发中，经常需要一些周期性的操作，比如每5分钟执行某一操作等。对于这样的操作最方便、高效的实现方式就是使用java.util.Timer工具类。 privatejava.util.Timer timer; timer = newTimer(true); timer.schedule( newjava.util.TimerTask() { public void run()
Webbench 流浪鱼 webbench
首页下载地址 http://home.tiscali.cz/~cz210552/webbench.html Webbench是知名的网站压力测试工具，它是由Lionbridge公司（http://www.lionbridge.com）开发。 Webbench能测试处在相同硬件上，不同服务的性能以及不同硬件上同一个服务的运行状况。webbench的标准测试可以向我们展示服务器的两项内容：每秒钟相
第11章动画效果（中） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
windows下制作bat启动脚本. sanyecao2314 java cmd 脚本 bat
java -classpath C:\dwjj\commons-dbcp.jar;C:\dwjj\commons-pool.jar;C:\dwjj\log4j-1.2.16.jar;C:\dwjj\poi-3.9-20121203.jar;C:\dwjj\sqljdbc4.jar;C:\dwjj\voucherimp.jar com.citsamex.core.startup.MainStart
Java进行RSA加解密的例子 tomcat_oracle java
加密是保证数据安全的手段之一。加密是将纯文本数据转换为难以理解的密文；解密是将密文转换回纯文本。　　数据的加解密属于密码学的范畴。通常，加密和解密都需要使用一些秘密信息，这些秘密信息叫做密钥，将纯文本转为密文或者转回的时候都要用到这些密钥。　　对称加密指的是发送者和接收者共用同一个密钥的加解密方法。　　非对称加密(又称公钥加密)指的是需要一个私有密钥一个公开密钥，两个不同的密钥的
Android_ViewStub 阿尔萨斯 ViewStub
public final class ViewStub extends View java.lang.Object android.view.View android.view.ViewStub 类摘要： ViewStub 是一个隐藏的，不占用内存空间的视图对象，它可以在运行时延迟加载布局资源文件。当 ViewSt