智源社区

《强化学习周刊》第31期：康奈尔大学推出基于强化学习的数据库调优工具DB-BERT...

No.31

智源社区

强化学习组

强

化

学

习

研究

观点

资源

活动

关于周刊

强化学习作为人工智能领域研究热点之一，其研究进展与成果也引发了众多关注。为帮助研究与工程人员了解该领域的相关进展和资讯，智源社区结合领域内容，撰写为第31期《强化学习周刊》。本期周刊整理了强化学习领域相关的最新论文推荐及新工具，以飨诸位。

周刊采用社区协作的模式产生，欢迎感兴趣的朋友们参与我们的工作，一起来推动强化学习社群的分享、学习和交流活动。可以扫描文末的二维码加入强化学习社区群。

本期贡献者：李明、刘青、小胖、陈元

论文推荐

强化学习近年来取得了令人瞩目的成就，其应用于各个领域的研究也取得较大的进步，比如深度强化学习在道路预测性维护、深度强化学习在组合优化问题、对抗性强化学习在自动驾驶领域、多智能体城市城市中深度强化学习在自动驾驶应用鲁棒性、安全深度强化学习、离线强化学习、深度强化学习应用于交通信号控制和5/6G相关的理论及其最新应用等。

本次推荐了13篇强化学习领域的相关论文，主要涉及于道路资产预测性维护规划的深度强化学习模型：集成 LCA 和 LCCA、求解无人机旅行商问题的深度强化学习方法、基于可信自动驾驶策略的对抗性深度强化学习、在多智能体城市驾驶环境中评估自主和对抗策略的深度强化学习的鲁棒性、基于水上航行的安全深度强化学习基准研究、基于约束强化学习的安全证书和安全控制策略联合综合、利用动作影响规律和部分已知模型进行离线强化学习、基于搜索和注意力的鲁棒调度学习、近端策略优化中提前停止优化的实证研究、学习奖励机器：部分可观察强化学习的研究、通过深度强化学习自适应优化交通信号时间、使用深度强化学习扩展 5G/6G 核心网中的 UPF 实例及基于深度强化学习的动态避障中速度信息缺失的影响等。

标题：A deep reinforcement learning model for predictive maintenance planning of road assets: Integrating LCA and LCCA（道路资产预测性维护规划的深度强化学习模型：集成 LCA 和 LCCA）了解详情

简介：道路维护规划是道路资产管理的组成部分。维护和修复(M&R)实践中的主要挑战之一是确定维护类型和时间。本研究基于长期路面性能(LTPP)数据库提出了使用强化学习的框架，以确定M&R实践的类型和时间。在所提出的算法中首先开发了预测DNN模型，该模型用作RL算法的环境。针对RL模型的策略估计，开发了DQN模型和PPO模型。由于更好的收敛性和更高的样本效率，最终选择了PPO。本研究中使用的指标是国际粗糙度指数(IRI)和车辙深度(RD)。并在成本效益计算(奖励)中，本文考虑了M&R处理的经济和环境影响。成本和环境影响已经用paLATE 2.0软件进行了评估。研究表明，本文拟议的计划有一个合乎逻辑的结果。决策者和运输机构可以利用这一方案进行更好的维护实践，防止预算浪费，同时最大限度地减少环境影响。

论文链接：https://arxiv.org/ftp/arxiv/papers/2112/2112.12589.pdf

标题：A Deep Reinforcement Learning Approach for Solving the Traveling Salesman Problem with Drone（求解无人机旅行商问题的深度强化学习方法）了解详情

简介：强化学习最近在许多组合优化问题的学习质量解决方案中显示出前景。特别是，基于注意力的编码器-解码器模型在各种路由问题上表现出很高的效率，包括旅行商问题。然而它们在带有无人机的TSP(TSP-D)中表现不佳，需要协调路由一个异构车队——一辆卡车和一架无人机。在TSP-D中，两辆车一前一后移动，可能需要在一个节点等待另一辆车加入。基于无状态注意力的解码器无法在车辆之间进行这种协调。故本文提出了一个注意力编码器-LSTM解码器混合模型，其中解码器的隐藏状态可以表示所做的动作序列。从经验上证明，这种混合模型在解决方案质量和计算效率方面都优于纯粹基于注意力的模型。并在min-max Capacitated Vehicle Routing Problem (mmCVRP)最小-最大容量约束车辆路径问题上的实验也证实了混合模型比基于注意力的模型更适合多车辆的协调路径。

论文链接：https://arxiv.org/pdf/2112.12545.pdf

标题：Adversarial Deep Reinforcement Learning for Trustworthy Autonomous Driving Policies（基于可信自动驾驶策略的对抗性深度强化学习）了解详情

简介：深度强化学习被广泛用于在模拟环境中训练自动驾驶汽车。尽管如此，无人驾驶汽车在遭遇敌对攻击时还是很容易受到攻击。由此引发的问题为是否可以训练对手作为驱动智能体，在自动驾驶汽车中发现故障场景，然后用新的对抗性输入重新训练自动驾驶汽车，以提高它们的鲁棒性。本文首先在两个自定义奖励函数上训练和比较对抗性汽车策略，以测试多智能体环境下自动驾驶汽车的驾驶控制决策。其次，通过验证对抗性示例不仅可以用于发现不想要的自动驾驶行为，还可以帮助自动驾驶汽车改进其深度强化学习策略。通过使用高保真城市驾驶模拟环境和基于视觉的驾驶代理，本文证明了使用对手播放器重新训练的自动驾驶汽车在减少碰撞和越野转向错误方面显著提高了其驾驶策略的性能。

论文链接：https://arxiv.org/pdf/2112.11937.pdf

标题：Evaluating the Robustness of Deep Reinforcement Learning for Autonomous and Adversarial Policies in a Multi-agent Urban Driving Environment（在多智能体城市驾驶环境中评估自主和对抗策略的深度强化学习的鲁棒性）了解详情

简介：深度强化学习被积极用于在基于视觉的城市模拟环境中训练自动驾驶智能体。由于各种强化学习算法的可用性很高，仍然不确定在单智能体和多智能体驾驶环境中训练自动驾驶汽车时，算法优劣性。基于视觉的自动驾驶中深度强化学习的比较将为训练更好的自动驾驶汽车策略开辟可能性。本文对6种深度强化学习算法进行了系统的评估和比较分析，分别用于四向交叉场景下的自主驾驶和对抗驾驶。即首先使用最新的深度强化学习算法来训练自动驾驶汽车。其次，测试了训练好的自主策略在单智能体和多智能体场景下的驱动能力。最后，使用相同的深度强化学习算法来训练对抗性驾驶代理，以测试自动驾驶汽车的驾驶性能，并寻找可能的碰撞和越野驾驶场景，和使用纯视觉高保真城市驾驶模拟环境进行实验。

论文链接：https://arxiv.org/pdf/2112.11947.pdf

标题：Benchmarking Safe Deep Reinforcement Learning in Aquatic Navigation（基于水上航行的安全深度强化学习基准研究）了解详情

简介：本文提出了一个新的基于水上航行的安全强化学习基准环境。由于非静态环境和机器人平台的不确定性，水上航行是一项极具挑战性的任务，因此通过分析训练网络的行为来避免危险情况(例如碰撞)来考虑问题的安全方面至关重要。为此，本文考虑了基于价值和策略梯度的深度强化学习(DRL)，提出了基于交叉的策略，该策略结合了基于梯度和无梯度的DRL来提高样本效率。并且提出了基于区间分析的验证策略，该策略检查经过训练的模型在一组所需属性上的行为。研究结果表明，基于交叉的训练优于先前的DRL方法，而本文的验证允许量化违反由属性描述的行为的配置的数量。至关重要的是，这将成为该应用领域未来研究的基准。

论文链接：https://arxiv.org/pdf/2112.10593.pdf

标题：The Impact of Missing Velocity Information in Dynamic Obstacle Avoidance based on Deep Reinforcement Learning（基于深度强化学习的动态避障中速度信息缺失的影响）了解详情

简介：本文通过定义具有可变复杂度的交通类型独立环境，提出了一种基于深度强化学习的动态避障方法。填补了现有文献的空白，通过深入研究了速度信息缺失对智能体在避障任务中性能的影响。这在实践中是一个关键问题，因为几个传感器只产生物体或车辆的位置信息。本文评估了部分可观测场景中常用的方法，即在深层神经网络中加入递归和简单的帧叠加。对于本文的分析，其依赖于最先进的无模型深度RL算法。速度信息的缺乏会显著影响代理的性能。这两种方法—重现和帧叠加—都不能始终如一地替代观测空间中缺失的速度信息。但是，在简化的场景中，它们可以显著提高性能并稳定整个训练过程。

论文链接：https://arxiv.org/pdf/2112.12465.pdf

标题：Joint Synthesis of Safety Certificate and Safe Control Policy using Constrained Reinforcement Learning（基于约束强化学习的安全证书和安全控制策略联合综合）了解详情

简介：安全性是使用强化学习（RL）控制复杂动力系统的主要考虑因素，其中安全证书可以提供可证明的安全保证。有效的安全证书是一种能量函数，表明安全状态为低能，并且存在相应的安全控制策略，允许能量函数始终消散。安全证书和安全控制政策密切相关，两者都很难综合。因此，现有的基于学习的研究将其中一个视为学习另一个的先验知识，这限制了它们在一般未知动态下的适用性。本文提出了一种新的方法，该方法同时综合基于能量函数的安全证书，并利用CRL学习安全控制策略。本文不依赖现有基于模型的控制器或完美安全证书的先验知识。特别是，本文建立了一个损失函数，通过最小化能量增加的发生来优化安全证书参数。通过将此优化过程作为外环添加到基于拉格朗日的约束强化学习（CRL）中，本文联合更新策略和安全证书参数，并证明它们将收敛到各自的局部最优解、最优安全策略和有效安全证书。

论文链接：https://arxiv.org/pdf/2111.07695.pdf

标题：Exploiting Action Impact Regularity and Partially Known Models for Offline Reinforcement Learning（利用动作影响规律和部分已知模型进行离线强化学习）了解详情

简介：离线强化学习从一批数据中学习策略是很困难的：如果不做出强有力的假设，很容易构造反例，导致现有算法失败。在这项工作中，本文考虑了一些现实世界的问题，其中离线强化学习应该是有效的：那些行动只对国家的一部分有有限的影响。本文形式化并引入这个动作影响规律性（AIR）属性。文章进一步提出了一种算法，该算法假设并利用了AIR特性，并在MDP满足AIR时，对输出策略的次优性进行了约束。最后，文章在两个模拟环境中证明了算法在不同的数据收集策略下优于现有的离线强化学习算法。

论文链接：https://arxiv.org/pdf/2111.08066.pdf

标题：Learning Robust Scheduling with Search and Attention（基于搜索和注意力的鲁棒调度学习）了解详情

简介：基于信道质量、缓冲区大小、需求和约束为用户分配物理层资源是无线资源管理中的核心优化问题之一。解空间随着每个维度的基数组合增长，使得在严格的时间要求下，很难使用穷举搜索甚至经典优化算法找到最优解。这个问题在MU-MIMO调度中更为明显，由于调度器可以将多个用户分配给相同的时频物理资源。因此，传统的方法求助于设计启发式算法，以最优性换取执行的可行性。本文将MU-MIMO调度问题视为一个树结构的组合问题，并借鉴AlphaGo Zero最近的成功经验，研究使用蒙特卡罗树搜索和强化学习相结合的方法搜索最佳性能解决方案的可行性。为了迎合当前问题的本质，比如用户缺乏内在的排序以及用户组合之间依赖关系的重要性，通过引入自我注意机制对神经网络结构进行了根本性的修改。在存在测量不确定性和有限缓冲区的情况下，所得到的方法不仅可行，而且大大优于最新的基于启发式的调度方法。

论文链接：https://arxiv.org/pdf/2111.08073.pdf

标题：An Empirical Investigation of Early Stopping Optimizations in Proximal Policy Optimization（近端策略优化中提前停止优化的实证研究）了解详情

简介：代码级优化是算法实现中使用的低级优化技术，一般不会出现在已发布的强化学习（RL）伪代码算法中。最近研究表明，这些优化对算法的性能至关重要，如近端策略优化（PPO）。本文研究了在openai/spinningup库中，为PPO实施的一种称为“提前停止”的优化效果。如果目标策略和当前策略之间的平均Kullback-Leibler（KL）差异太大，这种优化技术（KLE Stop）可以在一个时期内停止策略更新。具体来说，本文进行实验以检验 KLE-Stop 及其保守变体 KLE-Rollback 在与其他常见代码级优化结合使用时的经验重要性。本文主要发现：1）PPO的性能对每个回合的更新迭代次数K很敏感，2）提前停止优化（KLE停止和KLE回滚）通过动态调整一个回合内的实际更新迭代次数来降低这种敏感性，3）提前停止优化可以作为调整K的一种方便的替代方法。

论文链接：https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=9520424

标题：Learning Reward Machines: A Study in Partially Observable Reinforcement Learning（学习奖励机器：部分可观察强化学习的研究）了解详情

简介：强化学习（RL）是人工智能的核心问题，包括定义可以通过与环境交互来学习最佳行为的人工智能体—其中最佳行为是根据智能体寻求最大化的奖励信号来定义的。奖励机器 (RM) 提供奖励函数的结构化，使 RL智能体能够将 RL 问题分解为结构化子问题，这些子问题可以通过离线策略学习有效地学习。本文表明 RM 可以从经验中学习，而不是由用户指定，并且由此产生的问题分解可用于有效解决部分可观察的 RL 问题。本文将学习 RM 的任务视为离散优化问题，其目标是找到将问题分解为一组子问题的 RM，使得它们的最佳无记忆策略的组合是原始问题的最佳策略。本文在三个部分可观察的领域展示了这种方法的有效性，在这些领域它明显优于 A3C、PPO 和 ACER，并讨论了它的优势、局限性和更广泛的潜力。

论文链接：https://arxiv.org/pdf/2112.09477.pdf

标题：Adaptive Optimization of Traffic Signal Timing via Deep Reinforcement Learning（通过深度强化学习自适应优化交通信号时间）了解详情

简介：传统的红绿灯控制是通过优化循环长度，计算出一系列相应的时序参数的方法。然而，固定交通灯的顺序和持续时间对于动态交通流量调节是低效的。为了解决上述问题，本研究提出了一种基于深度强化学习（DRL）的交通灯配时优化方案。在该方案中，红绿灯可以根据路口各个方向的交通流状态输出合适的相位，动态调整相位长度。具体来说，本文首先采用近端策略优化（PPO）来提高模型的收敛速度。然后，本文详细阐述状态、动作的设计以及奖励，车辆状态由离散交通状态编码（DTSE）方法定义。最后，本文通过交通仿真平台SUMO对真实交通数据进行了实验。结果表明，与传统的时序控制相比，所提出的方案能够有效减少车辆在各种交通流模式下的等待时间和队列长度。

论文链接：https://downloads.hindawi.com/journals/jat/2021/6616702.pdf

标题：Scaling UPF Instances in 5G/6G Core With Deep Reinforcement Learning（使用深度强化学习扩展 5G/6G 核心网中的 UPF 实例）了解详情

简介：在 5G 核心和即将推出的 6G 核心中，用户平面功能 (UPF) 负责在协议数据单元（PDU）会话中向用户传输数据。UPF 通常在软件中实现并打包到虚拟机或容器中，这些虚拟机或容器可以作为 UPF 实例启动，在集群中具有特定的资源需求。为了节省 UPF 实例所需的资源消耗，启动 UPF 实例的数量应取决于客户所需的 PDU 会话数量，这通常由缩放算法控制。本文研究了深度强化学习 (DRL) 在扩展 Kubernetes 容器编排框架容器中的 UPF 实例方面的应用。本文提出了一种制定基于阈值的奖励函数的方法，并采用了近端策略优化 (PPO) 算法。此外，本文应用支持向量机 (SVM) 分类器来处理智能体因随机策略而建议不需要的动作时的问题。

论文链接：https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=9648317

新工具

标题：康奈尔大学 | DB-BERT：“阅读手册”的数据库调优工具了解详情

简介：DB-BERT是一个数据库调优工具，它利用通过手册和其他相关文本文档的自然语言分析获得的信息。它使用文本来标识要调整的数据库系统参数以及推荐的参数值。DB-BERT应用大型的、预先训练好的语言模型(特别是BERT模型)进行文本分析。在初始训练阶段，它微调模型权重，以便将自然语言提示转换为推荐设置。在运行时，DB-BERT学会聚合、调整和区分提示的优先级，以实现特定数据库系统和基准的最佳性能。这两个阶段都是迭代的，使用强化学习来指导选择要评估的调优设置(惩罚数据库系统拒绝的设置，同时奖励提高性能的设置)。本实验利用数百个关于数据库调优的文本文档作为DB-BERT的输入。考虑到不同的基准(TPC-C和TPC-H)、度量(吞吐量和运行时间)以及数据库系统(Postgres和MySQL)，并将DB-BERT与各种基准进行比较。在所有情况下，DB-BERT都会在所有比较的方法中找到最佳的参数设置。

论文链接：

https://arxiv.org/pdf/2112.10925.pdf

如果你正在从事或关注强化学习研究、实现与应用，欢迎加入“智源社区-强化学习-交流群”。在这里，你可以：

学习前沿知识、求解疑难困惑
分享经验心得、展示风貌才华
参与专属活动、结识研究伙伴

扫描下方二维码，加入强化学习兴趣群。

系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
C++11堆操作深度解析：std::is_heap与std::is_heap_until原理解析与实践
文章目录堆结构基础与函数接口堆的核心性质函数签名与核心接口std::is_heapstd::is_heap_until实现原理深度剖析std::is_heap的验证逻辑std::is_heap_until的定位策略算法优化细节代码实践与案例分析基础用法演示自定义比较器实现最小堆检查边缘情况处理性能分析与实际应用时间复杂度对比典型应用场景与手动实现的对比注意事项与最佳实践迭代器要求比较器设计C++标
Flask框架入门：快速搭建轻量级Python网页应用「已注销」 python-AI python基础网站网络 python flask 后端
转载：Flask框架入门：快速搭建轻量级Python网页应用1.Flask基础Flask是一个使用Python编写的轻量级Web应用框架。它的设计目标是让Web开发变得快速简单，同时保持应用的灵活性。Flask依赖于两个外部库：Werkzeug和Jinja2，Werkzeug作为WSGI工具包处理Web服务的底层细节，Jinja2作为模板引擎渲染模板。安装Flask非常简单，可以使用pip安装命令
Python Flask 框架入门：快速搭建 Web 应用的秘诀 Python编程之道 Python人工智能与大数据 Python编程之道 python flask 前端 ai
PythonFlask框架入门：快速搭建Web应用的秘诀关键词Flask、微框架、路由系统、Jinja2模板、请求处理、WSGI、Web开发摘要想快速用Python搭建一个灵活的Web应用？Flask作为“微框架”代表，凭借轻量、可扩展的特性，成为初学者和小型项目的首选。本文将从Flask的核心概念出发，结合生活化比喻、代码示例和实战案例，带你一步步掌握：如何用Flask搭建第一个Web应用？路由
冒泡、选择、插入排序：三大基础排序算法深度解析（C语言实现） xienda 算法排序算法数据结构
在算法学习道路上，排序算法是每位程序员必须掌握的基石。本文将深入解析冒泡排序、选择排序和插入排序这三种基础排序算法，通过C语言代码实现和对比分析，帮助读者彻底理解它们的差异与应用场景。算法原理与代码实现1.冒泡排序（BubbleSort）工作原理：通过重复比较相邻元素，将较大元素逐步"冒泡"到数组末尾。voidbubbleSort(intarr[],intn){ for(inti=0;iarr[
Leetcode 148. 排序链表
文章目录前引题目代码（首刷看题解）代码（8.9二刷部分看解析）代码（9.15三刷部分看解析）前引综合性比较强的一道题，要求时间复杂度必须O(logn)才能通过，最适合链表的排序算法就是归并。这里采用自顶向下的方法步骤：找到链表中点（双指针）对两个子链表排序(递归，直到只有一个结点，记得将子链表最后指向nullptr）归并（引入dummy结点）题目Leetcode148.排序链表代码（首刷看题解）c
python_虚拟环境阿_焦 python
第一、配置虚拟环境：virtualenv（1）pipvirtualenv>安装虚拟环境包（2）pipinstallvirtualenvwrapper-win>安装虚拟环境依赖包（3）c盘创建虚拟目录>C:\virtualenv>配置环境变量【了解一下】：（1）如何使用virtualenv创建虚拟环境a、cd到C:\virtualenv目录下：b、mkvirtualenvname>创建虚拟环境nam
全面触摸屏输入法设计与实现长野君
本文还有配套的精品资源，点击获取简介：触摸屏输入法是针对触摸设备优化的文字输入方案，包括虚拟键盘、手写、语音识别和手势等多种输入方式。本方案通过提供主程序文件、用户手册、界面截图、示例图、说明文本和音效文件，旨在为用户提供一个完整的、多样的文字输入体验。开发者通过持续优化算法和用户界面，使用户在无物理键盘环境下也能高效准确地进行文字输入。1.触摸屏输入法概述简介在现代信息技术飞速发展的今天，触摸屏
Android 开源组件和第三方库汇总 gyyzzr Android Android 开源框架
转载1、github排名https://github.com/trending,github搜索：https://github.com/search2、https://github.com/wasabeef/awesome-android-ui目录UIUI卫星菜单节选器下拉刷新模糊效果HUD与Toast进度条UI其它动画网络相关响应式编程地图数据库图像浏览及处理视频音频处理测试及调试动态更新热更新
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）阿牛的药铺算法移植部署 fpga开发 verilog
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）引言：为什么这个FPGA入门路线能帮你快速上岗？本文设计了一条**"Verilog语法→工具链操作→光学项目实战→岗位技能对标"的阶梯式学习路径。不同于泛泛而谈的FPGA教程，我们聚焦光学类产品开发**核心能力（时序接口设计、图像处理算法移植、高速接口应用），通过3个递进式项目（从LED闪烁到图像边缘检测），
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
Python爱心光波
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
Python流星雨 Want595 python 开发语言
文章目录系列文章写在前面技术需求完整代码代码分析1.模块导入2.画布设置3.画笔设置4.颜色列表5.流星类(Star)6.流星对象创建7.主循环8.流星运动逻辑9.视觉效果10.总结写在后面系列文章序号直达链接表白系列1Python制作一个无法拒绝的表白界面2Python满屏飘字表白代码3Python无限弹窗满屏表白代码4Python李峋同款可写字版跳动的爱心5Python流星雨代码6Python
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
Python之七彩花朵代码实现 PlutoZuo Python python 开发语言
Python之七彩花朵代码实现文章目录Python之七彩花朵代码实现下面是一个简单的使用Python的七彩花朵。这个示例只是一个简单的版本，没有很多高级功能，但它可以作为一个起点，你可以在此基础上添加更多功能。importturtleastuimportrandomasraimportmathtu.setup(1.0,1.0)t=tu.Pen()t.ht()colors=['red','skybl
算法学习笔记：15.二分查找 ——从原理到实战，涵盖 LeetCode 与考研 408 例题呆呆企鹅仔算法学习算法学习笔记考研二分查找
在计算机科学的查找算法中，二分查找以其高效性占据着重要地位。它利用数据的有序性，通过不断缩小查找范围，将原本需要线性时间的查找过程优化为对数时间，成为处理大规模有序数据查找问题的首选算法。二分查找的基本概念二分查找（BinarySearch），又称折半查找，是一种在有序数据集合中查找特定元素的高效算法。其核心原理是：通过不断将查找范围减半，快速定位目标元素。与线性查找逐个遍历元素不同，二分查找依赖
Python 脚本最佳实践2025版
前文可以直接把这篇文章喂给AI,可以放到AI角色设定里,也可以直接作为提示词.这样,你只管提需求,写脚本就让AI来.概述追求简洁和清晰：脚本应简单明了。使用函数(functions)、常量(constants)和适当的导入(import)实践来有逻辑地组织你的Python脚本。使用枚举(enumerations)和数据类(dataclasses)等数据结构高效管理脚本状态。通过命令行参数增强交互性
（Python基础篇）了解和使用分支结构 EternityArt 基础篇 python
目录一、引言二、Python分支结构的类型与语法（一）if语句（单分支）（二）if-else语句（双分支）（三）if-elif-else语句（多分支）三、分支结构的应用场景（一）提示用户输入用户名，然后再提示输入密码，如果用户名是“admin”并且密码是“88888”则提示正确，否则，如果用户名不是admin还提示用户用户名不存在,（二）提示用户输入用户名，然后再提示输入密码，如果用户名是“adm
（Python基础篇）循环结构 EternityArt 基础篇 python
一、什么是Python循环结构？循环结构是编程中重复执行代码块的机制。在Python中，循环允许你：1.迭代处理数据：遍历列表、字典、文件内容等。2.自动化重复任务：如批量处理数据、生成序列等。3.控制执行流程：根据条件决定是否继续或终止循环。二、为什么需要循环结构？假设你需要打印1到100的所有偶数：没有循环：需手动编写100行print()语句。print(0)print(2)print(4)
（Python基础篇）字典的操作 EternityArt 基础篇 python 开发语言
一、引言在Python编程中，字典（Dictionary）是一种极具灵活性的数据结构，它通过“键-值对”（key-valuepair）的形式存储数据，如同现实生活中的字典——通过“词语（键）”快速查找“释义（值）”。相较于列表和元组的有序索引访问，字典的优势在于基于键的快速查找，这使得它在处理需要频繁通过唯一标识获取数据的场景中极为高效。掌握字典的操作，能让我们更高效地组织和管理复杂数据，是Pyt
LeetCode算法题：电话号码的字母组合吱屋猪_ 算法 leetcode java
题目描述：给定一个仅包含数字2-9的字符串，返回所有它能表示的字母组合。答案可以按任意顺序返回。给出数字到字母的映射如下（与电话按键相同）。注意1不对应任何字母。2->"abc"3->"def"4->"ghi"5->"jkl"6->"mno"7->"pqrs"8->"tuv"9->"wxyz"例如，给定digits="23"，返回["ad","ae","af","bd","be","bf","cd
Python七彩花朵 Want595 python 开发语言
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
CentOS7环境卸载MySQL5.7 Hadoop_Liang mysql 数据库 mysql
备份重要数据切记，卸载之前先备份mysql重要的数据。备份一个数据库例如：备份名为mydatabase的数据库到backup.sql的文件中mysqldump-uroot-ppassword123mydatabase>backup.sql备份所有数据库mysqldump-uroot-ppassword123--all-databases>all_databases_backup.sql注意：-p后
php SPOF 贵哥的编程之路(热爱分享为后来者) PHP语言经典程序100题 php 开发语言
1.什么是单点故障（SPOF）？单点故障指的是系统中某个组件一旦失效，整个系统或服务就会不可用。常见的单点有：数据库、缓存、Web服务器、负载均衡、网络设备等。2.常见单点故障场景只有一台数据库服务器，宕机后所有业务不可用只有一台Redis缓存，挂掉后缓存全部失效只有一台Web服务器，挂掉后网站无法访问只有一个负载均衡节点，挂掉后流量无法分发只有一条网络链路，断开后所有服务失联3.消除单点故障的主
霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
用OpenCV标定相机内参应用示例（C++和Python）
下面是一个完整的使用OpenCV进行相机内参标定（CameraCalibration）的示例，包括C++和Python两个版本，基于棋盘格图案标定。一、目标：相机标定通过拍摄多张带有棋盘格图案的图像，估计相机的内参：相机矩阵（内参）K畸变系数distCoeffs可选外参（R,T）标定精度指标（如重投影误差）二、棋盘格参数设置（根据自己的棋盘格设置）：棋盘格角点数：9x6（内角点，9列×6行）；每个
centos7安装 mysql5.7(安装包) heiPony linux mysql mariadb centos mysql
一.卸载centos7自带数据库查看系统自带的Mariadbrpm-qa|grepmariadbmariadb-libs-5.5.44-2.el7.centos.x86_64卸载rpm-e--nodepsmariadb-libs-5.5.44-2.el7.centos.x86_64删除etc目录下的my.cnfrm/etc/my.cnf二.检查mysql是否存在(有就卸载,删除相关文件)rpm-q
Anaconda 详细下载与安装教程
Anaconda详细下载与安装教程1.简介Anaconda是一个用于科学计算的开源发行版，包含了Python和R的众多常用库。它还包括了conda包管理器，可以方便地安装、更新和管理各种软件包。2.下载Anaconda2.1访问官方网站首先，打开浏览器，访问Anaconda官方网站。2.2选择适合的版本在页面中，你会看到两个主要的下载选项：AnacondaIndividualEdition：适用于
MySQL Explain 详解：从入门到精通，让你的 SQL 飞起来
引言：为什么Explain是SQL优化的“照妖镜”？在Java开发中，我们常常会遇到数据库性能瓶颈的问题。一条看似简单的SQL语句，在数据量增长到一定规模后，可能会从毫秒级响应变成秒级甚至分钟级响应，直接拖慢整个应用的性能。此时，你是否曾困惑于：为什么这条SQL突然变慢了？索引明明建了，为什么没生效？到底是哪里出了问题？答案就藏在MySQL的EXPLAIN命令里。EXPLAIN就像一面“照妖镜”，
python中 @注解及内置注解的使用方法总结以及完整示例慧一居士 Python python
在Python中，装饰器（Decorator）使用@符号实现，是一种修改函数/类行为的语法糖。它本质上是一个高阶函数，接受目标函数作为参数并返回包装后的函数。Python也提供了多个内置装饰器，如@property、@staticmethod、@classmethod等。一、核心概念装饰器本质：@decorator等价于func=decorator(func)执行时机：在函数/类定义时立即执行装饰
多线程编程之存钱与取钱周凡杨 java thread 多线程存钱取钱
生活费问题是这样的：学生每月都需要生活费，家长一次预存一段时间的生活费，家长和学生使用统一的一个帐号，在学生每次取帐号中一部分钱，直到帐号中没钱时通知家长存钱，而家长看到帐户还有钱则不存钱，直到帐户没钱时才存钱。问题分析：首先问题中有三个实体，学生、家长、银行账户，所以设计程序时就要设计三个类。其中银行账户只有一个，学生和家长操作的是同一个银行账户，学生的行为是
java中数组与List相互转换的方法征客丶 JavaScript java jsonp
1.List转换成为数组。（这里的List是实体是ArrayList) 　　调用ArrayList的toArray方法。　　toArray 　　public T[] toArray(T[] a)返回一个按照正确的顺序包含此列表中所有元素的数组；返回数组的运行时类型就是指定数组的运行时类型。如果列表能放入指定的数组，则返回放入此列表元素的数组。否则，将根据指定数组的运行时类型和此列表的大小分
Shell 流程控制 daizj 流程控制 if else while case shell
Shell 流程控制和Java、PHP等语言不一样，sh的流程控制不可为空，如(以下为PHP流程控制写法)： <?php if(isset($_GET["q"])){ search(q);}else{// 不做任何事情} 在sh/bash里可不能这么写，如果else分支没有语句执行，就不要写这个else，就像这样 if else if if 语句语
Linux服务器新手操作之二周凡杨 Linux 简单操作
1.利用关键字搜寻Man Pages man -k keyword 其中-k 是选项，keyword是要搜寻的关键字如果现在想使用whoami命令，但是只记住了前3个字符who，就可以使用 man -k who来搜寻关键字who的man命令 [haself@HA5-DZ26 ~]$ man -k
socket聊天室之服务器搭建朱辉辉33 socket
因为我们做的是聊天室，所以会有多个客户端，每个客户端我们用一个线程去实现，通过搭建一个服务器来实现从每个客户端来读取信息和发送信息。我们先写客户端的线程。 public class ChatSocket extends Thread{ Socket socket; public ChatSocket(Socket socket){ this.sock
利用finereport建设保险公司决策分析系统的思路和方法老A不折腾 finereport 金融保险分析系统报表系统项目开发
决策分析系统呈现的是数据页面，也就是俗称的报表，报表与报表间、数据与数据间都按照一定的逻辑设定，是业务人员查看、分析数据的平台，更是辅助领导们运营决策的平台。底层数据决定上层分析，所以建设决策分析系统一般包括数据层处理（数据仓库建设）。项目背景介绍通常，保险公司信息化程度很高，基本上都有业务处理系统（像集团业务处理系统、老业务处理系统、个人代理人系统等）、数据服务系统（通过
始终要页面在ifream的最顶层林鹤霄
index.jsp中有ifream，但是session消失后要让login.jsp始终显示到ifream的最顶层。。。始终没搞定，后来反复琢磨之后，得到了解决办法，在这儿给大家分享下。。 index.jsp--->主要是加了颜色的那一句 <html> <iframe name="top" ></iframe> <ifram
MySQL binlog恢复数据 aigo mysql
1，先确保my.ini已经配置了binlog： # binlog log_bin = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.log log_bin_index = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.index log_error = D:/mysql-5.6.21-win
OCX打成CBA包并实现自动安装与自动升级 alxw4616 ocx cab
近来手上有个项目,需要使用ocx控件 (ocx是什么? http://baike.baidu.com/view/393671.htm) 在生产过程中我遇到了如下问题. 1. 如何让 ocx 自动安装? a) 如何签名? b) 如何打包? c) 如何安装到指定目录? 2.
Hashmap队列和PriorityQueue队列的应用百合不是茶 Hashmap队列 PriorityQueue队列
HashMap队列已经是学过了的,但是最近在用的时候不是很熟悉,刚刚重新看以一次, HashMap是K,v键 ,值 put()添加元素 //下面试HashMap去掉重复的 package com.hashMapandPriorityQueue; import java.util.H
JDK1.5 returnvalue实例 bijian1013 java thread java多线程 returnvalue
Callable接口：返回结果并且可能抛出异常的任务。实现者定义了一个不带任何参数的叫做 call 的方法。 Callable 接口类似于 Runnable，两者都是为那些其实例可能被另一个线程执行的类设计的。但是 Runnable 不会返回结果，并且无法抛出经过检查的异常。 ExecutorService接口方
angularjs指令中动态编译的方法(适用于有异步请求的情况) 内嵌指令无效 bijian1013 JavaScript AngularJS
在directive的link中有一个$http请求，当请求完成后根据返回的值动态做element.append('......');这个操作，能显示没问题，可问题是我动态组的HTML里面有ng-click，发现显示出来的内容根本不执行ng-click绑定的方法！
【Java范型二】Java范型详解之extend限定范型参数的类型 bit1129 extend
在第一篇中，定义范型类时，使用如下的方式： public class Generics<M, S, N> { //M,S,N是范型参数 } 这种方式定义的范型类有两个基本的问题： 1. 范型参数定义的实例字段，如private M m = null;由于M的类型在运行时才能确定，那么我们在类的方法中，无法使用m，这跟定义pri
【HBase十三】HBase知识点总结 bit1129 hbase
1. 数据从MemStore flush到磁盘的触发条件有哪些？ a.显式调用flush，比如flush 'mytable' b.MemStore中的数据容量超过flush的指定容量，hbase.hregion.memstore.flush.size,默认值是64M 2. Region的构成是怎么样？ 1个Region由若干个Store组成
服务器被DDOS攻击防御的SHELL脚本 ronin47
mkdir /root/bin vi /root/bin/dropip.sh #!/bin/bash/bin/netstat -na|grep ESTABLISHED|awk ‘{print $5}’|awk -F:‘{print $1}’|sort|uniq -c|sort -rn|head -10|grep -v -E ’192.168|127.0′|awk ‘{if($2!=null&a
java程序员生存手册-craps 游戏-一个简单的游戏 bylijinnan java
import java.util.Random; public class CrapsGame { /** * *一个简单的赌*博游戏，游戏规则如下： *玩家掷两个骰子，点数为1到6，如果第一次点数和为7或11，则玩家胜， *如果点数和为2、3或12，则玩家输， *如果和为其它点数，则记录第一次的点数和，然后继续掷骰，直至点数和等于第一次掷出的点
TOMCAT启动提示NB: JAVA_HOME should point to a JDK not a JRE解决开窍的石头 JAVA_HOME
当tomcat是解压的时候，用eclipse启动正常，点击startup.bat的时候启动报错; 报错如下： The JAVA_HOME environment variable is not defined correctly This environment variable is needed to run this program NB: JAVA_HOME shou
[操作系统内核]操作系统与互联网 comsci 操作系统
我首先申明：我这里所说的问题并不是针对哪个厂商的，仅仅是描述我对操作系统技术的一些看法操作系统是一种与硬件层关系非常密切的系统软件，按理说，这种系统软件应该是由设计CPU和硬件板卡的厂商开发的，和软件公司没有直接的关系，也就是说，操作系统应该由做硬件的厂商来设计和开发
富文本框ckeditor_4.4.7 文本框的简单使用支持IE11 cuityang 富文本框
<html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> <title>知识库内容编辑</tit
Property null not found darrenzhu datagrid Flex Advanced propery null
When you got error message like "Property null not found ***", try to fix it by the following way: 1)if you are using AdvancedDatagrid, make sure you only update the data in the data prov
MySQl数据库字符串替换函数使用 dcj3sjt126com mysql 函数替换
需求：需要将数据表中一个字段的值里面的所有的 . 替换成 _ 原来的数据是 site.title site.keywords .... 替换后要为 site_title site_keywords 使用的SQL语句如下： updat
mac上终端起动MySQL的方法 dcj3sjt126com mysql mac
首先去官网下载: http://www.mysql.com/downloads/ 我下载了5.6.11的dmg然后安装,安装完成之后..如果要用终端去玩SQL.那么一开始要输入很长的:/usr/local/mysql/bin/mysql 这不方便啊,好想像windows下的cmd里面一样输入mysql -uroot -p1这样...上网查了下..可以实现滴. 打开终端,输入: 1
Gson使用一（Gson） eksliang json gson
转载请出自出处：http://eksliang.iteye.com/blog/2175401 一.概述从结构上看Json，所有的数据（data）最终都可以分解成三种类型：第一种类型是标量（scalar），也就是一个单独的字符串（string）或数字（numbers），比如"ickes"这个字符串。第二种类型是序列（sequence），又叫做数组（array）
android点滴4 gundumw100 android
Android 47个小知识 http://www.open-open.com/lib/view/open1422676091314.html Android实用代码七段（一） http://www.cnblogs.com/over140/archive/2012/09/26/2611999.html http://www.cnblogs.com/over140/arch
JavaWeb之JSP基本语法 ihuning javaweb
目录 JSP模版元素 JSP表达式 JSP脚本片断 EL表达式 JSP注释特殊字符序列的转义处理如何查找JSP页面中的错误 JSP模版元素 JSP页面中的静态HTML内容称之为JSP模版元素，在静态的HTML内容之中可以嵌套JSP
App Extension编程指南（iOS8/OS X v10.10）中文版啸笑天 ext
当iOS 8.0和OS X v10.10发布后，一个全新的概念出现在我们眼前，那就是应用扩展。顾名思义，应用扩展允许开发者扩展应用的自定义功能和内容，能够让用户在使用其他app时使用该项功能。你可以开发一个应用扩展来执行某些特定的任务，用户使用该扩展后就可以在多个上下文环境中执行该任务。比如说，你提供了一个能让用户把内容分
SQLServer实现无限级树结构 macroli oracle sql SQL Server
表结构如下：数据库id path titlesort 排序 1 0 首页 0 2 0,1 新闻 1 3 0,2 JAVA 2 4 0,3 JSP 3 5 0,2,3 业界动态 2 6 0,2,3 国内新闻 1 创建一个存储过程来实现，如果要在页面上使用可以设置一个返回变量将至传过去 create procedure test as begin decla
Css居中div，Css居中img，Css居中文本，Css垂直居中div qiaolevip 众观千象学习永无止境每天进步一点点 css
/**********Css居中Div**********/ div.center { width: 100px; margin: 0 auto; } /**********Css居中img**********/ img.center { display: block; margin-left: auto; margin-right: auto; }
Oracle 常用操作(实用) 吃猫的鱼 oracle
SQL>select text from all_source where owner=user and name=upper('&plsql_name'); SQL>select * from user_ind_columns where index_name=upper('&index_name'); 将表记录恢复到指定时间段以前
iOS中使用RSA对数据进行加密解密 witcheryne ios rsa iPhone objective c
RSA算法是一种非对称加密算法,常被用于加密数据传输.如果配合上数字摘要算法, 也可以用于文件签名. 本文将讨论如何在iOS中使用RSA传输加密数据. 本文环境 mac os openssl-1.0.1j, openssl需要使用1.x版本, 推荐使用[homebrew](http://brew.sh/)安装. Java 8 RSA基本原理 RS

《强化学习周刊》第31期：康奈尔大学推出基于强化学习的数据库调优工具DB-BERT...

你可能感兴趣的:(算法,大数据,数据库,python,机器学习)