智源社区

《强化学习周刊》第30期：Deep Mind开展人机交互的新试点研究、MIT提出神经进化优化框架...

No.30

智源社区

强化学习组

强

化

学

习

研究

观点

资源

活动

关于周刊

强化学习作为人工智能领域研究热点之一，其研究进展与成果也引发了众多关注。为帮助研究与工程人员了解该领域的相关进展和资讯，智源社区结合领域内容，撰写为第30期《强化学习周刊》。本期周刊整理了强化学习领域相关的最新论文推荐等，以飨诸位。

周刊采用社区协作的模式产生，欢迎感兴趣的朋友们参与我们的工作，一起来推动强化学习社群的分享、学习和交流活动。可以扫描文末的二维码加入强化学习社区群。

本期贡献者：李明、刘青、小胖

论文推荐

强化学习近年来取得了令人瞩目的成就，其应用于各个领域的研究也取得较大的进步，比如分布式强化学习、可解释性强化学习、基于深度强化学习的量化金融应用、多智能体强化学习相关的理论及其最新应用等。

本次推荐了13篇强化学习领域的相关论文，主要涉及于基于多机器人强化学习无地图导航Dueling网络中的集中状态值、自然语言中的内在可解释强化学习、量化金融中数据驱动的深度强化学习的近似真实市场环境、基于强化学习的无人机基站综合接入回程自主导航与配置、基于强化学习算法的持续学习预测智能体评估VR中的人与系统交互、多维奖励函数的分布强化学习、分层强化学习中Landmark引导的子目标生成、学习用协调策略优化模拟自驱动粒子系统、深度强化学习的多样性增强内在动机、学习使用深度强化学习导航结晶模型、多智能体强化学习的横向迁移学习、广义注意加权强化学习、使用强化学习教机器人行走等。

标题：Centralizing State-Values in Dueling Networks for Multi-Robot Reinforcement Learning Mapless Navigation（基于多机器人强化学习无地图导航Dueling网络中的集中状态值）了解详情

简介：本文研究了流行的集中训练和分散执行(CTDE)模式下的多机器人mapless导航问题。当每个机器人考虑自己的路径而不与其他机器人明确共享观察结果时，其可能导致深度强化学习(DRL)中的非平稳问题。典型的CTDE算法将联合行动价值函数分解为单个行动价值函数，以利于合作并实现分散执行。这种因式分解涉及限制个体中新行为出现的约束(例如单调性)，因为每个智能体都是从联合动作值开始训练的。而本文为CTDE提出了新的体系结构，它使用集中式状态值网络来计算联合状态值，该网络用于在基于值的代理更新中注入全局状态信息。因此，考虑到环境的整体状态，每个模型计算其权重的梯度更新。该想法遵循了 Dueling Networks 的见解，即联合状态值的单独估计既有提高样本效率的优势，又能为每个机器人提供全局状态是否有价值的信息。在具有2个4机器人和8个机器人的机器人导航任务中的实验证实了该方法优于先前的CTDE方法(例如，VDN，QMIX)。

论文链接：https://arxiv.org/pdf/2112.09012.pdf

标题：Inherently Explainable Reinforcement Learning in Natural Language（自然语言中的内在可解释强化学习）了解详情

简介：本文专注于创建内在可解释的强化学习智能体的任务——通过在执行任务时仔细思考并在事后分析整个轨迹来产生因果解释，从而产生即时的局部解释的能力。这种可分层解释的强化学习代理(HEX-RL)在交互式小说、基于文本的游戏环境中运行，其中智能体使用文本自然语言感知并作用于世界。这些游戏通常被构造成具有长期依赖性的谜题或任务，其中智能体必须完成一系列动作才能成功—提供理想的环境来测试智能体解释其动作的能力。该智能体被设计为将可解释性视为一级公民，使用基于图形的状态表示的提取符号知识，并结合分层图注意机制，该机制指向内部图表示中对动作选择影响最大的事实。实验表明，这种智能体在强基线上提供了显著改进的解释，正如通常不熟悉环境的人类参与者所评价的那样，同时也匹配了最先进的任务性能。

论文链接：https://arxiv.org/pdf/2112.08907.pdf

标题：FinRL-Meta: A Universe of Near-Real Market Environments for Data-Driven Deep Reinforcement Learning in Quantitative Finance（FinRL Meta：用于量化金融中数据驱动的深度强化学习的近似真实市场环境）了解详情

简介：最近，深度强化学习(DRL)在构建金融市场模拟器方面显示出巨大的潜力。然而，由于现实世界市场的高度复杂性和动态性，原始历史金融数据通常包含大量噪声，可能无法反映市场的未来，从而降低了基于DRL的市场模拟器的保真度。此外，基于DRL的市场模拟器的准确性在很大程度上依赖于众多不同的DRL代理商，这增加了对市场环境宇宙的需求，并对模拟速度提出了挑战。本文提出了FinRL-Meta框架，为数据驱动的金融强化学习构建了一个市场环境的宇宙。首先，FinRL-Meta将金融数据处理从基于DRL的战略的设计管道中分离出来，并为金融大数据提供开源数据工程工具。其次，FinRL-Meta为各种交易任务提供了数百种市场环境。第三，FinRL-Meta通过利用数千个GPU内核来实现多处理模拟和训练。

论文链接：https://arxiv.org/pdf/2112.06753.pdf

标题：Autonomous Navigation and Configuration of Integrated Access Backhauling for UAV Base Station Using Reinforcement Learning（基于强化学习的无人机基站综合接入回程自主导航与配置）了解详情

简介：快速可靠的连接对于增强公共安全关键任务 (MC) 用户的态势感知和运营效率至关重要。在紧急或灾难情况下，现有的蜂窝网络覆盖和容量可能无法满足 MC 通信需求，可以迅速利用基于可部署网络的解决方案，例如 Cell-on-wheels/wings，以确保 MC 用户的可靠连接。本文考虑了宏基站（BS）因自然灾害而被破坏的场景，并设置了载有基站的无人机（UAV-BS）为灾区用户提供临时覆盖。UAV-BS 使用 5G 集成接入和回程 (IAB) 技术集成到移动网络中。本文提出了将机器学习应用于此用例的框架和信令程序。深度强化学习算法旨在联合优化 UAV-BS 的接入和回程天线倾斜度以及三维位置，以便在保持良好回程连接的同时为地面 MC 用户提供最佳服务。研究结果表明，所提出的算法可以自主导航和配置 UAV-BS，以提高吞吐量并降低 MC 用户的掉线率。

论文链接：https://arxiv.org/pdf/2112.07313v1.pdf

标题：Assessing Human Interaction in Virtual Reality With Continually Learning Prediction Agents Based on Reinforcement Learning Algorithms: A Pilot Study（基于强化学习算法的持续学习预测智能体评估VR中的人与系统交互：一项试点研究）了解详情

简介：人工智能系统越来越多地涉及持续学习，以实现灵活性。但现有研究尚未充分探索系统主动学习时发生的交互，这些交互可以在几分钟内显着改变其行为。本试点研究调查了人类与不断学习的预测智能体之间的交互如何随着智能体能力的发展而发展。此外，其比较了两种不同的代理架构，以评估代理设计中的表征选择如何影响人与智能体的交互。通过开发虚拟现实环境和基于时间的预测任务，其中从强化学习 (RL) 算法中学到的预测增强了人类的预测。并应用定量和定性分析来评估参与者在此任务中的表现和行为在不同类型的智能体中有何不同。研究结果表明，人类对系统的信任可能会受到与智能体的早期交互的影响，而这种信任反过来又会影响战略行为，但试点研究的局限性排除了任何结论性陈述。在考虑基于 RL 的技术时，将信任视为交互的关键特征，并提出了一些修改本研究的建议，为更大规模的调查做准备。

论文链接：https://arxiv.org/pdf/2112.07774.pdf

标题：Teaching a Robot to Walk Using Reinforcement Learning（使用强化学习教机器人行走）了解详情

简介：PID 和 LQR 等经典控制技术已被有效地用于维持系统状态，但当模型动态的复杂性和敏感性增加时，这些技术变得更加难以实施。对于具有多个自由度的自适应机器人运动任务，该任务在经典控制技术下变得不可行。然而，强化学习可以轻松训练最佳行走策略。本文应用深度 Q 学习和增强随机搜索 (ARS) 来教模拟二维双足机器人如何使用 OpenAI Gym BipedalWalker-v3 环境行走。深度 Q 学习没有产生高奖励策略，通常由于粗略离散化的动作空间而过早地收敛到次优的局部最大值。然而，ARS 产生了训练有素的机器人，并产生了正式“解决” BipedalWalker-v3 问题的最优策略。包括随机策略、手动编码的英寸前进策略和保持静止策略，被用作评估学习算法结果熟练程度的基准。

论文链接：https://arxiv.org/pdf/2112.07031.pdf

标题：Distributional Reinforcement Learning for Multi-Dimensional Reward Functions(多维奖励函数的分布强化学习）

了解详情

简介：基于价值的强化学习（RL）算法的一个发展趋势是在价值网络中捕获比标量值函数更多的信息。该分支中最著名的方法之一是分布式RL，它模拟返回分布而不是标量值。RL中的混合奖励体系结构（HRA）研究了为每个奖励源建模特定于源的价值函数，这也被证明对性能有益。为了充分继承分布式RL和混合奖励体系结构的优点，本文引入了多维分布式DQN，它扩展了分布式RL来模拟来自多个奖励源的联合回报分布。作为联合分布建模的副产品，MD3QN不仅可以捕获每个奖励来源回报的随机性，还可以捕获不同来源的随机性之间丰富的奖励相关性。研究表明联合分布Bellman算子的收敛性，并通过最小化联合收益分布与其Bellman目标之间的最大平均差异来构建我们的经验算法。在实验中，该方法准确地模拟了报酬函数高度相关的环境中的联合收益分布，并且优于以前在控制环境中利用多维奖励函数的RL方法。

论文链接：https://arxiv.org/pdf/2110.13578.pdf

标题：Landmark-Guided Subgoal Generation in Hierarchical Reinforcement Learning(分层强化学习中Landmark引导的子目标生成）了解详情

简介：目标条件分层强化学习（HRL）在解决复杂和长视界RL任务方面显示出良好的效果。然而，目标制约型人力资源学习中高层政策的行动空间往往很大，导致探索性差，导致培训效率低下。本文提出了地标引导的分层强化学习（HIGL），一种新的框架，用于训练具有地标引导的缩减行动空间的高级策略，即有希望探索的状态。HIGL的关键组成部分有两个：（a）为勘探提供信息的地标取样；（b）鼓励高级别政策为选定地标制定子目标。对于（a），我们考虑两个准则：覆盖整个访问状态空间（即，状态的分散）和状态的新颖性（即，状态的预测误差）。对于（b），本文选择一个地标作为节点为地标的图中最短路径的第一个地标。实验表明，该框架在各种控制任务中都优于现有技术，这要归功于由地标引导的有效探索。

论文链接：https://arxiv.org/pdf/2110.13625.pdf

标题：Learning to Simulate Self-Driven Particles System with Coordinated Policy Optimization(学习用协调策略优化模拟自驱动粒子系统）了解详情

简介：自驱动粒子（SDP）描述了日常生活中常见的一类多智能体系统，如鸟群和交通流。在SDP系统中，每个代理都追求自己的目标，并不断改变其与邻近代理的合作或竞争行为。手动设计此类SDP系统的控制器非常耗时，而由此产生的紧急行为通常既不现实也不可推广。因此，SDP系统的真实仿真仍然具有挑战性。强化学习为SDP控制器的自动化开发提供了一个有吸引力的替代方案。然而，以前的多智能体强化学习（MARL）方法将智能体定义为事先的队友或敌人，这无法抓住SDP的本质，即每个智能体的角色在一个事件中都是合作或竞争的。要用MARL模拟SDP，一个关键的挑战是在最大化个体目标的同时协调代理人的行为。本文以交通仿真为实验平台，提出了一种新的MARL方法，称为协调策略优化（CoPO），该方法结合社会心理学原理学习SDP的神经控制器。

论文链接：https://arxiv.org/pdf/2110.13827.pdf

标题：Diversity-augmented intrinsic motivation for deep reinforcement learning（深度强化学习的多样性增强内在动机）了解详情

简介：在许多实际问题中，智能体接收到的奖励信号是延迟的或稀疏的，这使得训练强化学习（RL）的智能体具有挑战性。一个内在的奖励信号可以帮助一个智能体探索此类环境以寻求新的状态。本文提出了一种普遍的端到端多样性增强的深层强化学习内在动机，它鼓励智能体探索新的状态，并自动提供更密集的奖励。即本文在基于行列式点过程（DPP）的状态序列模型下测量相邻状态的多样性；与直通梯度估计器相结合，以实现端到端的可微性。实验表明，基于DPP模型得出的多样性测度的内在奖励加速了Atari游戏和超级阿里奥的早期训练阶段。在MuJoCo，该方法改进了使用标准奖励设置的任务的先前技术，并在15项包含延迟奖励的任务中的12项上实现了最先进的性能。

论文链接：https://www.sciencedirect.com/science/article/pii/S0925231221015265#!

标题：Learning to navigate a crystallization model with Deep Reinforcement Learning（学习使用深度强化学习导航结晶模型）了解详情

简介：本文提出了基于卷积神经网络 (CNN) 的测量传感器和加速控制回路的强化学习 (RL) 框架的组合。控制器的目标是达到目标平均尺寸并减少晶体尺寸的可变性。基于 CNN 的传感器提高了晶体尺寸测量的质量并减少了处理图像的时间，而 RL 框架即使在面临干扰时也能学习以最佳方式导航结晶模型。在实验室规模的半间歇结晶器中，使用乙醇作为抗溶剂，针对水中氯化钠的非种子结晶，验证了所提出的数据驱动策略。本文在基于 RL 的控制器可以离线训练以优化多个目标条件，而 CNN 为控制器提供准确的反馈，以在面对干扰时重新计算最佳动作并引导系统朝向目标。

论文链接：https://www.sciencedirect.com/science/article/pii/S0263876221005037#!

标题：Generalized attention-weighted reinforcement learning（广义注意加权强化学习）了解详情

简介：在神经科学中，注意力已被证实可与强化学习 (RL) 双向交互，以减少任务表示的维度，将计算限制为相关特征。本文利用计算神经科学的理论模型——注意力加权 RL (AWRL)，定义人类如何识别任务相关的特征（即允许价值预测），来设计应用的深度强化学习范式。本文正式证明了广泛用于机器学习的自注意力机制与价值函数逼近的结合是 AWRL 模型的一般表述。并在三个不同复杂度级别的 Atari 任务上对智能体进行训练，结果证明了 AWRL 框架在复杂任务场景中的更广泛的有效性，并说明了神经科学衍生模型和 RL 之间更深层次集成用于机器学习决策制定的优势。

论文链接：https://www.sciencedirect.com/science/article/pii/S0893608021003853#!

标题：Lateral Transfer Learning for Multiagent Reinforcement Learning（多智能体强化学习的横向迁移学习）了解详情

简介：现有研究人员已将迁移学习机制引入多智能体强化学习 (MARL)。然而，现有的致力于多智能体系统跨任务转移的工作只是为同构智能体或类似领域设计的。本文提出了一种通用的交叉转移方法，称为多智能体横向迁移（MALT），帮助 MARL 减轻训练负担。本文讨论了开发通用多智能体跨任务迁移学习方法的几个挑战，并为 MARL 提供了一种可行的知识重用方法。在开发的方法中，受渐进式网络的启发，本文将特征而不是策略或经验作为传输对象。为了实现更有效的传输，本文基于聚类为智能体分配了预训练的策略网络，同时引入了注意力模块来增强传输框架，此方法对源任务和目标任务没有严格的要求。与现有工作相比，该方法可以在异构智能体之间转移知识，并且在完全不同的任务情况下也可以避免负转移。

论文链接：https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=9535269

新工具

标题：MIT | NeRL:基于强化学习的神经进化优化了解详情

简介：本文提出了一个开源的神经进化优化Python框架，该框架由麻省理工学院开发。NEORL提供了进化计算、通过强化学习的神经网络和混合神经进化算法领域最先进算法的全局优化界面。NEORL具有多种多样的算法集、用户友好的界面、并行计算支持、自动超参数调整、详细的文档以及数学和现实世界工程优化中的应用演示。NEORL包含各种优化问题，从组合、连续、混合离散/连续，到高维、昂贵和受限的工程优化。NEORL在与低碳能源研究相关的各种工程应用中进行测试，以解决气候变化问题。这些例子包括核反应堆控制和燃料电池发电。结果表明，NEORL相对于文献中的其他算法和优化框架具有竞争力，是解决大规模优化问题的潜在工具。

论文链接：

https://arxiv.org/pdf/2112.07057v1.pdf

如果你正在从事或关注强化学习研究、实现与应用，欢迎加入“智源社区-强化学习-交流群”。在这里，你可以：

学习前沿知识、求解疑难困惑
分享经验心得、展示风貌才华
参与专属活动、结识研究伙伴

扫描下方二维码，加入强化学习兴趣群。

ECharts 智慧医疗大屏制作实例详解
在大数据时代，数据可视化已成为信息传递和决策支持的重要手段。ECharts作为一款功能强大、易于上手的开源可视化库，凭借其丰富的图表类型、灵活的配置项和良好的跨平台兼容性，广泛应用于企业级数据大屏、BI报表、实时监控等场景。本教程以“智慧医疗大屏”为例，完整演示了从页面搭建、图表配置到动态交互与响应式适配的全过程。通过循序渐进的讲解，读者将掌握如何使用ECharts构建专业、美观、可交互的数据可视
邻近巷道爆破振动模拟与可视化：计算力学的工程应用碳酸的唐动态规划数学建模
引言隧道爆破施工是现代工程建设中常用的方法，但爆破产生的振动会对周围结构和地质环境产生影响。本文介绍一个基于Python的邻近巷道爆破振动模拟系统，该系统通过数值计算模拟爆破引起的应力波传播过程，并提供多种可视化方式展示振动效应。本研究对于理解爆破振动机理、评估爆破安全距离以及优化爆破参数具有重要意义。理论基础爆破应力波传播模型爆破引起的应力波在岩体中的传播可通过弹性波动理论描述。在均匀介质中，应
手把手教你编写Python抢购脚本_抢单脚本的制作教程网络安全小宇哥 python 开发语言测试工具学习 web安全网络安全安全架构
想买苹果手机，但总是抢不到，所以想试着能不能写个脚本代码。第一步：把想要抢购的商品加进购物车，注意：脚本是对购物车内全部商品进行下单操作，所以不够买的商品最好先从购物车内删除。第二步：写好Python脚本，在抢购之前运行，并设置好抢购时间。Python脚本实现安装Python。我安装的是anaconda安装webdriver扩展。它是Selenium模块的一部分。Selenium是一个用于Web应
喜讯 | Navicat 蝉联 2025 年 DBTA 100 强名单 Navicat中国 Navicat 17 焕新上市 navicat 数据库
Navicat在“DBTA1002025-数据领域最重要的公司”榜单中获得表彰。该奖项旨在表彰在数据管理与分析领域的领先创新者。数据库趋势与应用集团出版人TomHogan表示：“企业正寻求扩大人工智能的应用范围，采用新的技术与应用，增加数据分析/商业智能的使用，并对现有应用进行现代化改造”，“每年，《数据库趋势与应用》杂志都会推出DBTA100榜单，旨在表彰具有创新精神、能够为客户带来新产品新体验
Github 2025-07-04 Java开源项目日报 Top10 老孙正经胡说 github java 开源 Github趋势分析开源项目 Python Golang
根据GithubTrendings的统计，今日(2025-07-04统计)共有10个项目上榜。根据开发语言中项目的数量，汇总情况如下：开发语言项目数量Java项目10Java实现的算法集合：使用Gitpod.io进行编辑和贡献创建周期：2883天开发语言：Java协议类型：MITLicenseStar数量：57266个Fork数量：18692次关注人数：57266人贡献人数：431人OpenIss
水下目标检测：突破与创新加油吧zkf 目标跟踪人工智能计算机视觉
水下目标检测技术背景水下环境带来独特挑战：光线衰减导致对比度降低，散射引发图像模糊，色偏使颜色失真。动态水流造成目标形变，小目标（如10×10像素海胆）检测困难。声呐与光学数据融合可提升精度，但多模态对齐仍是技术难点。核心算法实现要点图像预处理直方图均衡化与Retinex算法结合改善对比度和色偏：defsingle_scale_retinex(img,sigma):retinex=np.log10
策略梯度在网络安全中的应用：AI如何防御网络攻击 AI智能探索者 web安全人工智能安全 ai
策略梯度在网络安全中的应用：AI如何防御网络攻击关键词：策略梯度、网络安全、AI防御、强化学习、网络攻击、入侵检测、自适应防御摘要：本文将探讨策略梯度这一强化学习算法在网络安全领域的创新应用。我们将从基础概念出发，逐步揭示AI如何通过学习网络攻击模式来构建自适应防御系统，分析其核心算法原理，并通过实际代码示例展示实现过程。文章还将讨论当前应用场景、工具资源以及未来发展趋势，为读者提供对这一前沿技术
Midjourney：AI人工智能图像生成的新方向 AI智能探索者人工智能 midjourney 计算机视觉 ai
Midjourney：AI人工智能图像生成的新方向关键词：Midjourney、AI图像生成、扩散模型、提示词工程、多模态学习、生成式AI、创意工具摘要：本文将带您走进AI图像生成的前沿领域，以Midjourney为核心，从技术原理到实际应用，用通俗易懂的语言解析其背后的“魔法”。我们将通过生活案例、技术拆解和实战演示，揭示Midjourney如何通过扩散模型、提示词工程和多模态学习，重新定义“用
【Python】类（class）的创建 Herbert_JL python python linux
1类简介1.1什么是类在面向对象编程（OOP）中，类（Class）是一种封装了数据和操作这些数据的函数的编程结构。它是一种抽象的概念，用于定义具有相同属性（变量）和方法（函数）的对象的模板。类可以看作是一个“蓝图”，用于创建具有相同特征和行为的对象实例。1.2类的作用1.2.1封装（Encapsulation）类将数据（属性）和操作数据的方法封装在一起，形成一个独立的单元。这样可以隐藏内部实现细节
【Python】类的继承、重载与多态
类的继承(Inheritance)类的继承是面向对象编程（OOP）中的一个重要概念，它允许一个类（称为子类或派生类）继承另一个类（称为父类或基类）的属性和方法。继承可以提高代码的复用性，减少重复代码，并且能够构建出层次化的类结构。继承的基本概念父类（基类）：被继承的类，提供了可以被继承的属性和方法。子类（派生类）：继承父类的类，可以使用父类的属性和方法，并且还可以添加新的属性和方法，或者覆盖父类的
【Python】For Herbert_JL python python 开发语言
For基本语法forelementiniterable:statement(s)element：是循环变量，用于存储可迭代对象中当前遍历到的元素。iterable：是需要遍历的可迭代对象，如列表、元组、字典等。for遍历列表fruits=["apple","banana","cherry"]forfruitinfruits:print(fruit)applebananacherryfor遍历字符串
【python 进阶】argparse模块 Herbert_JL python python java linux
argparse模块Python的argparse模块用于解析命令行参数，使得脚本能够灵活地接受用户从命令行传入的各种参数，从而根据不同的参数配置来执行不同的操作。ArgumentParser类argparse.ArgumentParser是Python中argparse模块的核心类，用于创建一个解析器对象，该对象能够读取和解析命令行参数和选项，将它们转换为相应的数据类型，并提供给程序使用。功能常
在python中function啥类型_Python中function和method
这两个概念已经有很多人解释过了，从本文的『参考』中就可以看出来。之所以还要写一篇这个主题，主要是为了用自己的语言表述一下，并且尽可能的讲的清楚一点。泛泛地说，function是一般意义上的函数，即对一段代码的封装，并由一个地址(函数名)来调用。method通常是面向对象的概念，即method是属于一个类或类的对象的。method是与类或类的对象相关的函数。下面讲一下我对这两个概念的更具体的理解。如
【pytorch】——Could not export Python function call ‘Scatter‘
pytorch用pytorch的trace导出模型的时候，报错errorRuntimeError:CouldnotexportPythonfunctioncall'Scatter'.RemovecallstoPythonfunctionsbeforeexport.Didyouforgettoadd@scriptor@script_methodannotation?Ifthisisann.Modul
Mac 磁盘检测和监控工具 DriveDx jia123yoou macos mac 磁盘监控
DriveDxMac一款不监视驱动器的内置S.M.A.R.T.状态的先进驱动器运行状况诊断和监测工具而且还分析了所有驱动器健康密切相关的指标，SSD或硬盘驱动器故障（像SSD磨损/耐久性，坏扇区重新分配，离线坏道，未定扇形区，I/O错误以及更多）和要是出了差错立即警报用户。我们的驱动器运行状况诊断算法是基于最近在这一领域的研究。原文地址：DriveDx英文Mac磁盘检测和监控工具
Python中如何将非内置数据类型导出成Json格式
前言：在Python开发中往往使用自定义的数据类型来封装属性特定对象。但是这些自定义的数据类型在导出成Json文件时往往会报出不支持的错误。本篇文章将介绍如何解决这个问题。操作步骤：1、创建自定义数据类型：fromdataclassesimportdataclassimportjson@dataclassclassOwnObject():prop1:strprop2:int2、将自定义数据类型导出
物联网零售领域AI算力网络与通信的应用探索 AI算力网络与通信物联网零售人工智能 ai
物联网零售领域AI算力网络与通信的应用探索关键词：物联网、零售领域、AI算力网络、通信、应用探索摘要：本文聚焦于物联网零售领域，深入探讨了AI算力网络与通信的应用。首先介绍了相关背景，包括目的、预期读者等。接着对核心概念进行解释，阐述它们之间的关系并给出原理架构示意图和流程图。然后详细讲解核心算法原理、数学模型与公式，通过项目实战展示代码案例及解读。还介绍了实际应用场景、推荐相关工具资源，分析未来
剖析AI人工智能领域Whisper的性能指标 AI大模型应用实战人工智能 whisper xcode ai
剖析AI人工智能领域Whisper的性能指标关键词：Whisper、语音识别、性能指标、ASR、AI模型评估、基准测试、语音转文本摘要：本文深入剖析OpenAI开发的Whisper语音识别系统的性能指标。我们将从技术原理、架构设计、性能基准测试等多个维度，全面分析Whisper在不同场景下的表现。文章将详细讲解Whisper的评估方法、关键性能指标解读、实际应用中的性能表现，以及与其他主流语音识别
探索AI人工智能领域多智能体系统的技术原理 AI大模型应用之禅人工智能网络 ai
探索AI人工智能领域多智能体系统的技术原理关键词：AI人工智能、多智能体系统、技术原理、智能体交互、分布式计算摘要：本文深入探索了AI人工智能领域多智能体系统的技术原理。首先介绍了多智能体系统的背景，包括其目的、预期读者、文档结构和相关术语。接着阐述了多智能体系统的核心概念与联系，通过文本示意图和Mermaid流程图进行清晰展示。详细讲解了核心算法原理，结合Python源代码进行说明，并给出了相关
【剪裁Patch】已标注的WSI剪裁Patch的处理流程（以QuPath软件得到的标注信息为例） X CODE WSI 病理图像 QuPath Python
1.整体处理思路整体处理流程如图所示，概括来说就是：根据标注信息将WSI区分为肿瘤区域和正常区域，对这个区域进行采样裁剪得到具有Patch级别标签的Patch。当然，这里的Patch标签是根据标注信息决定的，如果标注的是癌症亚型信息，那么也可以将不同亚型的Patch区分出来。那么下面就对每个步骤进行介绍以及提供具体的Python代码。2.详细步骤（提供代码）2.0标注文件示例以下是用QuPath软
23.5.15---在python中读取excel表格数据并可视化多一点灵性 python matplotlib 开发语言机器学习
目录1.在python中通过以下代码可以防止运行结果出现中文乱码的情况（如画图时）2.在将excel表格文件中的数据读取出来，并将其中的两列数据作为行列坐标用图画出来2.1设置坐标轴显示的刻度及范围3.在PythonConsole清除运行的控制台数据使用：1.在python中通过以下代码可以防止运行结果出现中文乱码的情况（如画图时）##设置字符集，防止中文乱码importmatplotlibasm
【华为od刷题（C++）】HJ30 字符串合并处理 m0_64866459 华为od c++链表
我的代码：#include//用于输入输出流#include//用于字符串处理#include//用于动态数组的处理#include//包含排序等常见算法#include//用于字符串流的处理，可以将数据从字符串流中提取#include//提供字符处理函数，如isdigit、isalpha等#include//提供位集处理，能够将数字转换为二进制表示usingnamespacestd;charbi
从零到精通：Linux上的Conda环境详细教程
第一章：Conda简介Conda的定义Conda是一个开源的包管理系统和环境管理系统，可以在多个平台上安装、运行和更新软件包和依赖项。Conda最初是为Python和R语言的数据科学包创建的，但现在支持多种编程语言和工具。Conda的主要功能和优势包管理：Conda能够自动处理包的依赖关系，确保每个包所需的库和工具都被正确安装。它支持从各种渠道安装包，如CondaForge和Anaconda官方仓
Briefcase 项目常见问题解决方案刘梓苹
Briefcase项目常见问题解决方案briefcaseToolstosupportconvertingaPythonprojectintoastandalonenativeapplication.项目地址:https://gitcode.com/gh_mirrors/br/briefcase1.项目基础介绍和主要编程语言Briefcase是一个由BeeWare项目开发的工具，旨在帮助开发者将Py
Ubuntu20.04切换源 dongdundun ubuntu linux 运维
一、ubuntu20.04系统重装二、工具安装1.更换Ubuntu源更换conda源更换pip源2.安装QQqq闪退卸载安装wine版QQ3.安装搜狗输入法及中文设置安装搜狗输入法中文设置4.安装vim5.安装google6.安装VsCode7.安装python3的opencv8.安装向日葵向日葵闪退9.ubuntu下识别不到U盘10.安装Typora11.安装百度网盘12.安装ceres库（优化
yolov5/v7/v8/v9/v10环境详细配置教程（Windows+conda+pycharm）视觉算法er 深度学习环境配置 YOLO 目标检测人工智能深度学习 conda pycharm
一、所需环境配置1.1.虚拟环境创建首先，打开AnacondaPrompt命令窗口，创建一个新的虚拟环境，后面的包都在这个环境中安装。创建命令是：我的习惯是使用3.8版本的python，你也可以换成更高版本；condacreate-nyolopython=3.8输入命令后，运行结果如下：输入y即可；1.2.激活虚拟环境安装完成后，即可激活虚拟环境，输入以下命令即可；condaactivateyol
大数据 ETL 工具 Sqoop 深度解析与实战指南
一、Sqoop核心理论与应用场景1.1设计思想与技术定位Sqoop是Apache旗下的开源数据传输工具，核心设计基于MapReduce分布式计算框架，通过并行化的Map任务实现高效的数据批量迁移。其特点包括：批处理特性：基于MapReduce作业实现导入/导出，适合大规模离线数据迁移，不支持实时数据同步。异构数据源连接：支持关系型数据库（如MySQL、Oracle）与Hadoop生态（HDFS、H
Python 领域 Conda 的集群环境部署经验
Python领域Conda的集群环境部署经验关键词：Conda、Python环境管理、集群部署、环境复制、依赖管理、虚拟环境、Anaconda摘要：本文深入探讨了在集群环境中使用Conda进行Python环境部署的最佳实践。我们将从Conda的核心概念出发，详细讲解环境创建、依赖管理、环境复制和集群部署的全流程。文章包含实际案例、性能优化技巧和常见问题解决方案，旨在帮助读者掌握高效、可靠的Pyth
Python pip与Conda环境的兼容性问题
Pythonpip与Conda环境的兼容性问题关键词：Python环境管理、pip与conda冲突、依赖解析、虚拟环境、包管理、兼容性解决方案、依赖冲突摘要：本文深入探讨Python生态中pip和conda两种主流包管理工具的兼容性问题。我们将从底层机制分析冲突根源，通过具体案例展示常见问题场景，并提供多种解决方案和最佳实践。文章包含详细的依赖解析算法分析、环境隔离技术比较，以及通过实际代码演示如
python中操作数据库 seiseilalei python 数据库 python sql
python中cursor操作数据库（转）原文出处：http://doudouclever.blog.163.com/blog/static/175112310201284115340663/python操作数据库，要安装一个Python和数据库交互的包MySQL-python-1.2.2.win32-py2.5.exe，然后我们就可以使用MySQLdb这个包进行数据库操作了。操作步骤如下：1、建
mongodb3.03开启认证 21jhf mongodb
下载了最新mongodb3.03版本，当使用--auth 参数命令行开启mongodb用户认证时遇到很多问题，现总结如下：（百度上搜到的基本都是老版本的，看到db.addUser的就是，请忽略） Windows下我做了一个bat文件，用来启动mongodb，命令行如下： mongod --dbpath db\data --port 27017 --directoryperdb --logp
【Spark103】Task not serializable bit1129 Serializable
Task not serializable是Spark开发过程最令人头疼的问题之一，这里记录下出现这个问题的两个实例，一个是自己遇到的，另一个是stackoverflow上看到。等有时间了再仔细探究出现Task not serialiazable的各种原因以及出现问题后如何快速定位问题的所在，至少目前阶段碰到此类问题，没有什么章法 1. package spark.exampl
你所熟知的 LRU(最近最少使用) dalan_123 java
关于LRU这个名词在很多地方或听说，或使用，接下来看下lru缓存回收的实现 1、大体的想法 a、查询出最近最晚使用的项 b、给最近的使用的项做标记通过使用链表就可以完成这两个操作，关于最近最少使用的项只需要返回链表的尾部；标记最近使用的项，只需要将该项移除并放置到头部，那么难点就出现你如何能够快速在链表定位对应的该项？这时候多
Javascript 跨域周凡杨 JavaScript jsonp 跨域 cross-domain
linux下安装apache服务器 g21121 apache
安装apache 下载windows版本apache，下载地址：http://httpd.apache.org/download.cgi 1.windows下安装apache Windows下安装apache比较简单，注意选择路径和端口即可，这里就不再赘述了。 2.linux下安装apache：下载之后上传到linux的相关目录，这里指定为/home/apach
FineReport的JS编辑框和URL地址栏语法简介老A不折腾 finereport web报表报表软件语法总结
JS编辑框： 1.FineReport的js。作为一款BS产品，browser端的JavaScript是必不可少的。 FineReport中的js是已经调用了finereport.js的。大家知道，预览报表时，报表servlet会将cpt模板转为html，在这个html的head头部中会引入FineReport的js，这个finereport.js中包含了许多内置的fun
根据STATUS信息对MySQL进行优化墙头上一根草 status
mysql 查看当前正在执行的操作，即正在执行的sql语句的方法为: show processlist 命令 mysql> show global status;可以列出MySQL服务器运行各种状态值，我个人较喜欢的用法是show status like '查询值%';一、慢查询mysql> show variab
我的spring学习笔记7-Spring的Bean配置文件给Bean定义别名 aijuans Spring 3
本文介绍如何给Spring的Bean配置文件的Bean定义别名？原始的 <bean id="business" class="onlyfun.caterpillar.device.Business"> <property name="writer"> <ref b
高性能mysql 之性能剖析 annan211 性能 mysql mysql 性能剖析剖析
1 定义性能优化 mysql服务器性能，此处定义为响应时间。在解释性能优化之前，先来消除一个误解，很多人认为，性能优化就是降低cpu的利用率或者减少对资源的使用。这是一个陷阱。资源时用来消耗并用来工作的，所以有时候消耗更多的资源能够加快查询速度，保持cpu忙绿，这是必要的。很多时候发现编译进了新版本的InnoDB之后，cpu利用率上升的很厉害，这并不
主外键和索引唯一性约束百合不是茶索引唯一性约束主外键约束联机删除
目标;第一步;创建两张表用户表和文章表第二步;发表文章 1,建表; ---用户表 BlogUsers --userID唯一的 --userName --pwd --sex create
线程的调度 bijian1013 java 多线程 thread 线程的调度 java多线程
1. Java提供一个线程调度程序来监控程序中启动后进入可运行状态的所有线程。线程调度程序按照线程的优先级决定应调度哪些线程来执行。 2. 多数线程的调度是抢占式的（即我想中断程序运行就中断，不需要和将被中断的程序协商） a)
查看日志常用命令 bijian1013 linux 命令 unix
一.日志查找方法，可以用通配符查某台主机上的所有服务器grep "关键字" /wls/applogs/custom-*/error.log 二.查看日志常用命令1.grep '关键字' error.log：在error.log中搜索'关键字'2.grep -C10 '关键字' error.log：显示关键字前后10行记录3.grep '关键字' error.l
【持久化框架MyBatis3一】MyBatis版HelloWorld bit1129 helloworld
MyBatis这个系列的文章，主要参考《Java Persistence with MyBatis 3》。样例数据本文以MySQL数据库为例，建立一个STUDENTS表，插入两条数据，然后进行单表的增删改查 CREATE TABLE STUDENTS ( stud_id int(11) NOT NULL AUTO_INCREMENT,
【Hadoop十五】Hadoop Counter bit1129 hadoop
1. 只有Map任务的Map Reduce Job File System Counters FILE: Number of bytes read=3629530 FILE: Number of bytes written=98312 FILE: Number of read operations=0 FILE: Number of lar
解决Tomcat数据连接池无法释放 ronin47 tomcat 连接池　优化
近段时间，公司的检测中心报表系统(SMC)的开发人员时不时找到我，说用户老是出现无法登录的情况。前些日子因为手头上有Jboss集群的测试工作，发现用户不能登录时，都是在Tomcat中将这个项目Reload一下就好了，不过只是治标而已，因为大概几个小时之后又会再次出现无法登录的情况。今天上午，开发人员小毛又找到我，要我协助将这个问题根治一下，拖太久用户难保不投诉。简单分析了一
java-75-二叉树两结点的最低共同父结点 bylijinnan java
import java.util.LinkedList; import java.util.List; import ljn.help.*; public class BTreeLowestParentOfTwoNodes { public static void main(String[] args) { /* * node data is stored in
行业垂直搜索引擎网页抓取项目 carlwu Lucene Nutch Heritrix Solr
公司有一个搜索引擎项目，希望各路高人有空来帮忙指导，谢谢！这是详细需求：（1）通过提供的网站地址(大概100-200个网站)，网页抓取程序能不断抓取网页和其它类型的文件（如Excel、PDF、Word、ppt及zip类型），并且程序能够根据事先提供的规则，过滤掉不相干的下载内容。（2）程序能够搜索这些抓取的内容，并能对这些抓取文件按照油田名进行分类，然后放到服务器不同的目录中。
[通讯与服务]在总带宽资源没有大幅增加之前,不适宜大幅度降低资费 comsci 资源
降低通讯服务资费，就意味着有更多的用户进入，就意味着通讯服务提供商要接待和服务更多的用户，在总体运维成本没有由于技术升级而大幅下降的情况下，这种降低资费的行为将导致每个用户的平均带宽不断下降，而享受到的服务质量也在下降，这对用户和服务商都是不利的。。。。。。。。 &nbs
Java时区转换及时间格式 Cwind java
本文介绍Java API 中 Date, Calendar, TimeZone和DateFormat的使用，以及不同时区时间相互转化的方法和原理。问题描述：向处于不同时区的服务器发请求时需要考虑时区转换的问题。譬如，服务器位于东八区（北京时间，GMT+8:00），而身处东四区的用户想要查询当天的销售记录。则需把东四区的“今天”这个时间范围转换为服务器所在时区的时间范围。
readonly,只读，不可用 dashuaifu js jsp disable readOnly readOnly
readOnly 和 readonly 不同，在做js开发时一定要注意函数大小写和jsp黄线的警告！！！我就经历过这么一件事：使用readOnly在某些浏览器或同一浏览器不同版本有的可以实现“只读”功能，有的就不行，而且函数readOnly有黄线警告！！！就这样被折磨了不短时间！！！（期间使用过disable函数，但是发现disable函数之后后台接收不到前台的的数据！！！）
LABjs、RequireJS、SeaJS 介绍 dcj3sjt126com js Web
LABjs 的核心是 LAB（Loading and Blocking）：Loading 指异步并行加载，Blocking 是指同步等待执行。LABjs 通过优雅的语法（script 和 wait）实现了这两大特性，核心价值是性能优化。LABjs 是一个文件加载器。RequireJS 和 SeaJS 则是模块加载器，倡导的是一种模块化开发理念，核心价值是让 JavaScript 的模块化开发变得更
[应用结构]入口脚本 dcj3sjt126com PHP yii2
入口脚本入口脚本是应用启动流程中的第一环，一个应用（不管是网页应用还是控制台应用）只有一个入口脚本。终端用户的请求通过入口脚本实例化应用并将将请求转发到应用。 Web 应用的入口脚本必须放在终端用户能够访问的目录下，通常命名为 index.php，也可以使用 Web 服务器能定位到的其他名称。控制台应用的入口脚本一般在应用根目录下命名为 yii（后缀为.php），该文
haoop shell命令 eksliang hadoop hadoop shell
cat chgrp chmod chown copyFromLocal copyToLocal cp du dus expunge get getmerge ls lsr mkdir movefromLocal mv put rm rmr setrep stat tail test text
MultiStateView不同的状态下显示不同的界面 gundumw100 android
只要将指定的view放在该控件里面，可以该view在不同的状态下显示不同的界面，这对ListView很有用，比如加载界面，空白界面，错误界面。而且这些见面由你指定布局，非常灵活。 PS：ListView虽然可以设置一个EmptyView，但使用起来不方便，不灵活，有点累赘。 <com.kennyc.view.MultiStateView xmlns:android=&qu
jQuery实现页面内锚点平滑跳转 ini JavaScript html jquery html5 css
平时我们做导航滚动到内容都是通过锚点来做，刷的一下就直接跳到内容了，没有一丝的滚动效果，而且 url 链接最后会有“小尾巴”，就像#keleyi，今天我就介绍一款 jquery 做的滚动的特效，既可以设置滚动速度，又可以在 url 链接上没有“小尾巴”。效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/37.htmHTML文件代码： &
kafka offset迁移 kane_xie kafka
在早前的kafka版本中（0.8.0），offset是被存储在zookeeper中的。到当前版本（0.8.2）为止，kafka同时支持offset存储在zookeeper和offset manager（broker）中。从官方的说明来看，未来offset的zookeeper存储将会被弃用。因此现有的基于kafka的项目如果今后计划保持更新的话，可以考虑在合适
android > 搭建 cordova 环境 mft8899 android
1 , 安装 node.js http://nodejs.org node -v 查看版本 2, 安装 npm 可以先从 https://github.com/isaacs/npm/tags 下载源码解压到
java封装的比较器，比较是否全相同，获取不同字段名字 qifeifei
非常实用的java比较器，贴上代码： import java.util.HashSet; import java.util.List; import java.util.Set; import net.sf.json.JSONArray; import net.sf.json.JSONObject; import net.sf.json.JsonConfig; i
记录一些函数用法 .Aky. 位运算 PHP 数据库函数 IP
高手们照旧忽略。想弄个全天朝IP段数据库，找了个今天最新更新的国内所有运营商IP段，copy到文件，用文件函数，字符串函数把玩下。分割出startIp和endIp这样格式写入.txt文件，直接用phpmyadmin导入.csv文件的形式导入。（生命在于折腾，也许你们觉得我傻X，直接下载人家弄好的导入不就可以，做自己的菜鸟，让别人去说吧）当然用到了ip2long()函数把字符串转为整型数
sublime text 3 rust wudixiaotie Sublime Text
1.sublime text 3 => install package => Rust 2.cd ~/.config/sublime-text-3/Packages 3.mkdir rust 4.git clone https://github.com/sp0/rust-style 5.cd rust-style 6.cargo build --release 7.ctrl

《强化学习周刊》第30期：Deep Mind开展人机交互的新试点研究、MIT提出神经进化优化框架...

你可能感兴趣的:(算法,大数据,python,机器学习,人工智能)