Simon#0209

学习日志6

关于量子强化学习：论文

Variational_Quantum_Circuits_for_Deep_Reinforcement_Learning：变分量子电路在深度强化学习中的应用

论文主要内容：将经典深度强化学习算法（如经验重放和目标网络）重塑为变分量子电路的表示

摘要

当前最先进的机器学习方法基于经典冯·诺伊曼计算架构，并在许多工业和学术领域得到广泛应用。随着量子计算的发展，研究人员和技术巨头们试图为机器学习任务设计新的量子电路。然而，由于深度量子电路的不可模拟性，现有的量子计算平台很难模拟经典深度学习模型或问题。因此，有必要为噪声中等规模量子 (NISQ) 设备设计可行的量子算法。这项工作探索了深度强化学习中的变分量子电路。具体来说，我们将经典深度强化学习算法（如经验重放和目标网络）重塑为变分量子电路的表示。此外，我们使用一种量子信息编码方案，与经典神经网络相比，减少了模型参数的数量。据我们所知，这项工作是变分量子电路首次证明可以近似深度 Q 值函数，用于具有经验重放和目标网络的决策和策略选择强化学习。此外，我们的变分量子电路可以部署在许多近期的 NISQ 机器上。

中等规模量子 (NISQ) 机器

Mitarai 等人设计了在具有噪声容限的设备上近似量子算法、电路和编码方案 [20]。具体来说，这项工作利用了量子计算中量子纠缠 [20]、[21] 的优势，将模型大小减少到一个本质上很小的数字，并利用迭代优化将量子电路深度减少到一个实际的低值，从而使混合量子-经典算法能够在现有的量子平台上实现，这些平台被称为噪声中等规模量子 (NISQ) 机器 [21]

通过利用量子计算参数数量显著较少的优势 [21]，NISQ 上的变分量子电路成功地在经典基准数据集上实现了标准分类和聚类算法 [20]、[23]、[24]。此外，还可以使用量子电路在 NISQ 机器上实现新的深度学习算法，例如生成对抗网络 [25] (GAN)

由于强化学习 (RL) 和深度强化学习 (DRL) 是两种复杂的顺序决策系统范式，并满足在不确定性下自动学习策略的要求，因此我们的工作侧重于在 NISQ 计算上增强 DRL。这指的是智能体与环境交互以获取背景知识并根据相应的策略进行决策 [26]、[27]。我们提出了一种新型的变分量子电路，该电路可以在当前的 NISQ 平台上实现，并与经典计算机上的迭代参数优化相结合，以解决电路深度挑战。此外，我们将变分量子电路推广到标准 DRL 的动作值函数近似 [27]、[28]。

变分量子电路

变分量子电路(Variational Quantum Circuit, VQC)是一种混合经典-量子算法,结合了经典计算和量子计算的优势。它被认为是当前噪声易干扰量子设备(NISQ)时代的一种实用量子算法。

变分量子电路的主要特点如下:

1. 混合架构:由一个经典的优化部分和一个可编程的量子电路部分组成。经典部分负责优化参数,量子部分执行计算。

2. 可调参数:量子电路使用一些可调参数,这些参数通过经典优化算法进行调整优化。

3. 反复迭代:通过多轮迭代,不断优化参数,使量子电路输出逼近所需的目标态或结果。

4. 适合NISQ设备:相比完全量子算法,变分量子电路对噪声和误差更加鲁棒,在当前的NISQ设备上表现更好。

强化学习

强化学习是一种机器学习范式，其中智能体与一个环境 E 在一系列离散时间步长内进行交互 [26]。在每个时间步长 t，智能体接收一个状态或观察 st，然后根据其策略 π 从一组可能的动作 A 中选择一个动作 at。策略是一个将状态 st 映射到动作 at 的函数。通常，策略可以是随机的，这意味着给定一个状态 s，输出动作可以是一个概率分布。执行动作 at 后，智能体接收下一个时间步长的状态 st+1 和一个标量奖励 rt。该过程一直持续到智能体达到终止状态。一次回合被定义为智能体从一个随机选择的初始状态开始，并遵循上述过程直到终止状态。
定义 Rt = PTt′=t γ t′−trt′ 为从时间步长 t 开始的总折扣回报，其中 γ 是位于 (0, 1] 之间的折扣因子。原则上，γ 由调查者提供，以控制未来奖励如何给予决策函数。当考虑一个大的 γ 时，无论折扣率如何，智能体都会考虑未来奖励。至于一个小的 γ，智能体可以快速忽略几个时间步长内的未来奖励。智能体的目标是最大化每个状态 st 在训练过程中的预期回报。
动作值函数或 Q 值函数 Qπ(s, a) = E[Rt|st = s, a] 是基于策略 π 在状态 s 中选择动作 a 的预期回报。最佳动作值函数 Q∗(s, a) = maxπ Qπ(s, a) 在所有可能的策略中给出最大的动作值。状态 s 在策略 π 下的值 V π(s) = E [Rt|st = s] 是智能体遵循策略 π 从状态 s 开始的预期回报。在强化学习任务中，经典的时序差分 (TD) 误差 [26] 用于更新值函数

A. Q-学习

Q-学习 [26] 是一种无模型的强化学习算法。在学习过程开始之前，Q 被赋予一个任意的固定值（由程序员选择）。然后，在每个时间步长，智能体选择一个动作 at（例如，使用来自 Q 的 ϵ-贪婪策略），观察一个奖励 rt，并进入一个新的状态 st+1（可能依赖于前一个状态 st 和所选的动作），然后 Q 使用学习率 α 更新。Q-学习是一个离策略学习器，因为它使用观察到的奖励 rt 和下一个状态 st+1 对所有可能的动作 a 的最大奖励 maxa Q (st+1, a) 来更新其 Q 值。更新是根据基准公式进行的：
Q (st, at)←Q (st, at)
α h rt +γ max a Q (st+1, a)−Q (st, at) i . (1)

B. 状态-动作-奖励-状态-动作 (SARSA)

一个 SARSA [26] 智能体与环境交互并根据执行的动作更新策略。Q 值表示在状态 st 中采取动作 at 后在下一个时间步长可能获得的奖励，加上来自下一个状态-动作观察的折扣未来奖励，并通过时序差分和从状态-动作对 (st, at) 到状态-动作对 (st+1, at+1) 的转换进行更新，学习率 α 调整如下：
Q (st, at) ← Q (st, at) +α [rt + γ Q (st+1, at+1) − Q (st, at)] . (2)

C. 深度 Q-学习

动作值函数 Q(s, a) 可以用一个二维表明确表示，该表包含 s × a 个条目，即可能状态的数量乘以可能动作的数量。然而，当状态空间或动作空间很大或甚至是连续的时，表格方法不可行。在这种情况下，动作值函数用函数逼近器（如神经网络 [27]、[28]）表示。这种基于神经网络的强化学习称为深度强化学习 (DRL)。
使用神经网络作为函数逼近器来表示 Q 值函数的研究已经进行了广泛 [27]、[28]，并在许多任务中取得了成功，例如玩电子游戏。在这种情况下，动作值函数 Q(s, a; θ) 由 θ 参数化，θ 可以通过来自其他机器学习任务的优化方法的迭代系列来推导。最简单的形式是 Q-learning。在这种情况下，目标是直接通过最小化均方误差 (MSE) 损失函数来近似最佳动作值函数 Q∗(s, a)：
L(θ)=E[(rt +γ max a′ Q(st+1, a′; θ−)−Q(st, at; θ))2]. (3)
在这里，预测是 Q(st, at; θ)，其中 θ 是策略网络的参数，目标是 rt + γ maxa′ Q(st+1, a′; θ−)，其中 θ− 是目标网络的参数，st+1 是在状态 st 执行动作 at 后遇到的状态。当使用非线性逼近器（如神经网络）表示动作值函数时，DRL 中的损失函数通常很难收敛，并且可能会发散 [28]。有几个可能的罪魁祸首。当状态或观察沿着轨迹相互关联时，从而违反了样本需要独立同分布 (IID) 的假设，Q 函数会急剧变化并大规模地改变策略。此外，动作值 Q 和目标值 rt + γ maxa′ Q(st+1, a′) 之间的相关性可能很大。与监督学习不同，监督学习中目标被给出并且是恒定的，DRL 的设置允许目标随 Q(s, a) 变化，导致 Q(s, a) 追逐一个非平稳目标。
深度 Q 学习 (DQL) 或深度 Q 网络 (DQN) [28] 通过两种机制解决了这些问题：

经验重放：为了执行经验重放，智能体存储遇到的每个转换。转换以以下形式的元组存储：在每个时间步长 t，(st, at, rt, st+1)。为了更新 Q 学习参数，从重放记忆中随机抽取一批经验，然后使用以下 MSE 损失函数执行梯度下降：
L(θ) = E[(rt +γ maxa′ Q(st+1, a′; θ−)−Q(st, at; θ))2],
其中，损失函数是在从重放记忆中抽取的批次上计算的。经验重放的关键重要性是降低训练 Q 函数的输入之间的相关性。

目标网络：θ− 是目标网络的参数，并且这些参数仅在有限时间步长内更新。与动作值函数相比，这种设置有助于稳定 Q 值函数的训练，因为目标相对稳定。

两个强化学习的例子，用于测试和验证

A. 冻结湖

我们在这项工作中考虑的第一个测试环境是冻结湖，这是 openAI Gym [29] 中的一个简单迷宫环境。在这个环境中，站在冻结湖上的智能体被期望从起点 (S) 到达目标点 (G)（见图 1）。由于湖并非全部冻结，沿途有几个洞 (H)，智能体应该学会避免踩到这些洞的位置，否则智能体将获得一个大的负奖励，并且回合将结束。此外，智能体还被期望采取最短的可能路径。为了完成这项任务，我们在智能体的每次移动上都设置了一个小的负奖励。在这里，我们演示了冻结湖环境的三个不同配置，如图 1 所示，用于训练。
冻结湖环境映射如下：
观察：所有时间步长的观察记录。
动作：动作空间中有四个动作 LEFT、DOWN、RIGHT、UP。如何在变分量子电路中选择动作将在第 VI-A 节中描述。
奖励：在这个环境中，成功达到目标的奖励为 +1.0，失败任务的奖励为 -0.2，即踩进其中一个洞。此外，为了鼓励智能体采取最短路径，每走一步也有 -0.01 的奖励。

B. 认知无线电

在第二个测试环境中，我们在现实世界应用中研究了所提出的变分量子-DQN 或 -DQL (VQ-DQN; VQ-DQL) 智能体。我们考虑认知无线电实验。在这种情况下，智能体被期望在每个时间步长选择一个未被占用或未被干扰的信道（见图 2）。如果智能体成功了，那么它将获得 +1 奖励，否则它将获得 -1 奖励。请注意，如果智能体收集了三个失败的选项或智能体玩了超过 100 步，则回合将结束。这项任务对于现代无线多信道环境至关重要，因为信道可能会被占用或受到干扰。
为了进行这项工作的演示，我们假设智能体可以选择 n 个可能的信道，并且信道的变化遵循一个简单的周期性模式，每个完整周期包含 n 个时间步长。在这里，我们演示了认知无线电环境的三个不同配置，如图 3 所示。
认知无线电环境映射如下：
观察：ns3 [30] 统计数据，带有无线电信道容量，具有自定义信道数 = n。（例如，状态 [1 0 0 0] 表示 n = 4 个信道，并且主用户在第 1 个信道上。）
动作：在 n 个信道中选择一个信道，供次级用户访问无线电信道。如何选择认知无线电场景中的动作将在第 VI-A 节中描述。
奖励：与主用户发生碰撞时为 -1；无碰撞时为 +1。测试环境中奖励列表如表 1 所示。智能体可以达到最高 100 分。

变分量子电路和深度 Q 学习

变分量子电路是一种混合量子-经典方法，它利用了量子计算和经典计算的优势。它是一种量子电路，具有可调参数，这些参数可以通过经典计算机以迭代方式优化。这些参数可以被视为人工神经网络中的权重。变分量子电路方法已被证明在电路深度和抗噪声方面具有灵活性 [31]–[33]。因此，即使 NISQ 设备中仍然缺乏量子纠错和容错量子计算，由变分量子电路驱动的量子机器学习算法也可以规避现有量子设备中存在的复杂量子错误。

基于变分量子电路的 DRL 及其相关组件的概述。强化学习智能体包括一个量子部分和一个经典部分。变分量子电路的量子部分采用两组参数并输出测量结果，这些测量结果决定了可能的动作。经典计算机的经典部分执行优化过程并计算新的参数集应该是哪些。图 5 显示了 DRL 的通用量子电路架构（量子电路的详细描述将在后面介绍），VQ-DQL 或 VQ-DQN 的算法如算法 1 所示。我们使用相同的电路架构构建两组电路参数。主电路参数每步更新一次，而目标电路参数每 20 步更新一次。对于经验重放，重放记忆设置为冻结湖测试环境的长度为 80，认知无线电测试环境的长度为 1000，训练批次的大小为 5。优化过程需要计算量子测量的期望值的梯度，这可以通过相同的电路架构和略有不同的参数分别进行 [37]。此外，我们使用计算基编码方案。在我们考虑的冻结湖环境 [29] 中，总共有 16 个状态。因此，需要 4 个量子比特来表示所有状态（见图 5）。在认知无线电实验中，我们应用了类似的方法和电路架构，并使用不同数量的量子比特来匹配可能的信道数量（见图 6）。此外，[38] 对不同的编码方案进行了讨论。我们将讨论计算基编码的概念以及冻结湖和认知无线电问题的量子电路。

本文探索了用于深度强化学习的变分量子电路。具体来说，我们将经典深度强化学习算法（如经验回放和目标网络）重塑为变分量子电路的表示形式。此外，我们使用了一种量子信息编码方案，与经典神经网络相比，可以减少模型参数的数量。据我们所知，这项工作是首次证明变分量子电路可以近似用于决策和策略选择强化学习的深度Q值函数，并具有经验回放和目标网络。此外，我们的变分量子电路可以部署在许多近期的NISQ机器上。
主要贡献：
首次将变分量子电路应用于深度强化学习，并证明了其在近似深度Q值函数方面的可行性。
设计了一种量子信息编码方案，与经典神经网络相比，可以减少模型参数的数量。
在冻结湖和认知无线电环境中测试了所提出的变分量子深度Q学习（VQ-DQL）算法，并展示了其在性能和内存消耗方面的优势。

总结

文章提出了一种对于深度Q学习算法的改进方式，通过差分量子电路来对算法进行优化，通过使用量子电路对强化学习中的动作部分进行优化，来完成传统计算机中需要大量计算取期望的部分。通过测量量子的状态判断行动的策略，减少模型参数的数量。

下一步方向

深度Q学习原理和论文的冷冻湖实验中量子电路的搭建和其具体的实现原理

汇编语言:基于x86处理器第一章习题解答「已注销」 Linux 内核资深专家 arm
汇编语言习题解答习题解答1.1.3本节回顾习题解答1.1.3本节回顾1、汇编器和链接器是如何一起工作的？汇编程序要转化为可执行程序，需要先译码后组合。这是因为一个完整的汇编程序常常是由多个文件构成，先用汇编器将每一个文件中的汇编代码转化为机器语言后，链接器再把这些文件组合成一个可执行程序。2、学习汇编语言如何能提高你对操作系统的理解？可用汇编语言验证操作系统的理论知识，从而更深刻的掌握操作系统3、
Git学习和使用 mayue_csdn 工具 git
文章目录5.2.gitmodules用法5.2.1.gitmodules用法5.2.2纯本地用法5.2.3gitsubmoduleinit5.2.4gitclone子分支不是最新（有的是有的不是、配置没指定）检查子模块状态更新子模块重新初始化子模块清理和重新克隆检查SSH密钥和权限使用最新版本的Gitgitclone指定分支一、Git介绍1.2Git使用教程1.3Git查看和设置用户名和邮箱二、G
stack_queue扩展学习 --- 反向迭代器茉莉玫瑰花茶 C++反向迭代器 C/C++
反向迭代器的实现思路源码及框架分析迭代器是用来遍历容器的，是一种封装，它不需要去关注容器的底层实现（底层是数组，链表，还是树等等这些结构），我们都是用统一的方式去对容器进行访问，访问行为是类似指针的。我们之前学习了普通迭代器和const迭代器：普通迭代器：能读能写；const迭代器：只能读，只能遍历数据，得到数据，不能修改数据，是不能写的。我们之前学的普通迭代器是正向迭代器，如果我想逆方向遍历呢？
Java技术栈/面试题合集(16)-SpringCloud篇霸道流氓气质 Java进阶 Java SpringCloud 微服务面试
场景Java入门、进阶、强化、扩展、知识体系完善等知识点学习、性能优化、源码分析专栏分享：Java入门、进阶、强化、扩展、知识体系完善等知识点学习、性能优化、源码分析专栏分享_java高级进阶-CSDN博客通过对面试题进行系统的复习可以对Java体系的知识点进行查漏补缺。注：博客：霸道流氓气质-CSDN博客实现什么是SpringCloud？一、SpringCloud的核心定位1.定义SpringC
想要了解大模型，看懂这一篇就够了！大模型工作流程及核心参数介绍！ Gq.xxu qwen3 vllm transforms 大语言模型部署深度学习人工智能
若想深入探究大模型核心参数的效果与作用，就务必先弄清大模型的工作流程，明确核心参数在流程各阶段的效能与功能，知晓其具体含义。一，大模型的工作流程大模型运行时的工作原理可以概括为输入处理→特征提取→模型推理→结果生成四个核心阶段，整个过程融合了深度学习架构、自然语言处理技术以及分布式计算能力。从用户输入到大模型输出，整个工作的处理流程如下：输入文本→分词→嵌入+位置编码→Transformer多层处
【初阶学习Linux】初识Linux 鳄鱼皮坡 linux 学习运维开发语言
1.Linux背景介绍发展史:本门课程学习Linux系统编程，你可能要问Linux从哪里来？它是怎么发展的？在这里简要介绍Linuxs的发展史。要说Linux，还得从UNIX说起。UNIX发展的历史：1968年，一些来自通用电器公司、贝尔实验室和麻省理工学院的研究人员开发了一个名叫Multics的特殊操作系统。Multics在多任务文件管理和用户连接中综合了许多新概念。1969－1970年，AT&
LSTM 论文（Hochreiter & Schmidhuber, 1997）精读（三）
文章：SeppHochreiter,JürgenSchmidhuber;LongShort-TermMemory.NeuralComput1997;9(8):1735–1780.doi:https://doi.org/10.1162/neco.1997.9.8.1735第2节PreviousWork（已有研究），这是论文对以往方法的一个评述，总结了已有递归神经网络在面对时间序列学习、尤其是长时依赖
R 语言操作csv文件详解
在R中，我们可以从R环境外部存储的文件中读取数据。我们还可以将数据写入将由操作系统存储和访问的文件中。R可以读取和写入各种文件格式，如csv、excel、xml等。在本章中，我们将学习从csv文件读取数据，然后将数据写入csv文件。该文件应存在于当前工作目录中，以便R可以读取它。当然我们也可以设置自己的目录并从那里读取文件。获取和设置工作目录您可以使用**getwd()函数检查R工作区指向哪个目录
深度学习-Tensor
Tensor张量：与numpy中的ndarray不同之处：tensor可以在GPU或其他专用硬件上运行，以加速计算。一、Tensor初始化1.直接从数据中创建data=[[1,2],[3,4]]x_data=torch.tensor(data)2.从numpy数组创建np_array=np.array(data)x_np=torch.from_numpy(np_array)3.从另一个Tensor
在WPF中使用CommunityToolkit.Mvvm——（一）为什么使用CommunityToolkit.Mvvm 永远的久远 wpf
前言阅读我文章的同学可能已经发现了，我总是会在一个系列文章的第一篇抛出问题，为什么要用到这个技术。因为一些成熟的库和技术会给我们带来生产力大幅的提升，同时通过学习一些优秀的开源项目，对我们个人的能力提升也会有帮助。接下来我们一起来看一下MVVMToolkit能为我们带来哪些惊喜～～CommunityToolkit.Mvvm是什么微软的官方文档这样介绍的CommunityToolkit.Mvvm包（
ubuntu上编译fastDDS库源码并运行hellworld示例程序的流程
1.介绍1.1.目的本文是关于自己了解、学习、并使用fastDDS中间件的文章，描述了在ubuntu18.04上从下载源码到安装运行hellworld的整个流程，本文章为亲身实践，有问题请私信沟通1.2.FastDDS介绍eProsimaFastDDS是一个独立的cpp中间件实现，提供OMGDDS1.4和OMGRTPS2.2可互操作的有线协议标准，是一款免费和开源软件（ApacheLicense2
《沟通力》：沟通力到底藏着多少不为人知的秘密？只因在人海中多看了你一眼个人成长学习
创作背景本文旨在通过多种沟通模型提升个人和团队的沟通能力。《沟通力》强调通过不同的沟通模型，提升沟通的效果和效率。阅读动机提升沟通能力：通过学习不同的沟通模型，提高日常交流的效果。优化工作表现：在职场中更好地表达自己，提高团队协作效率。增强人际关系：改善与家人、朋友的关系，建立更和谐的人际环境。核心概念与方法论1.沟通漏斗效应核心概念：沟通过程中，信息从发送者到接收者会逐渐减少，导致信息失真。方法
从0开始学习R语言--Day41--Moran‘s I Chef_Chen 学习
在处理带有空间特征的数据，我们往往都直接一股脑地处理数据点，但很多时候，空间上的信息对于处理后续衍生出来的问题会有很大帮助，例如对于城市里大小县城的发展情况，只知道单一县城的经济发展曲线，很难解释一些拐点和突然的攀升，而如果知道相邻县城存在经济发展飞快的例子，可能就是被带动了经济水平；亦或者是在处理社交网络的好有问题时，只知道谁和谁是朋友（类似于空间矩阵），是无法推断出经济收入相似的推论的，所以说
Flutter-完整开发实战详解(一、Dart-语言和-Flutter-基础) 2401_85122662 flutter
《Android学习笔记总结+最新移动架构视频+大厂安卓面试真题+项目实战源码讲义》完整开源地址：https://docs.qq.com/doc/DSkNLaERkbnFoS0ZF基本类型var可以定义变量，如vartag=“666”，这和JS、Kotlin等语言类似，同时Dart属于动态类型语言，支持闭包。Dart中number类型分为int和double，其中java中的long对应的也是Da
从0开始学习计算机视觉--Day08--卷积神经网络
之前我们提到，神经网络是通过全连接层对输入做降维处理，将输入的向量通过矩阵和激活函数进行降维，在神经元上输出激活值。而卷积神经网络中，用卷积层代替了全连接层。不同的是，这里的输入不再需要降维，而是可以保留输入的空间结构，例如输入的是32×32×3的图片，在全连接层中是3072×1的向量，而卷积层里则保持不变。这里的改变的地方是对于同样的WX的函数形式，这里是把5×5×3的权重矩阵（也叫卷积核）向量
UniApp的学习 xuzhihuan焕 uni-app 学习
一.Vue.js基础基本概念：总之，Vue.js是一个简洁、灵活、高效的前端JavaScript框架，具有响应式数据绑定、组件化开发、虚拟DOM等特点，适用于构建各种类型的Web应用。Vue.js介绍：了解Vue.js的起源、特点以及基本概念。特点：简洁易用：Vue.js的API简洁明了，学习曲线较为平缓，使得开发者能够快速上手。响应式数据绑定：Vue.js提供了响应式的数据绑定机制，当数据发生变
java中打印sql,利用JDBC的PrepareStatement打印真实SQL的方法详解 weixin_39878549 java中打印sql
前言本文主要给大家介绍了关于利用JDBC的PrepareStatement打印真实SQL的相关内容，分享出来供大家参考学习，下面来一起看看详细的介绍：我们知道，JDBC的PrepareStatement优点多多，通常都是推荐使用PrepareStatement而不是其基类Statment。PrepareStatement支持?占位符，可以将参数按照类型转自动换为真实的值。既然这一过程是自动的，封装
基于存算一体架构的实时深度学习推理优化瑕疵热点资讯架构深度学习人工智能
博客主页：瑕疵的CSDN主页Gitee主页：瑕疵的gitee主页⏩文章专栏：《热点资讯》基于存算一体架构的实时深度学习推理优化基于存算一体架构的实时深度学习推理优化基于存算一体架构的实时深度学习推理优化引言存算一体架构的核心优势1.能效比突破2.实时性保障架构设计与实现技术1.存储单元创新2.硬件加速器设计3.电路级优化深度学习推理优化策略1.模型压缩技术2.硬件-软件协同优化3.运行时调度典型应
每日学习问题记录
提交版本的时候一定注意，你改动的UI后一定要提交相关的文件，比如你的导出文件和UI图片，还有你改动的脚本文件。.血量更新机制立即更新(UpdateBossHpImmediate())//计算血条相关数值float hpPerBar = (float)maxHp / m_BossHpNum; // 每一条血条代表的血量值float totalHpBars = currentHp / hpPerBar
2024年最新4大典型安全漏洞是怎么来的？如何解决？，【2024网络安全最新学习路线】 2401_84297193 程序员 web安全学习网络
还有兄弟不知道网络安全面试可以提前刷题吗？费时一周整理的160+网络安全面试题，金九银十，做网络安全面试里的显眼包！王岚嵚工程师面试题（附答案），只能帮兄弟们到这儿了！如果你能答对70%，找一个安全工作，问题不大。对于有1-3年工作经验，想要跳槽的朋友来说，也是很好的温习资料！【完整版领取方式在文末！！】93道网络安全面试题内容实在太多，不一一截图了黑客学习资源推荐最后给大家分享一份全套的网络安全
在学校研究学习的偏算法，秋招投递开发岗位还有希望吗程序员
前言Thelasttime,Ihavelearned这是星球同学，在周五晚上答疑聊天的时候对我的提问：如果简历上的项目偏算法，但是自学了一些操作系统和计网的知识，秋招的时候投递偏开发的岗位有希望吗？简历上是否也要加上相关项目？估计也是很多朋友的疑问，毕竟很多同学读研，有些老师疯狂push，要成果，发论文。要想尽快发论文，那只能“研究”人工智能、算法的一些东西了。但是众所周知，算法要求很高，不仅要求
AlphaEvolve：谷歌的算法进化引擎 | 从数学证明到芯片设计的AI自主发现新纪元大千AI助手人工智能 Python #OTHER 算法人工智能深度学习 AlphaEvolve google gemini
AlphaEvolve：谷歌的算法进化引擎|从数学证明到芯片设计的AI自主发现新纪元——结合大语言模型与进化计算，重塑科学发现与工程优化的通用智能体本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！⚙️一、核心定义与技术架构AlphaEvolve是由谷歌DeepMind开发的通用科学AI智能体，其核心
python namedtuple转为dict 链池 python 开发语言
python相关学习资料：搭建私人助理大模型需要什么环境？006_指法标准_键盘正位_你好世界_hello_world_单引号_双引号一张图生成指定动作的动态视频,MagicAnimate本地部署Pythonnamedtuple转为dict的方法作为一名经验丰富的开发者，我很高兴能够帮助刚入行的小白们解决编程问题。今天，我们将一起学习如何将Python中的namedtuple转换为dict。这个过
C# 项目卷纸要用清风的 C#c#开发语言
语言基础开发环境与工具框架与库数据库与数据存储项目架构与设计模式前端技术（全栈开发场景）版本控制与协作测试与质量保障部署与运维安全实战项目建议学习资源推荐总结语言基础C#语法：变量、数据类型、控制流（条件语句、循环）、运算符、异常处理（try-catch）等。面向对象编程（OOP）：类与对象、继承、多态、封装、接口、抽象类。高级特性：委托（Delegate）与事件（Event）LINQ（Langu
2025 年机器学习工作流程的 7 个 AI 代理框架盖瑞理 AI Agent 人工智能
介绍机器学习从业者花费大量时间在重复性任务上：监控模型性能、重新训练流程、检查数据质量以及跟踪实验。虽然这些操作任务至关重要，但它们通常会占用团队60%到80%的时间，几乎没有留下任何创新和模型改进的空间。传统的自动化工具可以处理简单的、基于规则的工作流程，但它们难以应对机器学习操作所需的动态决策。何时应该根据性能漂移重新训练模型？当数据分布发生变化时，如何自动调整超参数？这些场景需要能够推理复杂
我与C语言二周目邂逅vlog—1.熟悉而又陌生-初识C语言 hope kc c语言开发语言
如题，在下是一名大二学生，希望改过自新，重新学习C语言（同时也在学习数据结构，希望各位大佬多多指教）1.C语言的历史C语言最初作为Unix系统的开发工具而发明的。如今成为一种高级语言，可谓C生万物2.编译与链接C语言代码是放在.c为后缀的文件里，.c为后缀的文件称为源文件，.c本身就是文本文件，无法直接运行，所以要得到最终运行的可执行程序，中间要经过编译和链接两个过程。3.VS项目的创建打开VS时
学习笔记：oracle online系列：oracle：Per-Process PGA memory limit 认真就输DBA Oracle 学习随笔学习笔记 oracle
我们的文章会在微信公众号IT民工的龙马人生和博客网站(www.htz.pw)同步更新，欢迎关注收藏，也欢迎大家转载，但是请在文章开始地方标注文章出处，谢谢！由于博客中有大量代码，通过页面浏览效果更佳。本文转自朋友的真实案例分享。oracleonline系列：oracle：Per-ProcessPGAmemorylimit前几日，东区某客户的19crac出现了ORA-04030，从报错的trace来
【深度学习新浪潮】什么是上下文长度？小米玄戒Andrew 深度学习新浪潮深度学习人工智能 LLM 语言模型大模型模型优化上下文长度
大型语言模型（LLM）的上下文长度是指模型在处理当前输入时能够有效利用的历史文本长度，通常以token（如单词、子词或标点）为单位衡量。例如，GPT-4支持128Ktoken的上下文，而Llama4Scout甚至达到了10Mtoken的惊人规模。这一指标直接影响模型在长文档理解、多轮对话等复杂任务中的表现。一、上下文长度的合理范围上下文长度的选择需结合具体应用场景：日常对话：通常需要8K–32Kt
如何阅读、学习 Git 核心源代码？ belldeep Linux Git 学习 git 源代码
学习Git核心源代码是一个深入理解版本控制系统底层原理的绝佳方式。以下是分阶段的系统性建议，结合了实践经验和学习路径设计：一、前置知识储备C语言进阶重点掌握指针操作（尤其是二级指针和函数指针）结构体嵌套与内存对齐哈希表、链表等基础数据结构实现POSIXAPI系统调用（文件IO、进程控制）Git原理深入重读《ProGit》第10章（GitInternals）理解对象模型四元组：blob/tree/c
Manus AI与多语言手写识别 tonngw 人工智能
技术文章大纲：ManusAI与多语言手写识别引言手写识别技术的发展背景与市场需求ManusAI的定位与核心技术优势多语言场景下的挑战与机遇ManusAI的核心技术架构基于深度学习的端到端手写识别模型多模态数据融合（笔迹压力、书写轨迹等）自适应语言模型与字符集扩展机制多语言手写识别的关键技术非拉丁语系（中文、阿拉伯语等）的笔迹特征提取小样本语言数据的迁移学习策略上下文感知与语法纠错在低资源语言中的应
JAVA基础灵静志远位运算加载 Date 字符串池覆盖
一、类的初始化顺序 1 （静态变量，静态代码块）-->（变量，初始化块）--> 构造器同一括号里的，根据它们在程序中的顺序来决定。上面所述是同一类中。如果是继承的情况，那就在父类到子类交替初始化。二、String 1 String a = "abc"; JAVA虚拟机首先在字符串池中查找是否已经存在了值为"abc"的对象，根
keepalived实现redis主从高可用 bylijinnan redis
方案说明两台机器（称为A和B），以统一的VIP对外提供服务 1.正常情况下，A和B都启动，B会把A的数据同步过来（B is slave of A） 2.当A挂了后，VIP漂移到B；B的keepalived 通知redis 执行：slaveof no one，由B提供服务 3.当A起来后，VIP不切换，仍在B上面；而A的keepalived 通知redis 执行slaveof B，开始
java文件操作大全 0624chenhong java
最近在博客园看到一篇比较全面的文件操作文章，转过来留着。 http://www.cnblogs.com/zhuocheng/archive/2011/12/12/2285290.html 转自http://blog.sina.com.cn/s/blog_4a9f789a0100ik3p.html 一.获得控制台用户输入的信息 &nbs
android学习任务不懂事的小屁孩工作
任务完成情况搞清楚带箭头的pupupwindows和不带的使用已完成熟练使用pupupwindows和alertdialog，并搞清楚两者的区别已完成熟练使用android的线程handler,并敲示例代码进行中了解游戏2048的流程，并完成其代码工作进行中-差几个actionbar 研究一下android的动画效果，写一个实例已完成复习fragem
zoom.js 换个号韩国红果果 oom
它的基于bootstrap 的 https://raw.github.com/twbs/bootstrap/master/js/transition.js transition.js模块引用顺序 <link rel="stylesheet" href="style/zoom.css"> <script src=&q
详解Oracle云操作系统Solaris 11.2 蓝儿唯美 Solaris
当Oracle发布Solaris 11时，它将自己的操作系统称为第一个面向云的操作系统。Oracle在发布Solaris 11.2时继续它以云为中心的基调。但是，这些说法没有告诉我们为什么Solaris是配得上云的。幸好，我们不需要等太久。Solaris11.2有4个重要的技术可以在一个有效的云实现中发挥重要作用：OpenStack、内核域、统一存档（UA）和弹性虚拟交换（EVS）。
spring学习——springmvc（一） a-john springMVC
Spring MVC基于模型-视图-控制器（Model-View-Controller，MVC）实现，能够帮助我们构建像Spring框架那样灵活和松耦合的Web应用程序。 1，跟踪Spring MVC的请求请求的第一站是Spring的DispatcherServlet。与大多数基于Java的Web框架一样，Spring MVC所有的请求都会通过一个前端控制器Servlet。前
hdu4342 History repeat itself-------多校联合五 aijuans 数论
水题就不多说什么了。 #include<iostream>#include<cstdlib>#include<stdio.h>#define ll __int64using namespace std;int main(){ int t; ll n; scanf("%d",&t); while(t--)
EJB和javabean的区别 asia007 bean ejb
EJB不是一般的JavaBean,EJB是企业级JavaBean,EJB一共分为3种,实体Bean,消息Bean,会话Bean,书写EJB是需要遵循一定的规范的,具体规范你可以参考相关的资料.另外,要运行EJB,你需要相应的EJB容器,比如Weblogic,Jboss等,而JavaBean不需要,只需要安装Tomcat就可以了 1.EJB用于服务端应用开发, 而JavaBeans
Struts的action和Result总结百合不是茶 struts Action配置 Result配置
一:Action的配置详解: 下面是一个Struts中一个空的Struts.xml的配置文件 <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE struts PUBLIC &quo
如何带好自已的团队 bijian1013 项目管理团队管理团队
在网上看到博客" 怎么才能让团队成员好好干活"的评论，觉得写的比较好。原文如下：我做团队管理有几年了吧，我和你分享一下我认为带好团队的几点： 1.诚信对团队内成员，无论是技术研究、交流、问题探讨，要尽可能的保持一种诚信的态度，用心去做好，你的团队会感觉得到。 2.努力提
Java代码混淆工具 sunjing ProGuard
Open Source Obfuscators ProGuard http://java-source.net/open-source/obfuscators/proguardProGuard is a free Java class file shrinker and obfuscator. It can detect and remove unused classes, fields, m
【Redis三】基于Redis sentinel的自动failover主从复制 bit1129 redis
在第二篇中使用2.8.17搭建了主从复制，但是它存在Master单点问题，为了解决这个问题，Redis从2.6开始引入sentinel，用于监控和管理Redis的主从复制环境，进行自动failover，即Master挂了后，sentinel自动从从服务器选出一个Master使主从复制集群仍然可以工作，如果Master醒来再次加入集群，只能以从服务器的形式工作。什么是Sentine
使用代理实现Hibernate Dao层自动事务白糖_ DAO spring AOP 框架 Hibernate
都说spring利用AOP实现自动事务处理机制非常好，但在只有hibernate这个框架情况下，我们开启session、管理事务就往往很麻烦。 public void save(Object obj){ Session session = this.getSession(); Transaction tran = session.beginTransaction(); try
maven3实战读书笔记 braveCS maven3
Maven简介是什么？ Is a software project management and comprehension tool.项目管理工具是基于POM概念(工程对象模型) [设计重复、编码重复、文档重复、构建重复，maven最大化消除了构建的重复] [与XP：简单、交流与反馈；测试驱动开发、十分钟构建、持续集成、富有信息的工作区] 功能：
编程之美-子数组的最大乘积 bylijinnan 编程之美
public class MaxProduct { /** * 编程之美子数组的最大乘积 * 题目: 给定一个长度为N的整数数组，只允许使用乘法，不能用除法，计算任意N-1个数的组合中乘积中最大的一组，并写出算法的时间复杂度。 * 以下程序对应书上两种方法，求得“乘积中最大的一组”的乘积——都是有溢出的可能的。 * 但按题目的意思，是要求得这个子数组，而不
读书笔记-2 chengxuyuancsdn 读书笔记
1、反射 2、oracle年-月-日时-分-秒 3、oracle创建有参、无参函数 4、oracle行转列 5、Struts2拦截器 6、Filter过滤器(web.xml) 1、反射 (1)检查类的结构在java.lang.reflect包里有3个类Field,Method,Constructor分别用于描述类的域、方法和构造器。 2、oracle年月日时分秒 s
[求学与房地产]慎重选择IT培训学校 comsci it
关于培训学校的教学和教师的问题,我们就不讨论了,我主要关心的是这个问题培训学校的教学楼和宿舍的环境和稳定性问题我们大家都知道，房子是一个比较昂贵的东西，特别是那种能够当教室的房子... &nb
RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系 daizj oracle rman filesperset PARALLELISM
RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系转 PARALLELISM --- 我们还可以通过parallelism参数来指定同时"自动"创建多少个通道： RMAN > configure device type disk parallelism 3 ; 表示启动三个通道，可以加快备份恢复的速度。
简单排序:冒泡排序 dieslrae 冒泡排序
public void bubbleSort(int[] array){ for(int i=1;i<array.length;i++){ for(int k=0;k<array.length-i;k++){ if(array[k] > array[k+1]){
初二上学期难记单词三 dcj3sjt126com sciet
concert 音乐会 tonight 今晚 famous 有名的；著名的 song 歌曲 thousand 千 accident 事故；灾难 careless 粗心的，大意的 break 折断；断裂；破碎 heart 心（脏） happen 偶尔发生，碰巧 tourist 旅游者；观光者 science （自然）科学 marry 结婚 subject 题目；
I.安装Memcahce 1. 安装依赖包libevent Memcache需要安装libevent,所以安装前可能需要执行 Shell代码收藏代码 dcj3sjt126com redis
wget http://download.redis.io/redis-stable.tar.gz tar xvzf redis-stable.tar.gz cd redis-stable make 前面3步应该没有问题，主要的问题是执行make的时候，出现了异常。异常一： make[2]: cc: Command not found 异常原因：没有安装g
并发容器 shuizhaosi888 并发容器
通过并发容器来改善同步容器的性能，同步容器将所有对容器状态的访问都串行化，来实现线程安全，这种方式严重降低并发性，当多个线程访问时，吞吐量严重降低。并发容器ConcurrentHashMap 替代同步基于散列的Map，通过Lock控制。 &nb
Spring Security（12）——Remember-Me功能 234390216 Spring Security Remember Me 记住我
Remember-Me功能目录 1.1 概述 1.2 基于简单加密token的方法 1.3 基于持久化token的方法 1.4 Remember-Me相关接口和实现
位运算焦志广位运算
一、位运算符Ｃ语言提供了六种位运算符： & 按位与 | 按位或 ^ 按位异或 ~ 取反 << 左移 >> 右移 1. 按位与运算按位与运算符"&"是双目运算符。其功能是参与运算的两数各对应的二进位相与。只有对应的两个二进位均为1时，结果位才为1 ，否则为0。参与运算的数以补码方式出现。例如：9&am
nodejs 数据库连接 mongodb mysql liguangsong mongodb mysql node 数据库连接
1.mysql 连接 package.json中dependencies加入 "mysql":"~2.7.0" 执行 npm install 在config 下创建文件 database.js
java动态编译 olive6615 java HotSpot jvm 动态编译
在HotSpot虚拟机中，有两个技术是至关重要的，即动态编译(Dynamic compilation)和Profiling。 HotSpot是如何动态编译Javad的bytecode呢？Java bytecode是以解释方式被load到虚拟机的。HotSpot里有一个运行监视器，即Profile Monitor,专门监视
Storm0.9.5的集群部署配置优化 roadrunners 优化 storm.yaml
nimbus结点配置（storm.yaml）信息： # Licensed to the Apache Software Foundation (ASF) under one # or more contributor license agreements. See the NOTICE file # distributed with this work for additional inf
101个MySQL 的调节和优化的提示 tomcat_oracle mysql
　1. 拥有足够的物理内存来把整个InnoDB文件加载到内存中——在内存中访问文件时的速度要比在硬盘中访问时快的多。　　2. 不惜一切代价避免使用Swap交换分区 – 交换时是从硬盘读取的，它的速度很慢。　　3. 使用电池供电的RAM（注：RAM即随机存储器）。　　4. 使用高级的RAID（注：Redundant Arrays of Inexpensive Disks，即磁盘阵列
zoj 3829 Known Notation(贪心) 阿尔萨斯 ZOJ
题目链接：zoj 3829 Known Notation 题目大意：给定一个不完整的后缀表达式，要求有2种不同操作，用尽量少的操作使得表达式完整。解题思路：贪心，数字的个数要要保证比∗的个数多1，不够的话优先补在开头是最优的。然后遍历一遍字符串，碰到数字+1，碰到∗-1,保证数字的个数大于等1，如果不够减的话，可以和最后面的一个数字交换位置（用栈维护十分方便），因为添加和交换代价都是1