ReEchooo

图解DQN，DDQN，DDPG网络

图解DQN，DDQN，DDPG网络

1. DQN
- 1.1 网络结构
- 1.2 产生experience的过程
- 1.3 Q网络的更新流程
2. DDQN
- 2.1 网络结构
- 2.2 产生experience的过程
- 2.3 Q网络的更新流程
3. DDPG
- 3.1 网络结构
- 3.2 产生experience的过程
- 3.3 Actor网络的更新流程
- 3.4 Critic网络的更新流程

本文未经许可，禁止转载，如需转载请联系笔者

1. DQN

深度Q网络(Deep Q Network)适用于动作离散的强化学习任务

1.1 网络结构

深度Q网络有两个网络结构，如下所示：

Q网络输入是状态，输出是各种动作对应的 $Q$ 值。

如果这个 $Q$ 值越精准，就说明Q网络训练地越好。

Q网络和Target Q网络的区别是，Q网络是每步都会在经验池中更新，而Target Q网络是隔一段时间将Q的网络参数拷贝到Target Q网络中，实现Target Q网络的更新。这种“滞后”更新是为了保证在训练Q网络时训练的稳定性。

1.2 产生experience的过程

已知一个状态 $s_t$ ，通过 Q网络 得到各种动作的Q值，然后用 $\epsilon$ 贪婪策略 选择动作 $a_t$ （ $\epsilon$ 贪婪策略是为了保证一定的探索，大概率会选择Q值最大的那个动作），然后将 $a_t$ 输入到环境中，得到 $s_{t+1}$ 和 $r_{t+1}$ ，这样就得到一个experience: $s_t, a_t, s_{t+1}, r_{t+1})$ ，然后将experience放入经验池中。

1.3 Q网络的更新流程

从经验池中取出一批experience，这里以一个experience： $s_t, a_t, s_{t+1}, r_{t+1})$ 为例讲述训练神经网络的过程。

下图假设 $a_t=a_1, a_{t+1}=a_2$

其中：红色字母代表已知项。

如上图所示，首先是根据 $s_t$ 和 $a_t$ 是可以确定当前的 $Q(s_t,a_t)$ 值的，即 $Q(s_t,a_1)$ 。然后将下一状态 $s_{t+1}$ 输入到Target Q网络中，得到各种不同的动作的Q值，接下来选择最大的Q值（注意是完全贪婪，不是 $\epsilon$ 贪婪），这里假设选择了动作 $a_2$ 。最后，以 $Q(s_t,a_1)$ 作为网络的预测值，而 $r_{t+1} + \gamma Q(s_{t+1},a_2)$ 作为网络的实际值，进行误差反向传播。loss函数可以选择方差等，把它当做一个有监督学习即可。

过一段时间后，将Q网络中的参数拷贝到Target Q网络中。

2. DDQN

DQN算法在深度强化学习领域取得了不俗的成绩，不过其并不能保证一直收敛，研究表明这种估计目标价值的算法过于乐观的高估了一些情况下的行为价值，导致算法会将次优行为价值一致认为最优行为价值，最终不能收敛至最佳价值函数。

一种使用双价值网络的DDQN(double deep Q network)被认为较好地解决了这个问题。

2.1 网络结构

DDQN算法的网络结构与DQN相同

2.2 产生experience的过程

与DQN相同

2.3 Q网络的更新流程

DDQN与DQN大部分都相同，只有一步不同，那就是在选择 $Q(s_{t+1},a_{t+1})$ 的过程中，DQN总是选择Target Q网络的最大输出值。而DDQN不同，DDQN首先从Q网络中找到最大输出值的那个动作，然后再找到这个动作对应的Target Q网络的输出值。用图像表示即为：

其中：红色字母代表已知项。

如上图所示，首先是根据 $s_t$ 和 $a_t$ 是可以确定当前的 $Q(s_t,a_t)$ 值的，这里假设为 $Q(s_t,a_1)$ 。然后将下一状态 $s_{t+1}$ 输入到 Q网络 中，得到各种不同的动作的Q值，接下来选择最大的Q值对应的动作（注意是完全贪婪，不是 $\epsilon$ 贪婪），这里假设选择了动作 $a_1$ 。接着将状态 $s_{t+1}$ 输入到 Target Q网络 中，找到动作 $a_1$ 对应的 $Q$ 值 $Q(s_{t+1},a_1)$ 。最后，以 $Q(s_t,a_1)$ 作为网络的预测值，而 $r_{t+1} + \gamma Q(s_{t+1},a_1)$ 作为网络的实际值，进行误差反向传播。loss函数可以选择方差等，把它当做一个有监督学习即可。

过一段时间后，将Q网络中的参数拷贝到Target Q网络中。

3. DDPG

3.1 网络结构

深度确定性策略梯度（deep deterministic policy gradient，DDPG）算法的主要网络结构为以下四个：

Actor网络输入是状态，输出是动作。Critic网络输入是状态和动作，输出是对应的Q值。

Actor网络的目的是根据状态 $s_t$ ，能够输出使得 $Q(s_t,a_t)$ 最大的动作 $a_t$ ，这个 $a_t$ 越能使 $Q(s_t,a_t)$ 大，就说明网络训练地越好。

Critic网络的目的是根据状态动作对 $s_t,a_t)$ 能够输出其action value $Q(s_t,a_t)$ ，这个 $Q$ 值越精确，就说明网络训练地越好。

Actor网络和Target Actor网络的区别是，Actor网络是每步都会在经验池中更新，而Target Actor网络是隔一段时间将Actor的网络参数拷贝到Target Actor网络中，实现Target Actor网络的更新。这种“滞后”更新是为了保证在训练Actor网络时训练的稳定性。Critic网络和Target Critic网络也是一样。

3.2 产生experience的过程

已知一个状态 $s_0$ ，通过 actor网络 得到动作 $a'_0$ ，然后再加噪声 $N$ 得到动作 $a_0=a'_0+N$ （噪声是为了保证一定的探索），然后将 $a_0$ 输入到环境中，得到 $s_1$ 和 $r_1$ ，这样就得到一个experience: $s_0, a_0, s_1, r_1)$ ，然后将experience放入经验池中。

经验池 存在的意义是为了消除experience的相关性，因为强化学习中前后动作通常是强相关的，而将它们打散，放入经验池中，然后在训练神经网络时，随机地从经验池中选出一批experience，这样能够使神经网络训练地更好。

3.3 Actor网络的更新流程

从经验池中取出一批experience，这里以一个experience： $s_0, a_0, s_1, r_1)$ 为例讲述训练神经网络的过程。

其中：红色字母代表已知项。

结合3.1中对Actor网络的描述可知，Actor网络的loss函数就是-Q，-Q越小越好。这个-Q需要由Critic网络得到，如上图所示。

将experience中的 $s_0$ 输入到Actor网络中，得到预测的动作 $a_{0\_predict}$ ，这里不加噪声了，直接将 $s_0$ 和 $a_{0\_predict}$ 输入到Critic网络中，得到Q值，然后将-Q作为loss函数，修正Actor网络。

python代码示意如下：

        pred_a0 = self.actor.forward(s0) # 直接使用a0会不收敛
        #反向梯度下降(梯度上升)，以某状态的价值估计为策略目标函数
        loss_actor = -1 * torch.sum(self.critic.forward(s0, pred_a0))
        self.actor_optimizer.zero_grad()
        loss_actor.backward()
        self.actor_optimizer.step()

3.4 Critic网络的更新流程

接着上述experience： $s_0, a_0, s_1, r_1)$ 为例讲述训练Critic网络的过程

其中：红色字母代表已知项。

结合3.1中对Critic网络的描述可知，Critic网络需要使预测的Q值越精确越好，因此它loss函数就是Critic网络的输出值 $Q(s_0,a_0)$ （被认为是预测值）与下一步Target Critic网络的输出值和奖励的和 $r_1+\gamma Q(s_1,a_1)$ （被认为是实际值）之间的差异，差异越小越好，这种差异可以用方差，或者一些其他的pytorch自带的loss函数。整个过程如上图所示。

python代码示意如下：

        a1 = self.target_actor.forward(s1).detach()
        next_val = torch.squeeze(self.target_critic.forward(s1, a1).detach())
        # y_exp = r + gamma*Q'( s2, pi'(s2))
        y_expected = r1 + self.gamma * next_val
        y_expected = y_expected.type(torch.FloatTensor)
        # y_pred = Q( s1, a1)
        a0 = torch.from_numpy(a0) # 转换成Tensor
        y_predicted = torch.squeeze(self.critic.forward(s0, a0))
        # compute critic loss, and update the critic
        loss_critic = F.smooth_l1_loss(y_predicted, y_expected)
        self.critic_optimizer.zero_grad()
        loss_critic.backward()
        self.critic_optimizer.step()

你可能感兴趣的:(强化学习基础理论,网络,深度学习,人工智能)

《翻转课堂与微课程教学法》学习心得 4组11号孙娜 4组11号孙娜
读完《翻转课堂与微课程教学法》这本书让我对为何要进行翻转课堂，以及如何进行有了一些了解，教学观念和思想有了一种新的认识。对翻转课堂和微课程早有耳闻，也或多或少地在网络上进行过一些查阅，但都是一些零碎的、浅尝辄止的了解，现在静下心来读这本系统的著作，使我对翻转课堂和微课程有了更清晰的认识。这本书共分为上、下两部分，上篇主要是翻转课堂的相关理论和目前翻转课堂进行的一些案例，后半部主要介绍如何实施翻转课
在 Conda 中删除环境及所有安装的库 Studying 开龙wu conda
注意事项1.删除环境前确保你没有在该环境中运行任何程序。2.删除操作是不可逆的，所有该环境中的包和配置都会被永久删除。3.如果你想保留环境的配置信息，可以在删除前使用condaenvexport>environment.yml导出环境配置。关于requirements.txt和environment.yaml文件使用介绍详情可参考以往文章，争对机器学习和深度学习里Python项目开发管理项目依赖的
通过Netplan为Ubuntu服务器新增DNS以解析内部域名
在企业网络环境中，Ubuntu服务器常常需要访问内部服务，这些服务通常通过内部域名进行寻址。如果服务器默认配置的DNS无法解析这些内部域名，就需要手动添加公司的内部DNS服务器地址。本章节将详细介绍如何在Ubuntu22.04LTS服务器上使用Netplan工具新增DNS服务器IP，并提供解决配置后可能遇到的常见问题的步骤，确保服务器能够顺利解析内部域名。前提条件拥有一台运行Ubuntu22.04
王清霞平顶山网络焦点中级八期坚持分享第256天20180930 懒洋洋_a7fc
写分享就像是小时候写日记一样，时间久了就不知道写什么了。总是词穷，都说是看书少可我也没少看啊，就是记不住。有时候想在看书的时候把感受顺便写出来。好难过
如何评价网络统计男方失业超过一年，女方提出离婚概率超80%？旧约Alatus 个人收藏游戏 golang linux java 机器学习 virtualenv tornado
我来添一把柴吧，即使是因为爱情在一起的男女，男方失业的话，女方提出离婚的概率也是很高的。失业往往并不是钱的问题，而是男人一失业或者在自己的行业内失去了“拼搏”能力，男人很容易失去自信，魅力，朋友圈和小团体的领导力以及对于生活的掌控的感觉，然后这种“失去”会容易在情绪和状态上表现出来，此时女人就容易“失去感觉”，从而导致感情破裂。别说失业了，就是男人有钱但是不上班或者事业一直没有什么开拓，进展，女人
可恶!社科院正式课堂通达OA朱民节能煤水风电不靠谱骗局！虚假数字投票被骗悔不当初！易星辰分享普法
随着互联网的普及，电视上和网络上有很多分析师，他们也是这个市场的一个群体。可能你也有疑惑，既然都能分析了，还做什么分析师啊，就在股市里赚大钱就是了，干嘛还要出来抛头露面。数字经济蓬勃发展，各种线上平台如雨后春笋般涌现。然而，在这些看似繁荣的平台中，不乏一些黑平台，它们以欺诈手段骗取用户的财产，给人们的财产安全带来严重威胁！近期我们接到多起投资者举报，称有人冒充知名财经分析师（知名人物大学教授经济学
离婚后，前妻带着儿子求和陆进姜新月热门网络小说推荐_热门小说免费阅读离婚后，前妻带着儿子求和(陆进姜新月) 喵喵美文
《离婚后，前妻带着儿子求和》主角：陆进姜新月简介：入赘姜家的第二年。我和姜新月有了一个儿子。之后的五年，每顿饭菜我都会精心准备，甚至会精确到调料放多少克。直到有一天，姜新月冷不丁地说了句。“汤放多盐了。”然后儿子当着我的面把汤毫不犹豫地倒掉了。那一刻，我忽然就累了。我主动和姜新月提了离婚。她扫了我一眼不悦出声。“有必要吗？”我点了点头，淡淡回了句有必要。“儿子才五岁！”“陆进，”姜新月抬头扫了我一
智慧水库信息化系统建设产品需求文档V2.0 小赖同学啊 test Technology Precious 物联网
智慧水库信息化系统建设产品需求文档1.引言1.1文档目的本文档旨在明确智慧水库信息化系统的建设需求，为系统设计、开发和实施提供全面依据，确保系统功能满足水库管理业务需求，提升水库管理的智能化水平和决策效率。1.2背景介绍传统水库管理面临数据采集不及时、分析手段有限、决策依赖经验等问题，难以应对复杂多变的水文情势和日益增长的管理需求。随着物联网、大数据、人工智能等技术的发展，智慧水库建设成为必然趋势
HCL 三层知识总结
HCL三层知识总结一、网络层基础1.1网络层的核心功能网络层位于数据链路层之上，主要负责跨网络的数据包转发，实现不同网段（广播域）之间的通信。其核心功能包括：寻址与路由：通过IP地址标识网络中的主机，并选择最佳路径将数据包从源端发送到目的端。分段与重组：当数据包大小超过底层链路的MTU（最大传输单元）时，将其分割为更小的片段，到达目的端后重新组合。拥塞控制：通过流量调节避免网络因过载而瘫痪（HCL
2024年圈子社交APP源码开发：仿小红书垂直社区小程序搭建详解宠友信息 IM即时通讯 APP源码社交APP源码小程序微信 java uni-app spring boot 微服务
目录核心功能模块及技术解析多平台适配与技术架构结语在社交网络迅速发展的今天，垂直社交平台逐渐成为主流。特别是类似小红书的圈子社交应用，它们不仅为用户提供了一个分享和交流的空间，还满足了特定群体的个性化需求。2024年您可以打造一个深度互动、功能丰富的垂直社区。本文将详细描述如何基于这些技术构建社交平台，并结合相关的技术术语和代码片段。演示下载地址：社交源码_语音聊天软件_即时通信软件-社交软件-宠
（详细！！）2024最新Neo4j详细使用指南熊猫发电机：miniqq207 neo4j neo4j
Neo4j详细使用指南一、介绍Neo4j是什么Neo4j是一个高性能的,NOSQL图形数据库，它将结构化数据存储在网络上而不是表中。它是一个嵌入式的、基于磁盘的、具备完全的事务特性的Java持久化引擎，但是它将结构化数据存储在网络(从数学角度叫做图)上而不是表中。Neo4j也可以被看作是一个高性能的图引擎，该引擎具有成熟数据库的所有特性。程序员工作在一个面向对象的、灵活的网络结构下而不是严格、静态
“星链”计划对通信及互联网产业影响何在 Lzb6
学号：20000300056姓名：刘照标转载自公众号赛迪智库作者赵燕温晓军2019年5月24日，美国SpaceX公司以一箭多星的方式发射了60颗“星链”卫星，引起全球高科技业界的广泛关注。马斯克的SpaceX公司于2015年提出“星链”计划，预计到2025年完成卫星组网部署，将向全球终端用户提供至少1Gbps/秒、最高可达23Gbps/秒的低延迟、高带宽的网络宽带服务。“星链”计划的实施可能对包括
2023-02-14 晨love
中原焦点团队网络初级38期何晓晨分享第167天20230214人生最好的投资，莫过于自身的成长。经济有周期，人生终有起落，但根植于内心的骄傲，深藏在脑子里的才华，自然流淌出来的气质，骨子里的坚定信念。唯有这些才能帮你穿越周期，迈向一个又一个人生巅峰。不能因为一时的低潮期和短暂的高峰期，而迷失了自我，忘记了一生中最重要的事情，就是持续自我成长。
Microsoft 紧急修补 SharePoint 远程代码执行漏洞，应对持续网络攻击
微软紧急修复SharePoint高危漏洞并提供安全建议周日，微软发布了一个关键补丁，用于修复SharePoint中正在被恶意利用的安全漏洞，同时公布了另一个已通过"增强防护措施"修复的漏洞细节。这家科技巨头确认，目前已发现攻击者正针对本地部署的SharePointServer用户发起攻击，利用的是7月安全更新中未完全修复的漏洞。漏洞详情当前被利用的漏洞编号为CVE-2025-53770（CVSS评
微信小程序开发中常用的组件介绍 DTcode7 微信小程序相关微信小程序小程序移动端前端源码
微信小程序开发中常用的组件介绍基础概念组件是什么？为什么要使用组件？常用组件详解视图容器组件view示例一：基础使用示例二：绑定点击事件文本显示组件text示例三：显示动态文本图像显示组件image示例四：显示网络图片表单组件forminput示例五：简单表单导航组件navigator示例六：页面跳转列表组件scroll-view示例七：垂直滚动列表实际开发中的技巧结合实际经验的案例分析案例一：商
川翔云电脑 4090Ultra 48G：全软件预装 + 高效算力，开发者必备
一、旗舰机型核心参数川翔云RTX4090Ultra48G机型，以48GB超大显存突破硬件限制：直接加载1200万面数模型（如《黑神话：悟空》级场景），告别“爆显存”8卡集群模式（总显存384GB），4K渲染效率提升8倍（12小时→90分钟）二、预装软件清单（全场景覆盖，开机即用）三、网络与存储硬指标远程体验：30Mbps稳定带宽，4K操作延迟＜20ms，手机/平板/电脑全端适配存储福利：50GB免
黄仁勋链博会演讲实录：脱掉皮衣，穿上唐装，中文开场
黄仁勋一度尝试用中文开场，他说，“我在美国长大，学到了很多汉语。”他表示，像DeepSeek、阿里巴巴、MiniMax、百度，他们开发的产品都是世界级的，推动了全球人工智能的发展。中国的开源AI是全球进步的催化剂，以至于全世界各个行业都有机会加入到AI革命当中。7月16日，黄仁勋身着唐装出席了第三届链博会，在此之前，他身着标志性皮衣出席多个场合活动。在此之前，英伟达官宣获得H20芯片对华的出口许可
【记录】2017.7-2018.7复盘杨帆_c4ea
keene草莓杨2017目标：踏入直销行业（有平台发展快且好）营养讲师（热爱营养学）有自己的团队一起拼搏（让更多人了解营养知识拥有保健意识实现财务自由荣誉感）一年期间我想要关于职业和学习上面的提升想要生活上自己保障自己@职业（一年期间）汤臣倍健1.能门诊顾客（了解保健品中药西药人体解剖学）2.能拿起话筒（每天天看小汤网络讲师课程学习技巧有上台机会一定要上丢人没事经历一场是财富）3.情商与逻辑思维能
OpenCV学习（二）-二维、三维识别香蕉可乐荷包蛋 #OpenCV opencv 学习人工智能
OpenCV是一个功能强大的计算机视觉库，可以用于识别和处理二维图像和三维图像。以下是关于二维图像和三维图像识别的基础知识和示例代码。1.二维图像识别二维图像识别通常包括图像分类、对象检测、特征提取等任务。以下是一些常见的操作：1.1图像分类使用预训练模型对图像进行分类，例如使用深度学习模型（如ResNet、MobileNet等）。importcv2#加载预训练的深度学习模型net=cv2.dnn
亨雪的心流浪的狗尾巴草
图片发自网络风舞尘/文盼来了盼来了你——洁白的礼花于是，我便有儿时的欣喜激动的张开臂膀接纳你，拥抱你，亲吻你我欢跃于这漫天飞雪中感知你的肌肤享受你的柔情你是圣洁的公主纯洁的上天赐下的精灵图片发自App我沉醉了消失了沉醉于这飞舞的雪花里消失在这银白的世界里可惜，你只是偶尔的光顾只在寒潮时来临更可惜，你也不能长久留存你来到这多舛的尘世把生命交给了大地滋润了万物且不留痕迹图片发自网络不知何时你也偷偷的融
基于 MySQL 8.0.40 MGR 与 ProxySQL 的高可用集群部署实践 derek2026 部署实践 mysql 数据库
构建高可用MySQL8.0.40集群：MGR+ProxySQL实战指南一、部署架构图流量路径：应用→ProxySQL（DNS解析ProxySQLIP）→MySQLMGR集群二、环境准备1.系统要求**操作系统:**CentOS7.x服务器配置3台节点（建议最小配置：4核CPU/8GB内存/100GB磁盘）网络互通（关闭防火墙或开放端口：3306,33081,6032,6033节点规划节点1:192
【AI 赋能：Python 人工智能应用实战】5. 梯度下降家族：SGD/Adam优化器对比实验与选择策略 AI_DL_CODE 人工智能 python 梯度下降优化器 SGD Adam PyTorch
摘要：本文系统解析梯度下降优化器的核心原理与演进脉络，构建从理论到实战的完整知识体系。理论部分梳理优化器发展里程碑，从1951年的SGD到2018年的AdamW，揭示技术迭代逻辑；通过数学公式对比SGD、Momentum、Adam等核心算法的更新机制，解析动量加速、自适应学习率的创新点。结合损失曲面分析，阐释Momentum如何逃离鞍点、Adam如何处理悬崖梯度。实战模块基于PyTorch在MNI
【人工智能之深度学习】6. 卷积核工作原理：从边缘检测到特征抽象的逐层演进（附可视化工具与行业实战代码） AI_DL_CODE 人工智能深度学习卷积核特征提取卷积神经网络边缘检测特征可视化
摘要：卷积核是卷积神经网络（CNN）的核心组件，其通过局部感受野与参数共享机制实现高效特征提取。本文从数学本质出发，揭示卷积操作的空域-频域对偶性：空域卷积等价于频域乘积（F{f∗g}=F{f}⋅F{g}F\{f*g\}=F\{f\}⋅F\{g\}F{f∗g}=F{f}⋅F{g}），解释边缘检测核（Sobel、Laplacian）的频域响应特性。通过特征可视化实验表明，CNN特征呈现逐层抽象规律：
"热门网络小说推荐替身将我凌虐致死后，疯批老公杀红了眼霍司年若微_ 替身将我凌虐致死后，疯批老公杀红了眼霍司年若微已完结小说推荐" 多多文馆
《替身将我凌虐致死后，疯批老公杀红了眼》主角：霍司年若微简介：十年前，我救了个落水男孩。给他做完人工呼吸后，他醒来对我说：“这辈子我认定你了，等我长大来娶你！”我只当是个玩笑，没放在心上。十年后，男孩长大成了疯批霸总。在我和未婚夫的结婚现场，他带着一群人打残了我未婚夫，强行将我掳走。“我说过我会娶你。你的老公，只能是我。”他以我全家人的性命要挟，强娶我为妻。甚至将我禁锢在私人别墅，不允许任何男人与
[论文]基于强化学习的控制输入非线性水下机器人自适应神经网络控制王莽v2 机器人神经网络神经网络算法控制器
[论文]基于强化学习的控制输入非线性水下机器人自适应神经网络控制摘要本文研究了在水平面内运动的全驱动自主水下机器人的轨迹跟踪问题。在我们的控制设计中考虑了外部干扰、控制输入非线性和模型不确定性。基于离散时间域的动力学模型，两个神经网络(包括一个临界神经网络和一个作用神经网络)被集成到我们的自适应控制设计中。引入临界神经网络来评价设计的控制器在当前时间步长内的长期性能，并利用作用神经网络来补偿未知动
颠覆未来：创新代码引领人工智能与量子计算深度融合金枝玉叶9 程序员知识储备1 程序员知识储备2 程序员知识储备3 人工智能量子计算
摘要在信息时代飞速演进的背景下，人工智能与量子计算正以前所未有的速度互相融合，推动着科技边界的不断拓展。本文回顾了经典算法的智慧，展示了前沿深度学习模型的构建，并通过量子电路设计探讨了创新代码的可能性，为探索未来科技变革提供了全新视角。1.引言当前，科技创新正处于高速迭代的关键阶段，传统计算方法与新型技术的交汇处正成为研究热点。人工智能的发展已渗透到各行各业，而量子计算的崛起则为解决复杂计算问题提
今天，清明节好好的__
缅怀逝者，生者奋发，生生不息电视上、手机上、网络上，大家都在为逝去的英雄们祈祷，在这个四处都是黑白的日子里，我们确定了一个新生命正在孕育着。醒来时，十点刚过十分，默哀的三分钟已经被我睡了过去。不知道是鸣笛和警报的声音唤醒了我，还是心中想知道她看过昨天文章会作何反应的渴望唤醒了我，将醒未醒时，恍惚间，竟觉得她正在用电脑写着什么东西，真正起来后，她已经在厨房准备食材。直到刚刚，我以为今天一整天都是我们
【大模型】结构化提示词：让AI高效完成复杂任务的“编程语言” JosieBook AI/大数据/云计算人工智能
文章目录前言：提示词一、不同提示词写作方法对比进阶技巧对比表实战组合策略二、三板斧：精准撰写提示词的黄金法则角色设定：为AI精准定位任务描述：明确行动指南输出要求：规范成果呈现三、魔法棒：零基础也能用的“AI需求翻译机”四、结构化：把提示词写成“可插拔的乐高”五、分治法：把“庞然大物”拆成可并行的小任务前言：提示词在人工智能时代，提示词（Prompt）已成为连接人类意图与AI能力的核心媒介。优质的
读古诗词 | 《定风波·莫听穿林打叶声》闲止
图片来源于网络，侵删《定风波·莫听穿林打叶声》宋：苏轼三月七日，沙湖道中遇雨。雨具先去，同行皆狼狈，余独不觉，已而遂晴，故作此词。莫听穿林打叶声，何妨吟啸且徐行。竹杖芒鞋轻胜马，谁怕?一蓑烟雨任平生。料峭春风吹酒醒，微冷，山头斜照却相迎。回首向来萧瑟处，归去。也无风雨也无晴。一句谁怕？道尽了所有洒脱。即便只有一件蓑衣，余生也能泰然处之。最后一句，无所谓风雨也无所谓晴天，更是把这份随遇而安的心境表达
使用UV管理PyTorch项目
PyTorch是深度学习研究和开发的流行选择。可以使用uv管理PyTorch项目，包括不同Python版本依赖、管理环境、甚至加速器选择等。安装Pytorch从打包角度来看，PyTorch有几个不常见的特点：许多PyTorchwheel托管在专门的索引上，而非Python包索引（PyPI）。因此，安装PyTorch通常需要配置项目使用PyTorch专属索引。PyTorch为每种加速器生成不同的构建
Java 并发包之线程池和原子计数 lijingyao8206 Java计数 ThreadPool 并发包 java线程池
对于大数据量关联的业务处理逻辑，比较直接的想法就是用JDK提供的并发包去解决多线程情况下的业务数据处理。线程池可以提供很好的管理线程的方式，并且可以提高线程利用率，并发包中的原子计数在多线程的情况下可以让我们避免去写一些同步代码。这里就先把jdk并发包中的线程池处理器ThreadPoolExecutor 以原子计数类AomicInteger 和倒数计时锁C
java编程思想抽象类和接口百合不是茶 java 抽象类接口
接口c++对接口和内部类只有简介的支持,但在java中有队这些类的直接支持 1 ,抽象类 : 如果一个类包含一个或多个抽象方法,该类必须限定为抽象类(否者编译器报错) 抽象方法 : 在方法中仅有声明而没有方法体 package com.wj.Interface;
[房地产与大数据]房地产数据挖掘系统 comsci 数据挖掘
随着一个关键核心技术的突破,我们已经是独立自主的开发某些先进模块,但是要完全实现,还需要一定的时间... 所以,除了代码工作以外,我们还需要关心一下非技术领域的事件..比如说房地产 &nb
数组队列总结沐刃青蛟数组队列
数组队列是一种大小可以改变，类型没有定死的类似数组的工具。不过与数组相比，它更具有灵活性。因为它不但不用担心越界问题，而且因为泛型（类似c++中模板的东西）的存在而支持各种类型。以下是数组队列的功能实现代码： import List.Student; public class
Oracle存储过程无法编译的解决方法 IT独行者 oracle 存储过程　
今天同事修改Oracle存储过程又导致2个过程无法被编译，流程规范上的东西，Dave 这里不多说，看看怎么解决问题。 1. 查看无效对象 XEZF@xezf(qs-xezf-db1)> select object_name,object_type,status from all_objects where status='IN
重装系统之后oracle恢复文强chu oracle
前几天正在使用电脑，没有暂停oracle的各种服务。突然win8.1系统奔溃，无法修复，开机时系统提示正在搜集错误信息，然后再开机，再提示的无限循环中。无耐我拿出系统u盘准备重装系统，没想到竟然无法从u盘引导成功。晚上到外面早了一家修电脑店，让人家给装了个系统，并且那哥们在我没反应过来的时候，直接把我的c盘给格式化了并且清理了注册表，再装系统。然后的结果就是我的oracl
python学习二（一些基础语法）小桔子 pthon 基础语法
紧接着把！昨天没看继续看django 官方教程，学了下python的基本语法与c类语言还是有些小差别： 1.ptyhon的源文件以UTF-8编码格式 2. / 除结果浮点型 // 除结果整形 % 除取余数 * 乘 ** 乘方 eg 5**2 结果是5的2次方25 _&
svn 常用命令 aichenglong SVN 版本回退
1 svn回退版本 1)在window中选择log,根据想要回退的内容,选择revert this version或revert chanages from this version 两者的区别: revert this version:表示回退到当前版本(该版本后的版本全部作废) revert chanages from this versio
某小公司面试归来 alafqq 面试
先填单子，还要写笔试题，我以时间为急，拒绝了它。。时间宝贵。老拿这些对付毕业生的东东来吓唬我。。面试官很刁难，问了几个问题，记录下； 1，包的范围。。。public,private,protect. --悲剧了 2，hashcode方法和equals方法的区别。谁覆盖谁.结果，他说我说反了。 3，最恶心的一道题，抽象类继承抽象类吗？（察，一般它都是被继承的啊） 4，stru
动态数组的存储速度比较集合框架百合不是茶集合框架
集合框架：自定义数据结构(增删改查等) package 数组; /** * 创建动态数组 * @author 百合 * */ public class ArrayDemo{ //定义一个数组来存放数据 String[] src = new String[0]; /** * 增加元素加入容器 * @param s要加入容器
用JS实现一个JS对象，对象里有两个属性一个方法 bijian1013 js对象
<html> <head> </head> <body> 用js代码实现一个js对象，对象里有两个属性，一个方法 </body> <script> var obj={a:'1234567',b:'bbbbbbbbbb',c:function(x){
探索JUnit4扩展：使用Rule bijian1013 java 单元测试 JUnit Rule
在上一篇文章中，讨论了使用Runner扩展JUnit4的方式，即直接修改Test Runner的实现(BlockJUnit4ClassRunner)。但这种方法显然不便于灵活地添加或删除扩展功能。下面将使用JUnit4.7才开始引入的扩展方式——Rule来实现相同的扩展功能。 1. Rule &n
[Gson一]非泛型POJO对象的反序列化 bit1129 POJO
当要将JSON数据串反序列化自身为非泛型的POJO时，使用Gson.fromJson(String, Class)方法。自身为非泛型的POJO的包括两种： 1. POJO对象不包含任何泛型的字段 2. POJO对象包含泛型字段，例如泛型集合或者泛型类 Data类 a.不是泛型类， b.Data中的集合List和Map都是泛型的 c.Data中不包含其它的POJO
【Kakfa五】Kafka Producer和Consumer基本使用 bit1129 kafka
0.Kafka服务器的配置一个Broker，一个Topic Topic中只有一个Partition（） 1. Producer： package kafka.examples.producers; import kafka.producer.KeyedMessage; import kafka.javaapi.producer.Producer; impor
lsyncd实时同步搭建指南——取代rsync+inotify ronin47
1. 几大实时同步工具比较 1.1 inotify + rsync 最近一直在寻求生产服务服务器上的同步替代方案，原先使用的是 inotify + rsync，但随着文件数量的增大到100W+，目录下的文件列表就达20M，在网络状况不佳或者限速的情况下，变更的文件可能10来个才几M，却因此要发送的文件列表就达20M，严重减低的带宽的使用效率以及同步效率；更为要紧的是，加入inotify
java-9. 判断整数序列是不是二元查找树的后序遍历结果 bylijinnan java
public class IsBinTreePostTraverse{ static boolean isBSTPostOrder(int[] a){ if(a==null){ return false; } /*1.只有一个结点时，肯定是查找树 *2.只有两个结点时，肯定是查找树。例如{5,6}对应的BST是 6 {6,5}对应的BST是
MySQL的sum函数返回的类型 bylijinnan java spring sql mysql jdbc
今天项目切换数据库时，出错访问数据库的代码大概是这样： String sql = "select sum(number) as sumNumberOfOneDay from tableName"; List<Map> rows = getJdbcTemplate().queryForList(sql); for (Map row : rows
java设计模式之单例模式 chicony java设计模式
在阎宏博士的《JAVA与模式》一书中开头是这样描述单例模式的：　　作为对象的创建模式，单例模式确保某一个类只有一个实例，而且自行实例化并向整个系统提供这个实例。这个类称为单例类。单例模式的结构　　单例模式的特点：单例类只能有一个实例。单例类必须自己创建自己的唯一实例。单例类必须给所有其他对象提供这一实例。　　饿汉式单例类 publ
javascript取当月最后一天 ctrain JavaScript
 <script language=javascript> var current = new Date(); var year = current.getYear(); var month = current.getMonth(); showMonthLastDay(year, mont
linux tune2fs命令详解 daizj linux tune2fs 查看系统文件块信息
一.简介： tune2fs是调整和查看ext2/ext3文件系统的文件系统参数，Windows下面如果出现意外断电死机情况，下次开机一般都会出现系统自检。Linux系统下面也有文件系统自检，而且是可以通过tune2fs命令，自行定义自检周期及方式。二.用法： Usage: tune2fs [-c max_mounts_count] [-e errors_behavior] [-g grou
做有中国特色的程序员 dcj3sjt126com 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有
Android：TextView属性大全 dcj3sjt126com textview
android:autoLink 设置是否当文本为URL链接/email/电话号码/map时，文本显示为可点击的链接。可选值(none/web/email/phone/map/all) android:autoText 如果设置，将自动执行输入值的拼写纠正。此处无效果，在显示输入法并输
tomcat虚拟目录安装及其配置 eksliang tomcat配置说明 tomca部署web应用 tomcat虚拟目录安装
转载请出自出处：http://eksliang.iteye.com/blog/2097184 1.-------------------------------------------tomcat 目录结构 config：存放tomcat的配置文件 temp ：存放tomcat跑起来后存放临时文件用的 work ：当第一次访问应用中的jsp
浅谈：APP有哪些常被黑客利用的安全漏洞 gg163 APP
首先，说到APP的安全漏洞，身为程序猿的大家应该不陌生；如果抛开安卓自身开源的问题的话，其主要产生的原因就是开发过程中疏忽或者代码不严谨引起的。但这些责任也不能怪在程序猿头上，有时会因为BOSS时间催得紧等很多可观原因。由国内移动应用安全检测团队爱内测（ineice.com）的CTO给我们浅谈关于Android 系统的开源设计以及生态环境。 1. 应用反编译漏洞：APK 包非常容易被反编译成可读
C#根据网址生成静态页面 hvt Web .net C#asp.net hovertree
HoverTree开源项目中HoverTreeWeb.HVTPanel的Index.aspx文件是后台管理的首页。包含生成留言板首页，以及显示用户名，退出等功能。根据网址生成页面的方法： bool CreateHtmlFile(string url, string path) { //http://keleyi.com/a/bjae/3d10wfax.htm stri
SVG 教程（一）天梯梦 svg
SVG 简介 SVG 是使用 XML 来描述二维图形和绘图程序的语言。学习之前应具备的基础知识：继续学习之前，你应该对以下内容有基本的了解： HTML XML 基础如果希望首先学习这些内容，请在本站的首页选择相应的教程。什么是SVG？ SVG 指可伸缩矢量图形 (Scalable Vector Graphics) SVG 用来定义用于网络的基于矢量
一个简单的java栈 luyulong java 数据结构栈
public class MyStack { private long[] arr; private int top; public MyStack() { arr = new long[10]; top = -1; } public MyStack(int maxsize) { arr = new long[maxsize]; top
基础数据结构和算法八：Binary search sunwinner Algorithm Binary search
Binary search needs an ordered array so that it can use array indexing to dramatically reduce the number of compares required for each search, using the classic and venerable binary search algori
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！刘星宇 c 面试
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！ 1.gets()函数问：请找出下面代码里的问题： #include<stdio.h> int main(void) { char buff[10]; memset(buff,0,sizeof(buff));
ITeye 7月技术图书有奖试读获奖名单公布 ITeye管理员活动 ITeye 试读
ITeye携手人民邮电出版社图灵教育共同举办的7月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 7月试读活动回顾： http://webmaster.iteye.com/blog/2092746 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《Java性能优化权威指南》

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他