南阁风起

强化学习论文(5): Learning Latent Dynamics for Planning from Pixels

Google Brain，Deepmind 提出的 PlaNet
论文地址：https://danijar.com/publications/2019-planet.pdf
源码地址：https://github.com/google-research/planet

摘要

planning（规划）对已知环境转移动态的控制任务非常成功，如需在未知环境中使用 planning，则 agent 需要通过环境交互学习转移动态。然而，学到足够精确支持 planning 的转移动态模型是一项长期挑战，特别是在图像领域。
本文提出 Deep Planning Network (PlaNet)，是一个model-based agent，能够：

从图像中学习环境转移动态；
通过在隐空间进行快速在线 planning 来选择动作。

要实现高性能，转移动态模型必须能精确预测多个时间步之后的 reward。为达成这一目标，本文使用了一个隐动态模型，包含确定性和随机性组件。同时，本文还提出了一个多步变分推断目标，记为 latent overshooting.
本文所提出的 agent 仅使用像素观察，来解决部分可观测，稀疏 reward 的控制问题，超出了以往 model-based方法解决问题的难度。其表现与 model-free 方法相当，而样本量更少。

背景介绍

学习转移动态模型最主要的困难包括：模型的准确性，多步预测累积的误差，未能捕获未来丰富的可能性，以及对训练分布的过拟合造成的泛化失败。
使用学习得到的模型进行 planning，相比 model-free 方法有以下几点好处：

model-based planning 方法更加 data-efficient（数据依赖小），因为它对训练信号的使用更充分，并且不需要通过贝尔曼方程传递 reward；
以增加对 action 的搜索为计算代价，planning 提高了agent 的表现
学到的模型独立于特定任务，有潜力通过转化服务于相同/似环境下的其他任务。

近期的工作已经展示了在简单低维情形下学习转移动态的优势，但这些工作都假定已知环境的底层状态和明确的reward函数，这在现实应用中并不可行。在高维情形下，我们希望在一个紧凑的隐空间学习转移动态以保证快速 planning。这种隐空间模型已经在简单任务上取得了成功。
一句话总结：PlaNet 发展了model-based planning 方法，解决了更困难的基于像素的连续控制问题。
主要贡献：潜空间planning，循环状态空间模型，latent overshooting（给出多步预测变分下界，改善多步预测结果）.

潜空间planning

Framework

假设已有学到的转移动态模型，算法框架如下：
由于单一图像无法反映环境状态的全部信息，将问题建模为一个POMDP（部分可观测 markov 决策过程）， $s_t$ 为底层状态， $o_t$ 为环境观测， $a_t$ 为连续动作向量。

注意到PlaNet所有的建模都只针对环境，而后在环境中进行规划，并没有策略网络/值网络。同时，在交互过程中，每一步都重新做planning，以保证能够根据新的观测作出调整（与MPC类似）。

Planning 算法

Planning算法使用了CEM (cross entropy method), CEM是一种基于群体的优化方法，它能够推断出动作序列的最优分布。

模型

本文提出一个循环状态空间模型 (RSSM) 在隐空间进行前向预测，这一模型可被看作非线性Kalman滤波器或者序列VAE.

SSM

潜状态空间模型如下图b所示，下面所涉及的模型都是由神经网络参数化的高斯分布。

由于模型都是非线性的，因此无法直接计算出参数学习所需的状态后验。因此，本文使用编码器 $q\left(s_{1 : T} | o_{1 : T}, a_{1 : T} \right)=\prod_{t=1}^{T} q\left(s_{t} | s_{t-1}, a_{t-1}, o_{t}\right)$ 来从过去的观测和动作中近似推断状态后验，其中 $q\left(s_{t} | s_{t-1}, a_{t-1}, o_{t}\right)$ 是一个由“卷积网络+前向网络”参数化的对角高斯分布。
为使用编码器，本文建立了一个基于数据对数似然的变分下界 (Jensen 不等式)：
$\ln p\left(o_{1 : T} | a_{1 : T}\right) \triangleq \ln \int \prod_{t} p\left(s_{t} | s_{t-1}, a_{t-1}\right) p\left(o_{t} | s_{t}\right) d s_{1 : T}\geq \sum_{t=1}^{T}\left(\underbrace{\mathrm{E}_{q\left(s_{t} | o _{\leq t}, a_{<t}\right)}\left[\ln p\left(o_{t} | s_{t}\right)\right]}_{\text { reconstruction }} -\underbrace{\mathrm{E}_{q\left(s_{t-1} | o _{\leq t-1}, a_{<t-1}\right)}\left[\mathrm{KL}\left[q\left(s_{t} | o_{ \leq t}, a_{<t}\right) \| p\left(s_{t} | s_{t-1}, a_{t-1}\right)\right]\right]}_{\text { complexity }}\right).$
推导比较简单，包含重要性采样和Jensen不等式的使用两个步骤，包含在附录中，关于变分下界的推导也可参考变分自编码器VAE(Variational Autoencoders)及示例代码。使用重参数化技巧保证了随机梯度下降可以顺利使用。

RSSM

尽管随机模型具有很强的泛化能力，然而，纯粹的随机模型难以记住多个时间步骤所包含的信息。理论上，某些情况下策略方差可以设置为0（确定性策略），然而上述优化过程难以收敛到这类结果。这促使本文引入了一个确定性激活向量序列 $\left\{h_{t}\right\}_{t=1}^{T}$ 允许模型确定地访问所有先前的状态。于是就有了本文所使用的模型 RSSM，如上图c所示。

其中 $f\left(h_{t-1}, s_{t-1}, a_{t-1}\right)$ 是一个RNN。直观地，我们可以理解为该模型将状态划分为一个随即部分 $s_t$ 和一个确定状态 $h_t$ ，它们由之前时间步的随即部分和确定部分决定。本文使用编码器 $q\left(s_{1 : T} | o_{1 : T}, a_{1 : T}\right)=\prod_{t=1}^{T} q\left(s_{t} | h_{t}, o_{t}\right)$ 来参数化近似状态后验。

Latent Overshooting

Motivation

在上一部分，本文建立了在隐序列空间进行学习和推断的标准变分下界，包含一个针对观测的重构项和一个针对近似后验的KL散度正则项。这个变分推断目标的一个缺陷是：转移概率函数 $p\left(s_{t} | s_{t-1}, a_{t-1}\right)$ 的随机部分仅被KL正则中的单步预测所训练，梯度经过 $p\left(s_{t} | s_{t-1}, a_{t-1}\right)$ 后直接进入 $q(s_{t-1})$ ，而不进入 $p\left(s_{t-1} | s_{t-2}, a_{t-2}\right)$ 从而遍历多个 $p(s_{t_i})$ . 在这一部分，我们将标准变分下界推广到 latent overshooting，可在潜空间训练所有的多步预测。
事实上，如果模型能够做完美的单步预测，那么它也能做出完美的多步预测。然而，通常使用的模型都容量有限并且限制在确定的分布族上，将模型单步训练至收敛，与多步预测所需的最佳模型并不一致。成功规划需要精确的多步预测，并在所有的多步预测数据上训练模型。本文把这一想法推广到潜序列模型，表明多步预测也可以被潜空间上的loss来优化，而不需要添加额外的图像。

固定距离 $d$ 的多步预测

我们开始把上面训练单步预测的标准变分下界推广到固定距离 $d$ 的多步预测情形。为省略起见，省略了 $s_t$ 关于 $a_t$ 的先验。则：
$\begin{aligned} p\left(s_{t} | s_{t-d}\right) & \triangleq \int \prod_{\tau=t-d+1}^{t} p\left(s_{\tau} | s_{\tau-1}\right) d s_{t-d+1 : t-1} \\ &=\mathrm{E}_{p\left(s_{t-1} | s_{t-d}\right)}\left[p\left(s_{t} | s_{t-1}\right)\right] \end{aligned}$
于是，关于多步预测分布 $p_{d}$ 的变分下界为：
$\ln p_{d}\left(o_{1 : T}\right) \triangleq \ln \int \prod_{t=1}^{T} p\left(s_{t} | s_{t-d}\right) p\left(o_{t} | s_{t}\right) d s_{1 : T}\geq \sum_{t=1}^{T}\left(\underbrace{\mathrm{E}_{q\left(s_{t} | o _{\leq t}\right)}\left[\ln p\left(o_{t} | s_{t}\right)\right]}_{\text { reconstruction }}-\underbrace{\mathrm{E}_{p\left(s_{t-1} | s_{t-d}\right) q\left(s_{t-d} | o_{ \leq t-d}\right)}\left[\mathrm{KL}\left[q\left(s_{t} | o_{ \leq t}\right) \| p\left(s_{t} | s_{t-1}\right)\right]\right]}_{\text { multi-step prediction }}\right)$
推导和上一部分类似，最大化这一目标就能使多步预测的准确性得到训练。这一反应了在多步预测中，模型无需访问先前的所有观测，仅在潜空间就可进行预测。

Latent overshooting：可变距离多步预测

Latent overshooting就是再把多步预测变分下界从固定 $d$ 步推广到 $1\le d \le D$ :
$\frac{1}{D} \sum_{d=1}^{D} \ln p_{d}\left(o_{1 : T}\right) \geq \sum_{t=1}^{T}\left(\underbrace{\mathrm{E}_{q\left(s_t | o _{\leq t}\right)}\left[\ln p\left(o_{t} | s_{t}\right)\right]}_{\text { reconstruction }}-\underbrace{\frac{1}{D} \sum_{d=1}^{D}\beta_d\mathrm{E}_{p\left(s_{t-1} | s_{t-d}\right) q\left(s_{t-d} | o_{ \leq t-d}\right)}\left[\mathrm{KL}\left[q\left(s_{t} | o_{ \leq t}\right) \| p\left(s_{t} | s_{t-1}\right)\right]\right]}_{\text { latent overshooting }}\right)$
Latent overshooting 可以被看作潜空间的正则项，鼓励单步和多步预测之间的一致性，因为这两者在数据集上的期望应该是相等的。同时引入了权重因子 $\{\beta_d\}^D_{d=1}$ ，可以被调整来决定是更多关注短期预测还是长期预测。

对比

如上图所示，a为标准变分下界，包含下方的重构loss，和上方单步预测的KL正则；b为观测overshooting，将潜空间展开预测多步重构loss，但是在图像领域计算代价过于昂贵；c可以看作以上两者的结合和扩展。
从附录结果看，latent overshooting 对于 RSSM 提升不显著，对于确定性模型可能意义更大。

实验

你可能感兴趣的:(算法基础)

【加密算法基础——对称加密和非对称加密】 XWWW668899 网络安全服务器笔记
对称加密与非对称加密对称加密和非对称加密是两种基本的加密方法，各自有不同的特点和用途。以下是详细比较：1.对称加密特点密钥:使用相同的密钥进行加密和解密。发送方和接收方必须共享这个密钥。速度:通常速度较快，适合处理大量数据。实现:算法相对简单，计算效率高。常见算法AES(高级加密标准)DES(数据加密标准)3DES(三重数据加密标准)RC4(流密码)应用场景文件加密磁盘加密传输大量数据时的加密2.
【加密算法基础——RSA 加密】 XWWW668899 网络服务器笔记 python
RSA加密RSA（Rivest-Shamir-Adleman）加密是非对称加密，一种广泛使用的公钥加密算法，主要用于安全数据传输。公钥用于加密，私钥用于解密。RSA加密算法的名称来源于其三位发明者的姓氏：R:RonRivestS:AdiShamirA:LeonardAdleman这三位计算机科学家在1977年共同提出了这一算法，并发表了相关论文。他们的工作为公钥加密的基础奠定了重要基础，使得安全通
Java 学习路线：适合小白的超细学习路线及实例代码 Dreams°123 后端 java eclipse jvm spring tomcat ide intellij-idea
Java学习路线：适合小白的超细学习路线及实例代码一、入门基础1.1、Java基础语法1.2、面向对象编程(OOP)二、核心Java编程2.1、数据结构和算法基础2.2、输入输出(I/O)三、进阶Java编程3.1、多线程编程3.2、网络编程四、高级应用4.1、数据库编程4.2、Web开发4.3、框架与库五、实践项目与进阶学习（留作业啦）5.1、实践项目5.2、持续学习一、入门基础1.1、Java
代码随想录算法训练营第十天 | Javascript | 力扣Leetcode | 144、145、94. 二叉树前序，后续，中序栗子皮皮布丁算法 leetcode 职场和发展
前言踏平坎坷成大道，斗罢艰险又出发！自律的尽头是自控，自控的尽头是硬控。愿道友们披荆斩棘，终能得偿所愿。简介本人是小几年经验的前端开发，算法基础只有力扣几十道题，非常薄弱。今天是个人的代码随想录算法硬控自己第10天，搞搞二叉树，冲！题目链接：144.二叉树前序，145.二叉树后序，94.二叉树中序比较简单，代码差别不大，直接贴上。
CSP-J 算法基础选择排序人才程序员 CSP-J 算法排序算法数据结构比赛 noi 青少年编程竞赛
文章目录前言选择排序选择排序的过程最终结果编程实现选择排序总结前言选择排序（SelectionSort）是一种简单直观的排序算法，其工作原理是每次从未排序的部分中选出最小（或最大）的元素，将其与当前的第一个元素交换位置，然后缩小未排序部分的范围。每一轮都会找到剩余部分中的最小元素，逐步构建一个有序的数组。选择排序的时间复杂度为O(n²)，不适合大数据集，但由于其实现简单，通常被用于教学和理解基本排
算法基础篇（整数二分、浮点二分模板以及讲解）阿拉伯的劳伦斯292 算法数据结构
这篇博客主要讲解二分模板，具体的二分原理可以去搜二分法原理博客整数二分可以分为两个模板，注释有解释模板一：intl=0;intr=1e6+10//一个比较大的数就行voidcheck(intmiddle){//具体代码看题}while(l>1//除以二的意思if(check(mid)){//满足check函数的值都控制在[l,mid]r=mid;//缩小搜索范围}elsel=mid+1//取不到m
代码随想录算法训练营第一天 | Javascript | 203. 移除链表元素、707. 设计链表 RayLobeCode 链表数据结构
目录简介题目链接：203.移除链表元素题目链接：707.设计链表简介本人是小几年经验的前端开发，算法基础只有力扣几十道题，非常薄弱。今天是个人的代码随想录算法打卡第一天，因为是第三天进的训练营，前两天内容还需补上，mark一下激励自己也激励同样在刷算法的道友们。黑神话悟空最近刚出，送大家一句话：踏平坎坷成大道，斗罢艰险又出发！题目链接：203.移除链表元素不使用虚拟头节点不难，但是刚开始没过，因为
Day28: 贪心算法基础 || Vanilla TY 贪心算法算法
122.买卖股票的最佳时机II给定一个数组，它的第i个元素是一支给定股票第i天的价格。设计一个算法来计算你所能获取的最大利润。你可以尽可能地完成更多的交易（多次买卖一支股票）。注意：你不能同时参与多笔交易（你必须在再次购买前出售掉之前的股票）。示例1:输入:[7,1,5,3,6,4]输出:7解释:在第2天（股票价格=1）的时候买入，在第3天（股票价格=5）的时候卖出,这笔交易所能获得利润=5-1=
2024牛客寒假算法基础集训营2 G Tokitsukaze and Power Battle (easy) Jiu-yuan 算法
原题链接：https://ac.nowcoder.com/acm/contest/67742/G题目大意：一段长为n的数组，可以进行二种操作，第一种是改变其中的一个数，第二种是给定一个区间[l,r]，可以选择这个区间中的一段[i,j],可以在这一段里面选择一个分割点x，[i,x]的区间和减去[x+1,j]的区间和为y，当进行这个操作的时候，题目要求找出最大的y。思路：进行第二种操作的时候，可以贪心
【算法基础实验】排序-最小索引优先队列IndexMinPQ Greyplayground 算法
回顾最小优先队列MinPQ理论知识概述在算法和数据结构中，优先队列是一种特殊的队列数据结构，每个元素都有一个优先级。当你从优先队列中删除元素时，通常会删除具有最高（或最低）优先级的元素。在最小优先队列中，优先级最低的元素最先被删除。索引最小优先队列是优先队列的一种变体，允许你通过索引（或键）快速地更新、插入、删除和访问最小元素。它的典型应用包括网络流、图算法（如Dijkstra最短路径算法）等。基
【论文解读】Macroblock Level Rate Control for Low Delay H.264/AVC based Video Communication Codec Conductor 论文解读 #x264 h.264 x264 音视频码率控制视频编解码 AVC
级别：IEEE时间：2015作者：MinGao等机构：哈尔滨工业大学下载：MacroblockLevelRateControlforLowDelayH.264/AVCbasedVideoCommunication摘要算法目的：提出了一种针对低延迟H.264/AVC视频通信的宏块（MB）级别速率控制算法。算法基础：基于ρ域速率模型，该模型涉及量化后零变换系数的百分比（ρ）。关键技术：使用指数模型来描
蓝桥杯算法基础（11）：十大排序算法（冒泡排序）c语言般版湖前一人对影成双算法排序算法 c语言
十大排序算法合集（c语言般）冒泡排序选择排序插入排序希尔排序快速排序归并排序堆排序计数排序桶排序基数排序分类:交换类1.冒泡排序2.快速排序分配类1.计数排序2.基数排序选择类1.选择排序归并类1.归并排序插入类1.插入排序2.希尔排序冒泡排序#include//它是一个基于交换的排序,每一轮搜索最大值放到序列的尾部#defineMAXSIZE10voidintArr(intarr[],intle
蓝桥杯算法基础（12）：十大排序算法（选择排序）（插入排序）c语言般版湖前一人对影成双排序算法算法蓝桥杯
选择排序选择排序的基本思想是冒泡排序，找到最小值，与未排序部分的第一个元素进行交换前面为已排序部分，后面为未排序部分选择排序需要用到三个指针第一个指针:从第一个元素开始，每次与最小值交换位置第二个指针:从第一个指针所在位置开始，记录未排序部分最小值的位置第三个指针:从第一个指针所在位置开始，往后找比k所在位置元素小的元素，找到后，k指向此位置intselectSort(intarr[],intle
0101插入排序-算法基础-算法导论第三版 gaog2zh 数据结构和算法插入排序算法基础算法导论第三版
文章目录一插入排序二循环不变式与插入排序的正确性三伪代码中的一些约定四Java代码实现插入排序结语一插入排序输入：nnn个数订单一个序列(a1,a2,⋯ ,an)(a_1,a_2,\cdots,a_n)(a1,a2,⋯,an).**输出：**输入序列的一个排列(a1′,a2′,⋯ ,an′)(a^{'}_1,a^{'}_2,\cdots,a^{'}_n)(a1′,a2′,⋯,an′),满足a1′≤
算法基础系列第三章——图论之最短路径问题杨枝算法基础图论算法 dijkstra bellman–ford algorithm
详解蓝桥图论之最短路径问题关于图论知识铺垫图的定义邻接矩阵邻接表最短路算法总大纲dijkstra算法朴素版dijsktra算法（适用于稠密图）例题描述参考代码(C++版本)算法模板细节落实堆优化版dijkstra算法（适用于稀疏图）例题描述参考实现代码(C++版本)算法模板细节落实bellman-ford算法例题描述——有边数限制的最短路参考代码(C++版本)算法模板细节落实SPFA算法例题描述参
蓝桥杯算法总结别催了马上交蓝桥杯算法算法蓝桥杯 c++
ACWing算法基础课笔记闲来无事，利用阿里云做了个图床，已经将图片全部上传了。1.基础算法1.排序快速：选择一个数，让数组中比他小的靠左，比他大的靠右，然后在左边右边同样进行操作。注意边界问题。O(nlogn)一般选择mid=l+r+1>>1，因为是用dowhile，所以设置i和j都是l和r往外一个。当i=j说明左边都小于a[mid]，右边都大于a[mid]了，然后对于左边和右边再进行quick
算法基础滑动窗口算法原理分析 Werido_wjh 算法
滑动窗口算法基本原理学过计算机网络的同学，都知道滑动窗口协议（SlidingWindowProtocol），该协议是TCP协议的一种应用，用于网络数据传输时的流量控制，以避免拥塞的发生。该协议允许发送方在停止并等待确认前发送多个数据分组。由于发送方不必每发一个分组就停下来等待确认。因此该协议可以加速数据的传输，提高网络吞吐量。滑动窗口算法其实和这个是一样的，只是用的地方场景不一样，可以根据需要调整
python算法指南程序员经典,python算法教程pdf百度云 2301_81895949 python
大家好，本文将围绕python算法教程这本书怎么样展开说明，你也能看得懂的python算法书是一个很多人都想弄明白的事情，想搞清楚python算法指南程序员经典需要先了解以下几个事情。大家好，小编来为大家解答以下问题，你也能看懂的python算法书pdf，python算法教程这本书怎么样，现在让我们一起来看看吧！给大家带来的一篇关于算法相关的电子书资源，介绍了关于算法、详解、算法基础方面的内容，本
数字PID算法基础 alex1801 未分类算法单片机嵌入式硬件
数字PID是由编程语言实现的PID算法并烧录到控制芯片中，控制芯片与电机驱动连接，将PID控制算法的输出转换为PWM控制信号发送给电机驱动电路，电机驱动电路与直流电机相连并将PWM控制信号转换为具有相同占空比的PWM供电电压，通过对输入电机的PWM供电电压占空比的控制实现对电机转速的调节；通过传感器监测电机转速，反馈至控制芯片，实现闭环。1、公式推导PID控制算法在连续时间序列下的公式如下：对连续
2024牛客寒假算法基础集训营1 Jared_devin 算法 c++贪心算法动态规划
牛客竞赛_ACM/NOI/CSP/CCPC/ICPC算法编程高难度练习赛_牛客竞赛OJA.DFS搜索思路：直接依次遍历子串即可代码如下：#includeusingnamespacestd;#definefsfirst#definescsecond#defineall(x)x.begin(),x.end()typedeflonglongll;typedefpairPII;voidsolve(){in
搜索与图论（一）——DFS、BFS、树与图的遍历 .浮尘. #acwing算法基础课深度优先算法图论
前言重学算法第8天，希望能坚持打卡不间断，每天早起学习算法明天再来！肝就完了2月26日,day08打卡今日已学完y总的算法基础课-3.1,3.2第三章搜索与图论（一）+Week4——习题课共7题，知识点如下DFS：排列数字、n-皇后问题。BFS：走迷宫、八数码。树与图的深度优先遍历：树的重心树与图的广度优先遍历：图中点的层次拓扑排序：有向图的拓扑序列DFS与BFSDFS动图只有无路可走了才会回溯D
【第二十二课】最短路：多源最短路floyd算法(acwing-852 spfa判断是否存在负环 / acwing-854 / c++代码) 爱写文章的小w 算法--学习笔记算法 c++最短路
目录acwing-852代码如下一些解释acwing-854foyld算法思想代码如下一些解释acwing-852在spfa求最短路的算法基础上进行修改。代码如下#include#include#include#includeusingnamespacestd;constintN=2010,M=10010;intn,m;inth[N],e[M],ne[M],w[M],idx;intdist[N],
算法导论总结索引 | 第一部分第二章：算法基础 Asher Gu 算法导论算法
1、插入排序（24）1、希望排序的数也称为关键词2、插入排序对于少量排序元素，是一个有效的算法3、原址排序输入的数：算法在数组A中重排这些数，在任何时候，最多只有其中的常数个数字存储在数组外面注意下标是从1开始的，从第2个数字开始向后的每个数向前插入到当前正确位置，确保插入数字及之前的数字从小到大排列1.1循环不变式与插入排序的正确性1、对于for循环（循环变量为j）中的每次迭代开始，剩余子数组A
2024牛客寒假算法基础集训营3题解（M题） shy666123 算法
M.智乃的36倍数(normalversion)题意简单来说就是问一个数组a中有多少种组合可以使得这个组合拼接而成的数是36的倍数思路36分解成4和9，能整除9代表各个位数之和是9的倍数，能整除4代表最后两位能整除4（因为100是4的倍数），由于样例过多，直接暴力是会超时的，所以想办法优化了一下：开了三个动态数组，分别为：除9的余数为i的下标，能除4的数且除9余数为i的下标，小于10且除9余数为i
牛客寒假算法基础集训营4-J-Applese 的减肥计划 Honyelchak 算法刷题 c++
链接：https://ac.nowcoder.com/acm/contest/330/J来源：牛客网已知Applese两只手分别产生的力的大小，以及它们之间的夹角，试求两力合力的大小。输入描述:仅一行三个整数f1,f2,af1,f2,a，分别表示两只手产生的力的大小以及它们之间的夹角。输出描述:输出一个实数表示两力合力的大小，要求相对误差或绝对误差不超过10−610−6。严格来讲，如果你的答案是a
2020牛客寒假算法基础集训营2 C - 算概率（DP）小松萘规划---动态规划
是个DP套路题，以前也见过类似的明明，一开始写不出我好菜#defineintllconstintmod=1e9+7;intp[2010],f[2010],dp[2010][2010];signedmain(){intn;cin>>n;rpp(i,n){cin>>p[i];f[i]=((1-p[i])%mod+mod)%mod;}dp[0][0]=1;for(inti=1;i<=n;++i){dp[
2023牛客寒假算法基础集训营4 J-清楚姐姐学排序 awaqqq 算法
原题链接：J-清楚姐姐学排序_2023牛客寒假算法基础集训营4(nowcoder.com)思路：一道表面说排序，实际上是建图的题，根据输入的条件同时建立一个正向和反向的图，用dfs分别搜索，复杂度为n2，不过该题的nusingnamespacestd;intmain(){inti,j,k,n,m;inta[1005][1005]={0},ans[1005];scanf("%d%d",&n,&m);
2024牛客寒假算法基础集训营3 C-智乃的前缀、后缀、回文心刍题解算法 c++哈希算法
来源题目智乃最近学习了字符串的相关算法。所谓字符串的非空前缀是指一个字符串的开头部分形成的子串，从字符串的第一个字符开始，包含连续的若干个字符。即对于一个长度为NNN的字符串SSS，有且仅有NNN个前缀，第iii个前缀为S0S1...Si−1S_{0}S_{1}...S_{i-1}S0S1...Si−1。字符串的非空后缀是指一个字符串的某一个位置延伸到字符串结尾的连续子串，从字符串的某一个字符开始
2024牛客寒假算法基础集训营2-c Tokitsukaze and Min-Max XOR 心刍题解算法 c++字典树
来源题目Tokitsukaze有一个长度为n的序列a1,a2,…,an和一个整数k。她想知道有多少种序列b1,b2,…,bm满足：其中⊕\oplus⊕为按位异或，具体参见百度百科：异或答案可能很大，请输出 mod1e9+7后的结果。输入描述:第一行包含一个整数T(1≤T≤2e5)，表示T组测试数据。对于每组测试数据：第一行包含两个整数n,k(1≤n≤2⋅e5;0≤k≤1e9)。第二行包含nnn个整
2024牛客寒假算法基础集训营1 再写一题就睡觉算法
ADFS搜索题目描述最近，fried-chicken完全学明白了DFS搜索（如上图所示）！于是学弟向他请教DFS搜索，fried-chicken热心的进行了讲解：所谓DFS搜索，就是给定一个字符串sss，问能否找到sss的一个子序列，使得该子序列的值为DFS或dfs。请你分别判断字符串sss中是否含有DFS子序列与dfs子序列。子序列的定义：从原字符串中选择一些字符，将这些字符按照其在原串中的顺序
C/C++Win32编程基础详解视频下载择善Zach 编程 C++Win32
课题视频：C/C++Win32编程基础详解视频知识：win32窗口的创建 windows事件机制主讲：择善Uncle老师学习交流群：386620625 验证码：625 --
Guava Cache使用笔记 bylijinnan java guava cache
1.Guava Cache的get/getIfPresent方法当参数为null时会抛空指针异常我刚开始使用时还以为Guava Cache跟HashMap一样，get(null)返回null。实际上Guava整体设计思想就是拒绝null的，很多地方都会执行com.google.common.base.Preconditions.checkNotNull的检查。 2.Guava
解决ora-01652无法通过128（在temp表空间中） 0624chenhong oracle
解决ora-01652无法通过128（在temp表空间中）扩展temp段的过程一个sql语句后，大约花了10分钟，好不容易有一个结果，但是报了一个ora-01652错误，查阅了oracle的错误代码说明：意思是指temp表空间无法自动扩展temp段。这种问题一般有两种原因：一是临时表空间空间太小，二是不能自动扩展。分析过程：既然是temp表空间有问题，那当
Struct在jsp标签不懂事的小屁孩 struct
非UI标签介绍：控制类标签： 1：程序流程控制标签 if elseif else <s:if test="isUsed"> <span class="label label-success">True</span> </
按对象属性排序换个号韩国红果果 JavaScript 对象排序
利用JavaScript进行对象排序，根据用户的年龄排序展示 <script> var bob={ name;bob, age:30 } var peter={ name;peter, age:30 } var amy={ name;amy, age:24 } var mike={ name;mike, age:29 } var john={
大数据分析让个性化的客户体验不再遥远蓝儿唯美数据分析
顾客通过多种渠道制造大量数据，企业则热衷于利用这些信息来实现更为个性化的体验。分析公司Gartner表示，高级分析会成为客户服务的关键，但是大数据分析的采用目前仅局限于不到一成的企业。挑战在于企业还在努力适应结构化数据，疲于根据自身的客户关系管理（CRM）系统部署有效的分析框架，以及集成不同的内外部信息源。然而，面对顾客通过数字技术参与而产生的快速变化的信息，企业需要及时作出反应。要想实
java笔记4 a-john java
操作符 1，使用java操作符操作符接受一个或多个参数，并生成一个新值。参数的形式与普通的方法调用不用，但是效果是相同的。加号和一元的正号（+）、减号和一元的负号（-）、乘号（*）、除号（/）以及赋值号（=）的用法与其他编程语言类似。操作符作用于操作数，生成一个新值。另外，有些操作符可能会改变操作数自身的
从裸机编程到嵌入式Linux编程思想的转变------分而治之：驱动和应用程序 aijuans 嵌入式学习
笔者学习嵌入式Linux也有一段时间了，很奇怪的是很多书讲驱动编程方面的知识，也有很多书将ARM9方面的知识，但是从以前51形式的（对寄存器直接操作，初始化芯片的功能模块）编程方法，和思维模式，变换为基于Linux操作系统编程，讲这个思想转变的书几乎没有，让初学者走了很多弯路，撞了很多难墙。笔者因此写上自己的学习心得，希望能给和我一样转变
在springmvc中解决FastJson循环引用的问题 asialee 循环引用 fastjson
我们先来看一个例子： package com.elong.bms; import java.io.OutputStream; import java.util.HashMap; import java.util.Map; import co
ArrayAdapter和SimpleAdapter技术总结百合不是茶 android SimpleAdapter ArrayAdapter 高级组件基础
ArrayAdapter比较简单，但它只能用于显示文字。而SimpleAdapter则有很强的扩展性，可以自定义出各种效果 ArrayAdapter;的数据可以是数组或者是队列 // 获得下拉框对象 AutoCompleteTextView textview = (AutoCompleteTextView) this
九封信 bijian1013 人生励志
有时候，莫名的心情不好，不想和任何人说话，只想一个人静静的发呆。有时候，想一个人躲起来脆弱，不愿别人看到自己的伤口。有时候，走过熟悉的街角，看到熟悉的背影，突然想起一个人的脸。有时候，发现自己一夜之间就长大了。 2014，写给人
Linux下安装MySQL Web 管理工具phpMyAdmin sunjing PHP Install phpMyAdmin
PHP http://php.net/ phpMyAdmin http://www.phpmyadmin.net Error compiling PHP on CentOS x64 一、安装Apache 请参阅http://billben.iteye.com/admin/blogs/1985244 二、安装依赖包 sudo yum install gd
分布式系统理论 bit1129 分布式
FLP One famous theory in distributed computing, known as FLP after the authors Fischer, Lynch, and Patterson, proved that in a distributed system with asynchronous communication and process crashes,
ssh2整合(spring+struts2+hibernate)-附源码白糖_ eclipse spring Hibernate mysql 项目管理
最近抽空又整理了一套ssh2框架，主要使用的技术如下： spring做容器，管理了三层(dao,service,actioin)的对象 struts2实现与页面交互(MVC)，自己做了一个异常拦截器，能拦截Action层抛出的异常 hibernate与数据库交互 BoneCp数据库连接池，据说比其它数据库连接池快20倍，仅仅是据说 MySql数据库项目用eclipse
treetable bug记录 braveCS table
// 插入子节点删除再插入时不能正常显示。修改： //不知改后有没有错，先做个备忘 Tree.prototype.removeNode = function(node) { // Recursively remove all descendants of +node+ this.unloadBranch(node); // Remove
编程之美-电话号码对应英语单词 bylijinnan java 算法编程之美
import java.util.Arrays; public class NumberToWord { /** * 编程之美电话号码对应英语单词 * 题目： * 手机上的拨号盘，每个数字都对应一些字母，比如2对应ABC，3对应DEF.........，8对应TUV，9对应WXYZ， * 要求对一段数字，输出其代表的所有可能的字母组合
jquery ajax读书笔记 chengxuyuancsdn jQuery ajax
1、jsp页面 <%@ page language="java" import="java.util.*" pageEncoding="GBK"%> <% String path = request.getContextPath(); String basePath = request.getScheme()
JWFD工作流拓扑结构解析伪码描述算法 comsci 数据结构算法工作活动 J#
对工作流拓扑结构解析感兴趣的朋友可以下载附件，或者下载JWFD的全部代码进行分析 /* 流程图拓扑结构解析伪码描述算法 public java.util.ArrayList DFS(String graphid, String stepid, int j)
oracle I/O 从属进程 daizj oracle
I/O 从属进程　　I/O从属进程用于为不支持异步I/O的系统或设备模拟异步I/O.例如，磁带设备(相当慢)就不支持异步I/O.通过使用I/O 从属进程，可以让磁带机模仿通常只为磁盘驱动器提供的功能。就好像支持真正的异步I/O 一样，写设备的进程(调用者)会收集大量数据，并交由写入器写出。数据成功地写出时，写入器(此时写入器是I/O 从属进程，而不是操作系统)会通知原来的调用者，调用者则会
高级排序:希尔排序 dieslrae 希尔排序
public void shellSort(int[] array){ int limit = 1; int temp; int index; while(limit <= array.length/3){ limit = limit * 3 + 1;
初二下学期难记忆单词 dcj3sjt126com english word
kitchen 厨房 cupboard 厨柜 salt 盐 sugar 糖 oil 油 fork 叉；餐叉 spoon 匙；调羹 chopsticks 筷子 cabbage 卷心菜；洋白菜 soup 汤 Italian 意大利的 Indian 印度的 workplace 工作场所 even 甚至；更 Italy 意大利 laugh 笑 m
Go语言使用MySQL数据库进行增删改查 dcj3sjt126com mysql
目前Internet上流行的网站构架方式是LAMP，其中的M即MySQL, 作为数据库，MySQL以免费、开源、使用方便为优势成为了很多Web开发的后端数据库存储引擎。MySQL驱动Go中支持MySQL的驱动目前比较多，有如下几种，有些是支持database/sql标准，而有些是采用了自己的实现接口,常用的有如下几种: http://code.google.c...o-mysql-dri
git命令 shuizhaosi888 git
---------------设置全局用户名： git config --global user.name "HanShuliang" //设置用户名 git config --global user.email "[email protected]" //设置邮箱 ---------------查看环境配置 git config --li
qemu-kvm 网络 nat模式 (四) haoningabc kvm qemu
qemu-ifup-NAT #!/bin/bash BRIDGE=virbr0 NETWORK=192.168.122.0 GATEWAY=192.168.122.1 NETMASK=255.255.255.0 DHCPRANGE=192.168.122.2,192.168.122.254 TFTPROOT= BOOTP= function check_bridge()
不要让未来的你，讨厌现在的自己 jingjing0907 生活奋斗工作梦想
故事one 　23岁，他大学毕业，放弃了父母安排的稳定工作，独闯京城，在家小公司混个小职位，工作还算顺手，月薪三千，混了混，混走了一年的光阴。　　　　24岁，有了女朋友，从二环12人的集体宿舍搬到香山民居，一间平房，二人世界，爱爱爱。偶然约三朋四友，打扑克搓麻将，日子快乐似神仙；　　　　25岁，出了几次差，调了两次岗，薪水涨了不过百，生猛狂飙的物价让现实血淋淋，无力为心爱银儿购件大牌
枚举类型详解一路欢笑一路走 enum 枚举详解 enumset enumMap
枚举类型详解一.Enum详解 1.1枚举类型的介绍 JDK1.5加入了一个全新的类型的”类”—枚举类型，为此JDK1.5引入了一个新的关键字enum,我们可以这样定义一个枚举类型。 Demo:一个最简单的枚举类 public enum ColorType { RED
第11章动画效果（上） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Eclipse中jsp、js文件编辑时，卡死现象解决汇总 ljf_home eclipse jsp卡死 js卡死
使用Eclipse编辑jsp、js文件时，经常出现卡死现象，在网上百度了N次，经过N次优化调整后，卡死现象逐步好转，具体那个方法起到作用，不太好讲。将所有用过的方法罗列如下： 1、取消验证 windows–>perferences–>validation 把除了manual 下面的全部点掉，build下只留 classpath dependency Valida
MySQL编程中的6个重要的实用技巧 tomcat_oracle mysql
每一行命令都是用分号(;)作为结束对于MySQL，第一件你必须牢记的是它的每一行命令都是用分号(;)作为结束的，但当一行MySQL被插入在PHP代码中时，最好把后面的分号省略掉，例如： mysql_query("INSERT INTO tablename(first_name,last_name)VALUES('$first_name',$last_name')");
zoj 3820 Building Fire Stations(二分+bfs) 阿尔萨斯 Build
题目链接：zoj 3820 Building Fire Stations 题目大意：给定一棵树，选取两个建立加油站，问说所有点距离加油站距离的最大值的最小值是多少，并且任意输出一种建立加油站的方式。解题思路：二分距离判断，判断函数的复杂度是o(n)，这样的复杂度应该是o(nlogn)，即使常数系数偏大，但是居然跑了4.5s，也是醉了。判断函数里面做了3次bfs，但是每次bfs节点最多

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他