RosebudTT

强化学习之基本核心概念与分类

1.基本概念

States and Observations
状态S可以完整地描述外部环境，观察O有可能会遗漏。如果O能够完整地观察S，就是环境就是完全可观察，否则就是部分可观察的
Action Spaces
行动空间是所有可以的行动S组成的空间，可以是离散的，也可以是连续的。
Policies
策略可以是确定性的，一般表示为μ，也可以是随机的，一般表示为π。
Rewards
强化学习中Agent的目标是累积获得最多奖励，一般来说奖励是随着运动轨迹衰减的。从直观上来说，未来的奖励肯定没有现在的奖励好，从数学上来说无衰减约束的奖励可能带来无法收敛的问题。

值函数是对应状态上开始行动，按照某个策略运行下去，最终期望能够获得的奖励。值函数有两个V函数(值函数)和Q函数(行动-值函数)，两者的区别是Q函数需要指定执行一个行动a。

MDP过程

MDP就是用来描述RL中的环境，未来只与当前的状态有关，与之前的历史没有关系。MP是一个随机过程。从现在状态 S到下一个状态 S' 通过Pss' 状态转移概率矩阵(State transition probability matrix)来完成这个过程奖励R是环境的反馈，有了R，有了S，有了Pss' 矩阵，实际上我们就能够估算出每一个S上的Gt：E(Gt|St = S)。

在Q learning中，这就是衰减系数。这个估算出来的Gt就叫做这个状态S上的Sate Value function(状态值函数): v(S)。

MDP则是指马尔可夫决策过程，决策就是在策略policy之后采取的行动。策略也是一个概率分布，体现了在给定状态下采取行动的概率。

Value Function(值函数)

贝尔曼等式

V函数和Q函数都是递归关系，也就是说知道了最终状态v(S最终)就可以倒推到初始状态的v(S初始)，这个关系就是用Bellman 等式表达出来的。

最优值函数的贝尔曼等式是：

他们之间有如下关系：

优势函数就是比较在状态s时，执行指定行动a，之后后再服从策略的Qπ(s,a)，与一直执行策略Vπ(s)的优势。
数学表达式即为：优势函数可以是负数，说明在s状态下，指定行动a，并不比在策略π的指导下随机选择一个行动有优势。

如果能求解最优Ballman 等式我们就能得到最优的V函数和Q函数进而得到最优的策略。最优Ballman等式并不是线性的，所以不能直接通过解线性方程的方法求得。但是可以通过一些迭代算法求得比如Q learning和Sarsa算法就是求最优Ballman等式的算法，当然这些算法也就是强化学习的算法了

2.分类

（一）有/无模型学习

有模型学习

（1）基于模型的强化学习：

第一步：从与真实世界互动的经历(Experience)中建立模型。
第二步：在模型中进行学习(可以使用MDP，TD等等所有之前使用的方法) 更新价值函数和策略。
第三步：用学到的价值函数和策略与真实世界进行互动并获得更多的经历。

它可以使用熟悉的监督学习方法，通过模型能够使机器人能够更加深入的理解环境，而不仅局限在最大化奖励本身，换句话说就是机器人能够通过模型具备一定的推理能力。但是整个过程涉及到两个学习过程，一是对模型的学习，二是对价值函数的学习，两个学习都会引入数学近似从而带来双重近似误差，这种误差会导致Agent虽然在模型中表现很好，但是在真实环境中可能打不到预期结果。

1.模型M实际上就是对环境，MDP的参数化η近似，假设状态S和行为空间A是已知的。实际上就是对转移函数P和奖励R的参数化近似。，其中

2.通过监督学习的方式建立模型

从s, a 学习 r 的过程是一个回归问题(regression problem)
从s, a 学习 s' 的过程是一个密度估计问题(density estimation problem)

模型可以是查表式(Table lookup Model)、线性期望模型(Linear Expectation Model)、线性高斯模型(Linear Gaussian Model)、高斯决策模型(Gaussian Process Model)、和深信度神经网络模型(Deep Belief Network Model)等

选择一个损失函数，比如均方差，KL 散度等，优化参数η来最小化经验损失(empirical loss)。所有监督学习相关的算法都可以用来解决上述两个问题。

这个算法赋予了机器人在与实际环境进行交互式时有一段时间用来思考的能力。其中的步骤：a,b,c,d,和e都是从实际经历中学习，d过程是学习价值函数，e过程是学习模型。

在f步，给以机器人一定时间（或次数）的思考。在思考环节，个体将使用模型，在之前观测过的状态空间中随机采样一个状态，同时从这个状态下曾经使用过的行为中随机选择一个行为，将两者带入模型得到新的状态和奖励，依据这个来再次更新行为价值和函数。

3 基于模型的规划(Planning)

在给定的模型M，规划过程就是解决这个MDP的过程。我们可以使用之前所讲到的各种方法，包括价值迭代，策略迭代，树搜索等等。

纯动态规划(Pure Planning)

Pure Planning 是一个基础的算法，其策略并不显示的表达出来，而是使用规划技术来选择行动。比如模型预测控制 (model-predictive control, MPC)。在MPC中：

第一步：Agent首先观察环境，并通过模型预测出所有可以行动的路径(路径包含多连续个行动)。
第二步：Agent执行规划的第一个行动，然后立即舍去规划剩余部分。
第三步：重复第一、二步。

Expert Iteration(专家迭代)

这个算法是Pure Planing 的升级版，它将策略显示地表达出来，并通过学习得到这个最优策略π*θ(a|s)

Agent用规划算法(类似于MT树搜索)在模型中通过采样生成候选行动。通过采样生成的行动比单纯通过策略本身生成的行动要好

免模型方法的数据增强

这个方法是将模型采样中生成的数据用来训练Model-Free的策略或者Q函数。训练的数据可以单纯是模型采样生成的，也可以是真实经历的数据与模型采样数据的结合

无模型学习

Policy Optimization
基于策略的强化学习就是参数化策略本身，获得策略函数πθ(a|s), 我们训练策略函数的目标是什么呢？是获得最大奖励。优化策略函数就是优化目标函数可以定义为J(πθ).

Q-Learning

Q-Learning 就是通过学习参数化Q函数Qθ(s,a)从而得* 到最优Q*(s,a)的，典型地方法是优化基于Bellman方程的目标函数。Q-Learning 通常是Off-Policy的，这就意味着训练的数据可以是训练期间任意时刻的数据。

Q-Learning 的经典例子包含DQN和C51。

Policy Optimization和Q-Learning 的权衡与融合

Policy Optimization直接了当地优化你想要的对象(策略)，因此Policy Optimization稳定性和可信度都较好，而Q-learning是采用训练Qθ的方式间接优化策略，会遇到不稳定的情况。但是Q-learning的优点是利用数据的效率较高，Policy Optimization和Q-Learning并非水火不相容，有些算法就融合和平衡了两者的优缺点：DDPG, 同时学出一个确定性策略和Q函数，并用他们互相优化。

根据观测数据的时间特性预测可以分为单步预测和多步预测「基于历史数据预测现在和未来的区别」；关于监督学习和时间差分的区别，传统监督学习是根据预测值和实际观测值的误差来修正预测模型，而TD是根据时间上连续两次预测之间的差值来修正预测误差；具体的来说前者需要得到全部观测数据后才能通过计算预测误差来修正预测模型，后者只需要某两个时刻的预测值和局部观测数据来修正预测模型；所以可以实现在线学习减少存储量和计算量有着更高效的学习效率；同时也可以看出监督学习只能实现单步学习预测也就是只能基于当前信息来对于当前时刻的输出进行预测，而TD可以实习多步预测；

时域差分算法往往被看组学习控制算法如sarsa和qlearning的一部分就像多步预测被看做为多步控制的一部分一样。

在上面也提到过学习预测可以看做学习控制的一个子问题，原因也就是在于常见的强化学习算法的目的毕竟还是为了优化决策求解出来一个合适的行动策略；而学习预测本质上依旧是为了给学习控制提供出来一个评判标准：评判出来当前的优化得到的策略是好亦或是坏；这句话也指明了学习控制本质的作用：求解策略，而学习预测本质目的：求解出来一个评价函数。

另一种分法，本质一样：

除了常见的序贯决策问题之外，本身序贯策略问题基于reward的是否延迟来源于联想强化学习，同时又有着非联想强化信息；而序贯策略本身为了解决它，采用markov模型来处理，基于指标的不同还会分为折扣型的和平均型的；在折扣型的里面基于交互环境的模型是否已知「markov中的转移概率」对于已知的我们直接采用动态规划来解决这一markov过程；未知的才是我们常见的各类强化学习算法，对于强化学习算法本身，我们根据其中过程可以分为学习预测部分和学习控制部分；紧接着根据问题环境的不同，对于小状态空间我们采用表格式的方法，大状态空间就是采用值函数近似或者策略梯度的方法；

（二）基于概率/价值

Policy-Based RL

最直接, 可通过感官分析所处的环境, 直接输出下一步要采取的各种动作的概率, 然后根据概率采取行动, 所以每种动作都有可能被选中, 只是可能性不同，可利用概率分布在连续动作中选取特定动作。如Policy Gradients。

Value-Based RL

输出所有动作的价值, 根据最高价值来选择动作，对于选取连续的动作无能为力，如Q learning，Sarsa

结合

Actor-Critic ， actor 会基于概率做出动作, 而 critic 会对做出的动作给出动作的价值, 这样就在原有的 policy gradients 上加速了学习过程.

（三）回合/单步更新

回合更新（Monte-Carlo update）

在蒙特卡罗中，如果采用确定性策略，每次试验的轨迹都是一样的，因此无法进一步改进策略。为了使更多状态-动作对参与到交互过程中，即平衡探索和利用，常用ε-greedy策略来产生动作，以保证每个状态-动作对都有机会作为初始状态，在评估状态-动作值函数时，需要对每次试验中所有状态-动作对进行估计。

基础版Policy Gradients，Monte-Carlo learning

单步更新/时序差分方法（Temporal-Difference update）

Q learning，Sarsa，升级版Policy Gradients

在此感谢洪滔Hongtao博主

青少年编程与数学 02-010 C++程序设计基础 46课题、链接库明月看潮生编程与数学第02阶段青少年编程 c++编程与数学开发语言
青少年编程与数学02-010C++程序设计基础46课题、链接库一、链接库（LinkLibrary）1.静态链接库（StaticLibrary）特点：示例：创建和使用静态链接库2.动态链接库（DynamicLibrary）特点：示例：创建和使用动态链接库1.2创建动态链接库2.编写使用链接库的程序3.编译和链接程序3.1编译和链接静态链接库3.2编译和链接动态链接库4.使用第三方链接库4.1下载和安
Hive SQL 精进系列：一行变多行的 LATERAL VIEW EXPLODE 进一步有进一步的欢喜 Hive SQL 精进系列 hive sql hadoop
目录一、引言二、`LATERALVIEWEXPLODE`概述2.1基本概念2.2单词解析2.2.1`LATERAL`2.2.2`VIEW`2.2.3`EXPLODE`三、语法详解3.1基本语法结构3.2完整语法示例（针对映射情况）四、使用场景4.1数组数据展开4.2映射数据展开五、案例分析5.1展开数组示例5.1.1数据准备5.1.2使用`LATERALVIEWEXPLODE`展开数组5.1.3结
matlab 模糊pid实现温度控制 studyer_爱啃鸡爪的小米 Matlab系列案例 matlab
1、内容简介matlab162-模糊pid实现温度控制可以交流、咨询、答疑2、内容说明略基于PID电加热炉温度控制系统设计摘要电加热炉随着科学技术的发展和工业生产水平的提高，已经在冶金、化工、机械等各类工业控制中得到了广泛应用，并且在国民经济中占有举足轻重的地位。对于这样一个具有非线性、大滞后、大惯性、时变性、升温单向性等特点的控制对象，很难用数学方法建立精确的数学模型，因此用传统的控制理论和方法
1997-2022年上市公司海外直接投资OFDI 资产剥离置换吸收合并债务重组要约收购股权转让-社科数据泡芙萝莉酱大数据社科数据人工智能大数据数据分析深度学习数据挖掘数据统计毕业论文
上市公司海外直接投资OFDI1997-2022资产剥离置换吸收合并债务重组要约收购股权转让-社科数据https://download.csdn.net/download/paofuluolijiang/90027743https://download.csdn.net/download/paofuluolijiang/90027743包括交易信息、涉及方明细、公司基本信息三张表。1、公司基本信息表
【手把手教你-Python】如何让 Flask 根据现有表结构生成 SQLAlchemy 模型文件？ EricLing2022 python flask 开发语言 sql database
首先你要具备一定Python基础，了解Flask框架，以及数据库工具SQLAchemy。为什么会有这个需求？在使用Python编写项目代码时，假设数据库中的表已经存在，我们需要根据现有的表结构来编写SQLAlchemy模型文件。为了避免逐行编写代码，我们可以使用一个工具来“一键生成”模型文件，那就是sqlacodegen。准备工作Python版本：3.11.5（只要是3.xx版本应该都可以）安装好
python记录6from flask import Flaskapp = Flask(__name__) @app.route(‘/‘)def hello_world(): retu 我讨厌python python 开发语言后端
利用pycharm实现视频分镜1.下载pip3installpycharm或者官网下载2.网页显示文字步骤想要在网页上显示：Hello，World!第一步先在PyCharm上新建项目然后在main.py中输入以下代码fromflaskimportFlaskapp=Flask(__name__)@app.route('/')defhello_world():return'Hello,World!'i
题目：将一个数组逆序输出。 bkswbksw C语言练习
//第一种#includeintmain(){inta[5]={1,2,3,4,5};inti;printf("原始数据为:\n");for(i=0;i=0;i--){printf("%d",a[i]);}return0;}//第二种#includeintmain(){inta[5]={1,2,3,4,5};inti,x,temp;printf("原始数组为:\n");for(i=0;i<5;i+
C语言刷题第五章(上) 乞丐1469 C语言刷题 c语言学习
一.题目:1.竞选社长(1)题目描述:假设你们社团要竞选社长，有两名候选人A和B。社团每名同学必须并且只能投一票，最终票数最多的为社长。(2)输入描述:一行，包括字符序列，包含A和B，输入以字符0结束。(3)输出描述:一行，一行字符，A，B或者E。输出A表示A得到的票数最多，输出B表示B得到的票数最多，输出E表示两个同学得到的票数一样多。(4)示例:输入:AABBBBBBBB0输出:B(5)代码实
(c语言)将一个数组逆序输出 WuwuwuH_ C语言 C语言数组逆序输出编程算法
(c语言)将一个数组逆序输出#include#includeintmain(){intarr[10]={0,2,5,7,9,10,13,15,18,25};inti;intlength=(int)sizeof(arr)/sizeof(arr[0]);//判断数组长度(总长度除以单个的长度）printf("数组共有%d个数字\n",length);for(i=length-1;i>0;i--){pr
手把手教你学AUTOSAR（10.1）--AUTOSAR 组件的配置与集成实例小蘑菇二号手把手教你学AUTOSAR 原型模式
目录AUTOSAR组件的配置与集成实例1.准备工作1.1安装工具1.2创建项目2.系统设计2.1创建系统包3.添加软件组件（SWCs）3.1创建TemperatureSensorSWC3.2创建ACControlSWC4.配置通信接口4.1连接端口5.配置ECU资源5.1创建ECU资源包5.2分配资源6.生成配置文件和代码6.1生成配置文件6.2生成代码7.示例代码7.1ReadTemperatu
手把手教你学AUTOSAR（4.4）--AUTOSAR的Ethernet 小蘑菇二号手把手教你学AUTOSAR 网络
目录AUTOSAR中的Ethernet1.Ethernet协议简介2.Ethernet在汽车中的应用3.AUTOSAR中的Ethernet支持3.1网络管理（NetworkManagement&#
手把手教你学AUTOSAR（8.2）--AUTOSAR 组件的配置与集成小蘑菇二号手把手教你学AUTOSAR unity 游戏引擎
目录AUTOSAR组件的配置与集成1.AUTOSAR组件概述2.配置与集成的主要步骤2.1系统设计2.2组件配置2.3组件集成3.工具支持3.1VectorDaVinciDeveloper3.2ETASINTECRIO3.3dSpaceSystemDesk3.4MentorGraphicsVolcanoVSA3.5ElektrobitEBtresos4.示例：使用VectorDaVinciDeve
element-plus按需引入报错IconsResolver is not a function Beamon__ 前端
官网文档：element-plus-best-practices/vite.config.tsatdb2dfc983ccda5570033a0ac608a1bd9d9a7f658·sxzz/element-plus-best-practices·GitHubElementPlusBestPractices最佳实践.Contributetosxzz/element-plus-best-practic
vue项目提示 WebSocketClient.js:49 WebSocket connection to ‘ws://xxxx/ws‘ failed: Invalid frame header Beamon__ vue vue.js 前端
项目信息vue-cli创建的vue3+webpack5项目；问题现状配置proxy代理后，控制台报错，不影响使用，但是不美观，并且不利于在控制台调试代码；原因定位代理问题，新配置的接口代理，影响到了项目内置的本地服务代理配置，参考Websocketconnectionfailed,Invalidframeheader·Issue#1850·vuejs/vue-cli·GitHub解决方案方案一一刀
Java中DDD概念之四理解仓储模式：领域与数据层的优雅桥梁以恒1 java 开发语言
Java，DDD概念之四理解仓储模式：领域与数据层的优雅桥梁一、仓储模式是什么？仓储（Repository）就像一个智能的业务数据管家。想象你经营一家图书馆，书籍的存放、检索、上架工作交给专业管理员，你只需告诉管理员：“我需要2023年出版的所有编程书籍”。仓储就是这样的管理员，把繁琐的数据操作封装起来，让业务代码专注处理核心逻辑。二、为什么需要仓储模式？1.传统开发的问题假设有一个用户管理系统：
MyBatis 从入门到精通：详解基础与实战（完整版）以恒1 mybatis
MyBatis从入门到精通：详解基础与实战（完整版）（新手入门篇在主页）一、MyBatis基础概念1.1什么是ORM？ORM（Object-RelationalMapping）即对象关系映射，是一种将数据库表与程序对象自动映射的技术。MyBatis作为半自动化的ORM框架，允许开发者直接编写SQL，同时自动处理对象与数据库结果的映射。1.2MyBatis核心功能SQL映射：将Java方法与SQL语
将一个数组逆序输出。-多语言赔罪 Practice questions 算法数据结构 python c语言 java javascript
目录C语言实现方法1:交换元素方法2:使用辅助数组方法3:使用递归方法4:使用标准库函数（C99及以上）总结Python实现方法1:交换元素方法2:使用切片方法3:使用reversed()函数方法4:使用list.reverse()方法方法5:使用for循环和append()总结Java实现方法1:交换元素方法2:使用Collections.reverse()方法（适用于对象数组）方法3:使用递归
app=Flask(__name__)中的__name__的意义 BirdMan98 flask python 后端
在app=Flask(__name__)这行代码中，Flask(__name__)用于初始化Flask应用对象，而__name__这个参数的作用主要是确定应用的根路径，影响Flask如何查找资源，如静态文件、模板等。1.__name__是Python内置变量__name__在Python模块中表示当前模块的名称：如果Python文件被直接运行，__name__的值为"__main__"。如果Pyt
【vscode-03】AUTOSAR CP 插件配置工程师平哥 AUTOSAR 工具使用保姆级教程持续更新...Windowns vscode ide 编辑器笔记嵌入式硬件
vscodeAUTOSARCP插件配置1.AUOTSARCP开发推荐接插件2.为什么要使用这些接插件？2.1新建配置2.2C/C++需求2.2编译脚本语言需求2.3ARXML/XML工具2.4文档工具2.4.1doxdocgen自动生成注释模板工具2.4.2OfficeViewer(MarkdownEditor)2.5git管理工具2.6自定义bar2.7代码格式化2.8程序员主题2.9语言选择1
使用yolov8+flask实现精美登录界面+图片视频摄像头检测系统 FL1623863129 深度学习 YOLO flask python
这个是使用flask实现好看登录界面和友好的检测界面实现yolov8推理和展示，代码仅仅有2个html文件和一个python文件，真正做到了用最简洁的代码实现复杂功能。测试通过环境：windowsx64anaconda3+python3.8ultralytics==8.3.81flask==1.1.2torch==2.3.0运行步骤：安装好环境执行pythonlogin.py后端实现代码：from
第2章 Vue核心架构解析道不尽世间的沧桑 vue深入理解前端 javascript vue.js
2.1双版本设计：运行时vs编译器2.1.1版本差异对比//完整版（包含编译器）构建过程newVue({template:'{{message}}'//需要编译模板})//运行时版（需预编译）构建过程newVue({render(h){//直接使用预编译的render函数returnh('div',this.message)}})关键差异说明表：特性完整版运行时版体积大小较大(~30KB)较小(~
python 解决 ‘win32api’ 模块找不到的问题 xybf python python 开发语言
出现这个问题可能是因为升级至python3.10之后，会遗漏两个重要的dll:`pythoncom310.dll`和`pywintypes310.dll`。解决方案就是在python目录下运行`pythonScripts/pywin32_postinstall.py-install`，然后这两个文件就会被创建在`C:\Windows\System32`或者是python目录下。如果这两个地方都找不
深度好文图解 RocketMQ 的系统架构橘野禾系统架构 kafka java 分布式后端
今天给大家分享一篇学习RocketMQ系统架构核心知识点的梳理和总结,在讲解时力求精简、通俗易懂，通过图解来给正在学习RocketMQ的小伙伴带来帮助。RocketMQ是阿里巴巴的分布式消息中间件，在2012年开源，在2017年成为Apache顶级项目。1集群架构RocketMQ的集群架构如下图：从上图可以看到，整个集群中有四个角色：NameServer集群、Broker主从集群、Producer
AI编程篇-python基础篇 cv工程师(ctrl+c\v) AI编程 python
转型AI算法后的总结-python基础篇python基础AI算法工程师的日常开发工作离不开python这门语言。python的优点：开源免费、简单易学、丰富的库。以下是我总结的python的一些基础：1.python及IDE工具安装对于初学者来说，python的安装是必不可少的，但是为了方便代码编辑和查看结果及debug，可以安装pycharm社区版暂时用来前期学习：python安装及注意事项：下
Elasticstack-日志分析平台尼古拉斯-邓 linux kafka centos
#ElasticStack-日志分析平台##1.Filebeat```shellvim/etc/hostsip1dijiaip2meimeiip3biaobei```###Filebeat安装```shellcurl-L-Ohttps://artifacts.elastic.co/downloads/beats/filebeat/filebeat-7.13.2-linux-x86_64.tar.g
DeepSeek+元脑企智大模型一体机（培训交流）互联网之路. deepseek
互联网各领域资料分享专区(不定期更新)：Sheet获取方式：请用手机点击链接进行保存，会自动赠送1TB内存，若链接生效请及时后台留言，谢谢。链接如下（夸克网盘）：夸克网盘分享免责声明：1）所共享的所有内容均来源于网络共享资源，版权归原作者或企业所有，下载的任何资源仅能用于学习和研究目的，请勿用于商业用途，否则后果自负。2）尊重版权，这些资源仅供个人学习和交流使用，请勿用于商业用途。本文档仅做整理。
torchvision与torch的版本冲突 RanGriffin python pytorch
在importtorchvision时报错：UserWarning:FailedtoloadimagePythonextension:[WinError127]解决在晚上查询之后，问题在于自己的torchvision版本与torch版本不对应。首先查询自己的torch和torchvision版本importtorchprint(torch.__version__)importtorchvision
MySQL底层原理编织幻境的妖 mysql 数据库
1.请解释MySQL的逻辑架构和物理架构。MySQL的逻辑架构和物理架构涉及到多个层面，包括网络连接、服务处理、存储引擎以及数据存储等部分。具体如下：逻辑架构：连接层（ConnectionLayer）：客户端通过TCP/IP或其他方式连接到MySQL服务器。为了解决频繁创建和销毁连接带来的性能问题，MySQL使用TCP连接池和线程池来管理连接和执行任务。服务层（ServiceLayer）：这一层包
大规模语言模型从理论到实践开源指令数据集 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战 AI大模型应用入门实战与进阶计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大规模语言模型从理论到实践开源指令数据集1.背景介绍大规模语言模型（LargeLanguageModels,LLMs）近年来在自然语言处理（NLP）领域取得了显著的进展。诸如GPT-3、BERT等模型在各种任务中表现出色，从文本生成到翻译，再到问答系统，几乎无所不能。这些模型的成功离不开庞大的训练数据集和复杂的算法架构。然而，如何有效地构建和利用开源指令数据集，仍然是一个值得深入探讨的话题。2.核
python socket库详解 mosquito_lover1 python websocket
socket是Python标准库中的一个模块，提供了对底层网络通信的接口，允许开发者进行网络编程。通过socket你可以创建客户端和服务器应用程序，实现网络通信。1.基本概念-Socket：是网络通信的端点，用于在不同主机之间或同一主机上的不同进程之间进行数据传输。-IP地址：标识网络中的设备。-端口号：标识设备上的特定进程或服务。-协议：常用的协议有TCP（传输控制协议）和UDP（用户数据报协议
C/C++Win32编程基础详解视频下载择善Zach 编程 C++Win32
课题视频：C/C++Win32编程基础详解视频知识：win32窗口的创建 windows事件机制主讲：择善Uncle老师学习交流群：386620625 验证码：625 --
Guava Cache使用笔记 bylijinnan java guava cache
1.Guava Cache的get/getIfPresent方法当参数为null时会抛空指针异常我刚开始使用时还以为Guava Cache跟HashMap一样，get(null)返回null。实际上Guava整体设计思想就是拒绝null的，很多地方都会执行com.google.common.base.Preconditions.checkNotNull的检查。 2.Guava
解决ora-01652无法通过128（在temp表空间中） 0624chenhong oracle
解决ora-01652无法通过128（在temp表空间中）扩展temp段的过程一个sql语句后，大约花了10分钟，好不容易有一个结果，但是报了一个ora-01652错误，查阅了oracle的错误代码说明：意思是指temp表空间无法自动扩展temp段。这种问题一般有两种原因：一是临时表空间空间太小，二是不能自动扩展。分析过程：既然是temp表空间有问题，那当
Struct在jsp标签不懂事的小屁孩 struct
非UI标签介绍：控制类标签： 1：程序流程控制标签 if elseif else <s:if test="isUsed"> <span class="label label-success">True</span> </
按对象属性排序换个号韩国红果果 JavaScript 对象排序
利用JavaScript进行对象排序，根据用户的年龄排序展示 <script> var bob={ name;bob, age:30 } var peter={ name;peter, age:30 } var amy={ name;amy, age:24 } var mike={ name;mike, age:29 } var john={
大数据分析让个性化的客户体验不再遥远蓝儿唯美数据分析
顾客通过多种渠道制造大量数据，企业则热衷于利用这些信息来实现更为个性化的体验。分析公司Gartner表示，高级分析会成为客户服务的关键，但是大数据分析的采用目前仅局限于不到一成的企业。挑战在于企业还在努力适应结构化数据，疲于根据自身的客户关系管理（CRM）系统部署有效的分析框架，以及集成不同的内外部信息源。然而，面对顾客通过数字技术参与而产生的快速变化的信息，企业需要及时作出反应。要想实
java笔记4 a-john java
操作符 1，使用java操作符操作符接受一个或多个参数，并生成一个新值。参数的形式与普通的方法调用不用，但是效果是相同的。加号和一元的正号（+）、减号和一元的负号（-）、乘号（*）、除号（/）以及赋值号（=）的用法与其他编程语言类似。操作符作用于操作数，生成一个新值。另外，有些操作符可能会改变操作数自身的
从裸机编程到嵌入式Linux编程思想的转变------分而治之：驱动和应用程序 aijuans 嵌入式学习
笔者学习嵌入式Linux也有一段时间了，很奇怪的是很多书讲驱动编程方面的知识，也有很多书将ARM9方面的知识，但是从以前51形式的（对寄存器直接操作，初始化芯片的功能模块）编程方法，和思维模式，变换为基于Linux操作系统编程，讲这个思想转变的书几乎没有，让初学者走了很多弯路，撞了很多难墙。笔者因此写上自己的学习心得，希望能给和我一样转变
在springmvc中解决FastJson循环引用的问题 asialee 循环引用 fastjson
我们先来看一个例子： package com.elong.bms; import java.io.OutputStream; import java.util.HashMap; import java.util.Map; import co
ArrayAdapter和SimpleAdapter技术总结百合不是茶 android SimpleAdapter ArrayAdapter 高级组件基础
ArrayAdapter比较简单，但它只能用于显示文字。而SimpleAdapter则有很强的扩展性，可以自定义出各种效果 ArrayAdapter;的数据可以是数组或者是队列 // 获得下拉框对象 AutoCompleteTextView textview = (AutoCompleteTextView) this
九封信 bijian1013 人生励志
有时候，莫名的心情不好，不想和任何人说话，只想一个人静静的发呆。有时候，想一个人躲起来脆弱，不愿别人看到自己的伤口。有时候，走过熟悉的街角，看到熟悉的背影，突然想起一个人的脸。有时候，发现自己一夜之间就长大了。 2014，写给人
Linux下安装MySQL Web 管理工具phpMyAdmin sunjing PHP Install phpMyAdmin
PHP http://php.net/ phpMyAdmin http://www.phpmyadmin.net Error compiling PHP on CentOS x64 一、安装Apache 请参阅http://billben.iteye.com/admin/blogs/1985244 二、安装依赖包 sudo yum install gd
分布式系统理论 bit1129 分布式
FLP One famous theory in distributed computing, known as FLP after the authors Fischer, Lynch, and Patterson, proved that in a distributed system with asynchronous communication and process crashes,
ssh2整合(spring+struts2+hibernate)-附源码白糖_ eclipse spring Hibernate mysql 项目管理
最近抽空又整理了一套ssh2框架，主要使用的技术如下： spring做容器，管理了三层(dao,service,actioin)的对象 struts2实现与页面交互(MVC)，自己做了一个异常拦截器，能拦截Action层抛出的异常 hibernate与数据库交互 BoneCp数据库连接池，据说比其它数据库连接池快20倍，仅仅是据说 MySql数据库项目用eclipse
treetable bug记录 braveCS table
// 插入子节点删除再插入时不能正常显示。修改： //不知改后有没有错，先做个备忘 Tree.prototype.removeNode = function(node) { // Recursively remove all descendants of +node+ this.unloadBranch(node); // Remove
编程之美-电话号码对应英语单词 bylijinnan java 算法编程之美
import java.util.Arrays; public class NumberToWord { /** * 编程之美电话号码对应英语单词 * 题目： * 手机上的拨号盘，每个数字都对应一些字母，比如2对应ABC，3对应DEF.........，8对应TUV，9对应WXYZ， * 要求对一段数字，输出其代表的所有可能的字母组合
jquery ajax读书笔记 chengxuyuancsdn jQuery ajax
1、jsp页面 <%@ page language="java" import="java.util.*" pageEncoding="GBK"%> <% String path = request.getContextPath(); String basePath = request.getScheme()
JWFD工作流拓扑结构解析伪码描述算法 comsci 数据结构算法工作活动 J#
对工作流拓扑结构解析感兴趣的朋友可以下载附件，或者下载JWFD的全部代码进行分析 /* 流程图拓扑结构解析伪码描述算法 public java.util.ArrayList DFS(String graphid, String stepid, int j)
oracle I/O 从属进程 daizj oracle
I/O 从属进程　　I/O从属进程用于为不支持异步I/O的系统或设备模拟异步I/O.例如，磁带设备(相当慢)就不支持异步I/O.通过使用I/O 从属进程，可以让磁带机模仿通常只为磁盘驱动器提供的功能。就好像支持真正的异步I/O 一样，写设备的进程(调用者)会收集大量数据，并交由写入器写出。数据成功地写出时，写入器(此时写入器是I/O 从属进程，而不是操作系统)会通知原来的调用者，调用者则会
高级排序:希尔排序 dieslrae 希尔排序
public void shellSort(int[] array){ int limit = 1; int temp; int index; while(limit <= array.length/3){ limit = limit * 3 + 1;
初二下学期难记忆单词 dcj3sjt126com english word
kitchen 厨房 cupboard 厨柜 salt 盐 sugar 糖 oil 油 fork 叉；餐叉 spoon 匙；调羹 chopsticks 筷子 cabbage 卷心菜；洋白菜 soup 汤 Italian 意大利的 Indian 印度的 workplace 工作场所 even 甚至；更 Italy 意大利 laugh 笑 m
Go语言使用MySQL数据库进行增删改查 dcj3sjt126com mysql
目前Internet上流行的网站构架方式是LAMP，其中的M即MySQL, 作为数据库，MySQL以免费、开源、使用方便为优势成为了很多Web开发的后端数据库存储引擎。MySQL驱动Go中支持MySQL的驱动目前比较多，有如下几种，有些是支持database/sql标准，而有些是采用了自己的实现接口,常用的有如下几种: http://code.google.c...o-mysql-dri
git命令 shuizhaosi888 git
---------------设置全局用户名： git config --global user.name "HanShuliang" //设置用户名 git config --global user.email "[email protected]" //设置邮箱 ---------------查看环境配置 git config --li
qemu-kvm 网络 nat模式 (四) haoningabc kvm qemu
qemu-ifup-NAT #!/bin/bash BRIDGE=virbr0 NETWORK=192.168.122.0 GATEWAY=192.168.122.1 NETMASK=255.255.255.0 DHCPRANGE=192.168.122.2,192.168.122.254 TFTPROOT= BOOTP= function check_bridge()
不要让未来的你，讨厌现在的自己 jingjing0907 生活奋斗工作梦想
故事one 　23岁，他大学毕业，放弃了父母安排的稳定工作，独闯京城，在家小公司混个小职位，工作还算顺手，月薪三千，混了混，混走了一年的光阴。　　　　24岁，有了女朋友，从二环12人的集体宿舍搬到香山民居，一间平房，二人世界，爱爱爱。偶然约三朋四友，打扑克搓麻将，日子快乐似神仙；　　　　25岁，出了几次差，调了两次岗，薪水涨了不过百，生猛狂飙的物价让现实血淋淋，无力为心爱银儿购件大牌
枚举类型详解一路欢笑一路走 enum 枚举详解 enumset enumMap
枚举类型详解一.Enum详解 1.1枚举类型的介绍 JDK1.5加入了一个全新的类型的”类”—枚举类型，为此JDK1.5引入了一个新的关键字enum,我们可以这样定义一个枚举类型。 Demo:一个最简单的枚举类 public enum ColorType { RED
第11章动画效果（上） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Eclipse中jsp、js文件编辑时，卡死现象解决汇总 ljf_home eclipse jsp卡死 js卡死
使用Eclipse编辑jsp、js文件时，经常出现卡死现象，在网上百度了N次，经过N次优化调整后，卡死现象逐步好转，具体那个方法起到作用，不太好讲。将所有用过的方法罗列如下： 1、取消验证 windows–>perferences–>validation 把除了manual 下面的全部点掉，build下只留 classpath dependency Valida
MySQL编程中的6个重要的实用技巧 tomcat_oracle mysql
每一行命令都是用分号(;)作为结束对于MySQL，第一件你必须牢记的是它的每一行命令都是用分号(;)作为结束的，但当一行MySQL被插入在PHP代码中时，最好把后面的分号省略掉，例如： mysql_query("INSERT INTO tablename(first_name,last_name)VALUES('$first_name',$last_name')");
zoj 3820 Building Fire Stations(二分+bfs) 阿尔萨斯 Build
题目链接：zoj 3820 Building Fire Stations 题目大意：给定一棵树，选取两个建立加油站，问说所有点距离加油站距离的最大值的最小值是多少，并且任意输出一种建立加油站的方式。解题思路：二分距离判断，判断函数的复杂度是o(n)，这样的复杂度应该是o(nlogn)，即使常数系数偏大，但是居然跑了4.5s，也是醉了。判断函数里面做了3次bfs，但是每次bfs节点最多