云端FFF

RL gym 环境（3）—— 环境向量化（批量训练）

本文介绍如何在 gym 套件中训练向量化的环境，所谓 “向量化”，可以理解为把所有环境的 observation、action、reward、info 等所有信息都合在一起，拼成一个 “环境向量”，从而把多个独立环境的训练过程组织在一起。agent 和这些环境的交互可以是串行的，也可以是并行的。本文参考自官方文档 Vectorising your environments
请先看之前关于 gym 套件的基础介绍
1. RL gym 环境（1）—— 安装和基础使用
2. RL gym 环境（2）—— 自定义环境

文章目录

1. 两种向量化环境
2. 创建向量化环境
- 2.1 环境副本完全相同
- 2.2 指定环境副本参数
3. 使用向量化环境
- 3.1 基础用法
- 3.2 观测空间 & 动作空间
- 3.3 共享内存
- 3.4 异常处理
4. 实验：通过异步向量化提高训练效率

1. 两种向量化环境

向量化环境Vectorized environments 将同一环境的多个独立副本组织在一起运行的环境，它输入一批动作，同时返回一批观察结果。环境向量化技术在训练时非常有用
Gym 提供了两种类型的向量化环境
1. 同步向量化（顺序向量化）环境 gym.vector.SyncVectorEnv：这里环境不同副本是顺序执行的
2. 异步向量化（并行向量化）环境 gym.vector.AsyncVectorEnv：这里使用 python 的多进程机制 multiprocessing 并行地执行环境的不同副本，每个环境副本都运行在一个独立的进程中

2. 创建向量化环境

2.1 环境副本完全相同

如果只想在某个特定环境训练，那么可以使用该环境的相同副本组成向量化环境，这常用于加速训练
可以用 gym.vector.make 方法创建这种向量化环境，原型如下
```
gym.vector.make(
    id: str,
    num_envs: int = 1,
    asynchronous: bool = True,
    wrappers: Union[<built-in function callable>, List[<built-in function callable>], NoneType] = None,
    disable_env_checker: Union[bool, NoneType] = None,
    **kwargs,
) -> gym.vector.vector_env.VectorEnv
```
1. num_envs 指定被组织的环境副本数量
2. asynchronous 指定是否异步交互（设为 True 异步并行）
3. wrappers 指定各个环境副本使用的包装，这里要么都加要么都不加
4. disable_env_checker 指定是否对第一个环境副本进行 gym 规范性检查（设为 None 或 True 不检查）
5. kwargs 代表环境副本的自身参数

以前文自定义的 Cliff Walking 环境为例，可以如下将其向量化

import gym
#envs = gym.vector.make('CartPole-v1', num_envs=3, disable_env_checker=None)
envs = gym.vector.make('MyGymExamples:MyGymExamples/CliffWalkingEnv-v0',
                        num_envs=3, 
                        disable_env_checker=False,
                        render_mode='rgb_array', 	# 从这开始为环境的自身参数
                        map_size=(4,12), 
                        pix_square_size=30)

observations, infos = envs.reset()

print('observations: ', observations)
print('infos: ', infos)

observations:  OrderedDict([('agent', array([[0, 3],
       [0, 3],
       [0, 3]], dtype=int64)), ('target', array([[11,  3],
       [11,  3],
       [11,  3]], dtype=int64))])
infos:  {'distance': array([11., 11., 11.]), '_distance': array([ True,  True,  True])}

2.2 指定环境副本参数

2.1 节的方法在以下三种情况不适用
1. 被组织的环境副本具有不同的参数 （比如具有不同重力 g 值的 “Pendulum-v0” 环境）
2. 被组织的环境没有注册到 gym
3. 在 一些（但不是全部） 环境副本上使用包装

这时可以用以下方式

# 异步（并行）
asyn_env = gym.vector.AsyncVectorEnv([
    lambda: gym.make("Pendulum-v0", g=9.81),
    lambda: gym.make("Pendulum-v0", g=1.62)
])

# 同步（顺序）
sync_env = gym.vector.SyncVectorEnv([
    lambda: gym.make("Pendulum-v0", g=9.81),
    lambda: gym.make("Pendulum-v0", g=1.62)
])

需要注意的是，如果用 gym.vector.AsyncVectorEnv 创建并行训练的一组环境，由于 python 的多进程机制性质，应将其放在 if __name__ == "__main__": 之后

3. 使用向量化环境

3.1 基础用法

向量化环境的使用和普通环境几乎完全相同，只是原先的所有变量维度都进行了扩展，见下例

env = gym.vector.make('MyGymExamples:MyGymExamples/CliffWalkingEnv-v0', 
                        num_envs=3, 
                        disable_env_checker=False,
                        render_mode='rgb_array', 
                        map_size=(4,12), 
                        pix_square_size=30)
observation, info = env.reset()

>>> observation
OrderedDict([('agent',
              array([[0, 3],
                     [0, 3],
                     [0, 3]], dtype=int64)),
             ('target',
              array([[11,  3],
                     [11,  3],
                     [11,  3]], dtype=int64))])
                     
>>> info
{'distance': array([11., 11., 11.]), '_distance': array([ True,  True,  True])}

从此可见

observation 和 info 内容的维度都扩展了，
info 字典中每个 key 都会多一个 _key 字段指示各个环境副本返回的该 key 字段是否有数据，其值由各个环境副本是否终止决定

接下来运行一步

action_direction = {'noop': 0, 'right': 1, 'down': 2, 'left': 3, 'up': 4}
observation, reward, terminated, truncated, info = env.step(np.array([action_direction['up'], 			# 这会向上移动一格
																		action_direction['down'],		# 这会被地图下界挡住停在起点 
																		action_direction['right']]))	# 这会落入悬崖

>>> observation
OrderedDict([('agent',
              array([[0, 2],
                     [0, 3],
                     [0, 3]], dtype=int64)),
             ('target',
              array([[11,  3],
                     [11,  3],
                     [11,  3]], dtype=int64))])
                     
>>> reward
array([  -1,   -1, -100])

>>> terminated
array([False, False, False])

>>> truncated
array([False, False,  True])

>>> info
{'distance': array([12., 11., 11.]),
 '_distance': array([ True,  True,  True]),
 'final_observation': array([None, None, {'agent': array([1, 3]), 'target': array([11,  3])}],
       dtype=object),
 '_final_observation': array([False, False,  True]),
 'final_info': array([None, None, {'distance': 10.0}], dtype=object),
 '_final_info': array([False, False,  True])}

从此可见

输入的 action、返回的 reward, terminated, truncated 等变量都进行了维度扩展
到达终止状态的子环境副本（由 terminated 或 truncated 指示）会自动 reset
env.step 返回的 info 还会多几个 final_observation、final_info 相关的字段，指出了被 reset 的环境副本 reset 前对终止状态的观测

3.2 观测空间 & 动作空间

向量化环境和普通环境完全类似，它也有属于 gym.space 子类的 observation_space 和 action_space，这些空间是自动从被组织的环境副本推断出来的

>>> envs = gym.vector.make("CartPole-v1", num_envs=3)
>>> envs.observation_space
Box([[-4.8 ...]], [[4.8 ...]], (3, 4), float32)

>>> envs.action_space
MultiDiscrete([2 2 2])

必须保证所有被组织子环境的观测和行动空间相同，否则无法正确推断

>>> envs = gym.vector.AsyncVectorEnv([
...    lambda: gym.make("CartPole-v1"),
...    lambda: gym.make("MountainCar-v0")
...])
RuntimeError: Some environments have an observation space different from `Box([-4.8 ...], [4.8 ...], (4,), float32)`. 
In order to batch observations, the observation spaces from all environments must be equal.

对于向量化环境，可以通过 VectorEnv.single_observation_space 和 VectorEnv.single_action_space 得到其子环境副本的观测和动作空间，常用这个来指定策略模型的一些参数尺寸
```
>>> envs = gym.vector.make("CartPole-v1", num_envs=3)
>>> envs.single_observation_space
Box([-4.8 ...], [4.8 ...], (4,), float32)

>>> envs.single_action_space
Discrete(2)
```

3.3 共享内存

gym.vector.AsyncVectorEnv 类型的并行向量化环境会在独立进程中运行每个环境副本，每次调用 AsyncVectorEnv.reset() 或AsyncVectorEnv.step() 时，所有并行环境的 observation 结果都会发送回主进程，这种进程间数据传输成本很高，对于高维 observation 此问题尤其明显
gym.vector.AsyncVectorEnv 默认使用进程共享内存方法 (shared_memory=True) 尽量减少进程间数据传输成本，这可以增加向量化环境的吞吐量（throughout）

3.4 异常处理

任何子环境副本中引发的异常都会在向量化环境中重新引发，这样我们可以自己选择如何处理这些异常，如下

class ErrorEnv(gym.Env):
    observation_space = gym.spaces.Box(-1., 1., (2,), np.float32)
    action_space = gym.spaces.Discrete(2)

    def reset(self):
        return np.zeros((2,), dtype=np.float32), {}

    def step(self, action):
        if action == 1:
            raise ValueError("An error occurred.")
        observation = self.observation_space.sample()
        return (observation, 0., False, {})

>>> envs = gym.vector.AsyncVectorEnv([lambda: ErrorEnv()] * 3)
>>> observations, infos = envs.reset()
>>> observations, rewards, dones, infos = envs.step(np.array([0, 0, 1]))
ERROR: Received the following error from Worker-2: ValueError: An error occurred.
ERROR: Shutting down Worker-2.
ERROR: Raising the last exception back to the main process.
ValueError: An error occurred.

4. 实验：通过异步向量化提高训练效率

本节对比普通环境 gym.Env、同步向量化环境 gym.vector.SyncVectorEnv 和异步向量化环境 gym.vector.AsyncVectorEnv 的运行速度，注意基础环境每一步交互越慢（即 .step() 用时越久），将其组织起来并行计算的效率提升将会越高，因此我们首先定义一个单步交互很慢的环境

class SlowEnv(gym.Env):
	# 随便定义观测和动作空间
    observation_space = gym.spaces.Dict({
        "position": gym.spaces.Box(-1., 1., (3,), np.float32),
        "velocity": gym.spaces.Box(-1., 1., (2,), np.float32)
    })
    action_space = gym.spaces.Dict({
        "fire": gym.spaces.Discrete(2),
        "jump": gym.spaces.Discrete(2),
        "acceleration": gym.spaces.Box(-1., 1., (2,), np.float32)
    })
	
    def reset(self):
        return self.observation_space.sample(), {}

    def step(self, action):
        i = 0
        for _ in range(500000): i+= 1 # make it slow
        observation = self.observation_space.sample()
        return (observation, 0., False, False, {})

创建普通环境和两种向量化环境

env = SlowEnv()
asyn_envs = gym.vector.AsyncVectorEnv([
                lambda: SlowEnv(),
                lambda: SlowEnv(),
                lambda: SlowEnv(),
            ])
sync_envs = gym.vector.SyncVectorEnv([
                lambda: SlowEnv(),
                lambda: SlowEnv(),
                lambda: SlowEnv(),
            ])

强化学习训练主要的耗时都在环境交互上，我们现在对比三种环境的交互速度，即对比 .step() 速度。可以很方便地使用 jupyter notebook 的 %timeit 魔法方法进行这种计时比较，结果如下
```
>>> %timeit -n 100 -r 2 env.step(env.action_space.sample())
26.5 ms ± 831 µs per loop (mean ± std. dev. of 2 runs, 100 loops each)

>>> %timeit -n 100 -r 2 asyn_envs.step(asyn_envs.action_space.sample())
30.4 ms ± 177 µs per loop (mean ± std. dev. of 2 runs, 100 loops each)

>>> %timeit -n 100 -r 2 sync_envs.step(sync_envs.action_space.sample())
78.9 ms ± 136 µs per loop (mean ± std. dev. of 2 runs, 100 loops each)
```
可见异步向量化的三个环境交互耗时只比单一环境多一点，而同步量化的三个环境交互耗时约为单一环境的三倍，使用并行计算可以大幅提高训练效率。关于 %timeit 魔法方法可以参考 Jupyter Notebook %timeit 功能详解 Python 代码执行时间

你可能感兴趣的:(#,gym,gym,强化学习,向量化环境,并行训练,多进程)

【2022年的STM32】 01-开发环境上手初体验 mcucpp STM32 stm32 单片机 arm mcu 嵌入式
概述最近基于NXPS32K1完成博客专栏，决定看一下好多年未使用ST的MCU，看其是否在开发环境、驱动、芯片特性上更好用了呢？S32K1博客专栏开发环境STM32的开发环境有很多EclipseARMEMbedKeilIARSystemsSTM32CUBEIDESTM32CUBE这里我们选择ST官方基于eclipse的免费STM32CUBEIDE，下载地址：STM32CUBEDownloadSTM3
设计模式-解释器模式夏旭泽设计模式解释器模式
背景四则运算问题：先输入表达式的形式如a+b+c-d，然后分别输入变量的值，最后输出结果。传统模式：编写一个方法，接收表达式的形式，分析表达式，再根据分析结果执行相关操作。问题：不利于拓展，耦合性高，（如果想要加入乘法运算需要修改很多地方）基本介绍给定一个语言（表达式），定义他的文法的一种表示，并定义解释器，使用解释器解释语言。最常见的例子：编译器四个角色①context：是环境角色，含有解释器之
Visual Studio Code + Stm32 （IAR） UIUI vscode stm32 ide
记录一下，以前看别人在vsc下配置stm32工程非常麻烦。最近，突然发现，iar官方出了两个插件，iarbuild、iarC-Spy安装之后，配置一下iar软件路径。然后，直接打开工程目录，编译，非常方便。再次测试了一下，下载，调试也是自动的，非常方便。环境，不知道是不是因为之前安装过IDF，调试过ESP32的原因。环境可能都配置过。所以，这边调试STM32也是直接通过的。刚测试了一下，比IAR在
路径规划：环境适应性路径规划_（7）.路径规划的不确定性处理 zhubeibei168 机器人（二）机器人计算机视觉机器人导航人工智能数码相机
路径规划的不确定性处理在路径规划中，不确定性是一个常见的问题，尤其是在动态和复杂的环境中。不确定性可以来源于多种因素，包括传感器误差、环境变化、动态障碍物等。处理不确定性是确保路径规划算法在实际应用中能够稳定、可靠运行的关键。本节将详细探讨路径规划中的不确定性处理方法，包括概率模型、鲁棒优化、重规划策略等。1.不确定性的来源在路径规划中，不确定性主要来源于以下几个方面：1.1传感器误差传感器是路径
@LoadBalanced注解的RestTemplate拥有负载均衡的能力享学源码 java基础 springcloud
关联阅读(必读)发送http请求(1):发送http请求的几种方式发送http请求(2):RestTemplate发送http请求SpringCloud源码阅读4:Ribbon客户端负载均衡(下)回顾当我在Ribbon的环境下使用RestTemplate发送请求时，通常我们会像下面这样注入一个restTemplate@Autowired@LoadBalancedRestTemplaterestTe
Java中的HTTP POST请求详解华科℡云 python http
HTTPPOST请求是HTTP协议中的另一种请求方法，通常用于向指定的资源提交数据，以创建或更新资源。与GET请求不同，POST请求会将请求数据包含在请求体中，而不是通过URL参数传递。这使得POST请求特别适合处理大量数据或敏感信息。在Java中，我们可以使用多种方式发送HTTPPOST请求，其中最常用的方法之一是使用java.net.HttpURLConnection类。此外，还有一些流行的第
PyTorch 基础数据集：从理论到实践的深度学习基石那年一路北 Pytorch理论+实践深度学习 pytorch 人工智能
一、引言深度学习作为当今人工智能领域的核心技术，在图像识别、自然语言处理、语音识别等众多领域取得了令人瞩目的成果。而在深度学习的体系中，数据扮演着举足轻重的角色，它是模型训练的基础，如同建筑的基石，决定了模型的性能和泛化能力。PyTorch作为当下最流行的深度学习框架之一，为开发者提供了丰富且强大的工具来处理数据集。本文将深入探讨PyTorch中的基础数据集，从深度学习中数据的重要性出发，详细介绍
服务器物理机如何实现系统快照,Lvm快照实现物理备份之自动化陶宇飞服务器物理机如何实现系统快照
环境：一台刚刚干净的linux服务器，使用centos系统create_kz.sh创建Lvm快照，实现备份#!/usr/bin/bash#创建一个lvm快照read-p'请输入新加磁盘的名字：'cpnamea=`lsblk|grep'sdb'|wc-l`if[!$a-eq1]thenecho'---'>/sys/class/scsi_host/host0/scanecho'---'>/sys/cl
通过Amazon Bedrock API调用Anthropic Claude模型的实战指南 qwd41564qwd python
在AI技术的飞速发展中，AmazonBedrockAPI为开发者提供了一种稳定可靠的方式来访问Anthropic的Claude模型。无论是启动新的项目还是集成AI解决方案，通过Bedrock调用Claude模型都提供了更广泛的应用场景和便利性。本文将指导您如何在Python中通过AmazonBedrock向Claude模型发起API调用。技术背景介绍Bedrock是Amazon推出的一个集成平台，
聊聊如何实现Android 放大镜效果咖啡老师 android
一、前言很久没有更新Android原生技术内容了，前些年一直在做跨端方向开发，最近换工作用重新回到原生技术，又回到了熟悉但有些生疏的环境，真是感慨万分。近期也是因为准备做地图交互相关的需求，功能非常复杂，尤其是交互部分，不过再复杂的交互，只要一点点将它拆解，分而治之，问题还是可以解决，就比如接下来要做的放大镜功能。二、功能设计该功能的场景是在操作地图时，对于边缘的精细化操作（像素级别的）需要在放大
jmeter接口压测 test猿压力测试 jmeter
一、接口压力测试过程与步骤接口压力测试的过程与步骤通常包括以下几个阶段：1.确定测试目标和指标在开始接口压力测试之前，首先需要明确测试的目标和指标。这可能包括测试接口在不同并发请求下的响应时间、吞吐量、错误率等。这些指标应根据业务需求、系统设计和性能预期来设定。2.准备测试环境和工具为了进行压力测试，需要准备相应的测试环境和工具。测试环境应尽可能与生产环境相似，以便获得更准确的测试结果。常用的压力
PenSafe（水洞扫描工具）不一样的信息安全工具安全 web安全网络安全
免责声明本系列工具仅供安全专业人员进行已授权环境使用，此工具所提供的功能只为网络安全人员对自己所负责的网站、服务器等（包括但不限于）进行检测或维护参考，未经授权请勿利用工具中的功能对任何计算机系统进行入侵操作。利用此工具所提供的信息而造成的直接或间接后果和损失，均由使用者本人负责。工具地址：点击领取PenSafe（水洞扫描工具）简介渗透测试安全（PenetrationTesting+Safe）：在
Day_1 数据结构与算法&LeetCode入门及攻略 Finger-Von-Frings c++leetcode
数据结构与算法学习目的：我们学习算法和数据结构，是为了学会在编程中从时间复杂度、空间复杂度方面考虑解决方案，训练自己的逻辑思维，从而写出高质量的代码，以此提升自己的编程技能，获取更高的工作回报。数据结构定义：数据结构(DataStructure)指的是带有结构特性的数据元素的集合。学习的目的：为了帮助我们了解和掌握计算机中的数据是以何种方式进行组织、存储的。Q1：何为结构特性？所谓结构特性，指的是
使用 RunnableParallel 并行执行步骤的实践指南 GEAWfaacc 服务器 linux 运维 python
在现代软件开发中，优化计算效率是非常关键的任务。尤其在涉及大规模数据处理或复杂计算时，并行执行成为提高性能的重要手段。LangChain提供了RunnableParallel工具，能够方便地将多个计算过程并行化执行。本文将通过实例代码，深入解析如何利用RunnableParallel实现计算过程的并行化。技术背景介绍RunnableParallel是一个强大的工具，可以将多个可运行的任务（即Run
【深度学习】Pytorch：导入导出模型参数 T0uken 深度学习 pytorch 人工智能
PyTorch是深度学习领域中广泛使用的框架，熟练掌握其模型参数的管理对于模型训练、推理以及部署非常重要。本文将全面讲解PyTorch中关于模型参数的操作，包括如何导出、导入以及如何下载模型参数。什么是模型参数模型参数是指深度学习模型中需要通过训练来优化的变量，如神经网络中的权重和偏置。这些参数存储在PyTorch的torch.nn.Module对象中，通过以下方式访问：importtorchim
AWS VPC及其网络还是转转云原生 aws 网络云计算
目录：AWS概述EMRServerlessAWSVPC及其网络关于AWS网络架构的思考网络作为云服务的交付手段，同时也是云内部体系的支撑骨架，是一项不可或缺的基础设施，所以这个系列先从AWS上的网络环境开始讲起。VPC（VirtualPrivateCloud）VPC是AWS上的一项重要且常用服务，它提供逻辑上隔离的私有网络环境。所谓隔离，即为该VPC与Internet以及其它VPC相隔绝，限制其间
FPGA在高速数据采集系统中的应用！！！ FPGA资料库 fpga开发 fpga verilog 物联网 stm32
FPGA（现场可编程门阵列）在高速数据采集系统中的应用非常广泛，主要得益于其并行处理能力、可编程性和高速接口特性。以下是FPGA在高速数据采集系统中的详细应用，以及一些具体例子：1.应用背景高速数据采集系统通常用于需要高采样率和大数据量处理的场合，如雷达信号处理、医疗成像、高速通信等。FPGA因其独特的硬件架构，能够有效处理高速数据流，因此在这些系统中扮演着关键角色。2.应用内容2.1数据采集接口
YOLOv8/YOLOv11使用web界面推理自己的模型，Gradio框架快速搭建挂科边缘 YOLOv8改进 YOLO 前端计算机视觉目标检测人工智能 python
前言Gradio是一个开源Python库，用于快速构建和共享机器学习模型的Web界面。开发者可以通过简单的Python代码将机器学习模型封装成交互式应用，无需复杂的设置即可在浏览器中使用自己训练好模型。接下来教你使用Gradio框架构建一个简单Web界面推理YOLOv8/YOLOv11模型。话不多说上检测结果：一、YOLOv8/YOLOv11源码下载YOLOv8源码下载：官网打不开的话，从我的网盘
mysql配置环境变量——（‘mysql‘ 不是内部或外部命令，也不是可运行的程序或批处理文件解决办法） vip1024p 面试学习路线阿里巴巴 mysql adb 数据库
当想在在（window+R输入cmd按Enter）命令提示符,打开MySQL运行时，出现‘mysql‘不是内部或外部命令，也不是可运行的程序或批处理文件可能是没有配置mysql配置环境变量或者配置路径有错误。mysql配置环境变量1.找到MySQL安装目录下的bin文件夹的路径。例如，如果你的MySQL安装在C:ProgramFilesMySQLMySQLServer5.7，那么bin文件夹的路径
深度学习笔记——模型部署好评笔记深度学习笔记深度学习笔记人工智能 transformer 模型部署大模型部署大模型
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本文简要概括模型部署的知识点，包括步骤和部署方式。文章目录模型部署模型部署的关键步骤常见的模型部署方式优势与挑战总结边缘端部署方案总结历史文章机器学习深度学习模型部署模型部署是指将训练好的机器学习或深度学习模型集成到生产环境中，使其能够在实际应用中处理实时数据和提供预测服务。模型部署的流程涉及模型的封装、部署环境的选择、部
探索泰坦尼克号生存分类数据集：机器学习与数据分析的完美起点岑童嵘
探索泰坦尼克号生存分类数据集：机器学习与数据分析的完美起点【下载地址】泰坦尼克号生存分类数据集本仓库提供了一个经典的机器学习数据集——泰坦尼克号生存分类数据集。该数据集包含两个CSV文件：训练集和测试集。数据集主要用于训练和评估机器学习模型，以预测泰坦尼克号乘客的生存情况项目地址:https://gitcode.com/open-source-toolkit/35561项目介绍泰坦尼克号生存分类数
PySide6 GUI 学习笔记——Python文件编译打包 Humbunklung PySide6 学习笔记 python
前面编写的软件工具都必须运行在Python环境中，且通过命令行的方式运行，通过Python打包工具，我们可以把.py文件封装成对应平台的运行文件，供用户执行。常见Python打包工具工具简介官网/文档地址py2exe将Python脚本转换为Windows可执行文件https://www.py2exe.orgcx_Freeze跨平台的Python打包工具，它可以将Python脚本打包为可执行文件或动
李开复与零一万物：AI创业的务实之道，以及AI写代码工具的崛起前端
2025年伊始，AI领域便掀起一阵波澜。零一万物，这家备受瞩目的AI公司，其人员变动和业务拆分引发了广泛关注。李开复，这位在AI领域深耕多年的资深人士，对此做出了回应，其核心观点值得我们深思：在AI领域，盲目追求规模并非最佳策略。这不仅关乎零一万物，也为众多AI初创公司提供了宝贵的经验。李开复观点解读：理性决策，而非盲目扩张李开复认为，初创公司“负担不起”超大模型的预训练。这“负担不起”并非仅仅指
Python中的Pipeline快速教学、 Coding Is Fun python 开发语言
在Python中，Pipeline通常指的是机器学习工作流中的流水线，尤其是在使用scikit-learn库时。Pipeline允许你将多个数据处理步骤和模型训练步骤串联起来，形成一个有序的工作流程。这不仅使代码更简洁，还能确保在训练和预测时一致的数据处理。以下是一个快速教学，帮助你掌握Python中Pipeline的核心概念和使用方法。目录安装和导入必要的库Pipeline的基本概念创建一个简单
Python实用记录(十五)：PyQt/PySide6打包成exe，精简版（nuitka/pyinstaller/auto-py-to-exe） ZZY_dl 实用操作总结 python pyqt 开发语言
文章目录Python打包工具：Nuitka、PyInstaller和Auto-py-to-exe详解方式一：Nuitka安装与使用方式二：PyInstaller安装环境打包方式使用spec文件打包打包后文件说明打包参数说明方式三：Auto-py-to-exe安装环境✅⚠️▶️➡️⭐❄️✅⚠️▶️➡️⭐❄️✅⚠️▶️➡️⭐❄️✅⚠️Python打包工具：Nuitka、PyInstaller和Auto
处理 SQL Server 中的表锁问题梓芮. SQL Server 数据库 sql sqlserver mssql 数据库开发微软数据库 sql 数据库
在SQLServer中，表锁是一个常见的问题，尤其是在并发访问和数据更新频繁的环境中。表锁会导致查询性能下降，甚至导致死锁和系统停滞。本文将详细介绍如何识别、分析和解决SQLServer中的表锁问题。什么是表锁？表锁是SQLServer用来管理并发访问的一种机制，确保多个事务在访问同一数据时不会互相干扰。表锁分为共享锁、排他锁和更新锁等类型。虽然锁机制可以保证数据的一致性，不当的锁策略可能会导致性
Nginx正向代理配置详解水月清辉 Nginx nginx 代理模式
一、nginx正向代理介绍及配置（需要在客户端配置代理服务器进行指定网站访问）#模块ngx_http_proxy_module:http://nginx.org/en/docs/http/ngx_http_proxy_module.html#proxy_set_header1、环境介绍代理服务器系统环境为：centosnginx代理服务器为：192.168.10.10测试客户端为局域网内任意win
simulink建模与仿真代做matlab程序代编设计帮做电力电子电机控制 matlabgoodboy matlab 开发语言
一、Simulink建模与仿真在电力电子与电机控制中的应用Simulink简介Simulink是Matlab中的一个重要组件，以其强大的图形化建模和仿真能力著称。它提供了一个直观的图形用户环境，用户可以通过拖放功能块来构建系统模型，无需编写大量代码。这使得Simulink成为控制系统、信号处理、通信系统等领域广泛应用的工具。在电力电子中的应用在电力电子领域中，Simulink可以用于建立电力转换器
04-初识Docker-Docker架构我以为心都空了微服务 docker 架构容器
04-初识Docker-Docker架构1.镜像和容器：(1)镜像(Image)：Docker将应用程序及其所需的依赖、函数库、环境、配置等文件打包在一起，称为镜像。解释：比如之前讲过的Mysql镜像，它里面肯定就会有各种各样所需要的依赖。这些东西最终落到硬盘就是一个一个的文件。比如说这里有Mysql运行时需要写数据的data目录文件，还有log日志文件，当然还有bin里面的可执行文件，这些就组成
Conda与Bash的完美融合：激活你的开发环境 2401_85760095 conda bash 开发语言
Conda与Bash的完美融合：激活你的开发环境在Python开发者的日常工作中，Conda不仅作为包管理器，更是一个强大的环境管理工具。为了在bashshell中使用Conda创建的环境，需要进行初始化操作。condainitbash命令正是为此设计的，它可以修改bash的配置文件，使得Conda的环境能够在每次启动bashshell时自动激活。本文将详细介绍如何使用condainitbash命
Spring中@Value注解，需要注意的地方无量 spring bean @Value xml
Spring 3以后,支持@Value注解的方式获取properties文件中的配置值，简化了读取配置文件的复杂操作 1、在applicationContext.xml文件(或引用文件中)中配置properties文件 <bean id="appProperty" class="org.springframework.beans.fac
mongoDB 分片开窍的石头 mongodb
mongoDB的分片。要mongos查询数据时候先查询configsvr看数据在那台shard上，configsvr上边放的是metar信息，指的是那条数据在那个片上。由此可以看出mongo在做分片的时候咱们至少要有一个configsvr,和两个以上的shard（片）信息。第一步启动两台以上的mongo服务 &nb
OVER(PARTITION BY)函数用法 0624chenhong oracle
这篇写得很好，引自 http://www.cnblogs.com/lanzi/archive/2010/10/26/1861338.html OVER(PARTITION BY)函数用法 2010年10月26日 OVER(PARTITION BY)函数介绍开窗函数 &nb
Android开发中，ADB server didn't ACK 解决方法一炮送你回车库 Android开发
首先通知：凡是安装360、豌豆荚、腾讯管家的全部卸载，然后再尝试。一直没搞明白这个问题咋出现的，但今天看到一个方法，搞定了！原来是豌豆荚占用了 5037 端口导致。参见原文章：一个豌豆荚引发的血案——关于ADB server didn't ACK的问题简单来讲，首先将Windows任务进程中的豌豆荚干掉，如果还是不行，再继续按下列步骤排查。 &nb
canvas中的像素绘制问题换个号韩国红果果 JavaScript canvas
pixl的绘制，1.如果绘制点正处于相邻像素交叉线，绘制x像素的线宽，则从交叉线分别向前向后绘制x/2个像素，如果x/2是整数，则刚好填满x个像素，如果是小数，则先把整数格填满，再去绘制剩下的小数部分，绘制时，是将小数部分的颜色用来除以一个像素的宽度，颜色会变淡。所以要用整数坐标来画的话（即绘制点正处于相邻像素交叉线时），线宽必须是2的整数倍。否则会出现不饱满的像素。 2.如果绘制点为一个像素的
编码乱码问题灵静志远 java jvm jsp 编码
1、JVM中单个字符占用的字节长度跟编码方式有关，而默认编码方式又跟平台是一一对应的或说平台决定了默认字符编码方式；2、对于单个字符：ISO-8859-1单字节编码，GBK双字节编码，UTF-8三字节编码；因此中文平台(中文平台默认字符集编码GBK)下一个中文字符占2个字节，而英文平台(英文平台默认字符集编码Cp1252(类似于ISO-8859-1))。 3、getBytes()、getByte
java 求几个月后的日期 darkranger calendar getinstance
Date plandate = planDate.toDate(); SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd"); Calendar cal = Calendar.getInstance(); cal.setTime(plandate); // 取得三个月后时间 cal.add(Calendar.M
数据库设计的三大范式（通俗易懂） aijuans 数据库复习
关系数据库中的关系必须满足一定的要求。满足不同程度要求的为不同范式。数据库的设计范式是数据库设计所需要满足的规范。只有理解数据库的设计范式，才能设计出高效率、优雅的数据库，否则可能会设计出错误的数据库. 目前，主要有六种范式：第一范式、第二范式、第三范式、BC范式、第四范式和第五范式。满足最低要求的叫第一范式，简称1NF。在第一范式基础上进一步满足一些要求的为第二范式，简称2NF。其余依此类推。
想学工作流怎么入手 atongyeye jbpm
工作流在工作中变得越来越重要，很多朋友想学工作流却不知如何入手。很多朋友习惯性的这看一点，那了解一点，既不系统，也容易半途而废。好比学武功，最好的办法是有一本武功秘籍。研究明白，则犹如打通任督二脉。系统学习工作流，很重要的一本书《JBPM工作流开发指南》。本人苦苦学习两个月，基本上可以解决大部分流程问题。整理一下学习思路，有兴趣的朋友可以参考下。 1 首先要
Context和SQLiteOpenHelper创建数据库百合不是茶 android Context创建数据库
一直以为安卓数据库的创建就是使用SQLiteOpenHelper创建,但是最近在android的一本书上看到了Context也可以创建数据库,下面我们一起分析这两种方式创建数据库的方式和区别,重点在SQLiteOpenHelper 一:SQLiteOpenHelper创建数据库: 1,SQLi
浅谈group by和distinct bijian1013 oracle 数据库 group by distinct
group by和distinct只了去重意义一样，但是group by应用范围更广泛些，如分组汇总或者从聚合函数里筛选数据等。譬如：统计每id数并且只显示数大于3 select id ,count(id) from ta
vi opertion 征客丶 mac opration vi
进入 command mode （命令行模式）按 esc 键再按 shift + 冒号注：以下命令中带 $ 【在命令行模式下进行】，不带 $ 【在非命令行模式下进行】一、文件操作 1.1、强制退出不保存 $ q! 1.2、保存 $ w 1.3、保存并退出 $ wq 1.4、刷新或重新加载已打开的文件 $ e 二、光标移动 2.1、跳到指定行数字
【Spark十四】深入Spark RDD第三部分RDD基本API bit1129 spark
对于K/V类型的RDD,如下操作是什么含义？ val rdd = sc.parallelize(List(("A",3),("C",6),("A",1),("B",5)) rdd.reduceByKey(_+_).collect reduceByKey在这里的操作，是把
java类加载机制 BlueSkator java 虚拟机
java类加载机制 1.java类加载器的树状结构引导类加载器 ^ | 扩展类加载器 ^ | 系统类加载器 java使用代理模式来完成类加载，java的类加载器也有类似于继承的关系，引导类是最顶层的加载器，它是所有类的根加载器，它负责加载java核心库。当一个类加载器接到装载类到虚拟机的请求时，通常会代理给父类加载器，若已经是根加载器了，就自己完成加载。虚拟机区分一个Cla
动态添加文本框 BreakingBad 文本框
<script> var num=1; function AddInput() { var str=""; str+="<input
读《研磨设计模式》-代码笔记-单例模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ public class Singleton { } /* * 懒汉模式。注意，getInstance如果在多线程环境中调用，需要加上synchronized，否则存在线程不安全问题 */ class LazySingleton
iOS应用打包发布常见问题 chenhbc ios iOS发布 iOS上传 iOS打包
这个月公司安排我一个人做iOS客户端开发，由于急着用，我先发布一个版本，由于第一次发布iOS应用，期间出了不少问题，记录于此。 1、使用Application Loader 发布时报错：Communication error.please use diagnostic mode to check connectivity.you need to have outbound acc
工作流复杂拓扑结构处理新思路 comsci 设计模式工作算法企业应用 OO
我们走的设计路线和国外的产品不太一样，不一样在哪里呢？国外的流程的设计思路是通过事先定义一整套规则(类似XPDL)来约束和控制流程图的复杂度(我对国外的产品了解不够多，仅仅是在有限的了解程度上面提出这样的看法)，从而避免在流程引擎中处理这些复杂的图的问题，而我们却没有通过事先定义这样的复杂的规则来约束和降低用户自定义流程图的灵活性，这样一来，在引擎和流程流转控制这一个层面就会遇到很
oracle 11g新特性Flashback data archive daizj oracle
1. 什么是flashback data archive Flashback data archive是oracle 11g中引入的一个新特性。Flashback archive是一个新的数据库对象，用于存储一个或多表的历史数据。Flashback archive是一个逻辑对象，概念上类似于表空间。实际上flashback archive可以看作是存储一个或多个表的所有事务变化的逻辑空间。
多叉树:2-3-4树 dieslrae 树
平衡树多叉树,每个节点最多有4个子节点和3个数据项,2,3,4的含义是指一个节点可能含有的子节点的个数,效率比红黑树稍差.一般不允许出现重复关键字值.2-3-4树有以下特征: 1、有一个数据项的节点总是有2个子节点(称为2-节点) 2、有两个数据项的节点总是有3个子节点(称为3-节
C语言学习七动态分配 malloc的使用 dcj3sjt126com c language malloc
/* 2013年3月15日15:16:24 malloc 就memory(内存) allocate(分配)的缩写本程序没有实际含义，只是理解使用 */ # include <stdio.h> # include <malloc.h> int main(void) { int i = 5; //分配了4个字节静态分配 int * p
Objective-C编码规范[译] dcj3sjt126com 代码规范
原文链接 : The official raywenderlich.com Objective-C style guide 原文作者 : raywenderlich.com Team 译文出自 : raywenderlich.com Objective-C编码规范译者 : Sam Lau
0.性能优化-目录 frank1234 性能优化
从今天开始笔者陆续发表一些性能测试相关的文章，主要是对自己前段时间学习的总结，由于水平有限，性能测试领域很深，本人理解的也比较浅，欢迎各位大咖批评指正。主要内容包括：一、性能测试指标吞吐量、TPS、响应时间、负载、可扩展性、PV、思考时间 http://frank1234.iteye.com/blog/2180305 二、性能测试策略生产环境相同基准测试预热等 htt
Java父类取得子类传递的泛型参数Class类型 happyqing java 泛型父类子类 Class
import java.lang.reflect.ParameterizedType; import java.lang.reflect.Type; import org.junit.Test; abstract class BaseDao<T> { public void getType() { //Class<E> clazz =
跟我学SpringMVC目录汇总贴、PDF下载、源码下载 jinnianshilongnian springMVC
----广告-------------------------------------------------------------- 网站核心商详页开发掌握Java技术，掌握并发/异步工具使用，熟悉spring、ibatis框架；掌握数据库技术，表设计和索引优化，分库分表/读写分离；了解缓存技术，熟练使用如Redis/Memcached等主流技术；了解Ngin
the HTTP rewrite module requires the PCRE library 流浪鱼 rewrite
./configure: error: the HTTP rewrite module requires the PCRE library. 模块依赖性Nginx需要依赖下面3个包 1. gzip 模块需要 zlib 库 ( 下载: http://www.zlib.net/ ) 2. rewrite 模块需要 pcre 库 ( 下载: http://www.pcre.org/ ) 3. s
第12章 Ajax（中） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Optimize query with Query Stripping in Web Intelligence blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Optimize+query+with+Query+Stripping+in+Web+Intelligence and a very straightfoward video http://www.sdn.sap.com/irj/scn/events?rid=/library/uuid/40ec3a0c-936
Java开发者写SQL时常犯的10个错误 tomcat_oracle java sql
1、不用PreparedStatements 　　有意思的是，在JDBC出现了许多年后的今天，这个错误依然出现在博客、论坛和邮件列表中，即便要记住和理解它是一件很简单的事。开发者不使用PreparedStatements的原因可能有如下几个：　　他们对PreparedStatements不了解　　他们认为使用PreparedStatements太慢了　　他们认为写Prepar
世纪互联与结盟有感阿尔萨斯
10月10日，世纪互联与（Foxcon）签约成立合资公司，有感。全球电子制造业巨头（全球500强企业）与世纪互联共同看好IDC、云计算等业务在中国的增长空间，双方迅速果断出手，在资本层面上达成合作，此举体现了全球电子制造业巨头对世纪互联IDC业务的欣赏与信任，另一方面反映出世纪互联目前良好的运营状况与广阔的发展前景。众所周知，精于电子产品制造（世界第一），对于世纪互联而言，能够与结盟

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他