赛亚茂

基于强化学习的多智能体任务规划(一)

在这篇文章中，相比于传统的AFSIM，作者开发了一种新的人工智能的系统。相比于传统的AI训练器有充分利用先验知识，训练步长更短更快的特点。在此我们不讨论其系统实现的具体细节，我们仅仅讨论其多智能体条件下的强化学习环境搭建问题。这里的问题是二维多智能体博弈对抗问题(MA2D)。

1.实验环境

实验搭建的是红蓝双方2v2环境，如下图所示：

在强化学习训练的每个回合中，初始状态红蓝战机的位置随机，可以出现在图示的任何一个地方(试探性出发假设)。使用传统的强化学习代理训练红方，用混合强化学习代理训练蓝方。文章作者在平台上搭建的实验环境效果图如下：

此示例包含两个蓝色战斗机和两个红色战战斗机，深灰色区域代表每个单位的武器区域。只要地方战机落在灰色区域一段时间，敌方战机就会被摧毁掉。而事实上，这样的简化可以有效避免对飞行导弹的二次建模过程。

在这里对蓝色战斗机的训练采用强化学习代理进行训练，在这里的红色战机的训练可以采取以下几种方式进行训练：

可以直接采用传统的AI脚本进行训练红色战机。
可以直接将纯粹的追击蓝色战机作为红色战斗机的行动策略。
红色战机单纯直行，为蓝色战机提供截击目标。

2.强化学习环境建模

初始位置的随机性：在每个回合epsiode的开始,每个战斗机在地图上的初始位置与初始方向角随机(试探性出发假设)，这一点的目的是为了保证战斗机能学到在全局任意一点的最优化策略，而非适用于一个点出发的最优策略。
战斗机的参数：包括战斗机每次采取动作的转向角 $\Delta \theta_t$ ，战斗机每次采取动作的加速度 $a_t$ 。其范围如下：
$\Delta \theta_t \in[-2.5^。,2.5^。],a_t\in[-5,5]\mathbf {m/s^2}$
战斗机的灰色火力网为扇形，其扇形视野半径 $r = 2 km$ ,扇形角为 $\alpha=30^{。}$ 。
杀伤条件：当敌机落入火力网的时间超过 $2 s$ 时，敌机即被摧毁。
回合截止条件：每个回合最多存在1000个时间步长，若超过这个时间此时存活的蓝色战机将获得奖励。
奖励函数：每个战机如果摧毁敌机，其将获得一个大的正奖励；如果其被摧毁，其将获得一个大的负奖励。一般来说，数值上这个大的正奖励是战机互未分胜负时的奖励的10倍。无论蓝色战机与敌机多么接近，只要时间步长超过1000步，回合都会立刻结束，蓝色战机都会返回奖励+1。该奖励函数还有被简化的空间如下：
观测空间：蓝色战机的观测值 $o_t$ 是包含地方一系列观测值的状态向量：
$o_t=\begin{pmatrix} \mathbf{relative\_ distance}_t\\\mathbf{bearing}_t\\\mathbf{heading}_t\\\mathbf{closing\_ speed}_t\\ \mathbf{cross\_speed}_t\\ \end{pmatrix}$
动作空间：蓝色战机的动作空间是离散的：
$a_t\in\{\mathbf{turn\_ left}, \mathbf{turn\_ right}, \mathbf{speed\_ up}, \mathbf{slow\_ down}, \mathbf{hold \_ course}\}$
网络结构：强化学习采用actor-critic的网络架构，其中Actor网络的架构如下：

其中Critic网络的架构如下:

对上述网络初始权重的分配采用基于输入输出的数量的均值作为标准差的正态分布随机数进行分配，而对价值网络仅仅采用TD算法作为更新优势函数的baseline，优势函数采用reinfoce+baseline的方法进行更新以达到减少方差的目的。

训练参数：

Property	Values
Optimizer	RMSProp
Learning rate	0.0007(学习率指数下降到 $1\times 10^{-10}$ )
Algorithm	A3C( 20 workers)
Tricks	adding an entropy term to the objective function
Episodes	200,000

结论：

3.待填坑代码

在这里挖了一个环境代码的坑，等后面填坑：

import numpy as np

class Fighter(object):
    def __init__(self,x0=0,y0=0,theta0=np.pi/2,delta_t=1,
                 L_limits=100,theta_limits=np.pi/180*2.5,
                 velocity_limits = 2175.0/3600,name="Fighter1",
                 a_limits=5/1000,fighter_range=2,alpha=np.pi/6,
                 fighter_aim_time=2,velocity=2175.0/3600/2):
        # 单位为km
        self.name = name
        self.x = x0
        self.y = y0
        self.theta = theta0
        self.delta_t = delta_t
        self.L_limits = L_limits
        self.theta_limits = theta_limits
        self.a_limits = a_limits
        self.fighter_range = fighter_range
        self.alpha = alpha
        self.fighter_aim_time = fighter_aim_time
        self.velocity0 = velocity
        self.velocity_limits = velocity_limits
        self.heading_angle = {'turn_left':-self.theta_limits,
                                 'turn_right':self.theta_limits,
                                 'speed_up':0,
                                 'slow_down':0,
                                 'hold_course':0}
        self.acceration_value = {'turn_left':0,
                                 'turn_right':0,
                                 'speed_up':self.a_limits,
                                 'slow_down':-self.a_limits,
                                 'hold_course':0}
        self.action_space = ['turn_left','turn_right','speed_up','slow_down','hold_course']
        self.action_ndim = 5
        self.observation_ndim = 3
        self.max_steps_time = 1000*self.delta_t # 超过这段时间游戏自动结束
        # 参数初始化
        self.dead = False
        self.aimed_time = 0 # 战机被锁定的时间
        self.total_rewards = 0
        self.time = 0 # 从开始到结束的时间
        self.acceration = 0
        self.velocity = velocity
        self.state = np.array([self.x,self.y,self.theta])
        self.normal_reward = -1
        self.burn_reward = 100*self.normal_reward
        self.win_reward = -100*self.normal_reward
        self.end_reward = -self.normal_reward
        self.count = 0 # 累计击毁数目
        self.aiming_time = 0
        self.aiming_name = self.name #当前瞄准的敌机姓名
    def reset(self,random_Initial_position=True):
        if random_Initial_position:
            self.x = np.random.random()*self.L_limits
            self.y = np.random.random()*self.L_limits
            self.theta = -np.pi + np.random.random()*2*np.pi
        else:
            self.x = 0
            self.y = 0
            self.theta = np.pi/4
        self.dead = False
        self.aimed_time = 0 # 战机被锁定的时间
        self.total_rewards = 0
        self.time = 0 # 从开始到结束的时间
        self.acceration = 0
        self.velocity = self.velocity0
        self.state = np.array([self.x,self.y,self.theta])
        self.count = 0 # 累计击毁数目
        self.aiming_time = 0 # 固定一个敌机的时间
        self.aiming_name = self.name
        return self.state
    def step(self,action):
        if not self.dead:
            a_str = self.action_space[action]
            delta_a = self.acceration_value[a_str]
            delta_theta = self.heading_angle[a_str]
            self.acceration += delta_a
            if self.acceration <= -self.a_limits:
                self.acceration = -self.a_limits
            elif self.acceration >= self.a_limits:
                self.acceration = self.a_limits
            self.theta += delta_theta
            if self.theta >= np.pi: # 下面始终将角度限制在[-pi,pi]
                self.theta = self.theta - 2*np.pi
            elif self.theta <= -np.pi:
                self.theta = self.theta + 2*np.pi
            # 更新状态
            self.x += self.velocity*self.delta_t*np.cos(self.theta) + 0.5*np.cos(self.theta)*self.acceration*(self.delta_t)**2
            self.y += self.velocity*self.delta_t*np.sin(self.theta) + 0.5*np.sin(self.theta)*self.acceration*(self.delta_t)**2
            self.velocity += self.acceration*self.delta_t
            if self.x >= self.L_limits:
                self.x = self.L_limits
            elif self.x <= 0:
                self.x = 0
            if self.y >= self.L_limits:
                self.y = self.L_limits
            elif self.y <= 0:
                self.y = 0
            if self.velocity <= -self.velocity_limits:
                self.velocity = -self.velocity_limits
            elif self.velocity >= self.velocity_limits:
                self.velocity = self.velocity_limits
            self.time += self.delta_t
            self.state = np.array([self.x,self.y,self.theta])
            # 更新被瞄准时间暂时不考虑
            # --------下面的奖励函数需要与外部同时更新--------
            if self.aiming_time >= self.fighter_aim_time:
                self.count += 1
                return self.state,self.win_reward,True # 打赢了，成功击毁一架
            # 下面只会考虑三种回合结束的情况,被击毁,游戏结束
            if self.time >= self.max_steps_time:
                return self.state,self.end_reward,True

            if self.aimed_time >= self.fighter_aim_time:
                self.dead = True
                return self.state, self.burn_reward, True
            return self.state,self.normal_reward,False # 回合正常结束
        else:
            print("{}已经阵亡!".format(self.name))


class CombatEnv(object):
    def __init__(self,red_num=2,blue_num=2,delta_t=1,L_limits=100,
                 radius=2,alpha=np.pi/6,fighter_aim_time=2):
        self.red_num = red_num
        self.blue_num = blue_num
        self.radius = radius
        self.alpha = alpha
        self.delta_t = delta_t
        self.L_limits = L_limits
        self.fighter_aim_time = fighter_aim_time
        self.red_fighter_list = []
        self.blue_fighter_list = []
        self.blue_state = []
        self.red_state = []
        self.red_name_space = {}
        self.blue_name_space = {}
        self.observation_space_ndim = int(self.blue_num * 3)
        self.action_space_ndim = int(self.blue_num * 2)
        # 产生不同数量的红方与蓝方战机群
        for fighter_blue_index in range(self.blue_num):
            bluefighter = Fighter(name="BlueFighter{}".format(fighter_blue_index),
                                  fighter_range=self.radius,
                                  delta_t=self.delta_t,
                                  L_limits=self.L_limits,
                                  fighter_aim_time=self.fighter_aim_time)
            self.blue_fighter_list.append(bluefighter)
            self.blue_state.append(bluefighter.state)
            self.blue_name_space["BlueFighter{}".format(fighter_blue_index)] = fighter_blue_index
        for fighter_red_index in range(self.red_num):
            redfighter = Fighter(name="RedFighter{}".format(fighter_red_index),
                                 fighter_range=self.radius,
                                 delta_t=self.delta_t,
                                 L_limits=self.L_limits,
                                 fighter_aim_time=self.fighter_aim_time)
            self.red_fighter_list.append(redfighter)
            self.red_state.append(redfighter.state)
            self.red_name_space["RedFighter{}".format(fighter_red_index)] = fighter_red_index
        # 下面开始更新参数
        self.aimed_matrix = np.zeros((self.red_num,self.blue_num)) # 记录第i个战机被第j个战机瞄准的时间aij
        self.aiming_matrix = np.zeros((self.red_num,self.blue_num)) # 记录第i个战机瞄准第j个战机的时间bij
    # 下面是重置阶段
    def reset(self):
        # 各种参数初始化
        self.blue_state = []
        self.red_state = []
        self.aimed_matrix = np.zeros((self.red_num, self.blue_num))  # 记录第i个战机被第j个战机瞄准的时间aij
        self.aiming_matrix = np.zeros((self.red_num, self.blue_num))  # 记录第i个战机瞄准第j个战机的时间bij
        for fighter_blue_index in range(self.blue_num):
            state = self.blue_fighter_list[fighter_blue_index].reset()
            self.blue_state.append(state)
        for fighter_red_index in range(self.red_num):
            state = self.red_fighter_list[fighter_red_index].reset()
            self.red_state.append(state)
        return self.blue_state,self.red_state
    # 下面是动作函数
    def step(self,action):
        # 输入action是一个列表，其中列表有self.blue_num个数
        # 先更新射击矩阵
        for fighter_blue_index in range(self.blue_num):
            for fighter_red_index in range(self.red_num):
                fighter_blue = self.blue_fighter_list[fighter_blue_index]
                fighter_red = self.red_fighter_list[fighter_red_index]
                blue_flag, red_flag = self.inArea(fighter_blue,fighter_red)
                # 一旦红方落入蓝方战机区域，红方战机历经的时间就将被计时
                if not blue_flag:
                    self.aiming_matrix[fighter_red_index,fighter_blue_index] = 0
                else:
                    self.aiming_matrix[fighter_red_index,fighter_blue_index] += self.delta_t
                # 一旦蓝方落入红方战机区域，蓝方战机历经的时间就将被记录时
                if not red_flag:
                    self.aimed_matrix[fighter_red_index,fighter_blue_index] = 0
                else:
                    self.aimed_matrix[fighter_red_index,fighter_blue_index] += self.delta_t
        r_sum = 0
        # 下面从蓝方的角度考虑
        for fighter_blue_index in range(self.blue_num):
            max_aimed_index = np.argmax(self.aimed_matrix[:,fighter_blue_index])
            max_aiming_index = np.argmax(self.aiming_matrix[:,fighter_blue_index])
            max_aimed_time = np.max(self.aimed_matrix[:,fighter_blue_index])
            max_aiming_time = np.max(self.aiming_matrix[:,fighter_blue_index])
            self.blue_fighter_list[fighter_blue_index].aimed_time = max_aimed_time
            self.blue_fighter_list[fighter_blue_index].aiming_time = max_aiming_time
            self.blue_fighter_list[fighter_blue_index].aiming_name = self.red_fighter_list[max_aiming_index].name
        # 下面从红方的角度考虑
        for fighter_red_index in range(self.red_num):
            max_aimed_index = np.argmax(self.aiming_matrix[fighter_red_index,:])
            max_aimed_time = np.max(self.aiming_matrix[fighter_red_index,:])
            ##-------------下面先不急着写了，吃完饭再写，主要是更新红方状态，看来还是需要点多智能体强化学习的基础!!!!-------------
            
        for fighter_blue_index in range(self.blue_num):
            s,r,done = self.blue_fighter_list[fighter_blue_index].step(action[fighter_blue_index])
            r_sum += r


    def inArea(self,blue_fighter,red_fighter):
        distance = np.sqrt((blue_fighter.x - red_fighter.x)**2 + (blue_fighter.y - red_fighter.y)**2) # 两个战机的距离
        # 下面是对蓝色战机的
        theta_blue = np.arctan2(red_fighter.y - blue_fighter.y,red_fighter.x - blue_fighter.x) # 以blue的视角看
        theta_max = blue_fighter.theta + self.alpha/2
        theta_min = blue_fighter.theta - self.alpha/2
        blue_flag = False
        # 对于一种最特殊的情况
        if theta_min <= -np.pi and theta_max >= -np.pi:
            theta_min = theta_min +2*np.pi
            if (distance<=blue_fighter.fighter_range) and \
                    ((theta_min <=theta_blue <= np.pi)or(-np.pi<=theta_blue <=theta_max)):
                blue_flag = True
            else:
                blue_flag = False
        else:
            if (distance <=blue_fighter.fighter_range) and (theta_min <= theta_blue <=theta_max):
                blue_flag = True
            else:
                blue_flag = False
        # 下面是对红色战机的
        theta_red = np.arctan2(blue_fighter.y - red_fighter.y, blue_fighter.x - red_fighter.x)  # 以red的视角看
        theta_max = red_fighter.theta + self.alpha / 2
        theta_min = red_fighter.theta - self.alpha / 2
        red_flag = False
        if theta_min <= -np.pi and theta_max >= -np.pi:
            theta_min = theta_min +2*np.pi
            if (distance<=red_fighter.fighter_range) and \
                    ((theta_min <=theta_red <= np.pi)or(-np.pi<=theta_red <=theta_max)):
                red_flag = True
            else:
                red_flag = False
        else:
            if (distance <=red_fighter.fighter_range) and (theta_min <= theta_red <=theta_max):
                red_flag = True
            else:
                red_flag = False
        return blue_flag,red_flag

新型人工智能“黑帽”工具：GhostGPT带来的威胁与挑战 FreeBuf- 资讯人工智能
生成式人工智能的发展既带来了有益的生产力转型机会，也提供了被恶意利用的机会。最近，AbnormalSecurity的研究人员发现了一个专门为网络犯罪创建的无审查AI聊天机器人——GhostGPT，是人工智能用于非法活动的新前沿，可以被用于网络钓鱼计划、恶意软件开发和漏洞利用开发。GhostGPT的主要特点快速处理：使攻击者能够快速生成恶意内容。无日志政策：声称不记录用户活动，吸引那些寻求匿名的人。
kuberay 安装和使用 CHEN_RUI_2200 数据库
KubeRay是一个基于Kubernetes的项目，旨在简化在Kubernetes上部署和管理Ray集群的过程。先贴点正确的废话：1.简化集群管理KubeRay提供了一个易于使用的界面和工具，允许用户快速创建、配置和管理Ray集群，而不需要深入了解底层Kubernetes的细节。2.自动化部署通过使用Kubernetes的自定义资源定义（CRD），用户可以通过简单的YAML配置文件来定义Ray集群
LEETCODE | PYTHON | 63 | 不同路径Ⅱ Angelawlc leetcode-python leetcode python 算法
LEETCODE|PYTHON|63|不同路径Ⅱ1.题目一个机器人位于一个mxn网格的左上角（起始点在下图中标记为“Start”）。机器人每次只能向下或者向右移动一步。机器人试图达到网格的右下角（在下图中标记为“Finish”）。现在考虑网格中有障碍物。那么从左上角到右下角将会有多少条不同的路径？网格中的障碍物和空位置分别用1和0来表示。来源：力扣（LeetCode）链接：https://leet
RDD 算子全面解析：从基础到进阶与面试要点天冬忘忧 Spark spark 大数据
Spark的介绍与搭建：从理论到实践_spark环境搭建-CSDN博客Spark的Standalone集群环境安装与测试-CSDN博客PySpark本地开发环境搭建与实践-CSDN博客Spark程序开发与提交：本地与集群模式全解析-CSDN博客SparkonYARN：Spark集群模式之Yarn模式的原理、搭建与实践-CSDN博客Spark中RDD的诞生：原理、操作与分区规则-CSDN博客Spar
【elasticsearch】如何更新许可证（License） risc123456 Elasticsearch elasticsearch jenkins 大数据
在Elasticsearch中，**许可证（License）**用于控制集群的功能和权限。Elasticsearch提供了多种许可证类型，包括**Basic（免费）**、**Trial（试用）**和**订阅许可证（如Gold、Platinum、Enterprise）**。如果你需要更新或更改许可证，可以按照以下步骤操作。---##1.**查看当前许可证**在更新许可证之前，可以先查看当前集群的许可
【MQ】如何保证消息队列的高可用？ Forest 森林消息队列 MQ kafka
RocketMQNameServer集群部署Broker做了集群部署主从模式类型：同步复制、异步复制主节点返回消息给客户端的时候是否需要同步从节点Dledger：要求至少消息复制到半数以上的节点之后，才给客户端返回写入成功slave定时从master同步数据（同步刷盘、异步刷盘），master一旦挂了，slave提供消费服务，不能写入消息KafkaKafka从0.8版本开始提供了高可用机制，可保障
日志收集Day008 ccnnlxc java 开发语言
1.zk集群优化修改zookeeper的堆内存大小，一般情况下，生产环境给到2G足以，如果规模较大可以适当调大到4G。(1)配置ZK的堆内存vim/app/softwares/zk/conf/java.envexportJAVA_HOME=/sortwares/jdk1.8.0_291exportJVMFLAGS="-Xms256m-Xmx256m$JVMFLAGS"EOF(2)同步文件到其他节点
大数据小白系列——YARN(1) weixin_44386638 大数据大数据人工智能机器学习数据挖掘数据分析
这是大数据小白系列，YARN的第一篇，准确的说是介绍YARN的“前身”，即MapReduce第一版(下称MRv1)中的资源管理系统。之前准备忽略这部分的内容，毕竟MRv1已经过时了，但为方便后续介绍YARN，这里还是(并不深入地)讲一讲。Q:为什么需要一个资源管理系统？A:在一个具有成百上千节点的集群上(这很常见)，资源管理十分重要，一个好的资源管理系统可以充分发挥各节点的能力，避免一些节点忙碌，
redis分布式锁与redsync库源码分析阿鹏哥哥01 golang学习专题 redis分布式锁 redis 分布式
redsync是redis官方推荐的go版本分布式锁实现，标准的官方redlock算法实现，阅读了下源码并顺便复习一下redis分布式锁原理。一.redlock算法单点场景首先来看单redis实例的场景，这是集群模式的基础。这种场景下实现分布式锁比较简单加锁各节点通过setkeyvaluenxex即可，如果set执行成功，则表明加锁成功，否则失败，其中value为随机串，用来判断是否是当前应用实例
Hadoop学习笔记 --- YARN执行流程与工作原理杨鑫newlfe 数据仓库大数据挖掘与大数据应用案例 YARN Hadoop 大数据资源调度数据仓库
一、YARN简述首先介绍一下YARN在Hadoop2.0版本引进的资源管理系统，直接从MapReduceV1演化而来(由于引擎的功能缺陷)；原因是将MapReduce1中的JobTracker的资源管理和作业调度两个功能分开，分别由ResourceManager和ApplicationMaster进行实现；ResourceManager：负责整个集群的资源管理和调度ApplicationMaste
基于Multi-Agent的无人机集群体系自主作战系统设计龙腾亚太无人机
源自：系统工程与电子技术作者：张堃,华帅,袁斌林,杜睿怡“人工智能技术与咨询”发布摘要针对无人集群自主作战体系设计中的关键问题,提出基于Multi-Agent的无人集群自主作战系统设计方法。建立无人集群各节点的Agent模型及其推演规则;对于仿真系统模块化和通用化的需求,设计系统互操作式接口和无人集群自主作战的交互关系;开展无人集群系统仿真推演验证。仿真结果表明,所提设计方案不仅能够有效开展并完成
无人机低成本集群技术实现详解无人机技术圈无人机技术无人机
在现代科技的迅猛发展中，无人机技术已广泛应用于军事侦察、环境监测、农业植保、物流配送等多个领域。其中，无人机集群技术作为提高任务效率、降低成本的重要手段，正受到越来越多的关注。本项目旨在研发一套低成本无人机集群系统，通过优化关键技术、设计合理的无人机平台、实现高效的集群编队与协同，以及智能化的自主控制，达到提升任务执行效率、降低总体成本的目标。具体目标包括：开发出高性价比的无人机单体、实现灵活的集
NVIDIA Isaac Lab 入门教程（一） kuan_li_lyg 机器人最优控制工具人工智能机器人开发语言 python 强化学习模仿学习 Isaac
系列文章目录前言IsaacLab是一个用于机器人学习的统一模块化框架，旨在简化机器人研究中的常见工作流程（如RL、从演示中学习和运动规划）。它建立在英伟达IsaacSim的基础上，利用最新的仿真功能实现逼真的场景和快速高效的仿真。该框架的核心目标是模块化：轻松定制和添加新环境、机器人和传感器。灵活性：适应社区不断变化的需求。开放性：保持开源，允许社区贡献和扩展框架。包含电池：包含大量可随时使用的环
IsaacLab从入门到精通（六）真机部署与Sim2real NathanWu7 IsaacLab 人工智能机器人深度学习机器学习
在之前的教程中，我们已经完成了整个强化学习任务流程，现在我们需要将自己训练的策略迁移到真机上1.1Sim2real简要方法论强化学习的Sim2real问题一直以来是非常难解决的问题，在仿真环境中训练的policy往往很难迁移到实际的机器人系统上，因此我们需要用一些特殊的方法协助来实现这个过程。1.1.1建立数字孪生（Digitaltwin）在仿真环境中，我们建立的环境需要尽可能与真实世界对齐，因此
自动控制原理二阶系统瞬态响应和稳定性实验研究报告戒了9 自动化课程设计学习方法
一、引言1.1研究背景与目的在自动控制领域，二阶系统作为一类典型且基础的系统，广泛应用于众多实际工程场景，如航空航天中飞行器的姿态控制、工业自动化里的电机调速系统以及机器人运动控制等。对二阶系统的深入研究，在自动控制理论与实践中占据着举足轻重的地位。二阶系统的动态特性直接关乎整个控制系统的性能表现。瞬态响应能够直观反映系统在受到输入信号激励后，从初始状态过渡到稳定状态的动态过程；稳定性则是确保系统
真实互联网线上系统JVM内存溢出排查流程(文末彩蛋) 程序健跑人生 JVM 多线程高并发工作感悟 jvm java 架构后端分布式
起因：近期在工作中发生因jvm内存溢出导致线上应用进程崩溃，导致服务瞬间瘫痪。期间发现集群中每台应用服务器JVM内存使用率高达96%左右，存在瞬间内存打满，导致服务瘫痪情况。根据经验分析，大概率是由于JVM中存在长期无法回收的（大）对象（此问题属代码本身问题）或瞬间流量激增导致垃圾收集器来不及回收（可调整JVM参数或横向增加服务器）导致。排查过程：1.通过命令（jmap-dump:format=b
【面试题】构建高并发、高可用服务架构：技术选型与设计言之。 redis python 面试架构
监控系统消息队列缓存层数据存储层应用层Web层负载均衡与流量分配GrafanaPrometheusAlertmanager消息队列Kafka/RabbitMQ集群/镜像队列缓存层Redis/Memcached数据库MySQL/PostgreSQL主从复制/主主复制应用服务器SpringBoot/Node.js应用服务器SpringBoot/Node.js应用服务器SpringBoot/Node.j
K8S中高级存储之PV和PVC 元气满满的热码式 kubernetes 容器云原生
高级存储PV和PVC由于kubernetes支持的存储系统有很多，要求客户全都掌握，显然不现实。为了能够屏蔽底层存储实现的细节，方便用户使用，kubernetes引入PV和PVC两种资源对象。PV（PersistentVolume）PV是Kubernetes中的一个API对象，它代表集群中的一块存储，这块存储已经预先按照某种方式设置好了，并且可以被多个用户使用。PV是集群资源，由Kubernete
【常用bsub指令介绍】使用bsub命令提交作业、开启交互式窗口，在集群服务器上用pdb进行代码调试凌漪_ 集群服务器服务器 gpu算力 bug
目录1.LSF作业调度系统和服务器集群介绍2.bsub运行作业的两种方式2.1bsub直接提交作业2.2bsub开启交互式窗口3.使用pdb进行代码调试4.更多bsub指令分享1.LSF作业调度系统和服务器集群介绍在一个服务器集群中，有很多的人要使用，却只有很少的GPU。LSF作业调度系统则是对每个用户提交的作业和需要使用的GPU进行调度。一般使用bsub命令来将待运行的作业提交到集群上。用bsu
软考高级系统架构设计师系列之：分布式存储技术快乐骑行^_^ 软考高级系统架构设计师考试软考高级系统架构设计师系列分布式存储技术
软考高级系统架构设计师系列之：分布式存储技术一、分布式存储技术及其实现机制二、分布式存储系统设计中的冗余技术三、常见的缓存工作模式和适应场景四、NOSQL一、分布式存储技术及其实现机制简要说明在分布式存储系统架构设计中所使用的分布式存储技术及其实现机制，详细叙述你在具体项目中选用了哪种分布式存储技术，说明其原因和实施效果。分布式存储技术集群存储技术。集群存储系统是指架构在一个可扩充服务器集群中的文
k8s的主要组件以及重要概念 linshuai-on kubernetes 容器云原生
K8S（Kubernetes）是一个用于自动部署、扩展和管理容器化应用程序的开源系统。它采用主从设备模型（Master-Slave架构），其中Master节点负责集群的调度、管理和运维，Slave节点（也被称为WorkerNode节点）负责执行工作负载。Kubernetes（K8s）主要由以下几个核心组件组成：一、Master节点组件APIServer：原理：作为Kubernetes系统的前端控制
菜鸟BUG之常见异常（一）苏白辛菜鸟BUG bug 数据库 java
雷声炸响，天地倾斜，海啸山崩，黎明前的曙光迟迟不现，群魔乱舞霍乱人间，有仙师集群英之心血，持剑出山，剑斩群魔，终于仙巅同最后一大魔同归于尽，然有人的江湖便有魔，为警示后人，群贤集巨力书群魔以息，吾初入江湖，不懂是非挫折，对错难学，借此抄录，以备他日与同道之友交流。目录一、空指针异常1、我是谁2、实例说明3、解决避免1）检查2）使用Optional类3）默认值4）优先使用String.valueOf
helm介绍和helm部署应用到k8s集群（helm+k8s）——详细文档运维实战课程 docker和k8s学习文档 docker kubernetes 运维
helm介绍和helm部署应用到k8s集群（helm+k8s）——详细笔记整理文档相关配套软件包和文档网盘地址:https://url28.ctfile.com/f/37115828-599686627-f6a619?p=4907访问密码：4907本人会经常更新运维相关技术文档，如有兴趣，可以关注我博客，欢迎互动分享1.为什么使用helm和部署大量应用时传统部署方式面临的挑战?K8s上的应用对象，
虚拟服务器的外部跟内部端口,虚拟服务器设置外部端口验行客虚拟服务器的外部跟内部端口
虚拟服务器设置外部端口内容精选换一换您可以使用镜像快速创建一个可公网访问的单实例工作负载。本章节将指导您基于云容器引擎CCE快速部署Nginx容器应用，并管理该容器应用的全生命周期，以期让您具备将云容器引擎应用到实际项目中的能力。您需要创建一个至少包含一个节点的集群，且该节点已绑定弹性IP。集群是运行工作负载的逻辑分组，包含一组云服务器资源，每台云服务器即集群中的一个节点。使用外部镜像文件创建私有
使用Ambassador容器构建docker容器集群安心Smile docker Docker技术入门与实战 docker容器集群 Ambassador容器
当两个Docker容器在同一主机（或虚拟机）时，可以通过--link命令让两者直接互相访问。如果要跨主机实现容器互联，则往往需要容器知道物理主机的ip地址。利用Ambassador容器机制，可以让互联的容器无需知道所在物理主机的IP地址即可互联。基本场景Ambassador容器也是一种docker容器，她在内部提供了转发服务。如下图。当客户端容器要访问服务器时，直接访问客户端Ambassador容
kubernetes 查询容器的 network namespace 安心Smile 云计算 kubernetes docker namespace
简介命名空间是容器使用的主要方面之一（请参见下图）。它们提供了一种隔离形式，允许容器保持可移植性并与主机系统分离。尽管Linux内核提供了各种类型的名称空间，在本文中，我们将研究如何查看Kubernetes集群中容器的networknamespace，这对于故障排除和学习非常有用。普通方式查询一般情况下，可以通过ipnetndlist命令查看主机的networknamespace，但是，在kube
2022-02-09大数据学习日志——PySpark——Spark快速入门&Standalone集群王络不稳定 spark big data 大数据
第一部分Spark快速入门01_Spark快速入门【Anaconda软件安装】[掌握]使用Python编写Spark代码，首先需要安装Python语言包，此时安装Anaconda科学数据分析包。Anaconda指的是一个开源的Python发行版本，其包含了conda、Python等180多个科学包及其依赖项。Anaconda是跨平台的，有Windows、MacOS、Linux版本。#下载地址：ht
spark2如何集成到cdh里蘑菇丁经验 hadoop 大数据+机器学习+oracle
最近做性能测试需要spark2测试下和spark1.6性能有多大差别，官方文档里写着可以集成，但是自己怎么搞都不行，折磨了3天的时间，目前终于把spark2集成到集群里了我安装的是最新版本的下载spark2安装包wgethttp://archive.cloudera.com/beta/spark2/parcels/latest/SPARK2-2.0.0.cloudera.beta2-1.cdh5.
大数据之Spark运行流程「已注销」 Spark 大数据 spark hadoop
文章目录前言（一）SparkOnYarn集群的Client模式运行流程（二）SparkOnYarn集群的Cluster模式运行流程总结前言上篇文章有讨论到SparkOnYarn的两种部署模式，如果有不清楚的地方，可以再看看，附上对应文章的链接：Spark的部署模式，本篇文章主要讨论SparkOnYarn两种部署模式的运行流程。（一）SparkOnYarn集群的Client模式运行流程该模式的Dri
K8S知识点余额很不足 kubernetes linux 容器
1.查看Pod状态详情列出所有Pod：使用kubectlgetpods命令可以查看集群所有Pod的概览信息，包括名称、状态、IP地址等。结合grep使用，查看包含关键字的podkubectlgetpods|greptest查看你特定Pod的详细信息：通过kubectldescribepod命令，你可以获取关于特定Pod的详细信息，包括其状态、事件历史、容器状态、资源使用情况。以YAML格式查看Po
js动画html标签（持续更新中） 843977358 html js 动画 media opacity
1.jQuery 效果 - animate() 方法改变 "div" 元素的高度： $(".btn1").click(function(){ $("#box").animate({height:"300px
springMVC学习笔记 caoyong springMVC
1、搭建开发环境 a>、添加jar文件，在ioc所需jar包的基础上添加spring-web.jar,spring-webmvc.jar b>、在web.xml中配置前端控制器 <servlet> &nbs
POI中设置Excel单元格格式 107x poi style 列宽合并单元格自动换行
引用：http://apps.hi.baidu.com/share/detail/17249059 POI中可能会用到一些需要设置EXCEL单元格格式的操作小结：先获取工作薄对象: HSSFWorkbook wb = new HSSFWorkbook(); HSSFSheet sheet = wb.createSheet(); HSSFCellStyle setBorder = wb.
jquery 获取A href 触发js方法的this参数无效的情况一炮送你回车库 jquery
html如下： <td class=\"bord-r-n bord-l-n c-333\"> <a class=\"table-icon edit\" onclick=\"editTrValues(this);\">修改</a> </td>" j
md5 3213213333332132 MD5
import java.security.MessageDigest; import java.security.NoSuchAlgorithmException; public class MDFive { public static void main(String[] args) { String md5Str = "cq
完全卸载干净Oracle11g sophia天雪 orale数据库卸载干净清理注册表
完全卸载干净Oracle11g A、存在OUI卸载工具的情况下：第一步：停用所有Oracle相关的已启动的服务；第二步：找到OUI卸载工具：在“开始”菜单中找到“oracle_OraDb11g_home”文件夹中 &
apache 的access.log 日志文件太大如何解决 darkranger apache
CustomLog logs/access.log common 此写法导致日志数据一致自增变大。直接注释上面的语法 #CustomLog logs/access.log common 增加： CustomLog "|bin/rotatelogs.exe -l logs/access-%Y-%m-d.log
Hadoop单机模式环境搭建关键步骤 aijuans 分布式
Hadoop环境需要sshd服务一直开启，故，在服务器上需要按照ssh服务，以Ubuntu Linux为例，按照ssh服务如下： sudo apt-get install ssh sudo apt-get install rsync 编辑HADOOP_HOME/conf/hadoop-env.sh文件，将JAVA_HOME设置为Java
PL/SQL DEVELOPER 使用的一些技巧 atongyeye java sql
1 记住密码这是个有争议的功能，因为记住密码会给带来数据安全的问题。但假如是开发用的库，密码甚至可以和用户名相同，每次输入密码实在没什么意义，可以考虑让PLSQL Developer记住密码。位置：Tools菜单－－Preferences－－Oracle－－Logon HIstory－－Store with password 2 特殊Copy 在SQL Window
PHP：在对象上动态添加一个新的方法 bardo 方法动态添加闭包
有关在一个对象上动态添加方法，如果你来自Ruby语言或您熟悉这门语言，你已经知道它是什么...... Ruby提供给你一种方式来获得一个instancied对象，并给这个对象添加一个额外的方法。好！不说Ruby了，让我们来谈谈PHP PHP未提供一个“标准的方式”做这样的事情，这也是没有核心的一部分... 但无论如何，它并没有说我们不能做这样
ThreadLocal与线程安全 bijian1013 java java多线程 threadLocal
首先来看一下线程安全问题产生的两个前提条件： 1.数据共享，多个线程访问同样的数据。 2.共享数据是可变的，多个线程对访问的共享数据作出了修改。实例：定义一个共享数据： public static int a = 0;
Tomcat 架包冲突解决征客丶 tomcat Web
环境： Tomcat 7.0.6 win7 x64 错误表象：【我的冲突的架包是：catalina.jar 与 tomcat-catalina-7.0.61.jar 冲突，不知道其他架包冲突时是不是也报这个错误】严重: End event threw exception java.lang.NoSuchMethodException: org.apache.catalina.dep
【Scala三】分析Spark源代码总结的Scala语法一 bit1129 scala
Scala语法 1. classOf运算符 Scala中的classOf[T]是一个class对象，等价于Java的T.class,比如classOf[TextInputFormat]等价于TextInputFormat.class 2. 方法默认值 defaultMinPartitions就是一个默认值，类似C++的方法默认值
java 线程池管理机制 BlueSkator java线程池管理机制
编辑 Add Tools jdk线程池一、引言第一：降低资源消耗。通过重复利用已创建的线程降低线程创建和销毁造成的消耗。第二：提高响应速度。当任务到达时，任务可以不需要等到线程创建就能立即执行。第三：提高线程的可管理性。线程是稀缺资源，如果无限制的创建，不仅会消耗系统资源，还会降低系统的稳定性，使用线程池可以进行统一的分配，调优和监控。
关于hql中使用本地sql函数的问题（问-答） BreakingBad HQL 存储函数
转自于：http://www.iteye.com/problems/23775 问：我在开发过程中，使用hql进行查询（mysql5）使用到了mysql自带的函数find_in_set()这个函数作为匹配字符串的来讲效率非常好，但是我直接把它写在hql语句里面（from ForumMemberInfo fm,ForumArea fa where find_in_set(fm.userId,f
读《研磨设计模式》-代码笔记-迭代器模式-Iterator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.Arrays; import java.util.List; /** * Iterator模式提供一种方法顺序访问一个聚合对象中各个元素，而又不暴露该对象内部表示 * * 个人觉得，为了不暴露该
常用SQL chenjunt3 oracle sql C++c C#
--NC建库 CREATE TABLESPACE NNC_DATA01 DATAFILE 'E:\oracle\product\10.2.0\oradata\orcl\nnc_data01.dbf' SIZE 500M AUTOEXTEND ON NEXT 50M EXTENT MANAGEMENT LOCAL UNIFORM SIZE 256K ; CREATE TABLESPA
数学是科学技术的语言 comsci 工作活动领域模型
从小学到大学都在学习数学，从小学开始了解数字的概念和背诵九九表到大学学习复变函数和离散数学，看起来好像掌握了这些数学知识，但是在工作中却很少真正用到这些知识，为什么？最近在研究一种开源软件-CARROT2的源代码的时候，又一次感觉到数学在计算机技术中的不可动摇的基础作用，CARROT2是一种用于自动语言分类（聚类）的工具性软件，用JAVA语言编写，它
Linux系统手动安装rzsz 软件包 daizj linux sz rz
1、下载软件 rzsz-3.34.tar.gz。登录linux，用命令 wget http://freeware.sgi.com/source/rzsz/rzsz-3.48.tar.gz下载。 2、解压 tar zxvf rzsz-3.34.tar.gz 3、安装 cd rzsz-3.34 ; make posix 。注意：这个软件安装与常规的GNU软件不
读源码之:ArrayBlockingQueue dieslrae java
ArrayBlockingQueue是concurrent包提供的一个线程安全的队列,由一个数组来保存队列元素.通过 takeIndex和 putIndex来分别记录出队列和入队列的下标,以保证在出队列时不进行元素移动. //在出队列或者入队列的时候对takeIndex或者putIndex进行累加,如果已经到了数组末尾就又从0开始,保证数
C语言学习九枚举的定义和应用 dcj3sjt126com c
枚举的定义 # include <stdio.h> enum WeekDay { MonDay, TuesDay, WednesDay, ThursDay, FriDay, SaturDay, SunDay }; int main(void) { //int day; //day定义成int类型不合适 enum WeekDay day = Wedne
Vagrant 三种网络配置详解 dcj3sjt126com vagrant
Forwarded port Private network Public network Vagrant 中一共有三种网络配置，下面我们将会详解三种网络配置各自优缺点。端口映射(Forwarded port)，顾名思义是指把宿主计算机的端口映射到虚拟机的某一个端口上，访问宿主计算机端口时，请求实际是被转发到虚拟机上指定端口的。Vagrantfile中设定语法为： c
16.性能优化-完结 frank1234 性能优化
性能调优是一个宏大的工程，需要从宏观架构(比如拆分，冗余，读写分离，集群，缓存等)，软件设计（比如多线程并行化，选择合适的数据结构），数据库设计层面（合理的表设计，汇总表，索引，分区，拆分，冗余等）以及微观（软件的配置，SQL语句的编写，操作系统配置等）根据软件的应用场景做综合的考虑和权衡，并经验实际测试验证才能达到最优。性能水很深，笔者经验尚浅，赶脚也就了解了点皮毛而已，我觉得
Word Search hcx2013 search
Given a 2D board and a word, find if the word exists in the grid. The word can be constructed from letters of sequentially adjacent cell, where "adjacent" cells are those horizontally or ve
Spring4新特性——Web开发的增强 jinnianshilongnian spring spring mvc spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装配置tengine并设置开机启动 liuxingguome centos
yum install gcc-c++ yum install pcre pcre-devel yum install zlib zlib-devel yum install openssl openssl-devel Ubuntu上可以这样安装 sudo aptitude install libdmalloc-dev libcurl4-opens
第14章工具函数（上） onestopweb 函数
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Xelsius 2008 and SAP BW at a glance blueoxygen BO Xelsius
Xelsius提供了丰富多样的数据连接方式，其中为SAP BW专属提供的是BICS。那么Xelsius的各种连接的优缺点比较以及Xelsius是如何直接连接到BEx Query的呢？以下Wiki文章应该提供了全面的概览。 http://wiki.sdn.sap.com/wiki/display/BOBJ/Xcelsius+2008+and+SAP+NetWeaver+BW+Co
oracle表空间相关 tongsh6 oracle
在oracle数据库中，一个用户对应一个表空间，当表空间不足时，可以采用增加表空间的数据文件容量，也可以增加数据文件，方法有如下几种： 1.给表空间增加数据文件 ALTER TABLESPACE "表空间的名字" ADD DATAFILE '表空间的数据文件路径' SIZE 50M; &nb
.Net framework4.0安装失败 yangjuanjava .net windows
上午的.net framework 4.0，各种失败，查了好多答案，各种不靠谱，最后终于找到答案了和Windows Update有关系，给目录名重命名一下再次安装，即安装成功了！下载地址：http://www.microsoft.com/en-us/download/details.aspx?id=17113 方法： 1.运行cmd，输入net stop WuAuServ 2.点击开

基于强化学习的多智能体任务规划(一)

1.实验环境

2.强化学习环境建模

3.待填坑代码

你可能感兴趣的:(集群机器人)