en大师兄

强化学习-随机策略梯度（Policy-Base）

比较懒，引用一下别人的图片
策略 $\pi$ 就是在状态 $s$ 下采取动作 $a$ 的概率分布，可以标示为以下形式：
$\tag{1} \pi_{\theta}(a|s)=\pi(a|s,\theta)=P_r\{A_t=a|S_t=s,\theta_t=\theta\}$
其中时刻 $t$ ，环境状态为 $s$ ，参数为 $\theta$ ，输出动作 $a$ 的概率为 $P_r$

智能体与环境做一次回合的动作轨迹：
$\tag{2} \tau=\{s_1,a_1,s_2,a_2,......,s_t,a_t,s_{t+1}\}$
由 $(2)$ 式可以算出 $\tau$ 轨迹发生的概率为:
$\tag{3} \begin{aligned} p(\tau)&=p\{s_1,a_1,s_2,a_2,......,s_t,a_t,s_{t+1}\} \\ &=p(s_1)*p(a_1|s_1)*p(s_2|s_1,a_1)*p(a_2|s_2)*p(s_3|s_2,a_2)*...*p(a_t|s_t)*p(s_{t+1}|s_t,a_t) \\ &=p(s_1)*\prod_{t=1}^Tp(a_t|s_t)*p(s_{t+1}|s_t,a_t) \end{aligned}$
由 $（ 1 ）$ 式可将 $(3)$ 式写成：
$\tag{4} p_\theta(\tau)=\pi_{\theta}(\tau)=p(s_1)*\prod_{t=1}^T\pi_\theta(a_t|s_t)*p(s_{t+1}|s_t,a_t)$
其中， $p_\theta(\tau)$ 标示在 $\pi_\theta$ 采用 $\theta$ 参数下，动作轨迹出现的概率，展开式中 $p(s_1)$ 和 $p(s_{t+1}|s_t,a_t) \kern{1em} t \in \{1,2,3,...,T\}$ 都是环境所产生的，因此跟 $\theta$ 没有关系

智能体与环境做一次回合的总回报为：
$\tag{5} R(\tau)=r_1+r_2+......=\sum_{t=1}^Tr_t=\sum_{t=1}^Tr(s_t,a_t)$
其中 $r_t$ 或者 $r(a_t|s_t)$ 标示在 $s_t$ 状态下，采取 $a_t$ 动作所得到的即时回报

那么智能体在策略 $\pi$ 取参数 $\theta$ 的情况下，跟环境做一个回合得到的总回报的期望为:
$\tag{6} \begin{aligned} \overline{R_\theta}&=\sum_{\tau}\pi_\theta(\tau)*R(\tau) \\ &=E_{\tau \sim\pi_{\theta}}R(\tau) \end{aligned}$
有些地方也将求和写出积分的形式，求和其实就是积分的一种特殊情况
$\tag {6.1} \begin{aligned} \overline{R_\theta}&=\int \pi_\theta(\tau)*R(\tau) d\tau \\ &=E_{\tau \sim\pi_{\theta}}R(\tau) \end{aligned}$
其中 $E_{\tau \sim\pi_{\theta}(\tau)}R(\tau)$ 对于每个行动轨迹 $\tau$ 在 $\pi_{\theta}(\tau)$ 概率分布下行动轨迹得到的总回报 $R$ 的期望

则我们的优化目标是，找到一组 $\theta$ 使得智能体跟环境进行一个回合的总回报期望值最大:
$\tag 7 \theta^*=\underset{\theta}{argmax} \kern{1em} {\overline{R_\theta}}$
那么怎么求得这个最优的 $\theta$ 呢，就需要使用梯度下降的办法来求解，则先求 $\overline{R_\theta}$ 对 $\theta$ 的偏导数，也就是参数 $\theta$ 的梯度（这里的 $\theta$ 是一组参数向量，不是一个标量）
$\tag 8 \begin{aligned} \triangledown_{\theta} {\overline{R_\theta}}&=\triangledown_{\theta} \sum_{\tau}\pi_\theta(\tau)*R(\tau) \\ &=\sum_{\tau}\triangledown_{\theta} \pi_\theta(\tau)*R(\tau) \end{aligned}$
又，由复合函数求导可知
$\tag 9 \triangledown_{\theta} log{\pi_{\theta}(\tau)} = {1 \over {\pi_\theta(\tau)}}*\triangledown_{\theta} \pi_{\theta}(\tau) \\ \kern{1em}\\ \rArr \triangledown_{\theta} \pi_{\theta}(\tau) = \pi_{\theta}(\tau)* \triangledown_{\theta} log{\pi_{\theta}(\tau)}$
由 $(8) (9)$ 可得:
$\tag {10} \begin{aligned} \triangledown_{\theta} {\overline{R_\theta}}&=\sum_{\tau}\triangledown_{\theta} \pi_\theta(\tau)*R(\tau) \\ &=\sum_{\tau} \pi_{\theta}(\tau)* \triangledown_{\theta} log{\pi_{\theta}(\tau)}*R(\tau) \\ &=E_{\tau \sim \pi_{\theta}(\tau)} \triangledown_{\theta} log{\pi_{\theta}(\tau)}*R(\tau) \end{aligned}$
从 $(10)$ 式可以看出，总回报的期望的梯度，其实就是每个轨迹 $\tau$ 在 $\pi_{\theta}(\tau)$ 概率分布下 $\triangledown_{\theta} log{\pi_{\theta}(\tau)}$ 的期望

然后我们再来求解 $\triangledown log{\pi_{\theta}(\tau)}$
$\tag{11} \begin{aligned} log{\pi_{\theta}(\tau)} &= log[p(s_1)*\prod_{t=1}^T\pi_\theta(a_t|s_t)*p(s_{t+1}|s_t,a_t)] \\ &=log[p(s_1)] + \sum_{t=1}^Tlog[\pi_{\theta}(a_t|s_t)] + \sum_{t=1}^Tlog[p(s_{t+1}|s_t,a_t)] \\ \end{aligned}$
由 $(11)$ 式可以看出，对参数 $\theta$ 求梯度， $log[p(s_1)]$ 和 $\sum_{t=1}^Tlog[p(s_{t+1}|s_t,a_t)]$ 都是跟参数 $\theta$ 没有关系的，因此求导为 $0$ ，因此得到如下式子:
$\tag{12} \begin{aligned} \triangledown_{\theta} log{\pi_{\theta}(\tau)}=&\xcancel{log[p(s_1)]} + \sum_{t=1}^T\triangledown_{\theta}log[\pi_{\theta}(a_t|s_t)] + \xcancel{\sum_{t=1}^Tlog[p(s_{t+1}|s_t,a_t)]} \\ \end{aligned}$
由 $(5) (10) (12)$ 式可以得到最终目标函数的梯度为:
$\tag{13} \triangledown_{\theta}J(\theta)=\triangledown_{\theta} \overline{R_{\theta}}=E_{\tau \sim \pi_{\theta}(\tau)}\{\sum_{t=1}^T \triangledown_{\theta}log[\pi_{\theta}(a_t|s_t)]\}*\{\sum_{t=1}^Tr(s_t,a_t)\}$
其实 $\overline{R_{\theta}}$ 就是我们的目标函数 $J(\theta)$ ，由于 $E_{\tau \sim \pi_{\theta}(\tau)}\{\sum_{t=1}^T \triangledown_{\theta}log[\pi_{\theta}(a_t|s_t)]\}*\{\sum_{t=1}^Tr(s_t,a_t)\}$ 是 $\{\sum_{t=1}^T \triangledown_{\theta}log[\pi_{\theta}(a_t|s_t)]\}*\{\sum_{t=1}^Tr(s_t,a_t)\}$ 的期望值，则实际操作过程中需要采样多个策略轨迹 $\tau_i$ 进行期望的计算，比如我们采样数量为n个，则上面 $(13)$ 式可以写为:
$\tag{14} \begin{aligned} \triangledown_{\theta}J(\theta)=\triangledown_{\theta} \overline{R_{\theta}}&=E_{\tau \sim \pi_{\theta}(\tau)}\{\sum_{t=1}^T \triangledown_{\theta}log[\pi_{\theta}(a_t|s_t)]\}*\{\sum_{t=1}^Tr(s_t,a_t)\} \\ &={1 \over n}\sum_{i=1}^n [(\sum_{t=1}^T \triangledown_{\theta}log[\pi_{\theta}(a_{it}|s_{it})])*(\sum_{t=1}^Tr(s_{it},a_{it}))] \end{aligned}$

那么我们就可以利用这个梯度对 $\theta$ 进行更新
$\tag{15} \theta^* \larr \theta + \alpha \triangledown_{\theta}J(\theta)$
其中 $\alpha$ 为学习率

那么运用到深度学习当中应该怎么使用呢？我们可以搭建一个神经网络，输入为状态 $s$ ，输出为每个动作 $a$ 的可能概率,而我们的损失函数则可以直接取 $-log[\pi_{\theta}(a_t|s_t)] * R(\tau)$ ,因为神经网络只能进行梯度递减，因此 $l o g$ 前面多了一个负号，另外，应为跟 $R(\tau)$ 有关，所以策略梯度求解，只能每个回合结束后进行参数更新，这个跟Value-base方法有区别。
$\tag{16} L(\theta)=-log[\pi_{\theta}(a_t|s_t)] * R(\tau)$
从公式来看，当 $R(\tau)$ 大的时候，因为 $- l o g x$ 是单调递减函数，则 $\pi_{\theta}(a_t|s_t)$ 需要增大才行能使总的 $L(\theta)$ 越小，同理，当 $R(\tau)$ 越小，则需要 $\pi_{\theta}(a_t|s_t)$ 越小,这样就可以增大有价值的动作概率，减小没有价值的动作概率。

代码实例：
手动实现一个迷宫探宝游戏，智能体（蓝色方块）随机出现在地图中的某个位置，并且在地图中放一个或者多个宝藏（红色方块），并且设置多个陷阱（黑色方块），智能体可以向周围8个方向移动，最终取得宝藏为目标。
代码和截图如下：
定义通用的游戏接口abstract_kernel.py

import abc


class AbstractPlayer(object):
    """
    玩家
    """

    def __init__(self):
        """
        初始化
        """
        pass

    @abc.abstractmethod
    def reinforce(self, observation, action, reward, done, info):
        """
        经验增强
        :param observation: 环境观测
        :param action:      环境观测执行的动作
        :param reward:      反馈
        :param done:
        :param info:        其他信息
        :return:
        """
        pass

    @abc.abstractmethod
    def decide(self, observation):
        """
        观测到环境后，进行动作决策
        :param observation:     观测到的环境
        :return:
        """
        pass


class AbstractGame(object):
    """
    定义所有验证游戏平台的统一接口
    """

    def __init__(self, rf=None, episodes=1):
        """
        初始化
        :param rf:       奖励函数
        :param episodes: 尝试次数
        """
        self._rf = rf
        self._episodes = episodes

    @abc.abstractmethod
    def start(self):
        """
        开始游戏
        :return:
        """
        pass


class AbstractGameUI(object):
    """
    游戏的UI界面
    """

    def __init__(self, game):
        """
        于某个游戏绑定
        :param game:    需要绑定的游戏
        """
        self._game = game

    @abc.abstractmethod
    def show(self):
        """
        开始展示
        :return:
        """
        pass

实现迷宫探宝游戏maze_kernel.py

import numpy as np
import sys
import pygame
from games.abstract_kernel import *


class Game(AbstractGame):
    """
    迷宫
    """

    def __init__(self, player, start_func, golds_func, traps_func=None,
                 scene_size=(10, 10), max_step=0, **kwargs):
        """
        初始化
        :param player:      玩家
        :param start_func:  出生地生成函数
        :param golds_func:  宝藏生成函数
        :param traps_func:  陷阱生成函数
        :param scene_size:  场地大小
        :param max_step:    最大步数
        :param kwargs:
        """
        super().__init__(**kwargs)

        # ************* 配置参数 ***************
        self.__player = player
        self.__golds_func = golds_func
        self.__traps_func = traps_func
        self.__start_func = start_func
        self.__scene_size = scene_size
        if max_step > 0:
            self.__max_step = max_step
        else:
            self.__max_step = (self.__scene_size[0] + self.__scene_size[1])
        # 设置默认的奖励函数
        if self._rf is None:
            self._rf = self.__default_reward_function
        # ************* 常数定义 ***************
        self.__actions = {
            0: (-1, 0),  # 上
            1: (0, 1),  # 右
            2: (1, 0),  # 下
            3: (0, -1),  # 左
            4: (-1, -1),  # 左上
            5: (-1, 1),  # 右上
            6: (1, 1),  # 右下
            7: (1, -1)  # 左下
        }
        # ************* 运行参数 ***************
        # 初始化场景
        self.__env = np.zeros(self.__scene_size)
        # 当前尝试次数
        self.__episode = 0
        # 当前智能体位置
        self.__p = [0, 0]

    def start(self):
        """
        开始游戏
        :return:
        """
        while self.__episode < self._episodes:
            # 记录场次
            self.__episode += 1
            self.__env = np.zeros(self.__scene_size)
            # 初始化场景,获取宝藏位置
            golds_locations = self.__golds_func()
            if golds_locations is None or len(golds_locations) == 0: return
            for location in golds_locations:
                self.__env[location[0], location[1]] = 1
            # 初始化场景，获取陷阱位置
            if self.__traps_func is not None:
                trap_locations = self.__traps_func()
                if trap_locations is not None and len(trap_locations) > 0:
                    for location in trap_locations:
                        if self.__env[location[0], location[1]] == 1: continue
                        self.__env[location[0], location[1]] = -1
            # 初始化智能体的出生位置
            self.__p = self.__start_func()
            # 记录总步数
            step = 0
            while True:
                # 步数加1
                step += 1
                # 取得一个决策
                action = self.__player.decide([np.copy(self.__env), np.copy(self.__p)])
                # 评价动作
                reward, done, win = self._rf([np.copy(self.__env), np.copy(self.__p)], action, step)
                # 反馈信息
                self.__player.reinforce([np.copy(self.__env), np.copy(self.__p)], action, reward, done, win)
                if done: break
                # 执行动作
                self.__p = self.__p + self.__actions.get(action)


    def get_env(self):
        """
        获取环境样式
        :return:
        """
        return [np.copy(self.__env), np.copy(self.__p)]

    def __default_reward_function(self, s, a, step):
        """
        默认的奖励函数
        :param s:       环境
        :param a:       动作
        :param step:    总步数
        :return:
        """
        # 得到环境和智能体位置
        env, p = s[0], s[1]
        # 执行前的最短距离
        d = self.__min_distance_for_gold(env, p)
        # 模拟执行动作
        n_p = p + self.__actions.get(a)
        if n_p[0] < 0 or n_p[1] < 0 or n_p[0] > self.__scene_size[0] - 1 or n_p[1] > self.__scene_size[1] - 1 or step >= self.__max_step:
            # 出界
            reward, done, info = -100 - d, True, False
        else:
            # 判断是否拿到宝藏
            if env[n_p[0], n_p[1]] == 1:
                reward, done, info = 100, True, True
            elif env[n_p[0], n_p[1]] == -1:
                reward, done, info = -100 - d, True, False
            else:
                # 计算距离差值
                n_d = self.__min_distance_for_gold(env, n_p)
                reward, done, info = d - n_d, False, False
        return reward, done, info

    def __min_distance_for_gold(self, env, p):
        """
        智能体距离宝藏最近的距离
        :param s: 环境
        :return:
        """
        # 宝藏位置
        golds = np.array(np.where(env == 1)).transpose()
        min_distance = sys.maxsize
        for g in golds:
            # 计算距离
            distance = ((p[0] - g[0]) ** 2 + (p[1] - g[1]) ** 2) ** 0.5
            if distance < min_distance: min_distance = distance
        return min_distance



class GameUI(AbstractGameUI):
    """
    UI展示
    """
    def __init__(self, game, cell_size=20):
        """
        初始化UI
        :param game:        游戏
        :param cell_size:   单元格尺寸大小
        """
        super().__init__(game)
        self.__cell_size = cell_size

    def show(self):
        """
        显示
        :return:
        """
        pygame.init()
        pygame.font.init()
        # 创建一个窗口
        size = self._game.get_env()[0].shape
        size = [size[0] * self.__cell_size, size[1] * self.__cell_size]
        screen = pygame.display.set_mode(size)
        # 设置窗口标题
        pygame.display.set_caption("Do Something")
        while True:
            # 处理事件监听
            for event in pygame.event.get():
                if event.type == pygame.QUIT:
                    print('exit game......')
                    pygame.quit()
            # 清理历史图像
            screen.fill((255, 255, 255))
            env, p = self._game.get_env()
            # 绘制游戏画面
            for row in range(len(env)):
                # 绘制行直线
                pygame.draw.line(screen, (0, 0, 0), (0, self.__cell_size * row), (size[0], self.__cell_size * row), 1)
                for column in range(len(env[row])):
                    # 绘制列
                    pygame.draw.line(screen, (0, 0, 0), (self.__cell_size * column, 0), (self.__cell_size * column, size[1]), 1)
                    # 绘制宝藏
                    if env[row, column] == 1:
                        pygame.draw.rect(screen, (220, 20, 60), [self.__cell_size * column, self.__cell_size * row, self.__cell_size, self.__cell_size], 0)
                    # 绘制陷阱
                    if env[row, column] == -1:
                        pygame.draw.rect(screen, (0, 0, 0), [self.__cell_size * column, self.__cell_size * row, self.__cell_size, self.__cell_size], 0)
                    # 绘制当前智能体位置
                    if row == p[0] and column == p[1]:
                        pygame.draw.rect(screen, (30, 144, 255), [self.__cell_size * column, self.__cell_size * row, self.__cell_size, self.__cell_size], 0)
                    # 设置当前的概率值
                    # to do
            # 设置时钟
            pygame.time.Clock().tick(24)
            pygame.display.update()

采用随机策略梯度测试代码,pg.py:

"""
采用随机策略梯度进行最优解逼近
"""
import tensorflow as tf
import os
import time
import tensorflow.python.keras.backend as K
from rl.games.maze.maze_kernel import *


class Player(AbstractPlayer):
    """
    采用随机策略梯度进行问题的求解
    """

    def __init__(self, alpha=0.02, gamma=0.9, think_time=0.1, prob_file=None):
        """
        初始化
        :param alpha:           学习率
        :param gamma:           反馈值衰减系数
        :param think_time:      思考时间
        :param prob_file:       模型保存文件
        """
        super().__init__()
        # ********** 配置参数 ********
        self.alpha = alpha
        self.gamma = gamma
        self.think_time = think_time
        self.prob_file = prob_file
        # ********** 运行参数 ********
        # 参数概率表
        self.prob = None
        if self.prob_file is not None and os.path.exists(self.prob_file):
            self.prob = tf.Variable(tf.constant(np.load(self.prob_file, allow_pickle=False)))
        # 得分记录
        self.record = [0, 0]
        # 轨迹记录
        self.observations, self.actions, self.rewards = [], [], []
        # 参数优化器
        self.optimizer = tf.keras.optimizers.Adam(self.alpha)

    def decide(self, observation):
        """
        进行决策
        :param observation:
        :return:
        """
        if self.prob is None:
            self.prob = tf.constant(np.zeros(shape=(observation[0].shape[0], observation[0].shape[1], 8)))
            self.prob = tf.Variable(self.prob)
        time.sleep(self.think_time)
        # 得到agent的位置信息
        agent = observation[1]
        # 得到得分值
        vt = self.prob[agent[0], agent[1]]
        # 通过softmax将概率归一化
        p = K.softmax(vt, axis=0)
        # 根据概率选择决策,随机策略梯度
        action = np.random.choice([0, 1, 2, 3, 4, 5, 6, 7], size=1, p=p)[0]
        return action

    def reinforce(self, observation, action, reward, done, info):
        """
        增强学习
        :param observation:
        :param action:
        :param reward:
        :param done:
        :param info:
        :return:
        """
        self.observations.append(observation)
        self.actions.append(action)
        self.rewards.append(reward)
        if done:
            self.optimizer.minimize(self.loss, [self.prob])
            # 记录一波Q值
            if self.prob_file is not None:
                np.save(self.prob_file, self.prob.numpy())
            # 记录
            if info:
                self.record[0] += 1
            else:
                self.record[1] += 1
            print(self.record)

    def loss(self):
        """
        更新策略
        :return:
        """
        # 计算每一个step的策略梯度
        vt = np.zeros(self.prob.shape)
        # 循环每一个step进行梯度计算
        for step in range(len(self.observations)):
            agent = self.observations[step][1]
            action = self.actions[step]
            R = 0
            for i in range(step, len(self.rewards)):
                R = R + self.rewards[i] * (self.gamma ** (i - step))
            vt[agent[0], agent[1], action] += R
            
        # 采用softmax进行概率归一化
        prob = K.softmax(self.prob)
        # 计算loss
        loss = -K.log(prob)
        # 乘以vt值
        loss = loss * vt
        loss = K.sum(loss)
        self.observations, self.actions, self.rewards = [], [], []
        return loss


def start_func():
    return np.array([np.random.randint(0, 19), np.random.randint(0, 19)])


# def start_func():
#     return np.array([0, 0])

def golds_func():
    return np.array([
        [19, 19]
    ])


def traps_func():
    return np.array([
        [6, 6],
        [9, 12],
        [4, 3],
        [13, 14],
        [17, 4],
        [3, 14],
        [6, 3],
        [1, 12],
        [14, 3],
        [1, 4],
        [17, 14],
        [19, 18],

        [10, 9],
        [8, 3],
        [6, 12],
        [9, 11],
        [11, 4],
        [15, 14],
        [17, 17],
    ])


import threading

if __name__ == '__main__':
    # 创建玩家
    player = Player(think_time=0.1, gamma=0.65, prob_file=os.path.sep.join([os.path.dirname(__file__), 'pg.npy']))
    # 创建游戏
    game = Game(player, episodes=sys.maxsize, scene_size=(20, 20), traps_func=traps_func, start_func=start_func,
                golds_func=golds_func)
    # 创建ui
    ui = GameUI(game)
    # 开始游戏
    t = threading.Thread(target=ui.show, args=())
    t.start()
    game.start()

最终运行结果：
控制台会打印成功和失败的尝试数量，刚开始的时候会很慢，可以将think_time设置成0.001或者去掉思考时间，大概总尝试次数达到5000次的时候，智能体的成功率会明显提升上来。

实例中所有的陷阱和宝藏都是固定的，因此观测其实只需要参考agent的当前位置就可以得到最优解，如果宝藏和陷阱式动态的，那么则需要将整个迷宫的布局信息加入到优化函数中，我们可以采用一个神经网络来拟合，输入就是迷宫当前陷阱和宝藏位置，以及agent的当前位置，输出也是agent各个方向的概率，这样agent就可以在动态的迷宫中避开陷阱并最终拿到宝藏。

信创国产芯片如何助力企业数字化转型程序员
企业数字化转型已成为当今时代的关键趋势，在这一进程中，信创国产芯片正发挥着日益重要的作用。随着全球科技竞争的加剧以及对信息安全重视程度的不断提升，信创国产芯片凭借其独特优势，为企业数字化转型提供了坚实的支撑与新的发展机遇。信创国产芯片的发展现状信创产业近年来在我国取得了显著的进步，国产芯片作为其中的核心环节，也迎来了快速发展期。国内众多科研机构和企业加大了在芯片研发领域的投入，不断攻克技术难题。从
如何提升 API 性能：来自 Java 和测试开发者的优化建议
你正在听你最喜欢的歌曲，测试你使用编写的新API。但等你听完一整首歌，API还没响应。哎呀！这是一个巨大的警告信号——是时候优化你的API响应时间了。让我们深入了解一些加速方法，让你的API跟你最喜欢的吉他独奏一样快。为什么API响应时间很重要想想看：API响应时间就是你的应用程序与服务器之间的对话速度。它响应得越快，用户就会越开心。API慢=用户沮丧，API快=用户高兴。所以，让我们解决那些延迟
PLM项目管理软件如何支持供应链管理与协作？程序员
在企业的运营过程中，供应链管理与协作至关重要，它关乎着企业的成本控制、产品交付速度以及客户满意度等多个关键方面。而PLM项目管理软件作为一种强大的工具，正逐渐在支持供应链管理与协作中发挥着不可忽视的作用。PLM软件涵盖了从产品的概念设计到产品生命周期结束的全过程管理，通过整合各种数据和流程，为供应链各环节的协同工作提供了坚实的基础。接下来，我们将深入探讨PLM项目管理软件是如何支持供应链管理与协作
对数据库的总结 java
一、数据库基础1.数据库是一个用于存储和操作数据的文件系统2.关系型数据库：是基于二维表存储的，每个表格由列和行组成，列代表属性，行代表约束，数据的组织和查询更加方便和高效。3.库表操作结构：MySQL和Oracle，通用工具Navicat4.SQL语句的库表操作：createtable：创建表altertable：修改表droptable：删除表truncatetable：删除表中的所有数据，但
Apifox vs Apipost，API 管理工具选型思考，企业究竟该如何选？
在企业级API调试与管理场景中，选择一款高效的工具至关重要。市面上的调试工具琳琅满目，而Apifox和Apipost是近几年两款备受开发者关注的API工具。二者都宣称为团队协作和接口调试赋能，但对企业来说，究竟谁才是更适合的选择呢？本文将从功能对比、用户体验、企业适配度和性价比等多个维度做一次全面解析，帮助你做出更明智的选择。一.概述与定位ApiFoxApifox是一款国产的API调试工具，主打“
Fuzzy Control | Degree of Membership Function 斐夷所非 mathematics 隶属度函数
注：本文为“隶属度函数”相关文章合辑。如有内容异常，请看原文。隶属函数（MembershipFunction），又称归属函数或模糊元函数，是用于表征模糊集合的重要数学工具。在经典集合中，元素与集合的关系只有属于或不属于两种明确情况，分别用111和000表示。但对于模糊集合而言，元素与集合的隶属关系具有不分明性。隶属函数正是为描述元素uuu对论域UUU上的一个模糊集合的隶属关系而引入的，它将用区间[
BPM软件是什么？15款好用的BPM软件盘点
在当今竞争激烈的商业环境中，企业需要不断优化其业务流程以提高效率和竞争力。而业务流程管理（BusinessProcessManagement，BPM）软件正是帮助企业实现这一目标的关键工具之一。本文将详细介绍BPM软件的概念、功能以及其在现代企业中的应用，并为大家盘点15款市场上广受好评的BPM软件。一、什么是BPM软件？BPM软件是一种用于设计、执行、监控和优化企业业务流程的软件工具。它通过图形
如何选择适合团队沟通管理的AI工具人工智能团队沟通团队协作工具
在现代的工作环境中，团队合作离不开高效的沟通与协作。尤其是当任务繁多、信息量庞大的时候，团队成员之间的沟通往往变得杂乱无章，效率低下。然而，在AI技术飞速发展的今天，许多智能工具应运而生，为团队带来了全新的解决方案。那么，是否有AI工具能够帮助团队打造高效顺畅的沟通与协作流程呢？答案是肯定的。通过集成AI助手、自动化任务和实时协作等功能，这些工具正逐步改变着团队协作的方式，让工作变得更加轻松、高效
ios如何像android那样不上架安装 ios上架
大家都知道像鸿蒙、安卓的安装是比较简单的，可以直接在android或华为手机上安装，不一定通过在线商店安装。但是ios手机不一样，假如你是使用普通苹果账号打包的appstore类型的ipa包，是无法直接安装在ios手机的，必须通过上架才能安装。不过，ios想直接安装，还是有通道的，就是注册苹果企业开发者账号，通过企业开发者账号，生成inhouse类型的证书和描述文件（证书profile文件），通过
CS5802一款HDMI转Typec方案转换芯片芯片嵌入式
CS5802是一款HDMI2.0b到Type-C转换器。C55802具有HDMI2.0b输入，最大带宽可达18Gbps。它支持4K@60Hz的最高分辨率。对于Type-Coutput，它由4个数据通道组成，支持1.62Gbps、2.7Gbps、5.4Gbps的链路速率。内置的可选SSC功能减少了EMI影响。嵌入式微控制器基于32位RISC-Vcore和内部串行闪存。CS5802适用于多个细分市场和
集睿致远CS5518 Mipi转lvds点屏方案芯片，pin to pin替代国腾GM8775C方案单片机芯片嵌入式
GM8775C型DSI转双通道LVDS发送器产品主要实现将MIPIDSI转单/双通道LVDS功能，MIPI支持1/2/3/4通道可选，最大支持4Gbps速率。LVDS时钟频率最高154MHz，最大支持视频格式为FULLHD（1920x1200）。产品特征MIPI输入：支持MIPI®D-PHY版本1.00.00和MIPI®DSI版本1.02.00；支持1~4个数据通道，1个时钟通道；支持ULPS(超
SpringBoot整合Swagger和Mybatis-Plus _拾柒_ spring boot mybatis
一、Swagger（一）、Swagger简介Swagger是一种用于描述、设计、构建和使用RESTful风格的Web服务的工具集和规范。它提供了一种标准的方式来定义API，并生成交互式文档，使得开发人员、测试人员和其他利益相关者可以快速了解和使用API。（二）、Swagger特点自动生成文档：基于API定义，Swagger可以自动生成交互式文档，其中包含了API的详细说明、请求示例、响应示例等信息
密码策略合规性检查仪表盘闲人编程 python 网络服务器异常报警实时监控多因素认证合规性密码策略
目录一、前言二、密码策略合规性背景与意义2.1密码策略的重要性2.2密码策略合规性检查的需求三、系统设计思路与架构3.1数据采集与加解密模块3.2异步任务调度与GPU加速模块3.3密码策略检查算法模块3.4GUI界面模块四、核心数学公式与算法证明4.1AES-GCM加解密公式4.2密码强度评分算法4.3合规性检测算法4.4统计与报告生成五、异步任务调度与GPU加速设计六、GUI界面设计与功能模块七
通俗详解redis底层数据结构哈希表之渐进式rehash 八股文领域大手子 java jvm 算法数据库 mysql redis
一、为什么要用渐进式rehash？假设你家的旧柜子（哈希表）装满了，需要换个大柜子。如果一次性把所有东西倒腾到新柜子，你可能得停下手头所有事，累得半死（这就是传统rehash的问题：卡顿）。Redis为了不“累死”，选择边搬边用，每次搬一点，这就是“渐进式”。二、具体怎么“搬家”？1️⃣先准备好新柜子（分配空间）•Redis会先申请一个更大的新哈希表（比如旧表两倍大），这时候系统里同时有「旧表」和
Zset应用之滑动窗口限流八股文领域大手子 java 数据库服务器算法开发语言
滑动窗口限流的实现原理滑动窗口限流的核心是：统计某个时间窗口内的请求数，若超过阈值则拒绝新请求。用RedisZSet实现的关键步骤：1.数据结构设计ZSetKey：rate_limit:api1（示例）member：请求唯一标识（如UUID或IP+时间戳）score：请求的时间戳（单位需一致，如秒或毫秒）2.限流逻辑（分步骤）假设限制60秒内最多100次请求：步骤1：删除时间窗口外的旧请求#删除6
什么是 HTML 实体和转义西门吹雪在编程前端开发 html 前端
在网页前端的源代码中，你可能会看到"这种字符串。这种字符串实际上是HTML实体之一，用于表示双引号字符（"）。HTML实体是一种用于在HTML文档中表示某些特殊字符的方法，因为这些字符在HTML中有特定的用途或可能会与HTML标签语法冲突。HTML实体的背景和用途在HTML中，一些字符有特定的意义。例如，用于标记HTML标签的开始和结束。如果你想在网页中显示这些字符而不是把它们解释为HT
【赵渝强老师】达梦数据库MPP集群的架构数据库信创
为了支持海量数据存储和处理等方面的需求，为高端数据仓库提供解决方案，达梦数据库提供了大规模并行处理MPP架构，以极低的成本代价，提供高性能的并行计算。通过使用MPP可以解决以下问题：需要较高的系统性能支持以支持大量的复杂查询操作硬件束缚对数据库响应能力的影响降低数据库成本视频讲解如下：https://www.bilibili.com/video/BV1dBftYoEkk/?aid=11386961
QKeras、Brevitas和QONNX量化工具对比 kanhao100 笔记深度学习边缘计算
QKeras、Brevitas和QONNX量化工具对比一、引言在深度学习模型部署领域，量化技术已成为提升模型执行效率的关键手段。通过将浮点权重转换为低精度表示，量化能显著减小模型体积、降低内存占用并加速推理过程。对于资源受限的设备（如移动设备、嵌入式系统和边缘计算设备），量化技术尤为重要。本文深入对比三款主流量化工具：QKeras、Brevitas和QONNX，从用户实际应用角度剖析它们的技术特点
Umi-OCR：解锁高效文字识别的新时代水熠芝Dark-Haired
Umi-OCR：解锁高效文字识别的新时代Umi-OCR一款强大而高效的文字识别工具项目地址:https://gitcode.com/Resource-Bundle-Collection/6adda项目介绍在数字化浪潮席卷全球的今天，文字识别技术已成为提升工作效率和生活质量的关键工具。Umi-OCR，作为一款基于深度学习技术的开源文字识别工具，凭借其强大的功能和高效的性能，迅速成为众多用户的首选。无
Umi-OCR：一款强大而高效的文字识别工具裘心国Trent
Umi-OCR：一款强大而高效的文字识别工具Umi-OCR一款强大而高效的文字识别工具项目地址:https://gitcode.com/Resource-Bundle-Collection/6adda介绍Umi-OCR是一款基于深度学习技术的开源文字识别工具，特别适合日常办公、学术研究及数据分析等场景。它能有效解决将图像中的文字快速转化为可编辑文本的需求，极大提升工作效率。此工具依托于先进的计算机
自动语音识别（ASR）：技术、应用与未来 ajie1117 语音识别人工智能
自动语音识别（ASR）：技术、应用与未来1.ASR简介自动语音识别（ASR，AutomaticSpeechRecognition）是一种将语音转换为文本的技术。它利用人工智能（AI）、深度学习和自然语言处理（NLP）技术来识别和理解人类的语言，使计算机能够与人类进行更自然的交互。2.ASR的工作原理ASR的核心流程通常包括以下几个步骤：语音信号采集：通过麦克风或其他设备获取音频数据。预处理：去除噪
springboot基于java的企业档案管理信息系统 QQ80213251 java spring boot 后端
收藏关注不迷路！！文末获取源码+数据库感兴趣的可以先收藏起来，还有大家在毕设选题（免费咨询指导选题），项目以及论文编写等相关问题都可以给我留言咨询，希望帮助更多的人文章目录前言详细视频演示一、项目介绍二、功能介绍三、核心代码数据库参考四、效果图五、文章目录六、源码获取前言企业档案管理信息系统是一种旨在提高文件资料归档、检索和利用效率的信息化解决方案。该系统通过电子化手段对企业的各类文档和档案进行归
ucOS的互斥所mutex和信号量semaphore的区别 louis.johnson ucOS 信号量互斥锁 mutex
mutex和semaphore都是计数器，计数器被拿完了，其他任务再想拿（pend函数），就要等有人归还（post函数），mutex可以理解为最大计数值为1的semaphore，只有1个人可以拿到这个球，其他人要玩，只能等这个人归还。
手机游戏《银河历险记2》：一场奇幻的星际解谜之旅 2501_90238385 游戏
《银河历险记2》是一款经典的解谜冒险游戏，故事发生在一个只有男孩和一只狗的星球上。一天，小狗被外星人抓走了，于是男孩踏上了营救小狗的冒险之旅。游戏的画面风格独特，采用了复古的像素艺术，营造出一种静谧而神秘的异星世界。游戏特色：奇幻与解谜的完美结合1.独特的像素艺术风格游戏的画面虽然简洁，但细节丰富，每个星球都有独特的风景和风格，从荒凉的沙漠到神秘的森林，让玩家仿佛置身于一个真实的异星世界。2.丰富
2. 猜数字游戏老实人y Rust小白初学 rust 开发语言后端
目录创建一个新项目处理一次猜测生成一个秘密数字使用crate来增加更多功能Cargo.lock文件确保构建是可重现的更新crate到一个新版本生成一个随机数比较猜测的数字和神秘数字使用循环来允许多次猜测猜测正确后退出处理无效输入最终代码程序会随机生成一个1到100之间的整数。接着它会提示玩家猜一个数并输入，然后指出猜测是大了还是小了。如果猜对了，它会打印祝贺信息并退出。创建一个新项目project
如何在 HTML 中创建一个有序列表和无序列表，它们的语义有何不同？前端大白话大白话前端八股前端 html
大白话如何在HTML中创建一个有序列表和无序列表，它们的语义有何不同？1.HTML中有序列表和无序列表的基本概念在HTML里，列表是一种用来组织信息的方式。有序列表就是带有编号的列表，它可以让内容按照一定的顺序呈现；无序列表则是用符号（像圆点、方块等）来标记每一项内容，重点在于展示并列的信息，不强调顺序。2.创建无序列表无序列表使用标签来创建，每一项内容用标签包裹。下面是具体的代码示例，代码里有详
机器学习是怎么一步一步由神经网络发展到今天的Transformer架构的？ yuanpan 机器学习神经网络 transformer
机器学习和神经网络的发展经历了一系列重要的架构和技术阶段。以下是更全面的总结，涵盖了从早期神经网络到卷积神经网络之前的架构演变：1.早期神经网络：感知机（Perceptron）时间：1950年代末至1960年代。背景：感知机由FrankRosenblatt提出，是第一个具有学习能力的神经网络模型。它由单层神经元组成，可以用于简单的二分类任务。特点：输入层和输出层之间直接连接，没有隐藏层。使用简单的
【Lua】实现面向对象 xiaoaiyu___ Lua lua 开发语言
面向对象面向对象的三大特性：封装、继承、多态。封装：就是把对象的属性和行为（数据）结合为一个独立的整体，并尽可能隐藏对象的内部实现细节。继承：从已有的类中派生出新的类称为子类，子类继承父类的数据属性和行为，并能根据自己的需求扩展出新的行为，可以提高代码的复用性。多态：指允许不同的对象对同一消息做出响应。即同一消息可以根据发送对象的不同而采用多种不同的行为方式（发送消息就是函数调用）。1.封装。在L
linux自律第 40 天嵌入式大大白数据库
在学习了sqlite3数据库的增删改查之后，我开始做了一个基于web服务端的商品查询系统，将商品的图片，名称，id，详细描述和关键词等都放入了该数据库中，利用该数据库和html构建的网页来完成该项目。该项目首先需要设计出登录系统，登录需要密码和账号，所以需要注册，我打算在注册的时候使用数据库，将注册的信息放在数据库中。然后使用账号密码登录的时候，输入的账号密码在请求报文中，以post的形式发出来，
python 函数—文档、类型注释和内省想知道哇 python python 开发语言
Python文档、类型注释和内省目录引言函数文档docstring的使用help()函数类型注释基本类型注释复杂类型注释内省技术基本内省方法inspect模块的高级内省综合示例建议引言Python提供了丰富的文档和内省机制，使开发者能够编写自解释的代码并在运行时检查对象属性。本教程详细介绍了函数文档、类型注释和内省技术。函数文档docstring的使用Python使用三引号字符串（'''或"""）
集合框架天子之骄 java 数据结构集合框架
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
Table Driven（表驱动）方法实例 bijian1013 java enum Table Driven 表驱动
实例一： /** * 驾驶人年龄段 * 保险行业，会对驾驶人的年龄做年龄段的区分判断 * 驾驶人年龄段：01-[18,25);02-[25,30);03-[30-35);04-[35,40);05-[40,45);06-[45,50);07-[50-55);08-[55,+∞) */ public class AgePeriodTest { //if...el
Jquery 总结 cuishikuan java jquery Ajax Web jquery方法
1.$.trim方法用于移除字符串头部和尾部多余的空格。如：$.trim(' Hello ') // Hello2.$.contains方法返回一个布尔值，表示某个DOM元素（第二个参数）是否为另一个DOM元素（第一个参数）的下级元素。如：$.contains(document.documentElement, document.body); 3.$
面向对象概念的提出麦田的设计者 java 面向对象面向过程
面向对象中，一切都是由对象展开的，组织代码，封装数据。在台湾面向对象被翻译为了面向物件编程，这充分说明了，这种编程强调实体。下面就结合编程语言的发展史，聊一聊面向过程和面向对象。 c语言由贝尔实
linux网口绑定被触发 linux
刚在一台IBM Xserver服务器上装了RedHat Linux Enterprise AS 4，为了提高网络的可靠性配置双网卡绑定。一、环境描述我的RedHat Linux Enterprise AS 4安装双口的Intel千兆网卡，通过ifconfig -a命令看到eth0和eth1两张网卡。二、双网卡绑定步骤： 2.1 修改/etc/sysconfig/network
XML基础语法肆无忌惮_ xml
一、什么是XML？ XML全称是Extensible Markup Language，可扩展标记语言。很类似HTML。XML的目的是传输数据而非显示数据。XML的标签没有被预定义，你需要自行定义标签。XML被设计为具有自我描述性。是W3C的推荐标准。二、为什么学习XML？用来解决程序间数据传输的格式问题做配置文件充当小型数据库三、XML与HTM
为网页添加自己喜欢的字体知了ing 字体秒表 css
@font-face { font-family: miaobiao;//定义字体名字 font-style: normal; font-weight: 400; src: url('font/DS-DIGI-e.eot');//字体文件 } 使用： <label style="font-size:18px;font-famil
redis范围查询应用-查找IP所在城市矮蛋蛋 redis
原文地址： http://www.tuicool.com/articles/BrURbqV 需求根据IP找到对应的城市原来的解决方案 oracle表（ip_country）：查询IP对应的城市： 1.把a.b.c.d这样格式的IP转为一个数字，例如为把210.21.224.34转为3524648994 2. select city from ip_
输入两个整数，计算百分比 alleni123 java
public static String getPercent(int x, int total){ double result=(x*1.0)/(total*1.0); System.out.println(result); DecimalFormat df1=new DecimalFormat("0.0000%");
百合——————>怎么学习计算机语言百合不是茶 java 移动开发
对于一个从没有接触过计算机语言的人来说，一上来就学面向对象，就算是心里上面接受的了，灵魂我觉得也应该是跟不上的，学不好是很正常的现象，计算机语言老师讲的再多，你在课堂上面跟着老师听的再多，我觉得你应该还是学不会的，最主要的原因是你根本没有想过该怎么来学习计算机编程语言，记得大一的时候金山网络公司在湖大招聘我们学校一个才来大学几天的被金山网络录取，一个刚到大学的就能够去和
linux下tomcat开机自启动 bijian1013 tomcat
方法一：修改Tomcat/bin/startup.sh 为: export JAVA_HOME=/home/java1.6.0_27 export CLASSPATH=$CLASSPATH:$JAVA_HOME/lib/tools.jar:$JAVA_HOME/lib/dt.jar:. export PATH=$JAVA_HOME/bin:$PATH export CATALINA_H
spring aop实例 bijian1013 java spring AOP
1.AdviceMethods.java package com.bijian.study.spring.aop.schema; public class AdviceMethods { public void preGreeting() { System.out.println("--how are you!--"); } } 2.beans.x
[Gson八]GsonBuilder序列化和反序列化选项enableComplexMapKeySerialization bit1129 serialization
enableComplexMapKeySerialization配置项的含义 Gson在序列化Map时，默认情况下，是调用Key的toString方法得到它的JSON字符串的Key，对于简单类型和字符串类型，这没有问题，但是对于复杂数据对象，如果对象没有覆写toString方法，那么默认的toString方法将得到这个对象的Hash地址。 GsonBuilder用于
【Spark九十一】Spark Streaming整合Kafka一些值得关注的问题 bit1129 Stream
包括Spark Streaming在内的实时计算数据可靠性指的是三种级别： 1. At most once，数据最多只能接受一次，有可能接收不到 2. At least once, 数据至少接受一次，有可能重复接收 3. Exactly once 数据保证被处理并且只被处理一次，具体的多读几遍http://spark.apache.org/docs/lates
shell脚本批量检测端口是否被占用脚本 ronin47
#!/bin/bash cat ports |while read line do#nc -z -w 10 $line nc -z -w 2 $line 58422>/dev/null2>&1if[ $?-eq 0]then echo $line:ok else echo $line:fail fi done 这里的ports 既可以是文件
java-2.设计包含min函数的栈 bylijinnan java
具体思路参见：http://zhedahht.blog.163.com/blog/static/25411174200712895228171/ import java.util.ArrayList; import java.util.List; public class MinStack { //maybe we can use origin array rathe
Netty源码学习-ChannelHandler bylijinnan java netty
一般来说，“有状态”的ChannelHandler不应该是“共享”的，“无状态”的ChannelHandler则可“共享” 例如ObjectEncoder是“共享”的, 但 ObjectDecoder 不是因为每一次调用decode方法时，可能数据未接收完全（incomplete），它与上一次decode时接收到的数据“累计”起来才有可能是完整的数据，是“有状态”的 p
java生成随机数 cngolon java
方法一： /** * 生成随机数 * @author [email protected] * @return */ public synchronized static String getChargeSequenceNum(String pre){ StringBuffer sequenceNum = new StringBuffer(); Date dateTime = new D
POI读写海量数据 ctrain 海量数据
import java.io.FileOutputStream; import java.io.OutputStream; import org.apache.poi.xssf.streaming.SXSSFRow; import org.apache.poi.xssf.streaming.SXSSFSheet; import org.apache.poi.xssf.streaming
mysql 日期格式化date_format详细使用 daizj mysql date_format 日期格式转换日期格式化
日期转换函数的详细使用说明 DATE_FORMAT(date,format) Formats the date value according to the format string. The following specifiers may be used in the format string. The&n
一个程序员分享8年的开发经验 dcj3sjt126com 程序员
在中国有很多人都认为IT行为是吃青春饭的，如果过了30岁就很难有机会再发展下去!其实现实并不是这样子的，在下从事.NET及JAVA方面的开发的也有8年的时间了，在这里在下想凭借自己的亲身经历，与大家一起探讨一下。明确入行的目的很多人干IT这一行都冲着“收入高”这一点的，因为只要学会一点HTML, DIV+CSS，要做一个页面开发人员并不是一件难事，而且做一个页面开发人员更容
android欢迎界面淡入淡出效果 dcj3sjt126com android
很多Android应用一开始都会有一个欢迎界面，淡入淡出效果也是用得非常多的，下面来实现一下。主要代码如下： package com.myaibang.activity; import android.app.Activity;import android.content.Intent;import android.os.Bundle;import android.os.CountDown
linux 复习笔记之常见压缩命令 eksliang tar解压 linux系统常见压缩命令 linux压缩命令 tar压缩
转载请出自出处:http://eksliang.iteye.com/blog/2109693 linux中常见压缩文件的拓展名 *.gz gzip程序压缩的文件 *.bz2 bzip程序压缩的文件 *.tar tar程序打包的数据，没有经过压缩 *.tar.gz tar程序打包后，并经过gzip程序压缩 *.tar.bz2 tar程序打包后，并经过bzip程序压缩 *.zi
Android 应用程序发送shell命令 gqdy365 android
项目中需要直接在APP中通过发送shell指令来控制lcd灯，其实按理说应该是方案公司在调好lcd灯驱动之后直接通过service送接口上来给APP，APP调用就可以控制了，这是正规流程，但我们项目的方案商用的mtk方案，方案公司又没人会改，只调好了驱动，让应用程序自己实现灯的控制，这不蛋疼嘛！！！！发就发吧！一、关于shell指令：我们知道，shell指令是Linux里面带的
java 无损读取文本文件 hw1287789687 读取文件无损读取读取文本文件 charset
java 如何无损读取文本文件呢？以下是有损的 @Deprecated public static String getFullContent(File file, String charset) { BufferedReader reader = null; if (!file.exists()) { System.out.println("getFull
Firebase 相关文章索引 justjavac firebase
Awesome Firebase 最近谷歌收购Firebase的新闻又将Firebase拉入了人们的视野，于是我做了这个 github 项目。 Firebase 是一个数据同步的云服务，不同于 Dropbox 的「文件」，Firebase 同步的是「数据」，服务对象是网站开发者，帮助他们开发具有「实时」（Real-Time）特性的应用。开发者只需引用一个 API 库文件就可以使用标准 RE
C++学习重点 lx.asymmetric C++笔记
1.c++面向对象的三个特性：封装性，继承性以及多态性。 2.标识符的命名规则：由字母和下划线开头，同时由字母、数字或下划线组成；不能与系统关键字重名。 3.c++语言常量包括整型常量、浮点型常量、布尔常量、字符型常量和字符串性常量。 4.运算符按其功能开以分为六类：算术运算符、位运算符、关系运算符、逻辑运算符、赋值运算符和条件运算符。 &n
java bean和xml相互转换 q821424508 java bean xml xml和bean转换 java bean和xml转换
这几天在做微信公众号做的过程中想找个java bean转xml的工具，找了几个用着不知道是配置不好还是怎么回事，都会有一些问题，然后脑子一热谢了一个javabean和xml的转换的工具里，自己用着还行，虽然有一些约束吧，还是贴出来记录一下顺便你提一下下，这个转换工具支持属性为集合、数组和非基本属性的对象。 packag
C 语言初级位运算 1140566087 位运算 c
第十章位运算 1、位运算对象只能是整形或字符型数据，在VC6.0中int型数据占4个字节 2、位运算符：运算符作用 ~ 按位求反 << 左移 >> 右移 & 按位与 ^ 按位异或 | 按位或他们的优先级从高到低； 3、位运算符的运算功能： a、按位取反： ~01001101 = 101
14点睛Spring4.1-脚本编程 wiselyman spring4
14.1 Scripting脚本编程脚本语言和java这类静态的语言的主要区别是:脚本语言无需编译,源码直接可运行; 如果我们经常需要修改的某些代码,每一次我们至少要进行编译,打包,重新部署的操作,步骤相当麻烦; 如果我们的应用不允许重启,这在现实的情况中也是很常见的; 在spring中使用脚本编程给上述的应用场景提供了解决方案,即动态加载bean; spring支持脚本

强化学习-随机策略梯度（Policy-Base）

你可能感兴趣的:(数学方法和原理,人工智能,强化学习,深度学习,算法,机器学习)