天寒心亦热

Unity-ML-Agents-代码解读-RollerBall

使用版本：https://github.com/Unity-Technologies/ml-agents/releases/tag/release_19

文件路径：ml-agents-release_19/docs/Learning-Environment-Create-New.md

20和19的在rollerBall上一样：https://github.com/Unity-Technologies/ml-agents/blob/develop/docs/Learning-Environment-Create-New.md

本文只涉及代码解析，对于unity的对应操作请看相应文档

1. Initialization and Resetting the Agent

1.1 代码总括

1.2 代码分解

1.2.1 导入包和命名空间

1.2.2 this.transform.localPosition.y < 0

1.2.3 this.transform.localPosition = new Vector3( 0, 0.5f, 0)

1.2.4 Target.localPosition = new Vector3(Random.value * 8 - 4, 0.5f, Random.value * 8 - 4); }

2. Observing the Environment

2.1 代码总括

2.2 代码分解

2.2.1 public override void CollectObservations(VectorSensor sensor)

2.2.2 sensor.AddObservation(Target.localPosition)

2.2.3 sensor.AddObservation(this.transform.localPosition)这一行代码将

2.2.4 sensor.AddObservation(rBody.velocity.x)

2.2.5 sensor.AddObservation(rBody.velocity.z)

3. Taking Actions and Assigning Rewards

3.1 代码总括

3.2 代码分解

3.2.1 public float forceMultiplier = 10

3.2.2 public override void OnActionReceived(ActionBuffers actionBuffers)

3.2.3 controlSignal.x = actionBuffers.ContinuousActions[0]

3.2.4 float distanceToTarget = Vector3.Distance(this.transform.localPosition, Target.localPosition)

4.问题

4.1 报错

4.1.1 解决报错1

4.1.2 解决报错2

4.2智能体移动的连续动作和离散动作

1. Initialization and Resetting the Agent

1.1 代码总括

using System.Collections.Generic; // 导入命名空间 System.Collections.Generic
using UnityEngine; // 导入 Unity 引擎的命名空间
using Unity.MLAgents; // 导入 Unity 引擎的 Machine Learning Agents（ML-Agents）的命名空间
using Unity.MLAgents.Sensors; // 导入 Unity 引擎的 ML-Agents 的 Sensors 的命名空间

public class RollerAgent : Agent // 声明一个 RollerAgent 类，继承自 Agent 类
{
    Rigidbody rBody; // 声明一个 Rigidbody 类型的变量 rBody

    void Start () { // 声明一个 Start 方法，当脚本启动时会执行该方法
        rBody = GetComponent(); // 获取当前 GameObject 的 Rigidbody 组件
    }

    public Transform Target; // 声明一个 Transform 类型的公共变量 Target，用于储存目标物体的位置信息

    public override void OnEpisodeBegin() // 重写 OnEpisodeBegin 方法
    {
       // 如果智能体掉落，则将其动量归零
        if (this.transform.localPosition.y < 0)
        {
            this.rBody.angularVelocity = Vector3.zero;
            this.rBody.velocity = Vector3.zero;
            this.transform.localPosition = new Vector3( 0, 0.5f, 0); // 将智能体放在起点
        }

        // 将目标物体移动到新的位置
        Target.localPosition = new Vector3(Random.value * 8 - 4, 0.5f, Random.value * 8 - 4);
    }
}

这段代码是一个简单的机器学习智能体（RollerAgent），用于学习如何控制一个球体移动到场景中随机位置的目标点。其中，using 语句用于导入所需的命名空间，public 关键字用于声明公共变量，Start 方法是 Unity 引擎中的一个特殊方法，当脚本启动时会自动执行，OnEpisodeBegin 方法则是重写了 Agent 类的该方法，用于在每个新的 episode（一次训练）开始时执行。

1.2 代码分解

1.2.1 导入包和命名空间

using System.Collections.Generic; // 导入命名空间 System.Collections.Generic
using UnityEngine; // 导入 Unity 引擎的命名空间
using Unity.MLAgents; // 导入 Unity 引擎的 Machine Learning Agents（ML-Agents）的命名空间
using Unity.MLAgents.Sensors // 导入 Unity 引擎的 ML-Agents 的 Sensors 的命名空间

using System.Collections.Generic 是一个 C# 中的命名空间，用于提供实现各种通用集合数据结构的类型。在使用 C# 中的 List、Dictionary 等数据结构时需要使用该命名空间。例如，当需要使用 List 类型时，需要在代码文件的头部使用 using System.Collections.Generic; 声明该命名空间。

using UnityEngine 是 C# 编程语言中的一个关键字，用于引入 Unity 引擎的命名空间，使得在代码中可以直接使用 Unity 引擎提供的类和方法。这些类和方法包括用于创建游戏对象、控制游戏对象的位置、旋转、缩放、碰撞检测等等，以及访问 Unity 引擎中的其他功能。

Unity.MLAgents 是 Unity 官方提供的一个工具包，用于支持在 Unity 中训练机器学习模型，尤其是用于支持强化学习算法的训练。其中包含了许多用于强化学习的组件和类。通过使用这个工具包，开发者可以快速地在 Unity 中构建强化学习场景，训练自己的智能体，以及评估和部署训练好的模型。

using Unity.MLAgents.Sensors 引入了用于创建智能体感知信息的 ML-Agents 的 Sensor 类和相关组件。感知信息由智能体的观测(observation)和其他一些信息(如reward等)组成，用于训练智能体进行决策。该命名空间包含了许多不同类型的Sensor，例如VisualSensor和RayPerceptionSensor等，这些Sensor可用于感知不同类型的环境。

1.2.2 this.transform.localPosition.y < 0

this.transform.localPosition.y < 0

这段代码用于检测智能体在环境中是否跌落。具体地，它检查智能体的本地坐标（local position）的y值是否小于0，如果是，说明智能体已经跌落到地面以下。

1.2.3 this.transform.localPosition = new Vector3( 0, 0.5f, 0)

this.transform.localPosition = new Vector3( 0, 0.5f, 0)

this.transform.localPosition = new Vector3( 0, 0.5f, 0) 是将当前游戏对象的本地坐标设置为 (0, 0.5, 0)。其中 localPosition 是相对于父物体坐标系的位置，因此将其设置为 (0, 0.5, 0) 会将游戏对象相对于其父物体向上移动 0.5 个单位。

问：this.transform.localPosition 中的this ？

在这里，this指代当前脚本所在的游戏对象，即关键字this代表当前类的实例。transform是每个GameObject对象上都有的一个组件，表示该对象的变换组件，可以控制对象的位置、旋转和缩放等属性。localPosition是变换组件中的一个属性，表示对象相对于其父对象的本地坐标。因此，this.transform.localPosition指代当前对象相对于其父对象的本地坐标。

this 表示当前脚本实例所在的游戏对象。例如，如果一个脚本是挂载在名为 "Player" 的游戏对象上的，那么 this.transform.localPosition 就是指该游戏对象的本地位置。

1.2.4 Target.localPosition = new Vector3(Random.value * 8 - 4, 0.5f, Random.value * 8 - 4); }

Target.localPosition = new Vector3(Random.value * 8 - 4, 0.5f, Random.value * 8 - 4);
    }

这行代码的作用是在每个Episode（一次训练周期）开始时将Target的位置设置为一个新的随机位置。具体来说，它使用Random.value生成一个介于0和1之间的随机值，并将其乘以8。然后，从这个结果中减去4，以使得结果介于-4和4之间。这个结果被用作新位置的X和Z坐标，而Y坐标设置为0.5f。因此，这行代码将随机移动目标的位置，从而使智能体必须适应不同的目标位置来完成任务。

2. Observing the Environment

2.1 代码总括

public override void CollectObservations(VectorSensor sensor)
{
    // 目标点和智能体位置
    sensor.AddObservation(Target.localPosition);
    sensor.AddObservation(this.transform.localPosition);

    // 智能体速度
    sensor.AddObservation(rBody.velocity.x);
    sensor.AddObservation(rBody.velocity.z);
}

public override void CollectObservations(VectorSensor sensor): 重写了父类 Agent 中的 CollectObservations 方法，该方法用于收集智能体的观测数据，VectorSensor 类型的参数 sensor 用于存储观测数据。
sensor.AddObservation(Target.localPosition): 将目标点的位置作为一个观测数据添加到 sensor 中。
sensor.AddObservation(this.transform.localPosition): 将智能体的位置作为一个观测数据添加到 sensor 中。
sensor.AddObservation(rBody.velocity.x): 将智能体在 x 轴方向的速度作为一个观测数据添加到 sensor 中。
sensor.AddObservation(rBody.velocity.z): 将智能体在 z 轴方向的速度作为一个观测数据添加到 sensor 中。

2.2 代码分解

2.2.1 public override void CollectObservations(VectorSensor sensor)

public override void CollectObservations(VectorSensor sensor)

public override void CollectObservations(VectorSensor sensor) 是一个重写了父类 Agent 中的 CollectObservations 方法的公共方法。在这个方法中，我们可以定义 Agent 用于学习的所有观察。这些观察将成为 Agent 的状态信息，并用于在训练过程中决策其行动。

VectorSensor sensor 参数是一个用于添加观察的 VectorSensor 实例。

这个方法的主要目的是向传感器添加观察。这个方法的实现可以根据具体的场景和需求而有所不同。

2.2.2 sensor.AddObservation(Target.localPosition)

sensor.AddObservation(Target.localPosition)

这行代码的作用是将 RollerAgent 脚本中定义的 Target（Unity Transform 组件）的本地位置添加到传感器观察中。在使用机器学习代理训练时，传感器负责向代理提供状态信息，这些信息可以是代理需要了解的任何东西，例如环境中其他物体的位置、速度、颜色等等。通过将目标的位置添加到传感器观察中，代理就可以了解到目标的位置。

2.2.3 sensor.AddObservation(this.transform.localPosition)这一行代码将

sensor.AddObservation(this.transform.localPosition);

这一行代码将 RollerAgent 自身的位置信息添加到 Sensor 中，具体来说，会将该 Agent 在 x、y、z 轴上的本地坐标分别作为 3 个观测值加入 Sensor 中，以供智能体在后续的训练中学习和使用。

2.2.4 sensor.AddObservation(rBody.velocity.x)

sensor.AddObservation(rBody.velocity.x)

这一行代码将 RollerAgent 的刚体在 x 轴上的速度信息添加到 Sensor 中，用于作为智能体的观测值。具体来说，它将 RollerAgent 的刚体在 x 轴上的速度值作为一个观测值加入到 Sensor 中，以供智能体在后续的训练中学习和使用。

问：sensor.AddObservation(rBody.velocity.x)中为什么rBody能代替物体对象本身？

并不是代替物体对象本身，在Unity中，每个游戏对象都有一个或多个组件。这些组件是实现游戏对象功能的核心部分。其中一个常见的组件是Rigidbody，它用于模拟物理行为。在脚本中，可以通过使用GetComponent函数来获取游戏对象上的组件。

在这种情况下，rBody表示与脚本相关联的Rigidbody组件。通过将rBody传递给AddObservation函数，我们可以获取与rBody关联的游戏对象的速度信息，而不是直接获取游戏对象本身。

问：this.Rigidbodey.velocity.x 和 rBody.velocity.x 等价吗？那为什么要用GetComponent函数来获取游戏对象上的组件？

this.Rigidbody.velocity.x 和 rBody.velocity.x 是等价的，它们都是获取了同一个游戏对象上的 Rigidbody 组件，并获取了该组件的 velocity 属性中的 x 值。其中的this指的是当前脚本所在的游戏对象，Rigidbody则是游戏对象上的一个组件，它可以让游戏对象具有物理特性，例如重力、速度等。使用this.Rigidbody可以访问游戏对象上的Rigidbody组件，从而获取其速度属性。

在 Unity 中，每个游戏对象可以添加不同的组件，例如 Rigidbody、Collider、Renderer 等等。这些组件是通过脚本中的 GetComponent 函数来获取的。在脚本中使用 GetComponent 函数可以在运行时动态地获取到游戏对象上的组件，并对组件进行操作，这样就可以方便地对游戏对象进行控制和修改。

问：脚本中使用 GetComponent 函数可以在运行时动态地获取到游戏对象上的组件？能具体举例子吗？

使用 GetComponent 函数可以在 Unity 中的脚本中在运行时动态地获取到游戏对象上的组件。这意味着在游戏运行时，脚本可以通过 GetComponent 函数获取到指定游戏对象上的组件，并对组件进行操作，如读取属性值、调用方法等。这种方式使得脚本可以在运行时与游戏对象的组件进行交互，实现动态控制和修改游戏对象的功能。

假设有一个场景中有一个名为 "Player" 的游戏对象，并且该游戏对象上挂载了一个名为 "PlayerController" 的脚本。在另一个脚本中，我们需要获取 "PlayerController" 组件上的一些信息。我们可以这样写：

// 在另一个脚本中使用 GetComponent 函数获取 "PlayerController" 组件
PlayerController playerController = GameObject.Find("Player").GetComponent();
// 使用 playerController 对象来访问 "PlayerController" 组件的方法和属性
playerController.Move();

在这个例子中，我们使用 GameObject.Find 函数获取名为 "Player" 的游戏对象，然后使用 GetComponent 函数获取该游戏对象上挂载的 "PlayerController" 组件，并将其赋值给 playerController 变量。然后，我们就可以使用 playerController 对象来访问 "PlayerController" 组件的方法和属性了。这样就可以在运行时动态地获取到游戏对象上的组件。

2.2.5 sensor.AddObservation(rBody.velocity.z)

sensor.AddObservation(rBody.velocity.z)

这一行代码将 RollerAgent 的刚体在 z 轴上的速度信息添加到 Sensor 中，用于作为智能体的观测值。具体来说，它将 RollerAgent 的刚体在 z 轴上的速度值作为一个观测值加入到 Sensor 中，以供智能体在后续的训练中学习和使用。

3. Taking Actions and Assigning Rewards

3.1 代码总括

public float forceMultiplier = 10; // 添加一个 public 变量 forceMultiplier，用于调节施加的力的倍数
public override void OnActionReceived(ActionBuffers actionBuffers) // Override 基类 Agent 的 OnActionReceived 方法
{
    // Actions, size = 2
    Vector3 controlSignal = Vector3.zero; // 创建一个大小为 0 的 Vector3 变量 controlSignal
    controlSignal.x = actionBuffers.ContinuousActions[0]; // 将连续控制输入的第一个元素赋值给 controlSignal 的 x 分量
    controlSignal.z = actionBuffers.ContinuousActions[1]; // 将连续控制输入的第二个元素赋值给 controlSignal 的 z 分量
    rBody.AddForce(controlSignal * forceMultiplier); // 施加力，乘以 forceMultiplier 调节施加力的大小

    // Rewards
    float distanceToTarget = Vector3.Distance(this.transform.localPosition, Target.localPosition); // 计算 Agent 与 Target 之间的距离

    // Reached target
    if (distanceToTarget < 1.42f) // 如果 Agent 到达了 Target 的范围内（1.42f 是指一个单位立方体的对角线长度）
    {
        SetReward(1.0f); // 奖励 Agent
        EndEpisode(); // 结束 episode
    }

    // Fell off platform
    else if (this.transform.localPosition.y < 0) // 如果 Agent 掉下了平台
    {
        EndEpisode(); // 结束 episode
    }
}

这段代码是 RollerAgent 类的 OnActionReceived 方法，主要是处理智能体的行动和奖励等逻辑。在该方法中，首先解析智能体的行动，将其转换成控制信号，然后通过给定的力量系数将其施加在 RollerAgent 的刚体上。然后，根据智能体距离目标的距离计算奖励。如果智能体到达目标位置，则奖励为 1，并结束该 episode；如果 RollerAgent 掉落出平台，则直接结束该 episode。

为了解决向目标移动的任务，Agent (Sphere)需要能够在x和z方向上移动。因此，代理需要两个动作:第一个决定沿x轴施加的力;第二个决定了作用在z轴上的力。(如果我们允许Agent在三维空间中移动，那么我们就需要第三个动作。)

3.2 代码分解

3.2.1 public float forceMultiplier = 10

public float forceMultiplier = 10

这段代码定义了一个名为forceMultiplier的公共变量，并将其初始化为10。该变量的作用是控制代理施加的力的强度。

3.2.2 public override void OnActionReceived(ActionBuffers actionBuffers)

public override void OnActionReceived(ActionBuffers actionBuffers)

OnActionReceived 是 Agent 类的方法，表示 Agent 接收到一个 action 后需要执行的操作。在这个 RollerAgent 脚本中，它用于接收动作向量，并对其进行处理。

参数 actionBuffers 是一个 ActionBuffers 对象，代表着一个动作向量。此处的动作向量是一个连续的向量，包含两个浮点数，分别表示在 x 轴和 z 轴上的控制力。

因此，该函数的主要功能是对 actionBuffers 进行解析，并将其转化为 controlSignal 控制力，再将该力传递给物理引擎，以使得 RollerAgent 在场景中移动。

3.2.3 controlSignal.x = actionBuffers.ContinuousActions[0]

    Vector3 controlSignal = Vector3.zero; // 创建一个大小为 0 的 Vector3 变量 controlSignal
    controlSignal.x = actionBuffers.ContinuousActions[0]; // 将连续控制输入的第一个元素赋值给 controlSignal 的 x 分量
    controlSignal.z = actionBuffers.ContinuousActions[1]; // 将连续控制输入的第二个元素赋值给 controlSignal 的 z 分量
    rBody.AddForce(controlSignal * forceMultiplier); // 施加力，乘以 forceMultiplier 调节施加力的大小

RollerAgent使用Rigidbody. addforce()将action[]数组中的值应用到它的Rigidbody组件rBody上:

这行代码定义了一个名为controlSignal的Vector3类型变量，初始值为(0,0,0)，用于存储代理（Agent）的操作信号。Vector3.zero通常代表3D向量或点类或结构中的零向量，通常表示为(0, 0, 0)。在许多编程语言和库中，包括Unity3D，Vector3.zero是一个缩写或常量，可以用来创建所有分量初始化为零的新3D向量或点。

Vector3 myVector = Vector3.zero; // 创建一个新的Vector3，x = 0，y = 0，z = 0

这行代码将第一个连续动作的值设置为控制信号向量controlSignal的x分量。actionBuffers.ContinuousActions[0]获取代理的第一个连续动作的值。在这个RollerBall例子中，代理有两个连续动作，每个动作的值范围在-1到1之间，代表x和z轴上的力量。

这行代码设置了控制信号的z轴分量，它的值从ActionBuffers中获取，index为1，代表模型的前后运动方向。具体来说，模型根据这个分量来决定是向前还是向后运动。

这行代码是将计算出来的控制向量controlSignal乘上一个forceMultiplier系数，然后通过调用AddForce函数对物体施加一个力的作用，从而实现对RollerAgent物体的控制。在这个环境下，RollerAgent物体被控制的目标是移动到一个随机移动的目标位置。

注意，forcMultiplier 类变量是在方法定义之前定义的。因为 forcMultiplier 是公共的，所以您可以设置检查器窗口中的值。

3.2.4 float distanceToTarget = Vector3.Distance(this.transform.localPosition, Target.localPosition)

float distanceToTarget = Vector3.Distance(this.transform.localPosition, Target.localPosition)

这段代码计算当前Agent和目标物体之间的距离，使用的是Vector3.Distance()方法，它返回两个向量之间的欧几里得距离（也称为长度）。

具体地说，它使用当前Agent位置this.transform.localPosition和目标物体位置Target.localPosition作为两个向量的参数，计算它们之间的距离，并将结果赋值给变量distanceToTarget。

4.问题

4.1 报错

4.1.1 解决报错1

这是在 Testing the Environment 的时候出现的问题，并不是实质意义上的报错，通过方向键可以控制agent，可以实现测试。

Couldn't connect to trainer on port 5004 using API version 1.5.0. Will perform inference instead.
UnityEngine.Debug:Log (object)
Unity.MLAgents.Academy:InitializeEnvironment () (at E:/ml-agents-release_19/com.unity.ml-agents/Runtime/Academy.cs:467)
Unity.MLAgents.Academy:LazyInitialize () (at E:/ml-agents-release_19/com.unity.ml-agents/Runtime/Academy.cs:286)
Unity.MLAgents.Academy:.ctor () (at E:/ml-agents-release_19/com.unity.ml-agents/Runtime/Academy.cs:255)
Unity.MLAgents.Academy/<>c:<.cctor>b__86_0 () (at E:/ml-agents-release_19/com.unity.ml-agents/Runtime/Academy.cs:117)
System.Lazy`1:get_Value ()
Unity.MLAgents.Academy:get_Instance () (at E:/ml-agents-release_19/com.unity.ml-agents/Runtime/Academy.cs:132)
Unity.MLAgents.DecisionRequester:Awake () (at E:/ml-agents-release_19/com.unity.ml-agents/Runtime/DecisionRequester.cs:57)

无法使用 API 版本 1.5.0 连接到端口 5004 上的训练器，将执行推断。在环境上执行 Academy 初始化，创建一个未初始化的单例实例。这是在 Unity.MLAgents.Academy.InitializeEnvironment() 和 Unity.MLAgents.Academy.LazyInitialize() 方法中完成的。在这段代码中，会通过访问 Unity.MLAgents.Academy.Instance 获取单例实例。当 DecisionRequester 对象被唤醒时，会触发 Unity.MLAgents.DecisionRequester.Awake() 方法。

这个错误提示说明 Unity ML-Agents 无法连接到本地端口 5004 的 Trainer，通常这是因为没有正确启动 Trainer。如果你没有启动 Trainer，可以忽略这个错误，Unity ML-Agents 将会自动切换到 Inference 模式，仍然可以在 Unity 中进行 Agent 行为的模拟和可视化。

如果你已经启动了 Trainer，那么请确保 Trainer 的端口号和 Unity 中 Academy 的端口号一致。你可以在 Unity 编辑器中的 ML-Agents 设置中查看 Academy 端口号，并在 Trainer 启动时指定相同的端口号。

4.1.2 解决报错2

[INFO] Listening on port 5004. Start training by pressing the Play button in the Unity Editor.
[INFO] Connected to Unity environment with package version 2.2.1-exp.1 and communication version 1.5.0
Traceback (most recent call last):
  File "D:\RuanJianAnZhunangWeiZhi\anaconda\anaconda3\envs\mlagents\Scripts\mlagents-learn-script.py", line 33, in 
    sys.exit(load_entry_point('mlagents', 'console_scripts', 'mlagents-learn')())
  File "e:\ml-agents-release_19\ml-agents\mlagents\trainers\learn.py", line 260, in main
    run_cli(parse_command_line())
  File "e:\ml-agents-release_19\ml-agents\mlagents\trainers\learn.py", line 256, in run_cli
    run_training(run_seed, options, num_areas)
  File "e:\ml-agents-release_19\ml-agents\mlagents\trainers\learn.py", line 132, in run_training
    tc.start_learning(env_manager)
  File "e:\ml-agents-release_19\ml-agents-envs\mlagents_envs\timers.py", line 305, in wrapped
    return func(*args, **kwargs)
  File "e:\ml-agents-release_19\ml-agents\mlagents\trainers\trainer_controller.py", line 173, in start_learning
    self._reset_env(env_manager)
  File "e:\ml-agents-release_19\ml-agents-envs\mlagents_envs\timers.py", line 305, in wrapped
    return func(*args, **kwargs)
  File "e:\ml-agents-release_19\ml-agents\mlagents\trainers\trainer_controller.py", line 105, in _reset_env
    env_manager.reset(config=new_config)
  File "e:\ml-agents-release_19\ml-agents\mlagents\trainers\env_manager.py", line 68, in reset
    self.first_step_infos = self._reset_env(config)
  File "e:\ml-agents-release_19\ml-agents\mlagents\trainers\subprocess_env_manager.py", line 446, in _reset_env
    ew.previous_step = EnvironmentStep(ew.recv().payload, ew.worker_id, {}, {})
  File "e:\ml-agents-release_19\ml-agents\mlagents\trainers\subprocess_env_manager.py", line 101, in recv
    raise env_exception
mlagents_envs.exception.UnityTimeOutException: The Unity environment took too long to respond. Make sure that :
         The environment does not need user interaction to launch
         The Agents' Behavior Parameters > Behavior Type is set to "Default"
         The environment and the Python interface have compatible versions.
         If you're running on a headless server without graphics support, turn off display by either passing --no-graphics option or build your Unity executable as server build.

这个错误信息表明 Unity 环境没有响应，可能是因为以下原因之一：

确保环境不需要用户交互才能启动。
确保代理的行为参数 > 行为类型设置为 "Default"。
确保环境和 Python 接口版本兼容。
如果您正在运行无图形支持的无头服务器，请通过传递 --no-graphics 选项或构建 Unity 可执行文件作为服务器构建来关闭显示。

解决方式就是错误原因的第二点，确保代理的行为参数 > 行为类型设置为 "Default"。

是因为在测试的时候，将Behavior Type 设置成了Heuristic Only（仅启用启发式），训练时需要设置成default。

4.2智能体移动的连续动作和离散动作

在强化学习（Reinforcement Learning）中，智能体（Agent）通常需要根据当前环境状态做出动作来实现特定的目标。这些动作可以分为连续动作和离散动作两种类型。

连续动作（Continuous Actions）指的是智能体可以在一个连续的动作空间内选择动作，通常是一个实数范围内的值。例如，在一个自动驾驶汽车的控制问题中，连续动作可能包括控制车辆的加速度、刹车力度和转向角度等。连续动作可以有无限多的可能性，需要在连续范围内进行选择，通常通过一个连续函数来表示动作选择的策略。

离散动作（Discrete Actions）指的是智能体在有限的动作选项中进行选择，通常是一个离散的动作空间。例如，在一个电子游戏中，离散动作可能包括向左移动、向右移动、跳跃、攻击等动作。离散动作通常通过一个离散的动作空间来表示，例如一个离散的动作索引或一个独热编码的向量。

在强化学习中，智能体根据当前的环境状态选择动作，并通过与环境的交互来学习最优的动作策略。对于连续动作，智能体需要通过对连续动作空间进行采样或者使用优化算法来选择合适的动作。而对于离散动作，智能体可以通过在离散动作空间中选择具体的动作进行决策。

不同类型的动作空间（连续或离散）在强化学习中具有不同的特点和应用场景，需要根据具体问题的需求和环境的特性来选择合适的动作表示方式。

你可能感兴趣的:(深度强化学习,unity,Ml-Agents,unity,深度学习,强化学习,深度强化学习,ML-Agents)

自然语言模型（NLP）介绍 Liudef06 Stable Diffusion 自然语言处理人工智能
一、自然语言模型概述自然语言模型（NLP）通过模拟人类语言理解和生成能力，已成为人工智能领域的核心技术。近年来，以DeepSeek、GPT-4、Claude等为代表的模型在技术突破和应用场景上展现出显著优势。例如，DeepSeek通过强化学习提升推理能力，其混合专家架构（MoE）显著优化了计算效率‌。二、核心技术解析1.DeepSeek模型架构混合专家模型（MoE）：DeepSeek-V3采用Mo
Python深度学习实践：神经网络在异常检测中的应用 AI天才研究院 AI大模型企业级应用开发实战 Python实战 DeepSeek R1 &大数据AI人工智能大模型 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
Python深度学习实践：神经网络在异常检测中的应用关键词：深度学习，神经网络，异常检测，Python，TensorFlow，PyTorch，模型优化，实战案例摘要：本文深入探讨了深度学习在异常检测领域的应用。通过Python实现的神经网络，本文介绍了深度学习的基本概念、核心算法、模型优化方法，并提供了详细的实战案例，包括数据预处理、模型训练和评估。读者将了解如何使用深度学习技术检测金融欺诈、网络
《深度学习实战》第12集：大模型的未来与行业应用带娃的IT创业者深度学习实战深度学习
深度学习实战|第12集：大模型的未来与行业应用随着深度学习技术的快速发展，大模型（如GPT、LLaMA、Bloom等）已经成为人工智能领域的核心驱动力。本篇博客将探讨大模型的发展趋势及其在医疗、金融、教育等行业的实际应用，并通过2个实战项目展示如何使用开源大模型构建问答系统。此外，我们还会分析大模型的前沿技术方向。图示：大模型发展历程与行业应用场景1.大模型发展历程图以下是大模型从早期到现在的关键
深度学习突破：LLaMA-MoE模型的高效训练策略人工智能大模型讲师培训咨询叶梓深度学习 llama 人工智能 Llama-Moe 大模型语言模型
在人工智能领域，大模型（LLM）的崛起带来了前所未有的进步，但随之而来的是巨大的计算资源需求。为了解决这一问题，Mixture-of-Expert（MoE）模型架构应运而生，而LLaMA-MoE正是这一架构下的重要代表。LLaMA-MoE是一种基于LLaMA系列和SlimPajama的MoE模型，它通过将LLaMA的前馈网络（FFNs）划分为稀疏专家，并为每层专家插入top-K个门，从而显著减小模
深度学习day1 孤城laugh 深度学习人工智能笔记学习机器学习
深度学习day11.深度学习与机器学习的区别1.1特征提取方面1.2数据量与计算性能要求1.3算法代表2.深度学习框架之TensorFlow2.1TensorFlow基础2.2TensorFlow基础知识1.**张量（Tensor）**：多维数组、多维列表2.**变量（Variable）**：用于表示程序处理的共享持久状态3.**图与函数**4.**可视化学习（TensorBoard）**：用来展
深度学习现状与未来发展趋势分析报告（深度学习还是主流吗？）与光同尘大道至简深度学习人工智能
此博客分析深度学习当前的主流应用领域、其受关注度的变化趋势、可能的技术替代或补充方案、产业界和学术界的不同发展方向，以及影响其受关注度变化的核心因素。报告将包括结构化分析（背景、现状、挑战、未来趋势）、数据驱动（市场趋势、论文发表量等数据支持）以及行业案例分析，以展示某些行业如何逐步减少对深度学习的依赖。背景深度学习的概念与发展历程：深度学习（DeepLearning）是机器学习中的一类方法，源于
Unity中用泛型实现单例天天进步2015 游戏开发 unity 游戏引擎
引言在游戏开发中，单例模式是一种常用的设计模式，它确保一个类只有一个实例，并提供一个全局访问点。在Unity开发中，单例模式尤为重要，因为它可以帮助我们管理游戏中的全局状态、资源和服务。本文将介绍如何在Unity中使用泛型来实现单例模式，这种方法不仅简洁高效，而且可以减少重复代码，提高代码的可维护性。单例模式基础在深入泛型实现之前，让我们先回顾一下传统的单例模式实现：publicclassGame
Python项目-基于深度学习的校园人脸识别考勤系统天天进步2015 Python项目实战 python
引言随着人工智能技术的快速发展，深度学习在计算机视觉领域的应用日益广泛。人脸识别作为其中的一个重要分支，已经在安防、金融、教育等多个领域展现出巨大的应用价值。本文将详细介绍如何使用Python和深度学习技术构建一个校园人脸识别考勤系统，该系统能够自动识别学生身份并记录考勤信息，大大提高了考勤效率，减轻了教师的工作负担。系统概述功能特点实时人脸检测与识别：能够从摄像头视频流中实时检测并识别人脸自动考
Search-o1：智体搜索增强的大型推理模型三谷秋水机器学习大模型人工智能人工智能深度学习机器学习
25年1月来自人大和清华的论文“Search-o1:AgenticSearch-EnhancedLargeReasoningModels”。大型推理模型(LRM)（例如OpenAI-o1）已通过大规模强化学习展示长步推理能力。然而，它们的扩展推理过程通常会受到知识不足的影响，从而导致频繁出现不确定性和潜在错误。为了解决这一限制，引入Search-o1，这是一个使用智体检索增强生成(RAG)机制和用
深度解析大模型蒸馏方法：原理、差异与案例赵大仁 AI 人工智能大语言模型人工智能
深度解析大模型蒸馏方法：原理、差异与案例1.引言随着深度学习的飞速发展，大模型（LargeModels）如GPT、BERT、ViT逐渐成为AI领域的主流。然而，这些模型通常参数量庞大，计算开销极高，不适用于移动端或低算力环境。因此，模型蒸馏（KnowledgeDistillation,KD）作为一种模型压缩技术，成为高效部署大模型的重要手段。在本篇文章中，我们将深入探讨不同类型的模型蒸馏方法，并通
基于opencv消除图片马赛克小苗爸爸 opencv 人工智能计算机视觉
以下是一个基于Python的图片马赛克消除函数实现，结合了图像处理和深度学习方法。由于马赛克消除涉及复杂的图像重建任务，建议根据实际需求选择合适的方法：importcv2importnumpyasnpfromPILimportImagedefremove_mosaic(image_path,output_path,method='traditional',block_size=10,scale_f
【AI深度学习基础】Pandas完全指南入门篇：数据处理的瑞士军刀（含完整代码） arbboter 人工智能人工智能深度学习 pandas 数据处理数据分析数据清洗数据分析效率提升
Pandas系列文章导航入门篇进阶篇终极篇一、引言在大数据与AI驱动的时代，数据预处理和分析是深度学习与机器学习的基石。Pandas作为Python生态中最强大的数据处理库，以其灵活的数据结构（如DataFrame和Series）和丰富的功能（数据清洗、转换、聚合等），成为数据科学家和工程师的核心工具。Pandas以Series（一维标签数组）和DataFrame（二维表格）为核心数据结构，提供高
对“预训练”的理解衣衣困深度学习神经网络自然语言处理
预训练有什么用传统的机器学习是偏数学的，对数据的量不做过多要求，而深度学习的项目通常是有大量的数据可供使用。在平常的任务或者项目中，我们可能并没有大量数据，只有少量数据，在这时我们就可以通过“借用”有大数据支持的模型的参数，作为基准，这样就能提高效率和准确率。因为他们神经网络的浅层是相似的，也就是说，在任务相似的情况下，可以用已有的模型即“预训练”好的模型参数实现小数据量的模型训练。预训练可以节省
安装mysql 大霞上仙数据库 mysql 数据库
1、安装数据库下载链接https://downloads.mysql.com/archives/community/下载zip安装包，解压到某个路径下，将bin文件夹添加到系统环境变量。然后终端输入指令mysql--version验证2、初始化数据库打开命令提示符（以管理员身份）。导航到你的MySQL目录的bin文件夹（例如cdC:\mysql\bin）。basedir路径下新建my.ini文件中
赋能农业数字化转型用DeepSeek大模型开启智慧农业新纪元 jingwang-cs 人工智能人工智能后端
赋能农业数字化转型用DeepSeek大模型开启智慧农业新纪元当农业遇见DeepSeek大模型：从经验驱动到数据智能的跨越传统农业依赖“看天吃饭”，而「智慧农业」平台依托公司自主研发的农业大模型，深度融合DeepSeek前沿AI技术，构建“数据-模型-决策”全链路智能服务体系。通过深度学习历史种植数据、气象信息、土壤墒情等多维农业要素，平台可精准预测病虫害风险、产量波动及市场趋势，为农户提供科学种植
强化学习实践 openai gymnasium CartPole-v1 DQN算法实现 abstcol 强化学习深度学习机器学习神经网络
文章目录前言DQN简介环境简介任务实现说开来去我的Github实现：gym（GitHub）本篇博客主要是个人实现过程的主观感受，如果想要使用模型可以直接去GitHub仓库，注释完善且规范。觉得有用请给我点个star！前言最近在学习强化学习，大致过了一遍强化学习的数学原理（视频）。视频讲的很好，但是实践的部分总是感觉有点匮乏（毕竟解决gridworld方格世界（GitHub）的问题的很难给人特别大的
打造高清3D虚拟世界|零基础学习Unity HDRP高清渲染管线（第一天）井队Tell #HDRP 3d 学习 unity
打造高清3D虚拟世界|零基础学习UnityHDRP高清渲染管线（第一天）前言最后前言说真的，用Unity工作这几年，经历的项目大大小小，对于场景的渲染算是有一定的经验，但涉及到HDRP高清渲染管线的了解，真是少之又少，一方面由于现有项目的要求不高，二是HDRP的学习存在一些门槛，所以下定决心，从零开始，每天记录一点点，打造一个属于自己的高清世界！我会从各种渠道，多方面记录，形成笔记，没有什么特殊的
强化学习是否能够在完全不确定的环境中找到一个合理的策略，还是说它只能在已知规则下生效？ concisedistinct 人工智能人工智能强化学习
强化学习（ReinforcementLearning，RL）是机器学习的一个重要分支，广泛应用于机器人控制、自动驾驶、游戏策略和金融决策等领域。其核心理念是通过与环境的互动，不断学习如何选择最优行动以最大化累积奖励。尽管强化学习在许多已知和相对确定的环境中表现出色，但在面对完全不确定或动态变化的环境时，其表现和可靠性是否依然能保持一致是一个值得深入探讨的问题。我们生活的世界充满了不确定性，尤其是在
Unity TMP_InputField 多行输入时的高度适应 2301_79311694 unity
实现设定输入框的行类型为多行新建行。inputField.lineType=TMP_InputField.LineType.MultiLineNewline;进行输入时调整输入框高度。height=inputField.textComponent.preferredHeight+offset;if(height()){inputField.GetComponent().rectTransform.
逐梦旅程：Windows游戏编程之从零开始读后感 wo16pao
读《Windows游戏编程之从零开始》有感我目前是一枚大三的学生，读的是数字媒体专业，在大一大二做过视频、三维动画等方面的内容之后，最终决定还是想学游戏编程方面的东西。在学习了一段时间的C++之后，不知如何开始自己的游戏编程，看过叶神给出的书单之后，本以为有了方向，可是实际上读的时候发现并不是那么回事。在读这本书之前，只知道游戏引擎是类似虚幻4和Unity那样的东西，完全不知道Shader是什么，
为什么UI导入png图会出现白边
1）为什么UI导入png图会出现白边2）升级Unity后产生的Objects泄露现象3）Unity升级后，加载Framework白屏4）如何优化轮廓线比较细的锯齿现象这是第419篇UWA技术知识分享的推送，精选了UWA社区的热门话题，涵盖了UWA问答、社区帖子等技术知识点，助力大家更全面地掌握和学习。UWA社区主页：community.uwa4d.comUWAQQ群：793972859AssetQ
AI创业机遇：垂直领域无限可能 AGI大模型与大数据研究院 DeepSeek R1 &大数据AI人工智能 java python javascript kotlin golang 架构人工智能
AI创业垂直领域机器学习深度学习自然语言处理计算机视觉无人驾驶1.背景介绍人工智能（AI）正在各行各业掀起一场革命，为创业者带来了前所未有的机遇。垂直领域，即特定行业或细分市场，正在成为AI创业的热门选择。本文将深入探讨AI在垂直领域的应用，并提供实用的指南，帮助读者把握AI创业机遇。2.核心概念与联系2.1AI与垂直领域AI在垂直领域的应用，需要理解AI与垂直领域的关系。AI可以为垂直领域提供智
清华大学DeepSeek PPT第二版深度解读：人工智能前沿技术解析 qudongmofashi 人工智能
立即下载完整课件资料点击此处获取最新版PPT一、DeepSeek课件为何值得关注？清华大学出品的DeepSeek系列教学资源，长期聚焦人工智能领域核心技术。第二版PPT从以下方面实现全面升级：AI前沿技术覆盖：涵盖大模型、深度强化学习等领域最新研究进展工业级实践案例：新增多个企业级项目解决方案案例三维知识框架：从算法原理→代码实现→工程部署的全链路解析下载建议：建议保存至本地，结合源码案例同步学习
深度学习代码分析——自用肆—— 深度学习人工智能笔记
代码来自：https://github.com/ChuHan89/WSSS-Tissue?tab=readme-ov-file借助了一些人工智能1_train_stage1.py代码功能总览该代码是弱监督语义分割（WSSS）流程的Stage1训练与测试脚本，核心任务是通过多标签分类模型生成图像级标签，为后续生成伪掩码（Pseudo-Masks）提供基础。代码分为train_phase和test_p
Python | Pytorch | Tensor知识点总结漂亮_大男孩 Python拾遗 python pytorch 深度学习人工智能
如是我闻：Tensor是我们接触Pytorch了解到的第一个概念，这里是一个关于PyTorchTensor主题的知识点总结，涵盖了Tensor的基本概念、创建方式、运算操作、梯度计算和GPU加速等内容。1.Tensor基本概念Tensor是PyTorch的核心数据结构，类似于NumPy的ndarray，但支持GPU加速和自动求导。PyTorch的Tensor具有动态计算图，可用于深度学习模型的前向
PyTorch 中结合迁移学习和强化学习的完整实现方案小赖同学啊人工智能 pytorch 迁移学习人工智能
结合迁移学习（TransferLearning）和强化学习（ReinforcementLearning,RL）是解决复杂任务的有效方法。迁移学习可以利用预训练模型的知识加速训练，而强化学习则通过与环境的交互优化策略。以下是如何在PyTorch中结合迁移学习和强化学习的完整实现方案。1.场景描述假设我们有一个任务：训练一个机器人手臂抓取物体。我们可以利用迁移学习从一个预训练的视觉模型（如ResNet
Unity 是否适合初学者学习？ unity
Unity非常适合初学者学习，尤其是那些对游戏开发或实时3D应用开发感兴趣的初学者。以下是Unity适合初学者的几个主要原因：易用性高的可视化编辑器Unity的核心优势之一是其强大的可视化编辑器，它提供了直观的界面，让初学者能够快速上手。以下是具体特点：拖拽式操作：初学者可以通过拖拽组件、对象和脚本，快速搭建游戏场景或应用界面，而无需深入代码。实时预览：在编辑器中，初学者可以实时看到修改后的效果，
一文讲清楚自我学习和深度学习平凡而伟大(心之所向) 人工智能人工智能深度学习机器学习
自我学习（Self-Learning）和深度学习（DeepLearning）是两个不同的概念，但它们在某些应用场景中可以有交集。下面我们将分别介绍这两个概念，并探讨如何将它们结合起来用于自我学习系统。自我学习（Self-Learning）自我学习是指个体或系统通过自主探索、实践和反思来获取知识和技能的过程。它强调的是无需外部直接指导的学习方式，通常包括以下几个方面：自主性：学习者根据自己的兴趣、需
Unity和C++之间的区别 c++
Unity和C++是两种完全不同的技术，它们在开发目标、语言特性、应用场景等方面存在显著区别。以下是它们之间的主要区别：语言特性C++底层语言：C++是一种通用的、静态类型的、自由格式的编程语言，支持过程化编程、面向对象编程和泛型编程。编译型语言：C++代码需要通过编译器编译成机器代码后才能运行，因此执行效率高，但开发周期较长。手动内存管理：C++允许开发者手动管理内存分配和释放，这提供了更高的性
【机器学习】Reinforcement Learning-强化学习基本概念长相忆兮长相忆深度学习人工智能算法机器学习
1、Q值与V值1.1Q值和V值的定义Q值：也称为动作价值函数，评估动作的价值，它代表了智能体选择这个动作后，一直到最终状态奖励总和的期望，表示为Q(s,a)，其中s是状态，a是动作。V值：评估状态的价值，也称为状态价值函数，表示为V(s)，其中s是状态。它代表了智能体在这个状态下，一直到最终状态的奖励总和的期望。V值与动作无关只与状态有关。Q值和V值的概念是一致的，都是衡量在马可洛夫树上某一个节点
312个免费高速HTTP代理IP（能隐藏自己真实IP地址） yangshangchuan 高速免费 superword HTTP代理
124.88.67.20:843 190.36.223.93:8080 117.147.221.38:8123 122.228.92.103:3128 183.247.211.159:8123 124.88.67.35:81 112.18.51.167:8123 218.28.96.39:3128 49.94.160.198:3128 183.20
pull解析和json编码百合不是茶 android pull解析 json
n.json文件: [{name:java,lan:c++,age:17},{name:android,lan:java,age:8}] pull.xml文件 <?xml version="1.0" encoding="utf-8"?> <stu> <name>java
[能源与矿产]石油与地球生态系统 comsci 能源
按照苏联的科学界的说法,石油并非是远古的生物残骸的演变产物,而是一种可以由某些特殊地质结构和物理条件生产出来的东西,也就是说,石油是可以自增长的.... 那么我们做一个猜想: 石油好像是地球的体液,我们地球具有自动产生石油的某种机制,只要我们不过量开采石油,并保护好
类与对象浅谈沐刃青蛟 java 基础
类，字面理解，便是同一种事物的总称，比如人类，是对世界上所有人的一个总称。而对象，便是类的具体化，实例化，是一个具体事物，比如张飞这个人，就是人类的一个对象。但要注意的是：张飞这个人是对象，而不是张飞，张飞只是他这个人的名字，是他的属性而已。而一个类中包含了属性和方法这两兄弟，他们分别用来描述对象的行为和性质（感觉应该是
新站开始被收录后，我们应该做什么？ IT独行者 PHP seo
新站开始被收录后，我们应该做什么？百度终于开始收录自己的网站了，作为站长，你是不是觉得那一刻很有成就感呢，同时，你是不是又很茫然，不知道下一步该做什么了？至少我当初就是这样，在这里和大家一份分享一下新站收录后，我们要做哪些工作。至于如何让百度快速收录自己的网站，可以参考我之前的帖子《新站让百
oracle 连接碰到的问题文强chu oracle
Unable to find a java Virtual Machine－－安装64位版Oracle11gR2后无法启动SQLDeveloper的解决方案作者：草根IT网来源：未知人气：813标签：导读：安装64位版Oracle11gR2后发现启动SQLDeveloper时弹出配置java.exe的路径，找到Oracle自带java.exe后产生的路径“C:\app\用户名\prod
Swing中按ctrl键同时移动鼠标拖动组件（类中多借口共享同一数据）小桔子 java 继承 swing 接口监听
都知道java中类只能单继承，但可以实现多个接口，但我发现实现多个接口之后，多个接口却不能共享同一个数据，应用开发中想实现：当用户按着ctrl键时，可以用鼠标点击拖动组件，比如说文本框。编写一个监听实现KeyListener,NouseListener,MouseMotionListener三个接口，重写方法。定义一个全局变量boolea
linux常用的命令 aichenglong linux 常用命令
1 startx切换到图形化界面 2 man命令:查看帮助信息 man 需要查看的命令,man命令提供了大量的帮助信息,一般可以分成4个部分 name:对命令的简单说明 synopsis:命令的使用格式说明 description:命令的详细说明信息 options:命令的各项说明 3 date:显示时间语法：date [OPTION]... [+FORMAT]
eclipse内存优化 AILIKES java eclipse jvm jdk
一基本说明在JVM中，总体上分2块内存区,默认空余堆内存小于 40%时，JVM就会增大堆直到-Xmx的最大限制；空余堆内存大于70%时，JVM会减少堆直到-Xms的最小限制。 1)堆内存(Heap memory):堆是运行时数据区域，所有类实例和数组的内存均从此处分配,是Java代码可及的内存，是留给开发人
关键字的使用探讨百合不是茶关键字
//关键字的使用探讨/*访问关键词private 只能在本类中访问public 只能在本工程中访问protected 只能在包中和子类中访问默认的只能在包中访问*//*final 类方法变量 final 类不能被继承 final 方法不能被子类覆盖，但可以继承 final 变量只能有一次赋值，赋值后不能改变 final 不能用来修饰构造方法*///this()
JS中定义对象的几种方式 bijian1013 js
1. 基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)： <html> <head> <title>基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)</title> </head> <script> var obj = new Object();
表驱动法实例 bijian1013 java 表驱动法 TDD
获得月的天数是典型的直接访问驱动表方式的实例，下面我们来展示一下： MonthDaysTest.java package com.study.test; import org.junit.Assert; import org.junit.Test; import com.study.MonthDays; public class MonthDaysTest { @T
LInux启停重启常用服务器的脚本 bit1129 linux
启动，停止和重启常用服务器的Bash脚本，对于每个服务器，需要根据实际的安装路径做相应的修改 #! /bin/bash Servers=(Apache2, Nginx, Resin, Tomcat, Couchbase, SVN, ActiveMQ, Mongo); Ops=(Start, Stop, Restart); currentDir=$(pwd); echo
【HBase六】REST操作HBase bit1129 hbase
HBase提供了REST风格的服务方便查看HBase集群的信息，以及执行增删改查操作 1. 启动和停止HBase REST 服务 1.1 启动REST服务前台启动（默认端口号8080） [hadoop@hadoop bin]$ ./hbase rest start 后台启动 hbase-daemon.sh start rest 启动时指定
大话zabbix 3.0设计假设 ronin47
What’s new in Zabbix 2.0? 去年开始使用Zabbix的时候，是1.8.X的版本，今年Zabbix已经跨入了2.0的时代。看了2.0的release notes，和performance相关的有下面几个： :: Performance improvements::Trigger related da
http错误码大全 byalias http协议 javaweb
响应码由三位十进制数字组成，它们出现在由HTTP服务器发送的响应的第一行。响应码分五种类型，由它们的第一位数字表示： 1）1xx：信息，请求收到，继续处理 2）2xx：成功，行为被成功地接受、理解和采纳 3）3xx：重定向，为了完成请求，必须进一步执行的动作 4）4xx：客户端错误，请求包含语法错误或者请求无法实现 5）5xx：服务器错误，服务器不能实现一种明显无效的请求
J2EE设计模式-Intercepting Filter bylijinnan java 设计模式数据结构
Intercepting Filter类似于职责链模式有两种实现其中一种是Filter之间没有联系，全部Filter都存放在FilterChain中，由FilterChain来有序或无序地把把所有Filter调用一遍。没有用到链表这种数据结构。示例如下： package com.ljn.filter.custom; import java.util.ArrayList;
修改jboss端口 chicony jboss
修改jboss端口 %JBOSS_HOME%\server\{服务实例名}\conf\bindingservice.beans\META-INF\bindings-jboss-beans.xml 中找到 <!-- The ports-default bindings are obtained by taking the base bindin
c++ 用类模版实现数组类 CrazyMizzz C++
最近c++学到数组类，写了代码将他实现，基本具有vector类的功能 #include<iostream> #include<string> #include<cassert> using namespace std; template<class T> class Array { public: //构造函数
hadoop dfs.datanode.du.reserved 预留空间配置方法 daizj hadoop 预留空间
对于datanode配置预留空间的方法为：在hdfs-site.xml添加如下配置 <property> <name>dfs.datanode.du.reserved</name> <value>10737418240</value>
mysql远程访问的设置 dcj3sjt126com mysql 防火墙
第一步: 激活网络设置你需要编辑mysql配置文件my.cnf. 通常状况，my.cnf放置于在以下目录： /etc/mysql/my.cnf (Debian linux) /etc/my.cnf （Red Hat Linux/Fedora Linux) /var/db/mysql/my.cnf (FreeBSD) 然后用vi编辑my.cnf，修改内容从以下行： [mysqld] 你所需要: 1
ios 使用特定的popToViewController返回到相应的Controller dcj3sjt126com controller
1、取navigationCtroller中的Controllers NSArray * ctrlArray = self.navigationController.viewControllers; 2、取出后，执行， [self.navigationController popToViewController:[ctrlArray objectAtIndex:0] animated:YES
Linux正则表达式和通配符的区别 eksliang 正则表达式通配符和正则表达式的区别通配符
转载请出自出处：http://eksliang.iteye.com/blog/1976579 首先得明白二者是截然不同的通配符只能用在shell命令中,用来处理字符串的的匹配。判断一个命令是否为bash shell(linux 默认的shell)的内置命令 type -t commad 返回结果含义 file 表示为外部命令 alias 表示该
Ubuntu Mysql Install and CONF gengzg Install
http://www.navicat.com.cn/download/navicat-for-mysql Step1: 下载Navicat ，网址：http://www.navicat.com/en/download/download.html Step2：进入下载目录，解压压缩包：tar -zxvf navicat11_mysql_en.tar.gz
批处理，删除文件bat huqiji windows dos
@echo off ::演示：删除指定路径下指定天数之前（以文件名中包含的日期字符串为准）的文件。 ::如果演示结果无误，把del前面的echo去掉，即可实现真正删除。 ::本例假设文件名中包含的日期字符串（比如：bak-2009-12-25.log） rem 指定待删除文件的存放路径 set SrcDir=C:/Test/BatHome rem 指定天数 set DaysAgo=1
跨浏览器兼容的HTML5视频音频播放器天梯梦 html5
HTML5的video和audio标签是用来在网页中加入视频和音频的标签，在支持html5的浏览器中不需要预先加载Adobe Flash浏览器插件就能轻松快速的播放视频和音频文件。而html5media.js可以在不支持html5的浏览器上使video和audio标签生效。 How to enable <video> and <audio> tags in
Bundle自定义数据传递 hm4123660 android Serializable 自定义数据传递 Bundle Parcelable
我们都知道Bundle可能过put****()方法添加各种基本类型的数据，Intent也可以通过putExtras(Bundle)将数据添加进去，然后通过startActivity()跳到下一下Activity的时候就把数据也传到下一个Activity了。如传递一个字符串到下一个Activity 把数据放到Intent
C＃：异步编程和线程的使用（.NET 4.5 ） powertoolsteam .net 线程 C#异步编程
异步编程和线程处理是并发或并行编程非常重要的功能特征。为了实现异步编程，可使用线程也可以不用。将异步与线程同时讲，将有助于我们更好的理解它们的特征。本文中涉及关键知识点 1. 异步编程 2. 线程的使用 3. 基于任务的异步模式 4. 并行编程 5. 总结异步编程什么是异步操作？异步操作是指某些操作能够独立运行，不依赖主流程或主其他处理流程。通常情况下，C＃程序
spark 查看 job history 日志 Stark_Summer 日志 spark history job
SPARK_HOME/conf 下: spark-defaults.conf 增加如下内容 spark.eventLog.enabled true spark.eventLog.dir hdfs://master:8020/var/log/spark spark.eventLog.compress true spark-env.sh 增加如下内容 export SP
SSH框架搭建 wangxiukai2015eye spring Hibernate struts
MyEclipse搭建SSH框架 Struts Spring Hibernate 1、new一个web project。 2、右键项目，为项目添加Struts支持。选择Struts2 Core Libraries -<MyEclipes-Library> 点击Finish。src目录下多了struts