v_JULY_v

对开源VLA sota π0的微调——如何基于各种开源数据集、以及你自己的私有数据集微调π0(含我司的微调实践)

前言

25年2.4日，几个月前推出π0的公司Physical Intelligence (π)宣布正式开源π0及π0-FAST，如之前所介绍的，他们对用超过 10,000 小时的机器人数据进行了预训练

该GitHub代码仓库「 π0及π0-FAST的GitHub地址：github.com/Physical-Intelligence/openpi」包括4个方面：简言之，就是π0本身的代码和权重、特定平台上特定任务的微调checkpoint、推理代码、微调代码

本文接上一篇文章《π0源码剖析——从π0模型架构的实现(如何基于PaLI-Gemma和扩散策略去噪生成动作)，到基于C/S架构下的模型训练与部署》而来，但本文侧重对π0的微调

第一部分如何基于各种开源数据集微调π0

1.1 π0及π0-FAST对外开源的具体内容

1.1.1 开源基础模型π0及π0-FAST，可自行微调

π0基础模型的代码及权重
可用于微调的扩散π0「标准的预训练π 0模型，该模型在 OXE 和他们的 7 个机器人平台上进行训练」
其对应的checkpoint路径为：s3://openpi-assets/checkpoints/pi0_base
π0-FAST基础模型的代码及权重
可用于微调的π0_FAST——基于FAST分词器的自回归模型
该模型使用FAST tokenizer通过自回归离散化实现控制
它提供了更好的语言跟踪性能，但推理成本更高(根据他们的经验，大约高出 4-5 倍)，如果您更喜欢使用discretization而不是流匹配，这是一个不错的选择

其对应的checkpoint路径为：s3://openpi-assets/checkpoints/pi0_fast_base

1.1.2 已经微调好的模型可直接推理：π0 DROID/π0 ALOHA/π0 Libero

且他们还提供了专门为ALOHA和DROID平台上一些简单任务做了微调的checkpoint，相当于在ALOHA 和 DROID 收集的相对较小的数据集上进行了微调

即several checkpoints that are fine-tuned for a few simple tasks on a few widely available platforms such as ALOHA and DROID，当然，它们可能无法推广到您的特定设置

π0 DROID：在DROID 数据集上微调过的扩散π0
DROID数据集由 Franka 机械臂在不同环境中执行的不同任务组成的开源数据集，且他们通过视频展示了 openpi 在训练数据中从未见过的环境中运行，这些环境遍布世界各地，包括蒙特利尔大学、华盛顿大学、韩国科学技术研究院等

其对应的checkpoint路径为：s3://openpi-assets/checkpoints/pi0_droid
推理速度比π0-FAST-DROID快，但可能不遵循语言命令
π0-FAST DROID：在DROID数据集微调过的π0-FAST
可以在DROID机器人平台上的新场景中执行各种简单的零样本桌面操控任务，例如“从烤面包机中取出面包”任务

其对应的checkpoint路径为：s3://openpi-assets/checkpoints/pi0_fast_droid
π0 ALOHA
根据 ALOHA(适合灵巧操作的低成本双臂系统) 数据进行了微调，可以在ALOHA机器人平台上进行毛巾折叠、食物舀取和其他任务，相当于提供了一套针对 ALOHA 平台上的任务进行微调的检查点「这些检查点可能对整体机器人设置非常敏感，但能够在完全未出现在训练数据中的全新 ALOHA 站点上运行它们」

不同任务对应的不同checkpoint路径分别为
折叠毛巾：s3://openpi-assets/checkpoints/pi0_aloha_towel
从容器中取出食物：s3://openpi-assets/checkpoints/pi0_aloha_tupperware
打开笔帽：s3://openpi-assets/checkpoints/pi0_aloha_pen_uncap
π0 Libero
此检查点针对 Libero 基准进行了微调，并且可以在 Libero 任务上进行开箱即用的评估

1.1.3 模型推理与私有数据自行微调

他们还开源了在多个显示世界和仿真机器人平台上推理运行的示例代码(example code to run inference on several real-world and simulated robot platforms)

以下是跑π0-FAST-DROID模型的预训练检查点

from openpi.training import config
from openpi.policies import policy_config
from openpi.shared import download

config = config.get_config("pi0_fast_droid")
checkpoint_dir = download.maybe_download("s3://openpi-assets/checkpoints/pi0_fast_droid")

# Create a trained policy.
policy = policy_config.create_trained_policy(config, checkpoint_dir)

# Run inference on a dummy example.
example = {
    "observation/exterior_image_1_left": ...,
    "observation/wrist_image_left": ...,
    ...
    "prompt": "pick up the fork"
}
action_chunk = policy.infer(example)["actions"]

且也可以在示例笔记本中测试这一点，他们还提供了在DROID和ALOHA机器人上运行预先训练的检查点的推理的详细分步示例

此外

远程推理：他们提供了示例和代码，用于远程运行模型推理，详见远程运行π0模型
模型可以在不同的服务器上运行，并通过 websocket 连接将操作传输到机器人。这样可以轻松在机器人外使用更强大的 GPU，并将机器人和策略环境分开

要启动远程策略服务器，您只需运行以下命令：
```
uv run scripts/serve_policy.py --env=[DROID | ALOHA | LIBERO]
```
其中，参数env指定哪个π0 checkpoint 应该被加载，比如是ALOHA还是LIBERO。在后台，这个脚本将执行如下命令，你可以使用它来启动策略服务器，例如用于你自己训练的检查点——这里是 DROID 环境的一个示例
```
uv run scripts/serve_policy.py policy:checkpoint --policy.config=pi0_fast_droid --policy.dir=s3://openpi-assets/checkpoints/pi0_fast_droid
```
其中，config这将启动一个策略服务器，该服务器将执行和参数指定的策略dir。该策略将在指定端口(默认值：8000)上执行
无需机器人即可测试推理：提供无需机器人即可测试推理的脚本。此脚本将生成随机观察并使用模型运行推理。有关更多详细信息，请参阅此处

1.2 基于自己的数据集微调π0基础模型

1.2.1 利用Libero数据集微调π0基础模型的三个步骤

此外，他们还提供了用于根据用户自身任务和平台微调π0的代码(code for fine-tuning the base π0 model for your own tasks and platforms)，这个微调π0的代码个人觉得很有价值，且huggingface上有相应的pytorch接口

Physical Intelligence (π)认为，1 到 20 小时的数据足以微调各种任务，具体而言，如果想利用自己的数据上微调π0基础模型，只需以下三个步骤即可：

将Libero数据集转换为LeRobot数据集v2.0格式
作者提供了一个脚本convert_libero_data_to_lerobot.py「下一小节，我会详细分析一下这个脚本」，用于将 Libero 数据转换为 LeRobot 数据集 v2.0 格式，且可以轻松修改它以转换您自己的数据

比如从此处下载原始 Libero 数据集，然后使用以下命令运行脚本
```
uv run examples/libero/convert_libero_data_to_lerobot.py --data_dir /path/to/your/libero/data
```
且作为示例，已将 BiPlay 代码库中的 aloha_pen_uncap_diverse_raw 数据集转换，并将其上传至 HuggingFace Hub，地址为 physical-intelligence/aloha_pen_uncap_diverse
定义使用自定义数据集的训练配置，并运行训练
提供pi0_aloha_pen_uncap 配置作为示例，您应该参考根README以了解如何使用新配置运行训练

比如下面是 Libero 示例配置，可以根据自己的数据集进行修改：
$\rightarrow$ LiberoInputs和LiberoOutputs：定义从 Libero 环境到模型的数据映射，反之亦然——将用于训练和推理
$\rightarrow$ LeRobotLiberoDataConfig：定义了如何处理来自 LeRobot 数据集的原始 Libero 数据以用于训练
$\rightarrow$ TrainConfig：定义微调超参数、数据配置和权重加载器
启动策略服务器并运行推理
训练完成后，可以通过启动策略服务器，然后从 Libero 评估脚本中查询它来运行推理。启动模型服务器很容易（他们在此示例中使用迭代 20,000 的检查点，根据需要进行修改）
```
uv run scripts/serve_policy.py policy:checkpoint --policy.config=pi0_fast_libero --policy.dir=checkpoints/pi0_fast_libero/my_experiment/20000
```

Libero数据集转换脚本convert_libero_data_to_lerobot.py的解析

接下来，我们使用Libero数据集（存储在RLDS格式中）作为示例——将RLDS格式转换为LeRobot格式，如何修改以适应其他自定义格式的数据

首先，咱们明确下Libero数据集的层级结构

Libero数据集
├── libero_10_no_noops/
├── libero_goal_no_noops/
├── libero_object_no_noops/
└── libero_spatial_no_noops/
└── train/
        └── episode
                └── steps
    ├── observation
    │    ├── image (256x256x3)
│ ├── wrist_image (256x256x3)
│   └── state (8维向量)
├── action (7维向量)
└── language_instruction (文本)

接下来，按如下步骤逐一执行
关键常量定义
# 输出数据集名称，也用于Hugging Face Hub
REPO_NAME = "your_hf_username/libero"  
RAW_DATASET_NAMES = [
    "libero_10_no_noops",
    "libero_goal_no_noops",
    "libero_object_no_noops",
    "libero_spatial_no_noops",
]  # 将多个Libero数据集合并为一个训练数据集
定义主函数结构
def main(data_dir: str, *, push_to_hub: bool = False):
主函数接受两个参数：
data_dir: 原始数据目录路径
push_to_hub: 是否推送到HuggingFace Hub的标志
清理现有数据
    output_path = LEROBOT_HOME / REPO_NAME
    if output_path.exists():
        shutil.rmtree(output_path)
确保输出目录干净，删除任何已存在的数据
创建LeRobot数据集：包含处理图像、状态和动作数据
    # 创建LeRobot数据集，定义要存储的特征
    # OpenPi假设本体感知数据存储在`state`中，动作存储在`action`中
    # LeRobot假设图像数据的dtype为`image`
    dataset = LeRobotDataset.create(
        repo_id=REPO_NAME,           # 数据集的仓库ID
        robot_type="panda",          # 机器人类型
        fps=10,                      # 帧率
        features={                   # 特征定义
            "image": {                  # image数据
                "dtype": "image",                             # 数据类型
                "shape": (256, 256, 3),                       # 数据形状
                "names": ["height", "width", "channel"],      # 维度名称
            },
            "wrist_image": {            # 手腕image数据
                "dtype": "image", 
                "shape": (256, 256, 3),  
                "names": ["height", "width", "channel"], 
            },
            "state": {                  # 状态数据
                "dtype": "float32",  
                "shape": (8,), 
                "names": ["state"],  
            },
            "actions": {                # 动作数据
                "dtype": "float32", 
                "shape": (7,),  
                "names": ["actions"],  
            },
        },
        image_writer_threads=10,           # 图像写入线程数
        image_writer_processes=5,          # 图像写入进程数
    )
定义数据集结构，包括：
- 机器人类型：panda
- 帧率：10fps
- 特征定义：
- 图像：256x256x3的RGB图像
- 手腕图像：同样的格式
- 状态：8维浮点数向量
- 动作：7维浮点数向量
- 多线程/进程配置用于图像处理
数据转换循环
    # 遍历原始Libero数据集并将episode写入LeRobot数据集
    # 你可以根据自己的数据格式修改此部分
    for raw_dataset_name in RAW_DATASET_NAMES:
        raw_dataset = tfds.load(raw_dataset_name, data_dir=data_dir, split="train")  # 加载原始数据集
        for episode in raw_dataset:  # 遍历每个episode
            for step in episode["steps"].as_numpy_iterator():      # 遍历每个步骤
                dataset.add_frame(
                    {
                        "image": step["observation"]["image"],      # 添加图像数据
                        "wrist_image": step["observation"]["wrist_image"],  # 添加手腕图像数据
                        "state": step["observation"]["state"],      # 添加状态数据
                        "actions": step["action"],                  # 添加动作数据
                    }
                )
            dataset.save_episode(task=step["language_instruction"].decode())  # 保存episode并解码语言指令
这部分实现了数据转换的核心逻辑：
1. 遍历所有原始数据集
2. 对每个数据集中的每个episode
3. 处理episode中的每一步
4. 保存frame数据和语言指令
数据集的整合与发布
最后的处理步骤：
1. 整合数据集（不计算统计信息）
2. 可选：推送到HuggingFace Hub，包括：
- 添加标签
- 设置为公开
- 包含视频
- 指定许可证
脚本可以通过以下命令运行：
uv run examples/libero/convert_libero_data_to_lerobot.py --data_dir /path/to/your/data
如果要推送到HuggingFace Hub：
uv run examples/libero/convert_libero_data_to_lerobot.py --data_dir /path/to/your/data --push_to_hub
总之，这个脚本展示了如何构建标准化的机器人学习数据集，为训练像Pi0这样的模型提供数据支持

1.2.2 在 UR5 数据集上微调 pi0

// 待更

1.3 安装与运行

1.3.1 如何安装本openpi开源库

要运行此存储库中的模型，需要至少具有以下规格的 NVIDIA GPU。这些估算假设单个 GPU，但您也可以通过fsdp_devices在训练配置中进行配置来使用具有模型并行性的多个 GPU，以减少每个 GPU 的内存要求。另请注意，当前的训练脚本尚不支持多节点训练

模式	所需内存	示例 GPU
推理	> 8 GB	RTX 4090
微调（LoRA）	> 22.5 GB	RTX 4090
微调（完整版）	> 70 GB	A100（80GB）/H100

PS，他们说该 repo 已在 Ubuntu 22.04 上测试过，其他操作系统可能不支持

以下是安装过程

克隆此 repo 时，请确保更新子模块：

git clone --recurse-submodules [email protected]:Physical-Intelligence/openpi.git

# Or if you already cloned the repo:
git submodule update --init --recursive

使用uv来管理 Python 依赖项。可参阅uv 安装说明进行设置
安装 uv 后，运行以下命令设置环境：
```
GIT_LFS_SKIP_SMUDGE=1 uv sync
```
注意：GIT_LFS_SKIP_SMUDGE=1需要将 LeRobot 作为依赖项
Docker：作为 uv 安装的替代方案，他们还提供了使用 Docker 安装 openpi 的说明
如果在系统设置中遇到问题，还可以考虑使用 Docker 来简化安装，详情请参阅Docker 设置

2.3.2 如何把该库的ALOHA sim环境跑起来

此外，该开源库还提供ALOHA SIM

如使用docker

export SERVER_ARGS="--env ALOHA_SIM"
docker compose -f examples/aloha_sim/compose.yml up --build

如没有docker，则采用C/S架构「我在上一篇文章中也解读过了这个C/S架构了，详见此文的《π0源码剖析——从π0模型架构的实现(如何基于PaLI-Gemma和扩散策略去噪生成动作)，到基于C/S架构下的模型训练与部署》的第三部分模型的训练与部署：基于客户端-服务器C/S架构」
终端窗口1：建立策略客户端
```
# Create virtual environment
uv venv --python 3.10 examples/aloha_sim/.venv
source examples/aloha_sim/.venv/bin/activate
uv pip sync examples/aloha_sim/requirements.txt
uv pip install -e packages/openpi-client

# Run the simulation
MUJOCO_GL=egl python examples/aloha_sim/main.py
```
注意：如果您看到 EGL 错误，则可能需要安装以下依赖项
```
sudo apt-get install -y libegl1-mesa-dev libgles2-mesa-dev
```
终端窗口2：建立策略服务器
```
# Run the server
uv run scripts/serve_policy.py --env ALOHA_SIM
```

// 待更

第二部分如何基于你自己的私有数据集微调π0：含我司的微调实践

// 待更

华为和H3c--交换技术
华为和H3c–交换技术一、VLAN的作用和交换网络链路类以及VLAN封装1、VLAN的作用和优势1）VLAN的作用隔离广播域2）VLAN的优势降低广播网络占用带宽资源安全性强屏蔽VLAN间访问增强设备的稳定性2、隔离广播的方式1）物理隔离通过路由器设备实现成本高2）VLAN交换机创建VLAN将接口加入到不同的VLAN中，VLAN之间相互隔离一个VLAN表示一个广播域3、交换网络链路的类型和Trun
28.行为型模式分析对比智想天开设计模式详解设计模式
原文地址:行为型模式分析对比更多内容请关注：智想天开1.行为型设计模式概述行为型设计模式关注对象之间的通信与职责分配，旨在优化对象之间的交互和协作。通过定义清晰的职责和交互方式，行为型模式提高了系统的灵活性、可扩展性和可维护性。关键特点：对象交互：优化对象之间的通信方式，减少耦合。职责分配：明确对象的职责，遵循单一职责原则。灵活性：允许动态地改变对象的行为和职责。复用性：通过模式的应用，提升代码的
27.访问者模式
原文地址:访问者模式更多内容请关注：智想天开1.访问者模式简介访问者模式（VisitorPattern）是一种行为型设计模式，它允许在不改变元素类的前提下，向元素添加新的操作。通过将操作封装到访问者对象中，访问者模式实现了操作与数据结构的分离，使得可以在不修改元素类的情况下，新增操作。关键点：操作封装：将不同的操作封装到独立的访问者类中。分离数据结构与操作：访问者模式将数据结构（元素类）与对其执行
【ARM】解决ArmDS的工程没有生成Map文件的问题亿道电子Emdoor ARM ARM arm开发
1、文档目标在嵌入式开发过程中，使用ArmDevelopmentStudio（简称ArmDS）进行项目构建时，Map文件的生成是调试和分析代码的重要环节。Map文件不仅记录了程序中各个段（sections）的内存分布情况，还提供了符号地址、函数调用关系等关键信息，对优化代码性能、排查问题具有不可替代的作用。然而，在某些情况下，开发者可能会发现ArmDS工程并未如预期生成Map文件。这一问题可能源于
Facebook公共主页创建不了？解决方案在此！出海探索的Cindy 出海日记人工智能
创建Facebook公共主页是推广业务、建立品牌或连接社群的重要一步，但不少人遇到“创建失败”、“此功能不可用”甚至毫无提示的卡死页面，这不是你一个人的问题，通常是特定原因导致的，而且绝大多数都可以解决。下面我将详细分析常见错误原因并提供一步步的解决方案。一、为什么创建不了？常见错误原因分析在解决问题之前，我们先了解“敌人”是谁。以下是导致Facebook公共主页创建失败的几大“元凶”：1、个人账
【Java基础】一次编译，随处运行的简单原理秃然想通了 java基础入门 java 开发语言
【Java基础】一次编译，随处运行的简单原理一句话解释：Java程序就像一个多变的机器人，能根据不同的环境变换外形，但核心始终不变！在Windows上变成.exe在Mac上变成.app在手机上变成.apk但无论它的外形如何变化，它的核心始终是同一个机器人！在我们的计算机中，存在着多种操作系统（如：Windows、Linux、MacOS等）。为了让Java程序能够在不同的操作系统上运行，Java内置
【Python爬虫实战】全面抓取网页资源（图片、JS、CSS等）——超详细教程与源码解析 Python爬虫项目 python 爬虫 javascript 新浪微博开发语言 css 旅游
前言在互联网时代，网页数据已经成为重要的信息来源。许多时候，我们不仅需要抓取网页中的文字信息，还需要将网页中的各种资源文件（如图片、CSS样式表、JavaScript脚本文件等）一起抓取并保存下来。这种需求广泛应用于网页备份、离线浏览、数据分析等场景。本篇文章将带你从零开始，系统讲解如何使用Python最新技术，一步步实现抓取网页中所有静态资源的完整流程，包括：页面结构分析爬虫基本架构搭建异步爬取
用Python爬虫抓取网页中的视频文件：从数据获取到处理与保存的完整教程 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言 selenium
一、引言随着在线视频平台的快速发展，视频成为了互联网中最重要的媒介之一。无论是用于娱乐、教育还是技术学习，视频内容都极大地改变了我们的信息获取方式。对于开发者、数据分析师或者研究者而言，获取和分析视频文件的数据不仅可以帮助他们深入理解某些平台的运营模式，也有助于建立自定义的多媒体内容库。爬虫技术是自动化抓取网页数据的一种工具。它通过模拟浏览器行为，抓取目标网页的内容。对于视频文件的抓取，尤其是那些
使用Python爬虫抓取免费音乐下载网站：从数据抓取到下载 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言
目录：前言爬虫基础知识什么是Web爬虫爬虫的工作原理抓取音乐下载网站的目标目标网站分析确定抓取数据的元素爬虫技术栈介绍Python爬虫的常用库requests库BeautifulSoup库Selenium库aiohttp和异步抓取抓取音乐下载网站的步骤选择目标网站并分析页面结构使用requests获取网页内容使用BeautifulSoup解析HTML解析音频文件下载链接使用Selenium抓取动态
在设计提示词（Prompt）时，关于信息位置的安排z怎么结合模型特性和任务目标 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python prompt 人工智能自然语言处理均值算法语言模型
在设计提示词（Prompt）时，关于信息位置的安排z怎么结合模型特性和任务目标在设计提示词（Prompt）时，关于信息位置的安排确实需要结合模型特性和任务目标。从自注意力机制的原理及应用场景来看，关键信息的位置选择需遵循以下启示，并结合具体场景灵活调整：一、核心启示：提示词的“信息权重”与“位置效应”1.最后位置的信息更易被模型“重点处理”原理：生成任务中（如文本续写、回答问题），模型生成最后一个
linux系统编程——Makefile、GDB调试舒克起飞了 linux 运维服务器
Makefilemakefile定义了一系列的规则来指定哪些文件需要先编译，哪些文件需要后编译，哪些文件需要重新编译，甚至于进行更复杂的功能操作，因为makefile文件就像一个shell脚本一样，也可以执行操作系统的命令。自动化编译，只要一个make命令，整个工程完全自动编译。规则一个makefile文件中可以有一个或者多个规则目标...:依赖...命令（shell命令）...目标：最终要生成的
借助 KubeMQ 简化多 LLM 集成强哥之神智能路由器 transformer 深度学习语言模型架构 deepseek
将多个大语言模型（LLM），如OpenAI和Anthropic的Claude集成到应用程序中是一项具有挑战性的任务。处理不同API和通信协议的复杂性，以及确保请求高效路由，都会带来诸多难题。然而，使用消息代理和路由器可以成为解决这些问题的优雅方案，能处理这些痛点并提供多项关键优势。在本文中，我们将探讨如何实现这一点，并提供代码示例，指导大家如何使用KubeMQ构建一个与OpenAI和Anthrop
西南交通大学【机器学习实验1】
实验目的理解和掌握回归问题和分类问题模型评估方法，学会使用均方误差、最大绝对误差、均方根误差指标评估回归模型，学会使用错误率、精度、查全率、查准率、F1指标评价分类模型。实验内容给定回归问题的真实标签和多个算法的预测结果，编程实现MSE、MAE、RMSE三种评测指标，对模型进行对比分析。给定二分类问题真实标签和多个算法的预测结果，编程实现混淆矩阵评测，采用错误率、精度、查全率、查准率、F1指标对结
AWS WebRTC：根据viewer端拉流日志推算视频帧率和音频帧率
viewer端拉流日志是这样的：07:19:26.263VERBOSEsampleAudioFrameHandler():AudioFramereceived.TrackId:140092278368896,Size:160,Flags32107293682025-06-1207:19:26.283VERBOSEsampleAudioFrameHandler():AudioFramereceive
AWS WebRTC: 判断viewer端拉流是否稳定的算法 Jasper张 AWS WebRTC webrtc aws 服务器 linux
在使用sdk-cviewer端进行拉流的过程中，viewer端拉取的是视频帧和音频帧，不会在播放器中播放，所以要根据收到的流来判断拉流过程是否稳定流畅。我这边采用的算法是：依据相邻帧之间的时间间隔是否落在期望值的±20%范围内。音频帧、视频帧的日志打印如下：07:19:26.263VERBOSEsampleAudioFrameHandler():AudioFramereceived.TrackId
WebRTC入门与提高2：WebRTC开发环境音视频开发老马音视频开发流媒体服务器音视频实时音视频视频编解码 webrtc c++
2.1安装vscode下载和安装vscodevscode官网：VisualStudioCode-CodeEditing.Redefined下载地址：https://vscode.cdn.azure.cn/stable/1b8e8302e405050205e69b59abb3559592bb9e60/VSCodeUserSetup-x64-1.31.1.exe下载完后按引导安装即可2.1.1配置vs
WebRTC基础介绍
WebRTC全称为：WebReal-TimeCommunication。它是为了解决Web端无法捕获音视频的能力，并且提供了peer-to-peer（就是浏览器间）的视频交互。WebRTC汇集了先进的实时通信技术，包括：先进的音视频编解码器（Opus和VP8/9），强制加密协议（SRTP和DTLS）和网络地址转换器（ICE＆STUN）。根据最初的定义，WebRTC被指定为P2P（peer-to-p
webRTC入门概览音视频开发老马 webrtc 服务器运维
1.什么是webRTCWebRTC（WebReal-TimeCommunications）是由谷歌开源并推进纳入W3C标准的一项音视频技术，旨在通过点对点的方式，在不借助中间媒介的情况下，实现浏览器之间的实时音视频通信。与Web经典的B/S架构(即浏览器和服务器架构模式)最大的不同是WebRTC的通信不经过服务器，而直接与客户端连接，在节省服务器资源的同时，提高通信效率。2.信令服务器信令(sig
SRS中RTMP推流RTC播放的实现原理及函数执行流程龙--技术总结分享 RTMP SRS RTC srs webrtc rtc rtmp
RTMP转RTC；或者RTC转RTMP，是通过Bridger实现的。RTMP转RTCclassSrsRtcFromRtmpBridger:publicISrsLiveSourceBridgerRTMP推流HTTP回调,类似RTMPmodule中onpublish回调创建接收推流的Threadpublishinghttp_hooks_on_publishacquire_publishdo_publi
DBG+TDE双剑合璧：打造从字段到存储的数据库全栈加密防御体系安当加密数据库网络
一、当数据泄露进入“立体攻击”时代：单一防护已失效某企业遭遇连环攻击：1️⃣攻击面1：黑客利用API漏洞越权访问数据库→窃取明文用户信息2️⃣攻击面2：窃取数据库备份文件→离线破解表数据传统方案短板：仅字段加密：无法防御存储层窃取（如.ibd文件被拷贝）仅TDE加密：无法阻止越权SQL直接读取明文✅安当破局之道：DBG（应用层网关）+TDE（存储层加密）=全链路数据“装甲”二、深度图解DBG+TD
centos使用wget下载jdk8 任意放逐 centos java linux
首先官网找需要的的jdk版本https://www.oracle.com/java/technologies/javase/javase8u211-later-archive-downloads.html我这里选择的是弹出下载提示框：勾选点Downloadjdk…这里需要使用一个账号登录，可以自行在网上搜一个账号，我就不给了。然后退回原来的页面下载，用一个能看到下载链接的软件下载，我使用的是idm
用sklearn库中的算法对数据集进行训练和auc评估（个人学习笔记） ZD困困困 python 机器学习
本文为个人学习笔记，仅供学习参考，欢迎讨论，要是有哪里写的不对或有疑问的欢迎讨论。题目：运用已给数据集进行模型训练，使用逻辑回归、决策树、随机森林和AdaBoost几个算法进行训练，并打印各个算法训练后的auc评价指标。文章目录1.导入数据集①read_csv():读取数据并以某字符分隔。②merge():合并③drop():删除行或列④tolist():将数组或矩阵转换为列表⑤train_tes
【网络编程】EPOLL 事件触发机制的服务器啟明起鸣网络服务器运维
文章目录业务拆解EPOLL机制介绍EPOLL的核心变量和函数EPOLL程序流程图C代码实现准备工作服务器代码代码运行效果总结推荐一个零声教育学习教程，个人觉得老师讲得不错，分享给大家：[Linux，Nginx，ZeroMQ，MySQL，Redis，fastdfs，MongoDB，ZK，流媒体，CDN，P2P，K8S，Docker，TCP/IP，协程，DPDK等技术内容，点击立即学习:https:/
华为研发岗位面试与暑期实习攻略：C++与Java深入解析丹力
本文还有配套的精品资源，点击获取简介：华为的面试和暑期实习对IT求职者至关重要，涉及技术实力与团队协作。本文深入探讨了华为面试的要点，包括专业技能、项目经验、问题解决能力的考察，以及暑期实习和校招中的C++和Java研发岗位要求。在面试中，求职者需要展示C++11/14/17新特性、内存管理、设计模式，以及Java核心技术、JVM原理等，同时还需关注新技术趋势。积极学习和展现出学习能力与团队精神，
UDP服务器主要是指什么意思？ wanhengidc udp 服务器网络协议
UDP的全称为用户数据报协议，是一种在计算机网络中常用的传输协议，属于是传输层协议，UDP属于是一种无连接的协议，在发送数据信息之前，发送方和接收方不需要建立任何握手连接，主要是用于发送小量数据的实时应用。UDP服务器则是一种基于UDP协议实现的网络服务端程序，能够用来接收、处理和响应客户端发送的UDP数据报，UDP服务器与TCP服务器相比较来说，UDP服务器不需要建立连接，但是也不能够保证数据信
电信路由模式改桥接模式！想尝一尝被打赏的味道桥接模式
记录一下，怕日后忘记！第一步先进去超级管理后台http://192.168.1.1:8080/超级帐号是：telecomadmin密码：nE7jA%5m里面网络设置可以看到宽带账号，但是看不到密码，致电10000号，愉快的重置了。短信已收到密码；【20240-12-16】换了新猫后，上面的方案失效了。新密码账号：telecomadmin密码：pQCT!mW6直接在192.168.1.1登录就行了，
Disruptor 介绍三石成山 java
Disruptor是由LMAX(一个金融交易平台)开发的一种高性能、低延迟的消息队列框架。它专为高吞吐量、低延迟的并发处理设计，能够极大地提升事件驱动架构的性能。Disruptor在许多实时系统中被广泛使用，尤其是在金融、游戏、日志处理等领域，具有与传统消息队列（如Kafka、RabbitMQ）不同的设计哲学和实现方式。链接LMAX-Exchange/disruptor:HighPerforman
LLCC68IMLTRT：Semtech新一代LoRa®射频收发器芯片，IoT设备续航翻倍深圳市尚想信息技术有限公司物联网收发器收发器芯片升特半导体工业传感器
LLCC68IMLTRT（Semtech）产品解析与推广文案1.产品概述LLCC68IMLTRT是Semtech（升特半导体）推出的一款高性能、低功耗LoRa®Sub-GHz射频收发器芯片，支持远距离无线通信，适用于物联网（IoT）、智能表计、工业传感器网络等场景。2.主要功能与优势（1）远距离&低功耗通信LoRa®调制技术：通信距离>5km（城市环境），>15km（郊区）。超低功耗：接收电流仅5
MYOJ_5078:(洛谷P5662)[CSP-J2019] 纪念品(完全背包提高) Jayfeather松鸦羽_sch NOIP+CSP系列题解背包DP(不同于动规)算法动态规划 c++
题目描述小伟突然获得一种超能力，他知道未来T天N种纪念品每天的价格。某个纪念品的价格是指购买一个该纪念品所需的金币数量，以及卖出一个该纪念品换回的金币数量。每天，小伟可以进行以下两种交易无限次：任选一个纪念品，若手上有足够金币，以当日价格购买该纪念品；卖出持有的任意一个纪念品，以当日价格换回金币。每天卖出纪念品换回的金币可以立即用于购买纪念品，当日购买的纪念品也可以当日卖出换回金币。当然，一直持有
嵌入式开发学习日志Day14（ARM体系架构——RTC及ADC)
一、RTCRTC（实时时钟）：非易失性在IMX6ULL内部SNVS（安全的非易失性存储器）提供RTC功能；原理图：二、ADC2.1基本概念ADC(模拟数字转换器)：用于将连续变化的模拟信号转换为离散的数字信号以便数字系统对它进行处理；模拟信号：一般指连续变化的电压信号，其值在一定范围内变化；数字信号：由一系列离散数字表示仅取有限值，通常以二进制表示；2.2工作原理将模拟信号分割成一系列离散的取样，
xml解析小猪猪08 xml
1、DOM解析的步奏准备工作： 1.创建DocumentBuilderFactory的对象 2.创建DocumentBuilder对象 3.通过DocumentBuilder对象的parse(String fileName)方法解析xml文件 4.通过Document的getElem
每个开发人员都需要了解的一个SQL技巧 brotherlamp linux linux视频 linux教程 linux自学 linux资料
对于数据过滤而言CHECK约束已经算是相当不错了。然而它仍存在一些缺陷，比如说它们是应用到表上面的，但有的时候你可能希望指定一条约束，而它只在特定条件下才生效。使用SQL标准的WITH CHECK OPTION子句就能完成这点，至少Oracle和SQL Server都实现了这个功能。下面是实现方式： CREATE TABLE books ( id &
Quartz——CronTrigger触发器 eksliang quartz CronTrigger
转载请出自出处：http://eksliang.iteye.com/blog/2208295 一.概述 CronTrigger 能够提供比 SimpleTrigger 更有具体实际意义的调度方案，调度规则基于 Cron 表达式，CronTrigger 支持日历相关的重复时间间隔（比如每月第一个周一执行），而不是简单的周期时间间隔。二.Cron表达式介绍 1）Cron表达式规则表 Quartz
Informatica基础 18289753290 Informatica Monitor manager workflow Designer
1. 1）PowerCenter Designer：设计开发环境，定义源及目标数据结构；设计转换规则，生成ETL映射。 2）Workflow Manager：合理地实现复杂的ETL工作流，基于时间，事件的作业调度 3）Workflow Monitor：监控Workflow和Session运行情况，生成日志和报告 4）Repository Manager：
linux下为程序创建启动和关闭的的sh文件，scrapyd为例酷的飞上天空 scrapy
对于一些未提供service管理的程序每次启动和关闭都要加上全部路径，想到可以做一个简单的启动和关闭控制的文件下面以scrapy启动server为例，文件名为run.sh： #端口号，根据此端口号确定PID PORT=6800 #启动命令所在目录 HOME='/home/jmscra/scrapy/' #查询出监听了PORT端口
人--自私与无私永夜-极光
今天上毛概课,老师提出一个问题--人是自私的还是无私的,根源是什么? 从客观的角度来看,人有自私的行为,也有无私的
Ubuntu安装NS-3 环境脚本随便小屋 ubuntu
将附件下载下来之后解压，将解压后的文件ns3environment.sh复制到下载目录下（其实放在哪里都可以，就是为了和我下面的命令相统一）。输入命令： sudo ./ns3environment.sh >>result 这样系统就自动安装ns3的环境，运行的结果在result文件中，如果提示 com
创业的简单感受 aijuans 创业的简单感受
2009年11月9日我进入a公司实习，2012年4月26日，我离开a公司，开始自己的创业之旅。今天是2012年5月30日，我忽然很想谈谈自己创业一个月的感受。当初离开边锋时，我就对自己说：“自己选择的路，就是跪着也要把他走完”，我也做好了心理准备，准备迎接一次次的困难。我这次走出来，不管成败
如何经营自己的独立人脉 aoyouzi 如何经营自己的独立人脉
独立人脉不是父母、亲戚的人脉，而是自己主动投入构造的人脉圈。“放长线，钓大鱼”，先行投入才能产生后续产出。现在几乎做所有的事情都需要人脉。以银行柜员为例，需要拉储户，而其本质就是社会人脉，就是社交！很多人都说，人脉我不行，因为我爸不行、我妈不行、我姨不行、我舅不行……我谁谁谁都不行，怎么能建立人脉？我这里说的人脉，是你的独立人脉。以一个普通的银行柜员
JSP基础百合不是茶 jsp 注释隐式对象
1,JSP语句的声明 <%! 声明 %> 　　声明：这个就是提供java代码声明变量、方法等的场所。表达式 <%= 表达式 %> 　　这个相当于赋值，可以在页面上显示表达式的结果，程序代码段/小型指令　<% 程序代码片段 %> 2,JSP的注释
web.xml之session-config、mime-mapping bijian1013 java web.xml servlet session-config mime-mapping
session-config 1.定义： <session-config> <session-timeout>20</session-timeout> </session-config> 2.作用：用于定义整个WEB站点session的有效期限，单位是分钟。 mime-mapping 1.定义： <mime-m
互联网开放平台（1） Bill_chen 互联网 qq 新浪微博百度腾讯
现在各互联网公司都推出了自己的开放平台供用户创造自己的应用，互联网的开放技术欣欣向荣，自己总结如下： 1.淘宝开放平台(TOP) 网址：http://open.taobao.com/ 依赖淘宝强大的电子商务数据，将淘宝内部业务数据作为API开放出去，同时将外部ISV的应用引入进来。目前TOP的三条主线： TOP访问网站：open.taobao.com ISV后台：my.open.ta
【MongoDB学习笔记九】MongoDB索引 bit1129 mongodb
索引可以在任意列上建立索引索引的构造和使用与传统关系型数据库几乎一样,适用于Oracle的索引优化技巧也适用于Mongodb 使用索引可以加快查询,但同时会降低修改,插入等的性能内嵌文档照样可以建立使用索引测试数据 var p1 = { "name":"Jack", "age&q
JDBC常用API之外的总结白糖_ jdbc
做JAVA的人玩JDBC肯定已经很熟练了，像DriverManager、Connection、ResultSet、Statement这些基本类大家肯定很常用啦，我不赘述那些诸如注册JDBC驱动、创建连接、获取数据集的API了，在这我介绍一些写框架时常用的API，大家共同学习吧。 ResultSetMetaData获取ResultSet对象的元数据信息
apache VelocityEngine使用记录 bozch VelocityEngine
VelocityEngine是一个模板引擎，能够基于模板生成指定的文件代码。使用方法如下： VelocityEngine engine = new VelocityEngine();// 定义模板引擎 Properties properties = new Properties();// 模板引擎属
编程之美-快速找出故障机器 bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; public class TheLostID { /*编程之美假设一个机器仅存储一个标号为ID的记录，假设机器总量在10亿以下且ID是小于10亿的整数，假设每份数据保存两个备份，这样就有两个机器存储了同样的数据。 1.假设在某个时间得到一个数据文件ID的列表，是
关于Java中redirect与forward的区别 chenbowen00 java servlet
在Servlet中两种实现： forward方式：request.getRequestDispatcher(“/somePage.jsp”).forward(request, response); redirect方式：response.sendRedirect(“/somePage.jsp”); forward是服务器内部重定向，程序收到请求后重新定向到另一个程序，客户机并不知
[信号与系统]人体最关键的两个信号节点 comsci 系统
如果把人体看做是一个带生物磁场的导体,那么这个导体有两个很重要的节点,第一个在头部,中医的名称叫做百汇穴, 另外一个节点在腰部,中医的名称叫做命门如果要保护自己的脑部磁场不受到外界有害信号的攻击,最简单的
oracle 存储过程执行权限 daizj oracle 存储过程权限执行者调用者
在数据库系统中存储过程是必不可少的利器，存储过程是预先编译好的为实现一个复杂功能的一段Sql语句集合。它的优点我就不多说了，说一下我碰到的问题吧。我在项目开发的过程中需要用存储过程来实现一个功能，其中涉及到判断一张表是否已经建立，没有建立就由存储过程来建立这张表。 CREATE OR REPLACE PROCEDURE TestProc IS fla
为mysql数据库建立索引 dengkane mysql 性能索引
前些时候，一位颇高级的程序员居然问我什么叫做索引，令我感到十分的惊奇，我想这绝不会是沧海一粟，因为有成千上万的开发者（可能大部分是使用MySQL的）都没有受过有关数据库的正规培训，尽管他们都为客户做过一些开发，但却对如何为数据库建立适当的索引所知较少，因此我起了写一篇相关文章的念头。最普通的情况，是为出现在where子句的字段建一个索引。为方便讲述，我们先建立一个如下的表。
学习C语言常见误区如何看懂一个程序如何掌握一个程序以及几个小题目示例 dcj3sjt126com c 算法
如果看懂一个程序，分三步 1、流程 2、每个语句的功能 3、试数如何学习一些小算法的程序尝试自己去编程解决它，大部分人都自己无法解决如果解决不了就看答案关键是把答案看懂，这个是要花很大的精力，也是我们学习的重点看懂之后尝试自己去修改程序，并且知道修改之后程序的不同输出结果的含义照着答案去敲调试错误
centos6.3安装php5.4报错 dcj3sjt126com centos6
报错内容如下: Resolving Dependencies --> Running transaction check ---> Package php54w.x86_64 0:5.4.38-1.w6 will be installed --> Processing Dependency: php54w-common(x86-64) = 5.4.38-1.w6 for
JSONP请求 flyer0126 jsonp
使用jsonp不能发起POST请求。 It is not possible to make a JSONP POST request. JSONP works by creating a <script> tag that executes Javascript from a different domain; it is not pos
Spring Security（03）——核心类简介 234390216 Authentication
核心类简介目录 1.1 Authentication 1.2 SecurityContextHolder 1.3 AuthenticationManager和AuthenticationProvider 1.3.1 &nb
在CentOS上部署JAVA服务 java--hhf java jdk centos Java服务
本文将介绍如何在CentOS上运行Java Web服务，其中将包括如何搭建JAVA运行环境、如何开启端口号、如何使得服务在命令执行窗口关闭后依旧运行第一步：卸载旧Linux自带的JDK ①查看本机JDK版本 java -version 结果如下 java version "1.6.0"
oracle、sqlserver、mysql常用函数对比[to_char、to_number、to_date] ldzyz007 oracle mysql SQL Server
oracle &n
记Protocol Oriented Programming in Swift of WWDC 2015 ningandjin protocol WWDC 2015 Swift2.0
其实最先朋友让我就这个题目写篇文章的时候，我是拒绝的，因为觉得苹果就是在炒冷饭，把已经流行了数十年的OOP中的“面向接口编程”还拿来讲，看完整个Session之后呢，虽然还是觉得在炒冷饭，但是毕竟还是加了蛋的，有些东西还是值得说说的。通常谈到面向接口编程，其主要作用是把系统设计和具体实现分离开，让系统的每个部分都可以在不影响别的部分的情况下，改变自身的具体实现。接口的设计就反映了系统
搭建 CentOS 6 服务器(15) - Keepalived、HAProxy、LVS rensanning keepalived
（一）Keepalived （1）安装 # cd /usr/local/src # wget http://www.keepalived.org/software/keepalived-1.2.15.tar.gz # tar zxvf keepalived-1.2.15.tar.gz # cd keepalived-1.2.15 # ./configure # make &a
ORACLE数据库SCN和时间的互相转换 tomcat_oracle oracle sql
SCN（System Change Number 简称 SCN）是当Oracle数据库更新后，由DBMS自动维护去累积递增的一个数字，可以理解成ORACLE数据库的时间戳，从ORACLE 10G开始，提供了函数可以实现SCN和时间进行相互转换；　　用途：在进行数据库的还原和利用数据库的闪回功能时，进行SCN和时间的转换就变的非常必要了；　　操作方法：　　1、通过dbms_f
Spring MVC 方法注解拦截器 xp9802 spring mvc
应用场景，在方法级别对本次调用进行鉴权，如api接口中有个用户唯一标示accessToken,对于有accessToken的每次请求可以在方法加一个拦截器，获得本次请求的用户，存放到request或者session域。 python中，之前在python flask中可以使用装饰器来对方法进行预处理，进行权限处理先看一个实例,使用@access_required拦截： ?

对开源VLA sota π0的微调——如何基于各种开源数据集、以及你自己的私有数据集微调π0(含我司的微调实践)

前言

第一部分 如何基于各种开源数据集微调π0

1.1 π0及π0-FAST对外开源的具体内容

1.1.1 开源基础模型π0及π0-FAST，可自行微调

1.1.2 已经微调好的模型 可直接推理：π0 DROID/π0 ALOHA/π0 Libero

1.1.3 模型推理与私有数据自行微调

1.2 基于自己的数据集微调π0基础模型

1.2.1 利用Libero数据集微调π0基础模型的三个步骤

1.2.2 在 UR5 数据集上微调 pi0

1.3 安装与运行

1.3.1 如何安装本openpi开源库

2.3.2 如何把该库的ALOHA sim环境跑起来

第二部分 如何基于你自己的私有数据集微调π0：含我司的微调实践

你可能感兴趣的:(通用机械臂之路:,π0等VLA,sota模型,开源VLA的sota模型,微调π0,微调VLA模型,基于私有数据集微调π0,基于开源数据集微调π0)

第一部分如何基于各种开源数据集微调π0

1.1.2 已经微调好的模型可直接推理：π0 DROID/π0 ALOHA/π0 Libero

第二部分如何基于你自己的私有数据集微调π0：含我司的微调实践