大吉机器人

ROS 科大讯飞语音（三）识别篇

环境准备

安装声卡驱动库

sudo apt-get install libasound2-dev

将demo里面的call.bnf拷贝到/Robot/voice/call.bnf

编写节点

语音识别节点代码

在xf_voice/src文件夹下新建xf_asr.cpp文件，并复制以下代码。
注意，请将appid改为你自己在官网申请的。

#include 
#include 
#include 
#include 
#include 
#include "ros/ros.h"
#include "std_msgs/String.h"
#include "pthread.h"
#include "/Robot/voice/inc/qisr.h"
#include "/Robot/voice/inc/msp_cmn.h"
#include "/Robot/voice/inc/msp_errors.h"
#include 
#include 
#include 
#define SAMPLE_RATE 16000
#define CHANNLE 1
#define FRAMES_SIZE 3200
#define FORMAT SND_PCM_FORMAT_S16_LE
#define PER_SAMPLE 2
#define DEVICE  "default"
 char data[10000];
 int flag_begin=0;
 int flag_understand=0;
 int flag_unknow=0;

/* wav音频头部格式 */
typedef struct _wave_pcm_hdr
{
    char            riff[4];                // = "RIFF"
    int             size_8;                 // = FileSize - 8
    char            wave[4];                // = "WAVE"
    char            fmt[4];                 // = "fmt "
    int             fmt_size;               // = 下一个结构体的大小 : 16

    short int       format_tag;             // = PCM : 1
    short int       channels;               // = 通道数 : 1
    int             samples_per_sec;        // = 采样率 : 8000 | 6000 | 11025 | 16000
    int             avg_bytes_per_sec;      // = 每秒字节数 : samples_per_sec * bits_per_sample / 8
    short int       block_align;            // = 每采样点字节数 : wBitsPerSample / 8
    short int       bits_per_sample;        // = 量化比特数: 8 | 16

    char            data[4];                // = "data";
    int             data_size;              // = 纯数据长度 : FileSize - 44
} wave_pcm_hdr;
/* 默认wav音频头部数据 */
wave_pcm_hdr default_wav_hdr =
{
    { 'R', 'I', 'F', 'F' },
    0,
    {'W', 'A', 'V', 'E'},
    {'f', 'm', 't', ' '},
    16,
    1,
    1,
    16000,
    32000,
    2,
    16,
    {'d', 'a', 't', 'a'},
    0
};
#define SAMPLE_RATE_16K     (16000)
#define SAMPLE_RATE_8K      (8000)
#define MAX_GRAMMARID_LEN   (32)
#define MAX_PARAMS_LEN      (1024)


const char * ASR_RES_PATH        = "fo|/Robot/voice/bin/msc/res/asr/common.jet"; //离线语法识别资源路径
const char * GRM_BUILD_PATH      = "/Robot/voice/bin/msc/res/asr/GrmBuilld"; //构建离线语法识别网络生成数据保存路径
const char * GRM_FILE            = "/Robot/voice/call.bnf"; //构建离线识别语法网络所用的语法文件
const char * listened_file            ="/Robot/voice/wav/ddhgdw.pcm";
typedef struct _UserData {
    int     build_fini; //标识语法构建是否完成
    int     update_fini; //标识更新词典是否完成
    int     errcode; //记录语法构建或更新词典回调错误码
    char    grammar_id[MAX_GRAMMARID_LEN]; //保存语法构建返回的语法ID
}UserData;
UserData asr_data;
int build_grammar(UserData *udata); //构建离线识别语法网络
int run_asr(void *udata); //进行离线语法识别
int build_grm_cb(int ecode, const char *info, void *udata)
{
    UserData *grm_data = (UserData *)udata;
    if (NULL != grm_data) {
        grm_data->build_fini = 1;
        grm_data->errcode = ecode;
    }

    if (MSP_SUCCESS == ecode && NULL != info) {
        printf("构建语法成功！ 语法ID:%s\n", info);
        if (NULL != grm_data)
            snprintf(grm_data->grammar_id, MAX_GRAMMARID_LEN - 1, info);
    }
    else
        printf("构建语法失败！%d\n", ecode);

    return 0;
}

int build_grammar(UserData *udata)
{
    FILE *grm_file                           = NULL;
    char *grm_content                        = NULL;
    unsigned int grm_cnt_len                 = 0;
    char grm_build_params[MAX_PARAMS_LEN]    = {NULL};
    int ret                                  = 0;
    grm_file = fopen(GRM_FILE, "rb");   
    if(NULL == grm_file) {
        printf("打开\"%s\"文件失败！[%s]\n", GRM_FILE, strerror(errno));
        return -1; 
    }
    fseek(grm_file, 0, SEEK_END);
    grm_cnt_len = ftell(grm_file);
    fseek(grm_file, 0, SEEK_SET);

    grm_content = (char *)malloc(grm_cnt_len + 1);
    if (NULL == grm_content)
    {
        printf("内存分配失败!\n");
        fclose(grm_file);
        grm_file = NULL;
        return -1;
    }
    fread((void*)grm_content, 1, grm_cnt_len, grm_file);
    grm_content[grm_cnt_len] = '\0';
    fclose(grm_file);
    grm_file = NULL;

    snprintf(grm_build_params, MAX_PARAMS_LEN - 1, 
        "engine_type = local, \
        asr_res_path = %s, sample_rate = %d, \
        grm_build_path = %s, ",
        ASR_RES_PATH,
        SAMPLE_RATE_16K,
        GRM_BUILD_PATH
        );
    ret = QISRBuildGrammar("bnf", grm_content, grm_cnt_len, grm_build_params, build_grm_cb, udata);

    free(grm_content);
    grm_content = NULL;

    return ret;
}

int recode_asr(void *ptr)
{
    char asr_params[MAX_PARAMS_LEN]    = {NULL};
    const char *rec_rslt               = NULL;
    const char *session_id             = NULL;

    FILE *f_pcm                        = NULL;
    char *pcm_data                     = NULL;
    long pcm_count                     = 0;

    int aud_stat                       = MSP_AUDIO_SAMPLE_CONTINUE;
    int ep_status                      = MSP_EP_LOOKING_FOR_SPEECH;
    int rec_status                     = MSP_REC_STATUS_INCOMPLETE;
    int rss_status                     = MSP_REC_STATUS_INCOMPLETE;
    int errcode                        = -1;

    long loops;
    int rc, size;
    float time=5;
    snd_pcm_t *handle;
    snd_pcm_hw_params_t *params;
    snd_pcm_uframes_t frames, ret;
    char *buffer;
    char *ptr_buffer;
    FILE *fp = fopen("/Robot/voice/wav/listened.wav", "wb");

    //离线语法识别参数设置
    snprintf(asr_params, MAX_PARAMS_LEN - 1,
        "engine_type = cloud,\
             sub=iat,\
             domain = iat,\
             sch=1,\
             nlp_version=2.0,\
             mixed_type=delay ,\
             mixed_threshold=50,\
             mixed_timeout= 3000 ,\
        asr_res_path = %s, sample_rate = %d, \
        grm_build_path = %s, local_grammar = %s, \
        result_type = json, result_encoding = UTF-8 ",
        ASR_RES_PATH,
        SAMPLE_RATE_16K,
        GRM_BUILD_PATH,
        asr_data.grammar_id
        );
    session_id = QISRSessionBegin(NULL, asr_params, &errcode);
    printf("开始识别...\n");
    if(fp == NULL){  }else(printf("open file success"));
    rc = snd_pcm_open(&handle, DEVICE, SND_PCM_STREAM_CAPTURE, 0);
    if (rc < 0) {  } else  printf("OK:before alloca\n");
    snd_pcm_hw_params_alloca(¶ms);
    printf("OK:after alloca\n");
    rc = snd_pcm_hw_params_any(handle, params);
    if (rc < 0) {  }  else{    printf("OK:snd_pcm_hw_params_an()\n");  }
    rc = snd_pcm_hw_params_set_access(handle, params,SND_PCM_ACCESS_RW_INTERLEAVED);
    if (rc < 0) {  }  else{    printf("OK:snd_pcm_hw_params_set_access()\n");  }
    rc = snd_pcm_hw_params_set_format(handle, params, FORMAT);
    if (rc < 0) {  }  else{    printf("OK:snd_pcm_hw_params_set_format()\n");  }
    rc = snd_pcm_hw_params_set_channels(handle, params, CHANNLE);
    if (rc < 0) {  }  else{    printf("OK:snd_pcm_hw_params_set_channels()\n");  }
    rc = snd_pcm_hw_params_set_rate(handle, params,SAMPLE_RATE, 0);
    if (rc < 0) {  }  else{    printf("OK:snd_pcm_hw_params_set_rate()\n");  }
    frames = FRAMES_SIZE;
    rc = snd_pcm_hw_params(handle, params);
    if (rc < 0) {  }  else{    printf("OK:snd_pcm_hw_paraams()\n");  }
    size = frames * PER_SAMPLE *CHANNLE; /* 2 bytes/sample, 1 channels */
    ptr_buffer = buffer = (char *) malloc(size);
    if(buffer == NULL){  }else{    printf("OK:malloc()\n");  }
    loops = SAMPLE_RATE/frames*time;
    fwrite(&default_wav_hdr, sizeof(default_wav_hdr) ,1, fp);
    while (loops > 0)
    {
          loops--;
          ret = snd_pcm_readi(handle, ptr_buffer, frames);
          if (ret == -EPIPE) {
            printf( "overrun occurred\n");
            snd_pcm_prepare(handle);
          } else if (ret < 0)  printf("error from read: %s\n",snd_strerror(ret));
          else if (ret != frames)    printf( "short read, read %d frames\n", ret);
          rc = fwrite(ptr_buffer, size, 1, fp);
          if (rc < 0){   printf("error in write\n");   }
          if (rc != 1)    printf("failed to write %d bytes\n",size);
          printf(">");
          fflush(stdout);
        if (0 == pcm_count) aud_stat = MSP_AUDIO_SAMPLE_FIRST;
        else   aud_stat = MSP_AUDIO_SAMPLE_CONTINUE;
        errcode = QISRAudioWrite(session_id, (const void *)ptr_buffer, size, aud_stat, &ep_status, &rec_status);
        if (MSP_EP_AFTER_SPEECH == ep_status)break;     //检测到音频结束
    }

    QISRAudioWrite(session_id, (const void *)NULL, 0, MSP_AUDIO_SAMPLE_LAST, &ep_status, &rec_status);

    if(buffer != NULL)  free(buffer);
    if(fp != NULL)  fclose(fp);
    snd_pcm_drain(handle);
    snd_pcm_close(handle);

    free(pcm_data);
    pcm_data = NULL;

    //获取识别结果
    while (MSP_REC_STATUS_COMPLETE != rss_status && MSP_SUCCESS == errcode) {
        rec_rslt = QISRGetResult(session_id, &rss_status, 0, &errcode);
        printf(".");
        usleep(150 * 1000);
    }
    printf("\n识别结束%d：\n",loops);
    printf("=============================================================\n");
    if (NULL != rec_rslt)
    {
        printf("%s\n", rec_rslt);
        sprintf(data,"%s\n", rec_rslt);
        flag_understand=1;
    }
    else
    {
        printf("没有识别结果！\n");
        flag_unknow=1;
    }
    printf("=============================================================\n");

    goto run_exit;

    if (NULL != pcm_data) {
        free(pcm_data);
        pcm_data = NULL;
    }
    if (NULL != f_pcm) {
        fclose(f_pcm);
        f_pcm = NULL;
    }
run_exit:
    printf("exit with code :%d..\n",errcode);
    QISRSessionEnd(session_id, NULL);
    return errcode;
}
void wakeupcallback(const std_msgs::String::ConstPtr& msg)
{
    std::cout<<"waking up"<data.c_str());
    usleep(700*1000);
    flag_begin=1;
}

int main(int argc,char **argv)
{
    const char *login_config    = "appid = 573bdbff"; //登录参数
    int ret                     = 0 ;
    ret = MSPLogin(NULL, NULL, login_config); //第一个参数为用户名，第二个参数为密码，传NULL即可，第三个参数是登录参数
    if (MSP_SUCCESS != ret) {
        printf("登录失败：%d\n", ret);
        return  -1;
    }
    printf("构建离线识别语法网络...\n");
    ret = build_grammar(&asr_data);  //第一次使用某语法进行识别，需要先构建语法网络，获取语法ID，之后使用此语法进行识别，无需再次构建
    if (MSP_SUCCESS != ret) {
        printf("构建语法调用失败！\n");
        return -1;
    }
    while (1 != asr_data.build_fini)    usleep(300 * 1000);
    if (MSP_SUCCESS != asr_data.errcode)    return -1;
    //printf("离线识别语法网络构建完成，开始识别...\n");
    if (MSP_SUCCESS != ret) {
        printf("离线语法识别出错: %d \n", ret);
       return -1;
    }
    ros::init(argc, argv, "xf_asr");
    ros::NodeHandle n;
    ros::Rate loop_rate(10);
    ros::Subscriber sub = n.subscribe("xfwakeup", 1000, wakeupcallback);
    ros::Publisher pub = n.advertise("xfsaywords", 1000);
    ros::Publisher pub2= n.advertise("xfunderstand",10000);
    while (ros::ok())
    {
        if(flag_begin)
        {
            ret = recode_asr(&asr_data);
           // ret = run_asr(&asr_data);
         flag_begin=0;
        }
        if(flag_unknow)
        {
            std_msgs::String msg;
            std::stringstream ss;
            flag_unknow=0;
            ss << "对不起，我好像不明白！ ";
            msg.data = ss.str();
            pub.publish(msg);

        }
        if(flag_understand)
        {
            flag_understand=0;
            std_msgs::String msg;
            std::stringstream ss2;
            ss2 << data;
            msg.data = ss2.str();
            pub2.publish(msg);

        }
     ros::spinOnce();
     loop_rate.sleep();
    }

    MSPLogout();
    printf("请按任意键退出...\n");
    getchar();
}

配置CMakeLists.txt

在原xf_voice文件夹的CMakeLists.txt文件末尾加上以下代码

add_executable(xf_asr src/xf_asr.cpp)
target_link_libraries(xf_asr ${catkin_LIBRARIES} /Robot/voice/lib/libmsc.so  -ldl -lpthread -lm -lrt -lasound)
add_dependencies(xf_asr xf_voice_generate_messages_cpp)

编译测试

编译

回到catkin_ws文件夹下，执行catkin_make

$ catkin_make

测试

第一个终端，运行主节点

roscore

第二个终端，运行语音合成节点

$ cd catkin_ws/
$ source devel/setup.sh 
$ rosrun xf_voice xf_tts

第三个终端，运行语音识别节点

$ cd catkin_ws/
$ source devel/setup.sh
$ rosrun xf_voice xf_asr

第四个终端，发送唤醒信号

$ cd catkin_ws/
$ source devel/setup.sh
$ rostopic pub /xfwakeup std_msgs/String s

效果

每次第四个终端发送一次唤醒信号，在第三个启动语音识别的终端中就会启动一次语音识别过程。
超时如果没有识别结果则返回没有识别结果！同时在第二个终端会提示“对不起，我好像不明白”，你也会听到相应的提示音。
如果有识别结果，则会停止识别并返回结果。同时结果会被发送到xfunderstand主题。

构建离线识别语法网络...
构建语法成功！ 语法ID:call
waking up
开始识别...
open file successOK:before alloca
OK:after alloca
OK:snd_pcm_hw_params_an()
OK:snd_pcm_hw_params_set_access()
OK:snd_pcm_hw_params_set_format()
OK:snd_pcm_hw_params_set_channels()
OK:snd_pcm_hw_params_set_rate()
OK:snd_pcm_hw_paraams()
OK:malloc()
>>>>>>>>>>>>>>>>>>>>>>>>>..
识别结束0：
=============================================================
没有识别结果！
=============================================================
exit with code :0..

waking up
开始识别...
open file successOK:before alloca
OK:after alloca
OK:snd_pcm_hw_params_an()
OK:snd_pcm_hw_params_set_access()
OK:snd_pcm_hw_params_set_format()
OK:snd_pcm_hw_params_set_channels()
OK:snd_pcm_hw_params_set_rate()
OK:snd_pcm_hw_paraams()
OK:malloc()
>>>>>>>>>>>>>>>>>>>>>>>>>....
识别结束0：
=============================================================
{"rc":0,"operation":"ANSWER","service":"chat","answer":{"text":"医院门口，一老大爷很伤心。好心人上前询问，老大爷答道：孙子生病，拉了坨便便想带来化验。用报纸包了好几层放口袋里，结果在车上被偷了……","type":"T"},"text":"给我讲一个笑话。"}
=============================================================
exit with code :0..

第二个终端语音合成节点输出内容

I heard,I will say:对不起，我好像不明白！ 
开始合成 ...
正在合成 ...

合成完毕

英伟达 Isaac ROS产品体验芝麻香儿 Roads to deep learning.AI 英伟达 Isaac ROS
这里写自定义目录标题英伟达IsaacROS产品体验运行的商品名称运行过程记录GPU加速仿真总结英伟达IsaacROS产品体验NVIDIAIsaacROS是一套为自主移动机器人（AMR）开发的硬件加速软件包，专为在NVIDIAGPU和Jetson平台上优化ROS（RobotOperatingSystem）应用程序而设计。它通过提供一系列模块化的ROS包和完整的处理管道，帮助开发者加速AI感知、图像处
Python 网络爬虫中 robots 协议使用的常见问题及解决方法
在Python网络爬虫开发中，robots协议的正确应用是保证爬虫合规性的关键。然而，在实际使用过程中，开发者常会遇到各种问题，若处理不当，可能导致爬虫被封禁或引发法律风险。本文将梳理robots协议使用中的常见问题，并提供针对性的解决方法。一、协议解析不准确导致的合规性问题1.1误读User-agent通配符范围问题表现：将User-agent:*错误理解为适用于所有场景，忽略了特定爬虫的单独规
【稀疏三维重建】Flash3D：单张图像重建场景的GaussianSplatting 杀生丸学AI 计算机视觉人工智能大模型稀疏三维重建立体几何单目深度估计
项目主页：https://www.robots.ox.ac.uk/~vgg/research/flash3d/来源：牛津、澳大利亚国立文章目录摘要1.引言2.相关工作3.方法3.1背景：从单个图像中重建场景3.2单目前向的多个高斯4.实验4.14.2跨域新视角合成4.3域内新视图合成摘要 Flash3D，一种通用的单一图像场景重建。模型从一个单目深度估计的“基础”模型开始，扩展到一个完整的三维形
Python 网络爬虫的基本流程及 robots 协议详解女码农的重启 python 网络爬虫 JAVA 开发语言
数据驱动的时代，网络爬虫作为高效获取互联网信息的工具，其规范化开发离不开对基本流程的掌握和对robots协议的遵守。本文将系统梳理Python网络爬虫的核心流程，并深入解读robots协议的重要性及实践规范。一、Python网络爬虫的基本流程Python网络爬虫的工作过程可分为四个核心阶段，每个阶段环环相扣，共同构成数据采集的完整链路。1.1发起网络请求这是爬虫与目标服务器交互的第一步，通过发送H
python读取pdf文档 reblue520
python读取txt#coding=utf-8importrequests#爬虫规则url="https://en.wikipedia.org/robots.txt"#读取网络资源res=requests.get(url).text#打印print(res)读取pdf#coding=utf-8frompdfminer.pdfparserimportPDFParser,PDFDocumentfro
李工ROBOT架构之硬件驱动或数据存储的详细代码
我将提供基于.NET8.0-windows7.0的半导体可靠性测试机上位机系统的硬件驱动和数据存储模块的详细代码实现。代码将与之前的UI框架（WPF、Prism、MVVM、MaterialDesignThemes、LiveCharts2）无缝集成，涵盖硬件驱动的抽象接口、不同协议（串口、TCP/UDP、Modbus）支持，以及数据存储的CSV、SQLite和MySQL实现。以下内容包含详细的代码示
李工ROBOT架构之扩展 TestController 以支持更多实验（如 TDDB、TC）并增强可扩展性
基于您的需求，我将为半导体可靠性测试机上位机系统提供以下内容的详细实现：扩展TestController以支持更多实验（如TDDB、TC）并增强可扩展性，以及硬件驱动层协议扩展（支持Modbus、UDP）。内容基于.NETCore8.0、WPF、MVVM模式、Prism框架，并使用中文描述，确保代码可落地且易于扩展。我将提供具体代码示例、设计思路和性能优化建议，并实现动态配置切换不同测试模式的功能
李工ROBOT架构之开篇 zhxup606 架构
以下是一个基于.NETCore+WPF的半导体可靠性测试机上位机系统的完整架构设计，涵盖UI、业务逻辑、硬件驱动、数据处理模块、日志、计算和扩展功能等。内容将按照模块化、分层设计进行详细说明，并提供关键代码示例。由于内容较长，我会分模块逐步展开，确保清晰且实用。同时，我会根据你的需求（MVVM、Prism、Autofac、Serilog、LiveCharts等）提供一个系统性框架，并附带中文解释。
ros-noetic搭建turtlebot3测试 qq_43133135 嵌入式 ros
准备先要搭建好ros环境，并用roscore验证，cmake--version查看版本不能低于3.2turtlebot3安装创建目录mkdir-pcatkin_turtlebot3/srccdcatkin_turtlebot3/src克隆最新的turtlebot3包gitclone-bnoetic-develhttps://github.com/ROBOTIS-GIT/turtlebot3_msg
RobotFramework打不开谷歌浏览器问题
当你装好了RobotFramework后，准备大干一场，如果你已正确把chromedriver放到python目录或者system32文件夹下，运行打开谷歌浏览器时，可以正常打开浏览器，如下图但是不能输入网址，发现RobotFramework运行日志中报以下错误，那可能是你的chromedriver版本和浏览器版本不兼容造成，更换一下相对应的版本就可以就可以正常运行，目前chromedriver已
睿尔曼系列机器人——以创新驱动未来，重塑智能协作新生态（上） BFT白芙堂机器人人工智能睿尔曼机器人协作机器人机器学习复合机器人
在工业自动化与智能服务深度融合的浪潮中，协作机器人凭借其安全、灵活、易部署的特性，成为推动产业升级的核心力量。睿尔曼（RuiermanRobotics）作为中国协作机器人领域的领军品牌，始终以“让机器人触手可及”为使命，专注于轻量化、高精度、高性价比的协作机器人研发与生产。其产品矩阵覆盖工业制造、物流仓储、医疗健康、商业服务等多场景，通过模块化设计、智能算法优化和开放生态构建，为全球客户提供高效、
第九章：LeRobot自定义硬件集成指南贾全实战具身智能机器人算法机器人学习人工智能机器学习
引言在前面的章节中，我们学习了如何使用LeRobot进行模仿学习、仿真实验以及摄像头配置。然而，真正的机器人研究往往需要使用自定义的硬件平台。每个研究团队或开发者可能都有自己独特的机器人设计，如何将这些自定义硬件无缝集成到LeRobot生态系统中，是实现高效机器人学习的关键。本章将详细介绍LeRobot的硬件集成框架，帮助读者掌握如何将自己的机器人硬件接入LeRobot系统。通过学习本章内容，你将
植物small RNA靶基因预测软件，psRobot Bioinfo科研生信筆記生物信息学科研绘图 psRoto small RNA miRNA 靶基因预测
psRoto软件安装网址http://omicslab.genetics.ac.cn/psRobot/downloads.php下载和安装wgethttp://omicslab.genetics.ac.cn/psRobot/program/WebServer/psRobot_v1.2.tar.gz#tar-zxvfpsRobot_v1.2.tar.gz#cdpsRobot_v1.2##./conf
第八章：LeRobot摄像头配置与应用指南贾全实战具身智能机器人深度学习人工智能算法机器学习机器人
引言在机器人学习系统中，视觉感知是至关重要的组成部分。摄像头作为机器人的"眼睛"，为系统提供环境信息，使机器人能够理解周围世界并做出相应的决策。LeRobot作为一个完整的机器人学习框架，提供了灵活且强大的摄像头支持系统，能够适配多种类型的摄像头设备。本章将详细介绍LeRobot的摄像头配置和使用方法，帮助读者掌握如何在机器人学习项目中有效地集成和使用视觉系统。8.1LeRobot摄像头系统架构L
LeRobot环境搭建与安装（简洁版）贾全 LeRobot系列教程机器人人工智能机器学习 ai
一、引言在上一篇文章（LeRobot入门：开启AI机器人开发之旅）中，我们全面了解了LeRobot的基本概念、核心优势和应用场景。现在，是时候动手实践了！本文将详细指导你完成LeRobot开发环境的搭建，确保你能够顺利开始LeRobot的学习和开发之旅。为了保证易读性，对文章进行了大幅精简，如果需要更加详细的介绍，可以查看详解篇：《LeRobot开发环境搭建详解》，二、准备工作创建专用虚拟环境虚拟
SafeMimic：迈向安全自主的人-到-机器人模仿移动操作三谷秋水智能体机器学习人工智能安全机器人人工智能机器学习
25年6月来自德州Austin分校的论文“SafeMimic:TowardsSafeandAutonomousHuman-to-RobotImitationforMobileManipulation”。机器人要想成为高效的家居助手，必须学会仅通过观察人类操作即可完成新的移动操作任务。仅凭人类的单个视频演示进行学习极具挑战性，因为机器人需要首先从演示中提取需要完成的任务及其方法，将策略从第三人称视角
Python3爬虫笔记 -- urllib Alst0n Python Python3 urllib urllib.request
urllib库是Python内置的HTTP请求库，不需要额外安装。它包含如下4个模块：request：HTTP请求模块error：异常处理模块parse：提供URL处理方法，包括拆分、解析、合并等robotparser：识别网站等robot.txt文件1、urllib.request发送请求连接URL，获取返回页面的源代码；默认请求方式为GETimporturllib.requestrespons
Python网络爬虫---urllib库介绍 db_hsk_2099 python 爬虫开发语言
1·urllib库简介·用途：urllib库是python的标准库之一，是python内置的HTTP请求库，用于发送HTTP/FTP请求，它可以看作处理URL的组件集合。·特点：简单易用，支持HTTP、HTTPS、FTP等协议。2.urllib库包含4大模块：目录：（1）urllib.request（2）urllib.parse（3）urllib.error（4）urllib.robotparse
ROS的可视化工具rviz介绍 Xian-HHappy 机器人-Robot 信息可视化
RViz简介RViz（RobotVisualization）是ROS（RobotOperatingSystem）中的一个可视化工具。它主要用于在三维空间中可视化机器人传感器数据、机器人的状态、规划路径等信息。RViz就像是一个“机器人世界”的三维展示窗口，能够让用户直观地看到机器人在虚拟环境中的各种情况。RViz的功能特点多传感器数据可视化RViz可以接收多种传感器数据。例如，它可以显示激光雷达（
ESP32学习笔记-读取SD卡并显示到屏幕上搞机械的假程序猿 ESP32学习笔记学习笔记 ESP32
硬件FireBeetle2ESP32-E开发板1.54"240x240IPS广视角TFT显示屏硬件接线测试代码//加载库#include"Arduino.h"#include"FS.h"#include"SD.h"#include"SPI.h"#include"DFRobot_GDL.h"//定义显示屏针脚#defineTFT_DCD2#defineTFT_CSD6#defineTFT_RSTD3
ROS2 强化学习：案例与代码实战芯动大师 ROS2学习目标检测人工智能
一、引言在机器人技术不断发展的今天，强化学习（RL）作为一种强大的机器学习范式，为机器人的智能决策和自主控制提供了新的途径。ROS2（RobotOperatingSystem2）作为新一代机器人操作系统，具有更好的实时性、分布式性能和安全性，为强化学习在机器人领域的应用提供了更坚实的基础。本文将通过一个具体案例，深入探讨ROS2与强化学习的结合应用，并提供相关代码实现。二、案例背景本案例以移动机器
python教学爬虫入门早柚不用工作了 python
Python爬虫入门教程：从零基础到抓取数据一、什么是网络爬虫？网络爬虫（WebCrawler），也称为网络蜘蛛（WebSpider），是一种按照一定的规则，自动抓取万维网信息的程序或者脚本。它能够模拟人类在浏览器中的操作，自动访问网页，提取所需的数据，广泛应用于数据采集、搜索引擎优化、市场调研等领域。但在编写爬虫时，务必遵守法律法规和网站的robots.txt协议，避免过度抓取对网站造成负担，同
DIY语音控制车辆玩具全攻略：从硬件组装到功能实现欧阳天羲硬件工程语音识别自动驾驶
一、设备清单与成本估算1.1硬件组件列表组件名称价格（元）备注ArduinoUno兼容板7.04控制核心，支持多传感器接入DFRobot离线语音识别模块105支持10条自定义语音指令L298N电机驱动板5双路电机驱动，带散热片直流减速电机×2（JGB37-520）3012V供电，150转/分钟SG90微型舵机5控制前轮转向HC-SR04超声波传感器2.45测距范围2-400cm18650锂电池（3
Python Robot Framework【自动化测试框架】简介老胖闲聊 Python库大全 python 开发语言
想全面了解DeepSeek的看过来【包邮】DeepSeek全攻略人人需要的AI通识课零基础掌握DeepSeek的实用操作手册指南【限量作者亲笔签名版售完即止】玩转DeepSeek这本就够了【自营包邮】DeepSeek实战指南deepseek从入门到精通实用操作指南现代科技科普读物AI普及知识读物人工智能使用教程中小学读物京东超级618Python初学者的入门教程动手学深度学习PyTorch版李沐和
索引优化SEO帮助你的网站内容更快被搜索引擎发现推广小赵经验分享
想要提升网站收录效果？别再盲目修改标题和关键词了！技术SEO中的索引优化才是关键所在！下面分享几个经过实践验证的索引优化技巧，帮助你的网站内容更快被搜索引擎发现。1、仔细检查robots.txt和noindex设置很多网站的内容无法被收录，问题往往出在网站自身的限制上。务必检查robots.txt文件和各页面的metarobots标签，确保重要内容没有被错误屏蔽。2、优化网站层级结构搜索引擎爬虫更
LeRobot: 让机械臂接入大模型小众AI AI开源人工智能 AI编程
HuggingFace推出的开源项目LeRobot引发了业界广泛关注。这一项目通过整合最先进的机器学习算法和便捷的开发工具链，为开发者提供了一个高效、易用的机器人AI开发平台，堪称机器人领域的“Transformer时刻”。LeRobot旨在为PyTorch中的真实机器人技术提供模型、数据集和工具。目标是降低机器人技术的准入门槛，以便每个人都可以从共享数据集和预训练模型中受益。LeRobot包含最
探索未来科技：Photon Vision，机器人竞赛的视觉革新郎轶诺
探索未来科技：PhotonVision，机器人竞赛的视觉革新photonvisionPhotonVisionisthefree,fast,andeasy-to-usecomputervisionsolutionfortheFIRSTRoboticsCompetition.项目地址:https://gitcode.com/gh_mirrors/ph/photonvision在当今科技快速发展的时代，
20亿！禾赛获百度萝卜快跑独家定点，ADAS激光雷达“破圈”L4应用高工智能汽车百度
继在前装量产领域“破圈”之后，禾赛率先将ADAS半固态激光雷达大规模应用部署在Robotaxi上面。近日，在武汉大街小巷穿梭着的数百辆百度萝卜快跑无人驾驶出租车，让自动驾驶再度火出圈。据了解，此次在武汉投入运营的无人驾驶车辆采用了百度Apollo第五代自动驾驶系统解决方案，搭载了禾赛Pandar系列高性能激光雷达作为感知主雷达。而今年，更安全、体验更舒适的第六代百度Apollo无人车也将陆续投放市
Node鼠标键盘屏幕控制泓博 node.js
安装RobotJSRobotJS是一个Node.js库，用于控制鼠标、键盘和屏幕。安装前确保已安装Node.js和npm。通过以下命令安装：npminstallrobotjs基本鼠标控制RobotJS提供鼠标移动、点击和拖动的功能。以下代码示例展示如何移动鼠标并点击：constrobot=require("robotjs");//移动鼠标到屏幕坐标(100,100)robot.moveMouse(
【Androidstudio】kotlin class org.greenrobot.greendao.test.DbTest, unresolved supertypes: android.test 来了就未晚 androidstudio android studio
问题描述kotlin项目中引入GreenDao数据库，在编译并运行时出现如下问题：Supertypesofthefollowingclassescannotberesolved.Pleasemakesureyouhavetherequireddependenciesintheclasspath:classorg.greenrobot.greendao.test.DbTest,unresolveds
桌面上有多个球在同时运动，怎么实现球之间不交叉，即碰撞？换个号韩国红果果 html 小球碰撞
稍微想了一下，然后解决了很多bug，最后终于把它实现了。其实原理很简单。在每改变一个小球的x y坐标后，遍历整个在dom树中的其他小球，看一下它们与当前小球的距离是否小于球半径的两倍？若小于说明下一次绘制该小球（设为a）前要把他的方向变为原来相反方向（与a要碰撞的小球设为b），即假如当前小球的距离小于球半径的两倍的话，马上改变当前小球方向。那么下一次绘制也是先绘制b，再绘制a，由于a的方向已经改变
《高性能HTML5》读后整理的Web性能优化内容白糖_ html5
读后感先说说《高性能HTML5》这本书的读后感吧，个人觉得这本书前两章跟书的标题完全搭不上关系，或者说只能算是讲解了“高性能”这三个字，HTML5完全不见踪影。个人觉得作者应该首先把HTML5的大菜拿出来讲一讲，再去分析性能优化的内容，这样才会有吸引力。因为只是在线试读，没有机会看后面的内容，所以不胡乱评价了。
[JShop]Spring MVC的RequestContextHolder使用误区 dinguangx jeeshop 商城系统 jshop 电商系统
在spring mvc中，为了随时都能取到当前请求的request对象，可以通过RequestContextHolder的静态方法getRequestAttributes()获取Request相关的变量，如request, response等。在jshop中，对RequestContextHolder的
算法之时间复杂度周凡杨 java 算法时间复杂度效率
在计算机科学中，算法的时间复杂度是一个函数，它定量描述了该算法的运行时间。这是一个关于代表算法输入值的字符串的长度的函数。时间复杂度常用大O符号表述，不包括这个函数的低阶项和首项系数。使用这种方式时，时间复杂度可被称为是渐近的，它考察当输入值大小趋近无穷时的情况。这样用大写O()来体现算法时间复杂度的记法，
Java事务处理 g21121 java
一、什么是Java事务通常的观念认为，事务仅与数据库相关。事务必须服从ISO/IEC所制定的ACID原则。ACID是原子性（atomicity）、一致性（consistency）、隔离性（isolation）和持久性（durability）的缩写。事务的原子性表示事务执行过程中的任何失败都将导致事务所做的任何修改失效。一致性表示当事务执行失败时，所有被该事务影响的数据都应该恢复到事务执行前的状
Linux awk命令详解 510888780 linux
一. AWK 说明 awk是一种编程语言，用于在linux/unix下对文本和数据进行处理。数据可以来自标准输入、一个或多个文件，或其它命令的输出。它支持用户自定义函数和动态正则表达式等先进功能，是linux/unix下的一个强大编程工具。它在命令行中使用，但更多是作为脚本来使用。 awk的处理文本和数据的方式：它逐行扫描文件，从第一行到
android permission 布衣凌宇 Permission
<uses-permission android:name="android.permission.ACCESS_CHECKIN_PROPERTIES" ></uses-permission>允许读写访问"properties"表在checkin数据库中，改值可以修改上传 <uses-permission android:na
Oracle和谷歌Java Android官司将推迟 aijuans java oracle
北京时间 10 月 7 日，据国外媒体报道，Oracle 和谷歌之间一场等待已久的官司可能会推迟至 10 月 17 日以后进行，这场官司的内容是 Android 操作系统所谓的 Java 专利权之争。本案法官 William Alsup 称根据专利权专家 Florian Mueller 的预测，谷歌 Oracle 案很可能会被推迟。　　该案中的第二波辩护被安排在 10 月 17 日出庭，从目前看来
linux shell 常用命令 antlove linux shell command
grep [options] [regex] [files] /var/root # grep -n "o" * hello.c:1:/* This C source can be compiled with:
Java解析XML配置数据库连接(DOM技术连接 SAX技术连接) 百合不是茶 sax技术 Java解析xml文档 dom技术 XML配置数据库连接
XML配置数据库文件的连接其实是个很简单的问题,为什么到现在才写出来主要是昨天在网上看了别人写的,然后一直陷入其中,最后发现不能自拔所以今天决定自己完成 ,,,,现将代码与思路贴出来供大家一起学习 XML配置数据库的连接主要技术点的博客; JDBC编程 : JDBC连接数据库 DOM解析XML: DOM解析XML文件 SA
underscore.js 学习（二） bijian1013 JavaScript underscore
Array Functions 所有数组函数对参数对象一样适用。1.first _.first(array, [n]) 别名: head, take 返回array的第一个元素，设置了参数n，就
plSql介绍 bijian1013 oracle 数据库 plsql
/* * PL/SQL 程序设计学习笔记 * 学习plSql介绍.pdf * 时间：2010-10-05 */ --创建DEPT表 create table DEPT ( DEPTNO NUMBER(10), DNAME NVARCHAR2(255), LOC NVARCHAR2(255) ) delete dept; select
【Nginx一】Nginx安装与总体介绍 bit1129 nginx
启动、停止、重新加载Nginx nginx 启动Nginx服务器，不需要任何参数u nginx -s stop 快速(强制)关系Nginx服务器 nginx -s quit 优雅的关闭Nginx服务器 nginx -s reload 重新加载Nginx服务器的配置文件 nginx -s reopen 重新打开Nginx日志文件
spring mvc开发中浏览器兼容的奇怪问题 bitray jquery Ajax springMVC 浏览器上传文件
最近个人开发一个小的OA项目,属于复习阶段.使用的技术主要是spring mvc作为前端框架,mybatis作为数据库持久化技术.前台使用jquery和一些jquery的插件. 在开发到中间阶段时候发现自己好像忽略了一个小问题,整个项目一直在firefox下测试,没有在IE下测试,不确定是否会出现兼容问题.由于jquer
Lua的io库函数列表 ronin47 lua io
1、io表调用方式：使用io表，io.open将返回指定文件的描述，并且所有的操作将围绕这个文件描述　　io表同样提供三种预定义的文件描述io.stdin,io.stdout,io.stderr 　　2、文件句柄直接调用方式,即使用file:XXX()函数方式进行操作,其中file为io.open()返回的文件句柄　　多数I/O函数调用失败时返回nil加错误信息,有些函数成功时返回nil
java-26-左旋转字符串 bylijinnan java
public class LeftRotateString { /** * Q 26 左旋转字符串 * 题目：定义字符串的左旋转操作：把字符串前面的若干个字符移动到字符串的尾部。 * 如把字符串abcdef左旋转2位得到字符串cdefab。 * 请实现字符串左旋转的函数。要求时间对长度为n的字符串操作的复杂度为O(n)，辅助内存为O(1)。 */ pu
《vi中的替换艺术》-linux命令五分钟系列之十一 cfyme linux命令
vi方面的内容不知道分类到哪里好，就放到《Linux命令五分钟系列》里吧！今天编程，关于栈的一个小例子，其间我需要把”S.”替换为”S->”(替换不包括双引号)。其实这个不难，不过我觉得应该总结一下vi里的替换技术了，以备以后查阅。 1 所有替换方案都要在冒号“:”状态下书写。 2 如果想将abc替换为xyz，那么就这样 :s/abc/xyz/ 不过要特别
[轨道与计算]新的并行计算架构 comsci 并行计算
我在进行流程引擎循环反馈试验的过程中，发现一个有趣的事情。。。如果我们在流程图的每个节点中嵌入一个双向循环代码段，而整个流程中又充满着很多并行路由，每个并行路由中又包含着一些并行节点，那么当整个流程图开始循环反馈过程的时候，这个流程图的运行过程是否变成一个并行计算的架构呢？
重复执行某段代码 dai_lm android
用handler就可以了 private Handler handler = new Handler(); private Runnable runnable = new Runnable() { public void run() { update(); handler.postDelayed(this, 5000); } }; 开始计时 h
Java实现堆栈（list实现） datageek 数据结构——堆栈
public interface IStack<T> { //元素出栈，并返回出栈元素 public T pop(); //元素入栈 public void push(T element); //获取栈顶元素 public T peek(); //判断栈是否为空 public boolean isEmpty
四大备份MySql数据库方法及可能遇到的问题 dcj3sjt126com DB backup
一：通过备份王等软件进行备份前台进不去？用备份王等软件进行备份是大多老站长的选择，这种方法方便快捷，只要上传备份软件到空间一步步操作就可以，但是许多刚接触备份王软件的客用户来说还原后会出现一个问题：因为新老空间数据库用户名和密码不统一，网站文件打包过来后因没有修改连接文件，还原数据库是好了，可是前台会提示数据库连接错误，网站从而出现打不开的情况。解决方法：学会修改网站配置文件，大多是由co
github做webhooks：[1]钩子触发是否成功测试 dcj3sjt126com github git webhook
转自: http://jingyan.baidu.com/article/5d6edee228c88899ebdeec47.html github和svn一样有钩子的功能，而且更加强大。例如我做的是最常见的push操作触发的钩子操作，则每次更新之后的钩子操作记录都会在github的控制板可以看到！工具/原料 github 方法/步骤
">的作用" target="_blank">JSP中的作用蕃薯耀
JSP中<base href="<%=basePath%>">的作用 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
linux下SAMBA服务安装与配置 hanqunfeng linux
局域网使用的文件共享服务。一.安装包： rpm -qa | grep samba samba-3.6.9-151.el6.x86_64 samba-common-3.6.9-151.el6.x86_64 samba-winbind-3.6.9-151.el6.x86_64 samba-client-3.6.9-151.el6.x86_64 samba-winbind-clients
guava cache IXHONG cache
缓存，在我们日常开发中是必不可少的一种解决性能问题的方法。简单的说，cache 就是为了提升系统性能而开辟的一块内存空间。　　缓存的主要作用是暂时在内存中保存业务系统的数据处理结果，并且等待下次访问使用。在日常开发的很多场合，由于受限于硬盘IO的性能或者我们自身业务系统的数据处理和获取可能非常费时，当我们发现我们的系统这个数据请求量很大的时候，频繁的IO和频繁的逻辑处理会导致硬盘和CPU资源的
Query的开始--全局变量,noconflict和兼容各种js的初始化方法 kvhur JavaScript jquery css
这个是整个jQuery代码的开始，里面包含了对不同环境的js进行的处理，例如普通环境，Nodejs，和requiredJs的处理方法。还有jQuery生成$, jQuery全局变量的代码和noConflict代码详解完整资源： http://www.gbtags.com/gb/share/5640.htm jQuery 源码： (
美国人的福利和中国人的储蓄 nannan408
今天看了篇文章，震动很大，说的是美国的福利。美国医院的无偿入院真的是个好措施。小小的改善，对于社会是大大的信心。小孩，税费等，政府不收反补，真的体现了人文主义。美国这么高的社会保障会不会使人变懒？答案是否定的。正因为政府解决了后顾之忧，人们才得以倾尽精力去做一些有创造力，更造福社会的事情，这竟成了美国社会思想、人
N阶行列式计算(JAVA) qiuwanchi N阶行列式计算
package gaodai; import java.util.List; /** * N阶行列式计算 * @author 邱万迟 * */ public class DeterminantCalculation { public DeterminantCalculation(List<List<Double>> determina
C语言算法之打渔晒网问题 qiufeihu c 算法
如果一个渔夫从2011年1月1日开始每三天打一次渔，两天晒一次网，编程实现当输入2011年1月1日以后任意一天，输出该渔夫是在打渔还是在晒网。代码如下： #include <stdio.h> int leap(int a) /*自定义函数leap()用来指定输入的年份是否为闰年*/ { if((a%4 == 0 && a%100 != 0
XML中DOCTYPE字段的解析 wyzuomumu xml
DTD声明始终以!DOCTYPE开头,空一格后跟着文档根元素的名称,如果是内部DTD,则再空一格出现[],在中括号中是文档类型定义的内容. 而对于外部DTD,则又分为私有DTD与公共DTD,私有DTD使用SYSTEM表示,接着是外部DTD的URL. 而公共DTD则使用PUBLIC,接着是DTD公共名称,接着是DTD的URL. 私有DTD <!DOCTYPErootSYST

ROS 科大讯飞语音（三）识别篇

ROS 科大讯飞语音（三）识别篇

环境准备

编写节点

语音识别节点代码

配置CMakeLists.txt

编译测试

编译

测试

效果

你可能感兴趣的:(ROBOT)