hiascend

【SDK案例系列 01】基于MindX SDK的视频转码应用案例详解

源码链接：
https://gitee.com/ai_samples/atlas_mindxsdk_samples/tree/master/contrib/cv/data_process/video_transcoding

一、使用live555搭建 rtsp server

（1）安装live555

wget http://www.live555.com/liveMedia/public/live555-latest.tar.gz
tar xzf live555-latest.tar.gz
cd live
./genMakefiles linux-64bit #注意后面这个参数是根据当前文件夹下config.<后缀>获取得到的
make

（2）启动rtsp server

cd mediaServer
./live555MediaServer

（3）验证rtsp server是否正常

下面上传文件到 live555MediaServer 同级目录

[root@localhost mediaServer]#
[root@localhost mediaServer]# ls
COPYING         DynamicRTSPServer.cpp  DynamicRTSPServer.o  live555MediaServer.cpp  Makefile       Makefile.tail  video.264
COPYING.LESSER  DynamicRTSPServer.hh   live555MediaServer   live555MediaServer.o    Makefile.head  version.hh
[root@localhost mediaServer]#

我上传了一个 video.264 那么，使用http协议访问的地址就行 http://你的ip:8000/文件名

例：http://127.0.0.1:8000/video.264；

使用rtsp协议访问的地址 http://你的ip/文件名

例：rtsp://127.0.0.1/video.264

然后请准备一个流媒体播放器，我下载的是vlc播放器

输入测试地址：

输入测试地址后点击播放，播放的时候能看到视频，说明rtsp server功能正常。

二、安装昇腾驱动

先安装昇腾驱动，昇腾驱动请参考各个产品安装手册，安装完成后npu-smi info 显示安装成功

[root@localhost ~]#
[root@localhost ~]# npu-smi info
+-------------------------------------------------------------------------------------------------+
| npu-smi 22.0.2                   Version: 22.0.2                                                |
+------------------+--------------+---------------------------------------------------------------+
| NPU    Name      | Health       | Power(W)             Temp(C)           Hugepages-Usage(page)  |
| Chip   Device    | Bus-Id       | AICore(%)            Memory-Usage(MB)                         |
+==================+==============+===============================================================+
| 1      310       | OK           | 12.8                 45                0   / 0                |
| 0      0         | 0000:05:00.0 | 0                    2621  / 8192                             |
+==================+==============+===============================================================+

三、安装MindX SDK > mxVision

（1）MindX SDK需要通过官网获取。

（2）mxVision说明手册：

https://www.hiascend.com/document/detail/zh/mind-sdk/30rc3/quickstart/visionquickstart/visionquickstart_0000.html

（3）安装MindX SDK

./Ascend-mindxsdk-mxvision_3.0.RC2_linux-aarch64.run --install --install-path=/usr/local/sdk_home

–install-path为指定安装的路径

（4）安装成功后会提示如下信息

Installing collected packages:mindx
Successfully installed mindx-3.0.RC2

（5）安装成功后在对应目录下查看，能看到mxVision

[root@localhost sdk_home]#
[root@localhost sdk_home]# pwd
/usr/local/sdk_home
[root@localhost sdk_home]# ls
mxVision mxVision-3.0.RC2
[root@localhost sdk_home]#
[root@localhost sdk_home]#

（6）MindX SDK使用中需要用到OSD功能，安装后需要执行以下命令，生成om文件

bash /usr/local/sdk_home/mxVision/operators/opencvosd/generate_osd_om.sh

执行成功后，显示如下效果

[root@localhost ~]# bash /usr/local/sdk_home/mxVision/operators/opencvosd/generate_osd_om.sh
ASCEND_HOME is set to /usr/local/Ascend by user
Set ASCEND_VERSION to the default value:ascend-toolkit/latest
ATC start working now,please wait for a moment.
ATC run success, welcome to the next use.

The model has been successfully converted to om,please get it under /usr/local/sdk_home/mxVision/operators/opencvosd.
[root@localhost ~]#

（9）安装完MindX SDK后，需要配置环境变量

.bashrc文件添加以下环境变量

# 安装mxVision时配置
. /usr/local/sdk_home/mxVision/set_env.sh

用户也可以通过修改~/.bashrc文件方式设置永久环境变量，操作如下：

a) 以运行用户在任意目录下执行vi ~/.bashrc命令，打开.bashrc文件，在文件最后一行后面添加上述内容。

b) 执行:wq!命令保存文件并退出。

c) 执行source ~/.bashrc命令使其立即生效。

四、使用video_transcoding

1、修改run_cpp.sh中MX_SDK_HOME为MindX SDK安装目录

export MX_SDK_HOME=/usr/local/sdk_home/mxVision

2、修改data/pipeline/test.pipeline中rtspUrl，rtspUrl修改为拉取视频流的链接

"rtspUrl": "rtsp://127.0.0.1/video.264"

3、修改run_cpp.sh权限

chmod +x run_cpp.sh

4、执行run_cpp.sh

./run_cpp.sh

5、目录下会生成out.h264

[root@localhost video_transcoding]#
[root@localhost video_transcoding]# ls
README.md  build  cpp  data  main  out.h264  run_cpp.sh
[root@localhost video_transcoding]#

五、video_transcoding详解

1、技术流程图

视频解码：调用硬件（DVPP）解码能力，转换为 YUV 格式图像数据。

图像缩放：基于硬件（DVPP）图像加速处理能力，将图像缩放到一定尺寸大小。

视频编码：调用硬件（DVPP）编码能力，将 YUV 格式的图像数据转换为 H264 视频流。

2、pipeline详解

{
    "encoder": {
        "stream_config": {  ##设置业务流在哪个芯片上处理
            "deviceId": "0"
        },
        "mxpi_rtspsrc0": {  ##拉取视频流
            "props": {
                "rtspUrl": "rtsp://127.0.0.1/video.264",
                "channelId": "0"
            },
            "factory": "mxpi_rtspsrc",
            "next": "queue0"
        },

        "queue0":{  ##队列缓存
            "props":{
                "max-size-buffers":"50"
            },
            "factory":"queue",
            "next": "mxpi_videodecoder0"
        },

        "mxpi_videodecoder0": {  ##视频解码（纯硬件）
            "props": {
                "inputVideoFormat": "H264",
                "outputImageFormat": "YUV420SP_NV12",
                "vdecChannelId": "0"
            },
            "factory": "mxpi_videodecoder",
            "next": "queue1"
        },

        "queue1":{  ##队列缓存
            "props":{
                "max-size-buffers":"50"
            },
            "factory":"queue",
            "next": "mxpi_imageresize0"
        },

        "mxpi_imageresize0": {  ##视频缩放（纯硬件）
            "props": {
                "dataSource": "mxpi_videodecoder0",
                "resizeHeight": "288",
                "resizeWidth": "352"
            },
            "factory": "mxpi_imageresize",
            "next": "queue2"
        },

        "queue2":{  ##队列缓存
            "props":{
                "max-size-buffers":"50"
            },
            "factory":"queue",
            "next": "mxpi_videoencoder0"
        },

        "mxpi_videoencoder0": {  ##视频编码（纯硬件）
            "props": {
                "dataSource": "mxpi_imageresize0",
                "imageHeight": "288",
                "imageWidth": "352",
                "inputFormat": "YUV420SP_NV12",
                "outputFormat": "H264",
                "fps": "1",
                "iFrameInterval": "50"
            },
            "factory": "mxpi_videoencoder",
            "next": "queue3"
        },

        "queue3":{  ##队列缓存
            "props":{
                "max-size-buffers":"50"
            },
            "factory":"queue",
            "next": "appsink0"
        },

        "appsink0": {  ##视频流输出
            "factory": "appsink"
        }
   }
}

3、源码详解

namespace {
    std::string ReadPipelineConfig(const std::string& pipelineConfigPath)  // 读取pipeline配置文件
    {
        std::ifstream file(pipelineConfigPath.c_str(), std::ifstream::binary);
        if (!file) {
            LogError << pipelineConfigPath <<" file dose not exist.";
            return "";
        }
        file.seekg(0, std::ifstream::end);
        uint32_t fileSize = file.tellg();
        file.seekg(0);
        std::unique_ptr<char[]> data(new char[fileSize]);
        file.read(data.get(), fileSize);
        file.close();
        std::string pipelineConfig(data.get(), fileSize);
        return pipelineConfig;
    }
}

int main(int argc, char* argv[])
{
    // 读取pipeline配置文件
    std::string pipelineConfigPath = "data/pipeline/test.pipeline";
    std::string pipelineConfig = ReadPipelineConfig(pipelineConfigPath);
    if (pipelineConfig == "") {
        LogError << "Read pipeline failed.";
        return APP_ERR_COMM_INIT_FAIL;
    }

    // 初始化 stream manager 资源
    MxStream::MxStreamManager mxStreamManager;
    APP_ERROR ret = mxStreamManager.InitManager();
    if (ret != APP_ERR_OK) {
        LogError << "Failed to init Stream manager, ret = " << ret << ".";
        return ret;
    }

    // 根据指定的pipeline配置创建Stream
    ret = mxStreamManager.CreateMultipleStreams(pipelineConfig);
    if (ret != APP_ERR_OK) {
        LogError << "Failed to create Stream, ret = " << ret << ".";
        return ret;
    }

    // 创建空的h264文件
    FILE *fp = fopen("./out.h264", "wb");
    if (fp == nullptr) {
        LogError << "Failed to open file.";
        return APP_ERR_COMM_OPEN_FAIL;
    }

    bool m_bFoundFirstIDR = false;
    bool bIsIDR = false;
    uint32_t frameCount = 0;
    uint32_t MaxframeCount = 1000;

    std::string streamName = "encoder";
    int inPluginId = 0;

    while (1) {
        // 获取视频编码后的视频帧
        MxStream::MxstDataOutput* output = mxStreamManager.GetResult(streamName, inPluginId);
        if (output == nullptr) {
            LogError << "Failed to get pipeline output.";
            return ret;
        }

        // H264视频格式，第一帧写入必须是IDR帧
        bIsIDR = (output->dataSize > 1);
        if(!m_bFoundFirstIDR)
        {
            if(!bIsIDR) {
                continue;
            } else {
                m_bFoundFirstIDR = true;
            }
        }

        // 把视频编码后的数据帧写入h264文件
        if (fwrite(output->dataPtr, output->dataSize, 1, fp) != 1) {
            LogInfo << "write frame to file fail";
        }

        frameCount++;
        if (frameCount > MaxframeCount) {
            LogInfo << "write frame to file done";
            break;
        }

        delete output;
    }

    // 关闭h264文件
    fclose(fp);

    // 销毁Streams
    mxStreamManager.DestroyAllStreams();

    return 0;
}

你可能感兴趣的:(推理开发-MindX,SDK系列,音视频,linux,运维)

Taro 本地存储 API 详解与实用指南
Taro本地存储API详解与实用指南在多端开发中，本地存储是非常常用的功能。无论是保存用户登录信息、缓存接口数据，还是实现离线体验，合理使用本地存储都能极大提升应用的性能和用户体验。Taro作为一款多端统一开发框架，提供了与微信小程序一致的本地存储API，支持异步和同步两种调用方式，方便开发者在不同平台下统一管理本地数据。本文将详细介绍Taro的本地存储相关API，包括：Taro.setStora
从 C# 到 Python：项目实战第五天的飞跃 AI、少年郎数据库 c#开发语言
在前面三天的学习中，我们已经掌握了Python的基础语法、数据结构以及一些核心库的使用。今天，我们将通过三个实战项目，深入对比C#和Python在命令行工具开发、Web应用开发以及数据处理方面的差异，感受Python在实际项目中的强大魅力。一、命令行工具开发：文件批量处理命令行工具是开发者日常工作中经常用到的工具，无论是文件处理、数据转换还是系统管理，都离不开命令行工具的身影。下面我们就来对比一下
YOLO11-obb使用C++及trt进行推理（详细版）范男 c++目标检测计算机视觉 YOLO 图像处理
针对YOLO的使用.engine权重及C++代码进行推理使用TensorRT-YOLO项目网站是：https://github.com/laugh12321/TensorRT-YOLO可以直接选择git或者下载下来gitclonehttps://github.com/laugh12321/TensorRT-YOLOcdTensorRT-YOLO1.编译主程序教程网址是：https://github
Java EE的历史（转）古剑诛仙
转自公众号码农翻身。前言：昨天下午有同学问我JavaEE是干什么用的，能开发什么系统，我在QQ中敲了很多字，掰扯了半天，终于给他整明白了。我突然意识在其实很多初学者对JavaEE的来龙去脉并去清楚，大家并不知道为什么会出现这个技术，要解决什么问题。所以就写了这篇文章介绍下JavaEE的历史。先把时间扯的远一点，94年我上高中的时候，见过亲戚家有过电脑，很好奇，虽然上面都是一些单机桌面程序，根本上不
2025AI智能体平台，10个Agent智能体开发平台推荐 cczixun 人工智能智能体大数据安全
1、扣子（Coze）开发平台字节跳动推出的AI智能体开发平台，用户无需编程基础，通过拖拽和配置即可快速创建聊天机器人，并部署到豆包、飞书、抖音、微信等多个平台。平台提供超过1万+的插件，内置豆包・Functioncall32k、通义千问-Max8k等多个大模型，还具备知识库、数据库、图像流等功能。2、通义千问Agent平台阿里巴巴基于通义千问大模型打造的智能体开发框架，以强大的多模态能力和工具集成
Redis面试精讲 Day 4：Redis事务与原子性保证在未来等你 Redis面试专栏 Redis 面试数据库缓存
【Redis面试精讲Day4】Redis事务与原子性保证开篇欢迎来到"Redis面试精讲"系列的第4天！今天我们将深入探讨Redis的事务机制与原子性保证，这是Redis面试中出现频率极高的核心知识点。掌握Redis事务不仅能帮助你在面试中脱颖而出，更能让你在实际开发中合理利用事务特性构建可靠的分布式系统。在面试中，面试官通常会通过以下方式考察候选人对Redis事务的理解：解释Redis事务的基本
实现一个HTML页面，上传图片后可以测量两条辅助线之间的距离，支持点击添加、拖动和右键删除辅助线
一、项目背景偶尔需要测量图片上元素的宽度高度和间距。因此实现一个交互式、可视化的测距工具。开发一个简单易用的HTML页面，用户可以上传任意图片，在图片上通过点击添加辅助线，拖动调整辅助线位置，右键删除不需要的辅助线，同时自动计算并显示相邻辅助线间的距离，提升效率和准确度。二、核心功能图片上传用户可以上传本地图片作为测距背景，图片会按用户指定的宽高展示，支持任意尺寸，不做限制。辅助线添加用户点击图片
5. 移动端适配rem方案未路过
1.rem+动态html的font-sizerem单位是相对于html元素的font-size来设置的，那么如果我们需要在不同的屏幕下有不同的尺寸，可以动态的修改html的font-size尺寸。比如如下案例：1.设置一个盒子的宽度是2rem；2.设置不同的屏幕上html的font-size不同；image.png这样在开发中，我们只需要考虑两个问题：问题一：针对不同的屏幕，设置html不同的fo
从传统到智能的跨越——广州曼顿断路器如何赋能工业能源革命 mdkk678 能源人工智能
在广州某汽车制造厂的产线上，冲压机正轰鸣作业，但后台系统却悄然优化着每一度电的流向——当设备空载时，电流自动降低；光伏板发电高峰期，储能电池立即启动存储；甚至某台焊接机器人因老化出现电流波动，0.1秒内断路器便切断电源并推送警报。这一系列“聪明操作”的幕后指挥官，正是广州曼顿的智能断路器。传统断路器的“智商”觉醒过去，工厂里的断路器像个“哑巴保安”：只能等电路过载、短路时跳闸，却对绝缘老化、谐波污
卫浴吊顶与烟机控制应用方案（OB5510CGP与OB5510CIP的应用）
在现代家居生活中，卫浴吊顶和烟机作为厨房与卫生间的核心设备，其智能化控制水平直接影响着用户的使用体验与生活品质。昂宝OB5510系列芯片，凭借其卓越的性能与高度集成化的设计，为卫浴吊顶和烟机的智能控制提供了强大的“芯”动力，成为众多家电制造商的首选方案。OB5510系列芯片简介OB5510系列芯片包括OB5510CGP（SOP16封装）和OB5510CIP（SOP20封装），均由国内知名半导体企业
用 Trae AI Vibe Coding 写一个 AI 智能体太@阳#鸟 LangChain 人工智能状态模式
这里写自定义目录标题前言代码识别成果展示开发反思与洞见未来演进方向结语：新范式革命前言在初步学习了Langchain的基础知识后，我产生了一个大胆的想法：能否完全不写代码，仅靠AI直接生成一个完整的智能体系统？这个想法最终催生了Agent-Zero-一个完全由AI生成的智能体框架。万万没想到真的给我实现了，弄了一个Agent-Zero的简易版本，全程一个代码都没有写，准确的来说我可能还有很多代码不
Vite：下一代前端构建工具的革命布兰妮甜 vite javascript 前端构建工具
Hi，我是布兰妮甜！在现代前端开发领域，构建工具的选择对开发体验和项目效率有着决定性影响。从早期的Grunt、Gulp到Webpack、Rollup，前端构建工具不断演进。而Vite的出现，则彻底改变了传统构建工具的工作模式，为开发者带来了前所未有的开发体验。本文将深入探讨Vite的设计哲学、核心特性、工作原理以及实际应用场景。文章目录一、什么是Vite？二、Vite的核心设计理念2.1利用浏览器
python docker 阿狸的家 SDN docker
我们的开发人员和布署人员经常因环境问题，而使得安装过程困难重重，相比于虚拟机较少硬件资源的虚拟化，同时不需要加载虚拟机操作系统的耗时，因为docker共享宿主机的操作系统Centos和Ubunta共用内核kernel即bootfs相同，但是加载内核的rootfs不同，即文件的结构目录不同docker三要素docker可以看作为一个小型的linux系统，部署时秒级启动镜像：模板（应用程序代码），一个
【深度学习新浪潮】什么是system 1和system 2？小米玄戒Andrew 深度学习新浪潮深度学习人工智能大模型推理模型 COT 模型蒸馏动态推理
在大模型研究中，System1和System2的概念源于心理学家DanielKahneman的双系统理论，用于描述人类思维的两种模式。System1代表快速、直觉、自动化的思维（如模式识别），而System2代表慢速、有意识、需要努力的逻辑推理（如复杂数学计算）。这一理论被引入AI领域后，成为理解大模型能力边界和优化方向的重要框架。一、大模型中的System1与System2的定义System1（
赏帮赚和趣闲赚哪个好,刷视频挣钱一天300元(帮赏赚安全吗)详细比较小易的生活
赏帮赚和趣闲赚都是目前市场上较为知名的兼职赚钱平台，它们在任务类型、赚钱机制、用户评价等方面各有特点。以下是对这两个平台的详细比较：一、平台背景与特点赏帮赚：赏帮赚是一款由重庆优玖互邦科技有限公司开发的手机应用，专注于为自由就业者、灵活就业者提供佣金发放方案，并为用户提供完成任务获得奖励的平台。该平台已有十多年的历史，积累了丰富的经验和实力。二、任务类型与难度赏帮赚：赏帮赚提供的任务类型非常丰富，
车载诊断架构 --- 诊断功能开发流程汽车电子实验室电子电器架构开发流程车载电子电气架构架构电子电气架构 ECU刷写与busoff原则电气电子架构开发的应对策略开发语言
我是穿拖鞋的汉子，魔都中坚持长期主义的汽车电子工程师。老规矩，分享一段喜欢的文字，避免自己成为高知识低文化的工程师：做到欲望极简，了解自己的真实欲望，不受外在潮流的影响，不盲从，不跟风。把自己的精力全部用在自己。一是去掉多余，凡事找规律，基础是诚信；二是系统思考、大胆设计、小心求证；三是“一张纸制度”，也就是无论多么复杂的工作内容，要在一张纸上描述清楚；四是要坚决反对虎头蛇尾，反对繁文缛节，反对老
forwardRef ：打破函数组件封装限制的技巧
在React开发中，我们经常会遇到这样一个需求：如何让父组件直接访问子组件内部的DOM元素或组件实例？例如，点击按钮时自动聚焦某个输入框，或者直接调用子组件的方法。当你面对这样的需求时，你第一时间可能会想到组件通信的方式，通过props传递数据和回调函数，然而，组件通信并不能满足直接访问子组件内部DOM或实例的需求。为了解决这个问题，React提供了React.forwardRef这一特殊机制，本
一次 POI 版本升级踩坑记录恰在灯火阑珊处 Q&A Java spring boot maven
前言结论先行。开发过程中由于可能涉及到二次开发，若原系统开发时间久远，没有达成一致规范设计，导致风格各异，确实满足当时开发场景，但增大了后续的更新的难度，容易出现俄罗斯套娃现象，新的更正引发新的问题和冲突，一环套一环。如非必要，可延用老版本poi依赖。旧系统的迭代开发，更适合更新增加而非修改固有代码设计，牵一发而动全身。一、版本升级触发条件引入hutool新工具包，pom依赖与原系统旧版本冲突，导
电科金仓AI数据库一体机发布：30%性能提升+自然语言运维，重塑数据底座！ Loving_enjoy 计算机学科论文创新点人工智能深度学习迁移学习经验分享
>百万级并发处理与聊天式数据库运维，正在中国企业机房掀起静默革命。“替换数据库是一件非常困难的事。”电科金仓总裁杜胜在7月15日北京发布会现场坦言。过去20多年里，国外数据库建立的标准让应用软件与数据库深度耦合，迁移复杂度高、改造成本大、停机风险难控。随着他身后大屏幕亮起**“数据库平替用金仓”**的全新口号，电科金仓正式向这一行业痛点宣战。这场名为“融合进化智领未来”的发布会，最耀眼的明星是**
稳赚不赔的线上兼职,人人都可以做！氧惠购物达人
知识付费这么火，每年几百亿的市场，与我们普通人能够产生什么交集呢？或者说：想要在这个领域掘金的话，我们应该如何做，才能多一分副业收入呢？从经营角度来看，可以大致分两类。第一类：不会开发网课，但也想通过网课赚钱。第二类：会开发网课，通过卖课赚钱。大部分人都是第一类的，那么要怎么做呢？那就是推广别人的网课赚佣金赚钱~今天聊聊网课分销！一、课程分销是什么？通俗来说，就是把课程推广出去，有人购买，自己获得
Spring Boot笔记(3)日志弹钢琴的崽崽
三、日志1、日志框架小张；开发一个大型系统；1、System.out.println("")；将关键数据打印在控制台；去掉？写在一个文件？2、框架来记录系统的一些运行时信息；日志框架；zhanglogging.jar；3、高大上的几个功能？异步模式？自动归档？xxxx？zhanglogging-good.jar？4、将以前框架卸下来？换上新的框架，重新修改之前相关的API；zhanglogging
c厂黑水鬼什么价位(c厂黑水鬼价格一览表) 潮品会
近年来，随着我国钟表市场的繁荣，越来越多的名表品牌进入消费者视野。其中，劳力士作为世界知名奢侈品牌，其旗下众多款式都备受表迷喜爱。而C厂黑水鬼作为劳力士潜航者系列的一员，以亲民的价格和良好的品质，吸引了大量关注【重要提醒】文章最下面有联系方式为您揭秘C厂黑水鬼的价格及性价比。一、C厂黑水鬼简介C厂黑水鬼，全称为“C厂劳力士潜航者系列黑水鬼”，是一款由国内手表制造商C厂生产的劳力士复刻表。这款手表凭
大数据集群运维常见的一些问题以及处理方式
态）；若为YARN节点，重启NodeManager后手动将其加入集群。若为节点整体宕机：排查电源和网络，重启节点后，依次启动HDFS、YARN等服务进程，确认数据块完整性（避免因节点宕机导致副本不足）。2.网络问题现象：节点间通信超时（如HDFS心跳超时、YARN任务调度延迟）、数据传输卡顿。可能原因：交换机故障、网线松动、网络带宽过载、防火墙规则拦截。处理方式：用ping、traceroute检
SIMATIC Step 7授权书的含义与应用
本文还有配套的精品资源，点击获取简介：Step7是西门子用于PLC编程的专业软件，适用于多种控制器系列，如S7-300/400和S7-1200/1500。授权书是用户合法使用该软件的证明，包含序列号或激活码，确保合法下载、安装和更新。它支持多种编程语言，符合IEC61131-3标准，并与多种自动化组件集成。此外，Step7V5.4版本可能表示软件的某个特定版本，包含新特性和性能优化。用户可以通过授
学习人工智能开发的详细指南 Ws＿学习人工智能 python
一、引言人工智能（AI）开发是一个充满挑战与机遇的领域，它融合了数学、计算机科学、统计学、认知科学等多个学科的知识。随着大数据、云计算和深度学习技术的快速发展，AI已经成为推动社会进步和产业升级的关键力量。本文将为初学者提供一份详细的学习指南，帮助大家逐步掌握AI开发的核心技能。二、基础知识准备数学基础：线性代数：理解向量、矩阵、线性变换等基本概念，掌握矩阵运算和特征值分解等技巧。概率论与统计学：
测试开发的流程 Ws＿需求分析自动化测试用例
测试开发的流程测试开发‘’的流程通常包括从需求分析到测试执行和维护的全生命周期，主要目标是设计、实现并自动化测试用例，保障产品质量。一、需求分析目标：理解产品业务逻辑，明确测试点阅读产品需求文档(PRD)和技术设计文档(TDD)参与需求评审会议(Review)，提出可测性，可自动化的建议和开发、产品沟通不明确的点输出：需求分析文档、测试点列表详细：理解需求：测试开发人员要与开发人员、项目经理、业务
前端基础知识Vue系列 - 17（vue中key的原理）
一、Key是什么开始之前，我们先还原两个实际工作场景当我们在使用v-for时，需要给单元加上key...用+newDate()生成的时间戳作为key，手动强制触发重新渲染那么这背后的逻辑是什么，key的作用又是什么？一句话来讲key是给每一个vnode的唯一id，也是diff的一种优化策略，可以根据key，更准确，更快的找到对应的vnode节点场景背后的逻辑当我们在使用v-for时，需要给单元加上
【AI论文】EmbRACE-3K: 复杂环境中的具身推理与行为研究
摘要：近期先进的视觉语言模型（Vision-LanguageModels，VLMs）在被动、离线的图像和视频理解任务中展现出了卓越的性能。然而，在具身场景中，这些模型的有效性仍较为有限。具身场景要求在线交互和主动的场景理解，在此类场景中，智能体以第一人称视角感知环境，且每一次动作都会动态地影响后续的观察结果。即便是像GPT-4o、Claude3.5Sonnet和Gemini2.5Pro这样的先进模
【Hugging Face全面拥抱LangChain：全新官方合作包】
文末有福利！❝最近HuggingFace官宣发布langchain_huggingface，这是一个由HuggingFace和LangChain共同维护的LangChain合作伙伴包。这个新的Python包旨在将HuggingFace最新功能引入LangChain并保持同步。通过HuggingFace官方包的加持，开发小伙伴们通过简单的api调用就能在langchain中轻松使用HuggingFa
Linux机器上Selenium+Python3+Chrome使用driver.get()只能获取到标签而没有内容的解决方法
代码：#!/usr/bin/python3#coding=utf8fromseleniumimportwebdriverfromselenium.webdriver.chrome.optionsimportOptionschrome_options=Options()chrome_options.add_argument('--headless')chrome_options.add_argume
对于规范和实现，你会混淆吗？ yangshangchuan HotSpot
昨晚和朋友聊天，喝了点咖啡，由于我经常喝茶，很长时间没喝咖啡了，所以失眠了，于是起床读JVM规范，读完后在朋友圈发了一条信息： JVM Run-Time Data Areas：The Java Virtual Machine defines various run-time data areas that are used during execution of a program. So
android 网络百合不是茶网络
android的网络编程和java的一样没什么好分析的都是一些死的照着写就可以了,所以记录下来方便查找 , 服务器使用的是TomCat 服务器代码; servlet的使用需要在xml中注册 package servlet; import java.io.IOException; import java.util.Arr
[读书笔记]读法拉第传 comsci 读书笔记
1831年的时候,一年可以赚到1000英镑的人..应该很少的... 要成为一个科学家,没有足够的资金支持,很多实验都无法完成但是当钱赚够了以后....就不能够一直在商业和市场中徘徊......
随机数的产生沐刃青蛟随机数
c++中阐述随机数的方法有两种：一是产生假随机数（不管操作多少次，所产生的数都不会改变）这类随机数是使用了默认的种子值产生的，所以每次都是一样的。 //默认种子 for (int i = 0; i < 5; i++) { cout<<
PHP检测函数所在的文件名 IT独行者 PHP 函数
很简单的功能，用到PHP中的反射机制，具体使用的是ReflectionFunction类，可以获取指定函数所在PHP脚本中的具体位置。创建引用脚本。代码： [php] view plain copy // Filename: functions.php <?php&nbs
银行各系统功能简介文强chu 金融
银行各系统功能简介　业务系统核心业务系统业务功能包括：总账管理、卡系统管理、客户信息管理、额度控管、存款、贷款、资金业务、国际结算、支付结算、对外接口等清分清算系统以清算日期为准，将账务类交易、非账务类交易的手续费、代理费、网络服务费等相关费用，按费用类型计算应收、应付金额，经过清算人员确认后上送核心系统完成结算的过程国际结算系
Python学习1(pip django 安装以及第一个project) 小桔子 python django pip
最近开始学习python,要安装个pip的工具。听说这个工具很强大，安装了它，在安装第三方工具的话so easy!然后也下载了，按照别人给的教程开始安装，奶奶的怎么也安装不上！第一步：官方下载pip-1.5.6.tar.gz, https://pypi.python.org/pypi/pip easy! 第二部：解压这个压缩文件，会看到一个setup.p
php 数组 aichenglong PHP 排序数组循环多维数组
1 php中的创建数组 $product = array('tires','oil','spark');//array()实际上是语言结构而不是函数 2 如果需要创建一个升序的排列的数字保存在一个数组中，可以使用range()函数来自动创建数组 $numbers=range(1,10)//1 2 3 4 5 6 7 8 9 10 $numbers=range(1,10,
安装python2.7 AILIKES python
安装python2.7 1、下载可从 http://www.python.org/进行下载#wget https://www.python.org/ftp/python/2.7.10/Python-2.7.10.tgz 2、复制解压 #mkdir -p /opt/usr/python #cp /opt/soft/Python-2
java异常的处理探讨百合不是茶 JAVA异常
//java异常 /* 1，了解java 中的异常处理机制，有三种操作 a,声明异常 b,抛出异常 c,捕获异常 2，学会使用try-catch-finally来处理异常 3，学会如何声明异常和抛出异常 4，学会创建自己的异常 */ //2，学会使用try-catch-finally来处理异常
getElementsByName实例 bijian1013 element
实例1： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/x
探索JUnit4扩展：Runner bijian1013 java 单元测试 JUnit
参加敏捷培训时，教练提到Junit4的Runner和Rule，于是特上网查一下，发现很多都讲的太理论，或者是举的例子实在是太牵强。多搜索了几下，搜索到两篇我觉得写的非常好的文章。文章地址：http://www.blogjava.net/jiangshachina/archive/20
[MongoDB学习笔记二]MongoDB副本集 bit1129 mongodb
1. 副本集的特性 1)一台主服务器(Primary),多台从服务器(Secondary) 2)Primary挂了之后，从服务器自动完成从它们之中选举一台服务器作为主服务器，继续工作，这就解决了单点故障，因此，在这种情况下，MongoDB集群能够继续工作 3)挂了的主服务器恢复到集群中只能以Secondary服务器的角色加入进来 2
【Spark八十一】Hive in the spark assembly bit1129 assembly
Spark SQL supports most commonly used features of HiveQL. However, different HiveQL statements are executed in different manners: 1. DDL statements (e.g. CREATE TABLE, DROP TABLE, etc.)
Nginx问题定位之监控进程异常退出 ronin47
nginx在运行过程中是否稳定，是否有异常退出过？这里总结几项平时会用到的小技巧。 1. 在error.log中查看是否有signal项，如果有，看看signal是多少。比如，这是一个异常退出的情况： $grep signal error.log 2012/12/24 16:39:56 [alert] 13661#0: worker process 13666 exited on s
No grammar constraints (DTD or XML schema).....两种解决方法 byalias xml
方法一：常用方法关闭XML验证工具栏：windows => preferences => xml => xml files => validation => Indicate when no grammar is specified:选择Ignore即可。方法二：（个人推荐）添加内容如下 <?xml version=
Netty源码学习-DefaultChannelPipeline bylijinnan netty
package com.ljn.channel; /** * ChannelPipeline采用的是Intercepting Filter 模式 * 但由于用到两个双向链表和内部类，这个模式看起来不是那么明显，需要仔细查看调用过程才发现 * * 下面对ChannelPipeline作一个模拟，只模拟关键代码： */ public class Pipeline {
MYSQL数据库常用备份及恢复语句 chicony mysql
备份MySQL数据库的命令，可以加选不同的参数选项来实现不同格式的要求。 mysqldump -h主机 -u用户名 -p密码数据库名 > 文件备份MySQL数据库为带删除表的格式，能够让该备份覆盖已有数据库而不需要手动删除原有数据库。 mysqldump -–add-drop-table -uusername -ppassword databasename > ba
小白谈谈云计算--基于Google三大论文 CrazyMizzz Google 云计算 GFS
之前在没有接触到云计算之前，只是对云计算有一点点模糊的概念，觉得这是一个很高大上的东西，似乎离我们大一的还很远。后来有机会上了一节云计算的普及课程吧，并且在之前的一周里拜读了谷歌三大论文。不敢说理解，至少囫囵吞枣啃下了一大堆看不明白的理论。现在就简单聊聊我对于云计算的了解。我先说说GFS &n
hadoop 平衡空间设置方法 daizj hadoop balancer
在hdfs-site.xml中增加设置balance的带宽，默认只有1M： <property> <name>dfs.balance.bandwidthPerSec</name> <value>10485760</value> <description&g
Eclipse程序员要掌握的常用快捷键 dcj3sjt126com 编程
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得
Android学习之路 dcj3sjt126com Android学习
转自：http://blog.csdn.net/ryantang03/article/details/6901459 以前有J2EE基础，接触JAVA也有两三年的时间了，上手Android并不困难，思维上稍微转变一下就可以很快适应。以前做的都是WEB项目，现今体验移动终端项目，让我越来越觉得移动互联网应用是未来的主宰。下面说说我学习Android的感受，我学Android首先是看MARS的视
java 遍历Map的四种方法 eksliang java HashMap java 遍历Map的四种方法
转载请出自出处： http://eksliang.iteye.com/blog/2059996 package com.ickes; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Map.Entry; /** * 遍历Map的四种方式
【精典】数据库相关相关 gengzg 数据库
package C3P0; import java.sql.Connection; import java.sql.SQLException; import java.beans.PropertyVetoException; import com.mchange.v2.c3p0.ComboPooledDataSource; public class DBPool{
自动补全 huyana_town 自动补全
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml&quo
jquery在线预览PDF文件，打开PDF文件天梯梦 jquery
最主要的是使用到了一个jquery的插件jquery.media.js，使用这个插件就很容易实现了。核心代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.
ViewPager刷新单个页面的方法 lovelease android viewpager tag 刷新
使用ViewPager做滑动切换图片的效果时，如果图片是从网络下载的，那么再子线程中下载完图片时我们会使用handler通知UI线程，然后UI线程就可以调用mViewPager.getAdapter().notifyDataSetChanged()进行页面的刷新，但是viewpager不同于listview，你会发现单纯的调用notifyDataSetChanged()并不能刷新页面
利用按位取反（~）从复合枚举值里清除枚举值草料场 enum
以 C# 中的 System.Drawing.FontStyle 为例。如果需要同时有多种效果，如：“粗体”和“下划线”的效果，可以用按位或（|） FontStyle style = FontStyle.Bold | FontStyle.Underline; 如果需要去除 style 里的某一种效果，
Linux系统新手学习的11点建议刘星宇编程工作 linux 脚本
　　随着Linux应用的扩展许多朋友开始接触Linux，根据学习Windwos的经验往往有一些茫然的感觉：不知从何处开始学起。这里介绍学习Linux的一些建议。　　一、从基础开始：常常有些朋友在Linux论坛问一些问题，不过，其中大多数的问题都是很基础的。例如：为什么我使用一个命令的时候，系统告诉我找不到该目录，我要如何限制使用者的权限等问题，这些问题其实都不是很难的，只要了解了 Linu
hibernate dao层应用之HibernateDaoSupport二次封装 wangzhezichuan DAO Hibernate
/** * <p>方法描述:sql语句查询返回List<Class> </p> * <p>方法备注: Class 只能是自定义类 </p> * @param calzz * @param sql * @return * <p>创建人：王川</p> * <p>创建时间：Jul

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他