极术社区

探游·R329·AI部署实战（二）移植搭建AI环境

首发极术社区
如对Arm相关技术感兴趣，欢迎私信aijishu20加入技术微信群。

前言

hello呀~我又来啦~这一期拖了好久啦~由于周末抽时间做的，时间不稳定，抱歉呐~

上次做了R329的第一期，也就是解决了配置R329开发板并跑起来的问题；
这一期能解决的问题是：你能用R329上的AIPU跑个resnet50啥的，你能用R329的CPU跑起来NCNN，跑个resnet50，mobilenet啥的，并对比性能数据。

ps. 关于自定义模型如何在AIPU上跑，如YOLO_XX，KWS_XX等，就是下一节的内容啦~当然按照惯例，我会先教你们把环境搭建好；

这一期大概要解决的问题如下：

”我要怎么样才能在R329上跑模型的呀？不要多了，能跑你们官方的demo就行，我主要想对整体的开发流程有个主观印象。”
”我想跟NCNN跑的数据做对比，我该如何在R329上移植NCNN并跑benchmark的呀？要怎么准备环境、怎么跑的呀？“
“我要跑自定义模型该如何操作的呀？”
”我的模型贼复杂，有前后处理balabala的，我想一部分在CPU上做一部分在AIPU上做（这有个装逼的名字叫"切图"），这要怎么搞得呀？“

我相信上述的这些问题，对大部分非经验丰富的开发者来说，是有一点点困扰的吧！？

因此本着传播知识的初衷，我将从底层细节一点点带大家开荒R329，尽量讲清楚为什么这么做的原因，而不是机械的教大家去操作。

同时，为了尽可能照顾到不同开发环境的童鞋，我准备了两个版本的开发环境，一个是WIN10自带的WSL（ubuntu18），一个是虚拟机下的ubuntu14.04，目的是为了尽可能的把坑给踩完先。

第一节我要怎样才能在R329上跑起来AIPU的呀？

可能有小伙伴不想看啰嗦的分析，只想一步到位跑起来呀，所以，请跟着我左手右手一个慢动作。。。。

先跟着教程第一章把板子准备好，注意此时的板子的linux kernel驱动是有的，但是没有把AIPU的runtime库编译进去的。
从【点击这里】获取下载链接，得到lib库文件；从【这里这里】下载resnet50 demo的执行文件。
将libaipudrv.so*文件放到开发版的/lib目录下(用usb的话直接adb push就好啦, 用wifi传的话就直接scp下载了)；
将resnet50文件夹放到开发版的/etc/zhouyi/目录下即可；
运行sh脚本，加上参数-C resnet_50即可；加上time指令就大致知道花了多少的时间啦～

下面就是详细的分析啦，不想看我叭叭的就直接跳过哈～

要能跑起来AIPU首先驱动层得支持，其次runtime库也得支持，接着我们才可以在应用层调用AIPU；

这里得好消息是驱动默认就支持了，坏消息是runtime库一时半会还不会完全开源，因此我们需要先解决runtime库得问题。

上期我们说过了，由于AIPU的知识产权是属于ARM china的，所以全志暂时是不会开放出来给我们使用的（对应的就是在开发的源码中把这一部分库代码给删除了），

但值得注意的是内核驱动时有支持的，既然有内核驱动，因此我们只需要在库层面添加用户runtime包就可支持AIPU啦～

啥？你问这个runtime包是啥？

这个runtime包的定义在不同语境里都不一样的，在这里代表的就是对AIPU驱动的一层封装；常规的嵌入式开发流程里面，有个外设，你要在应用层调用它，你就得

直接用read/write/ioctl等一系列操作来控制这个设备，很原始很低效，于是我们就在此基础上封装出一个库，来屏蔽底层的繁琐细节，这就是runtime库存在的意义。

理论可行，但实际上这个包一般也是拿不到的，因为官方没开放也没开源呀~

头疼，俗话说的好，万事开头难在，中间难，后面也难，既然都这么难了，那我选择躺好，选择求助官方。

于是经过三分钟的对话沟通，我从ARM china官方接口那获取到了runtime库的lib包，因此我会把该文件分享给有需要的人，以及教会大家如何使用它。

把这些文件给adb push *** /etc/zhouyi/即可，记得把libaipudrv.so/libaipudrv.so.3/libaipudrv.so.3.5.3全部复制到开发板的/lib/目录下；

跑出来的效果如下：

可以看到用户空间的耗时大致是10ms的样子，于是我们就可以根据数据分析一波了：

Resnet50	OPs	INT8
MAC	3857973248	3.8G
OUT	35778536	35MB
PARA	25557096	25MB

我们知道resnet50的理论计算量大概是4Gops，而我们AIPU的理论算力是128MAC *0.8Gpbs=102.4GOPS

因此理论峰值算力下的FPS为：FPS=102.4/4=25FPS

而真实的算力约为10FPS，算力仅利用完一半不到，也就是可以大致推断出访存部分是瓶颈，嗯，访存带宽的问题没有做好呀~

做优化的都知道，访存其实这个也好分析，resnet中存在大量的3X3跟1X1卷积层，这些卷积层在硬件底层都是由脉动阵列进行计算的，而3x3的卷积属于计算密集型，实际上MAC利用率能达到百分之八九十，

而1x1卷积属于访存密集型，也就是说巨大的算力往往都在等数据ready，实际中MAC利用率也就50%左右的样子，因此这个帧率跟最终的结果就对上啦~

嗯，其他的硬件如CPU，GPU、NPU都可以这么分析，基本原理都是一样滴哇~

第二节我要怎样才能用R329的双核A53上跑起来NCNN呀？

这部分看下如何使用交叉编译链！

上一篇中我们简单使用了gcc编译了个helloworld，可以正常运行，但是用g++则不行，后来百般调试无果之后，直接选择放弃官方提供的prebuild工具链。

我们自己动手丰衣足食。

思路是这样子的：
1. 先去板子上确认交叉编译器的版本，然后选择比这个版本低的来编译NCNN，因为发布的版本向后兼容，不会向前兼容的呀。
2. 在ubuntu上下载对应版本，解决其中出现的一些问题，链接到合适的版本，balbala~很碎所的，这就是为什么叫开荒的由来了！
3. 下载NCNN源码，配置好CMAKE，然后修改并编译好benchmark文件，解决其中出现的一大堆问题；
4. 跑benchmark，看数据~

我特意在几个版本的环境下编NCNN，期间出现了很多基本问题，虽然不是很难，但我知道总有一部分读者是需要的，需要这些“显而易见”的指引的，往往前行路上的一颗绊脚小石头就可能会阻碍你的脚步、消融你的激情，因此我希望我写的内容不单单是冰冷的技术分享，而应当是有温度的包容，这是我敲下这行字时想到的。

所以，我这里不计其繁地一一记录如下，大家权当debug手册来用吧~

要知道编译器版本，我们先去板子上看下交叉编译的版本，怎么看呢？

我们去lib目录下，系统库文件都在下面呢！

用ldd指令可以看到libc.so使用的GCC 版本是6.4.1，因此我们在ubuntu下直接安装小于等于这个版本的GCC就行啦~

通用的方法是去官网下载：

https://developer.arm.com/tools-and-software/open-source-software/developer-tools/gnu-toolchain/gnu-a/downloads

但是我们可以简化处理，直接再ubuntu下在线下载安装。

由于我们得宿主机是ubuntu14.4，因此先看下有哪些版本得交叉编译工具可以下载：

可以看到，针对arm64的，只有4.8的版本，4.8的版本比R329的6.4.1版本低，因此编译出的文件送到板子上理论上可以运行。

然后再下载一个不带版本的GCC、G++：

此时可以发现安装的版本对应上啦，gcc version 4.8.4 ubuntu/linaro;

这个时候我们再验证下helloworld看看，这个时候gcc g++都得验证下：

然后我们看下ELF头信息：

可以看到对应的是aarch64，对应上了~可以整活了~

然后，直接把编译好的gcc/g++ 版本helloword，通过adb push推送到开发板上执行，此时发现

ok啦~
一切都好起来啦~

然后我们开始编译复杂点的NCNN。

git clonehttps://github.com/Tencent/ncnn.git
cd ncnn
mkdir -p build-aarch64-linux
cd build-aarch64-linux
cmake -DCMAKE_TOOLCHAIN_FILE=../toolchains/aarch64-linux-gnu.toolchain.cmake ..
make -j8
make install

按照官网流程，一套组合拳直接打下来，看现象：

编译到36%直接报错，说是找不到某个layer的某个方法，一顿查，发现是交叉环境没装全：

sudo apt install g++-arm-linux-gnueabi g++-arm-linux-gnueabihf g++-aarch64-linux-gnu

补全后，再编译，发现最后链接时出问题啦又：

这里卡了好久，为啥不行，百般查询之后发现，是源的选择不对，我选的是阿里源，在这个源下只有4.8版本的可以安装，因此我们换一下，换成清华源：

# 清华大学源
debhttp://mirrors.tuna.tsinghua.edu.cn/ubuntu/bionic main restricted universe multiverse
debhttp://mirrors.tuna.tsinghua.edu.cn/ubuntu/bionic-security main restricted universe multiverse
debhttp://mirrors.tuna.tsinghua.edu.cn/ubuntu/bionic-updates main restricted universe multiverse
debhttp://mirrors.tuna.tsinghua.edu.cn/ubuntu/bionic-backports main restricted universe multiverse
##測試版源
debhttp://mirrors.tuna.tsinghua.edu.cn/ubuntu/bionic-proposed main restricted universe multiverse
# 源碼
deb-srchttp://mirrors.tuna.tsinghua.edu.cn/ubuntu/bionic main restricted universe multiverse
deb-srchttp://mirrors.tuna.tsinghua.edu.cn/ubuntu/bionic-security main restricted universe multiverse
deb-srchttp://mirrors.tuna.tsinghua.edu.cn/ubuntu/bionic-updates main restricted universe multiverse
deb-srchttp://mirrors.tuna.tsinghua.edu.cn/ubuntu/bionic-backports main restricted universe multiverse
##測試版源
deb-srchttp://mirrors.tuna.tsinghua.edu.cn/ubuntu/bionic-proposed main restricted universe multiverse

具体操作如下：

修改源文件 sources.list：
Ubuntu 的源存放在在 /etc/apt/ 目录下的 sources.list 文件中，
修改前我们先做个备份，在终端中执行以下命令：
sudo cp /etc/apt/sources.list /etc/apt/sources.list.bcakup
然后执行下面的命令打开 sources.list 文件，清空里面的内容，把上面我们编辑好的清华的源复制进去，保存后退出。
sudo gedit /etc/apt/sources.list
更新软件列表和升级，在终端上执行以下命令更新软件列表，检测出可以更新的软件：
sudo apt-get update
在终端上执行以下命令进行软件更新：
sudo apt-get upgrade

此时再检查下有哪些交叉编译器版本：

可以看到5，6，7，8版本都有的，此时我们只需要选择一个版本安装就行啦！

选择哪个版本？当然是小于等于开发板的版本呀！前面查过开发板的是6.4.1版本，这里的6版本安装后发现是6.5.0版本的，因此不行的，我们只能用5开头的版本（当然7版本的我也试过，NCNN没出什么问题，但是不排除今后移植其他三方软件的时候出问题，因此稳妥起见这里用5开头的版本）：

先把之前的6.4.1版本的aarch64-arm-linux-gnu gcc/g++都删掉:

sudo apt-get remove *(注意：把依赖也要删除干净，用autoremove指令。)

然后安装之后发现aarch64-linux-gcc/g++ 链接到的不是5开头的编译器，因此修改软连接ln -snf /usr/bin/aarch64-linux-gnu-gcc-5 /usr/bin/aarch64-linux-gnu-gcc；

好啦终于把NCNN编译出来啦，由于我们只跑benchmark，因此直接在build目录下找benchnn，推到板子上运行，注意对应的param文件也要推进去哟：

好家伙发现，直接内存爆掉了，一想也对，毕竟就256M内存，看一下剩余多少？

开机就只剩余71M内存，内存不够的呀，怎么办？

1. 修改镜像让CAM分配少一点内存给AIPU；
2. 修改ncnn的benchmark.cpp 使用inplace轻量内存模式，不开数据重排（数据重排可以使CPU加速的哟，这块我贼6，有空给大家叨叨）；

方案一得该内核，太麻烦了，于是我直接改NCNN benchmark.cpp了，只跑mobilenet系列：

嗯结果出来啦，我跑得是A53单线程，理论峰值算力一二十个GFlops，加上访存得固有缺陷，因此跑出这个数据也是阔以理解的。

我们能得到的结论就是： AIPU大法好呀~

第三节我要怎样才能跑自己的模型呀？？

好的，至此，从下往上看，我们的硬件能跑起来了，AIPU驱动是ok的了， runtime环境也ok了（见附录：如何编译第三方package），

接下来就可以到AIPUBuilder部分了，这部分是整个AI软件部分的核心部件，也就是能让你自己的模型在R329上跑起来的关键了。

jio逗嘛嘚~~等等。。。

肯定有人要问的啦，“啥啥啥？咋又出来个AIPUBuilder？这是啥？干啥用的？怎么用？

你之前整了这么多出，啰嗦了这么多，我都整晕了，你就从我使用者的角度出发，告诉我这个是啥？能解决啥问题？”

······
·······

好的，好的，不要再骂了，我错了，我知道错了，是我写博客流程有瑕疵了，我已经深刻地认识到了我的错误了~

但是我还敢…还敢不改（国家一级精分表演大师show场。。。）

各位大佬们此时此刻恰如彼时彼刻：

好liao好liao，不自娱自乐了，正式开整（真好，想怎么写怎么写，想怎么乐怎么乐~周末还能宅一天）：

我们看问题采用黑盒模型，输入是啥，目标（输出）是啥：

输入：是一个模型，可能来自pytorch/tensoflow/tflite/onnx/caffe….等等格式；

目标：就是把这个模型部署到R329硬件板子上，能跑起来看到效果，语音就能答应你，人脸识别就能认出你。

可以看到我们有头（输入），有尾（目标）了，因此只要在两者之间填充亿点点细节

我们的AI模型就在R329上跑起来啦~ 怎么样是不是很简单呀~

这个部分分三个阶段：

大致讲下AIPUBuilder是啥，能干啥；
准备AIPUBuilder的环境；
~~使用AIPUbuilder生成目标bin文件；~~（划掉，这次不想细写）
AIPUBuilder能干啥？

你看我们的模型来自五湖四海吧（pytorch/tensoflow/tflite/onnx/caffe….），是不是格式都千奇百怪，算子也是奇形怪状，

这么多的差异要跑到特定的（固定的、单一的）硬件上来，那就可以简单认为是一个多对一的接口呀！

说个时髦一点的词，就是AI编译器啊！

说到AI编译器，我们可以看一篇2020年8月份的综述：《The Deep Learning Compiler: A Comprehensive Survey》

上面的图我大致解释下，所谓的AI编译器，分为前端跟后端，前端对接各种训练框架，把模型解析了，然后做各种与硬件无关的图优化，量化啊啥的，分的细一点的话这部分也会产生上层IR表示。

后端就是用来对接不同的硬件的，标准的AI编译器是要能对接任意硬件后端的，跟硬件相关的话简单来说就是各种算子实现了，基于各种不同硬件的算子实现，在这个层面就有各种优化策略，与上层的IR表示有所差异，因此一般会产生底层IR表示；

而R329的AIPU由于不是做通用的编译器，不需要支持很多的硬件后端，因此结构可以优化一下，比如只用一套IR表示、上层图优化与底层硬件绑定等等，当然其他的通用优化这里也都能做。

因此按照行业标准流程我们可以大致分为parser、quantization、graph optimizer、compiler，builder等等部分，但是为了简化用户操作，只留一个aipubuild的接口，具体怎么使用下一节再说。

我们简单解释下IR作用是啥？

上述的几个大的部分，就好比人的脑袋、躯体、手脚，这些部分之间需要一个东西来互相通信，在人体里面是神经系统，而在AIPUbuilder里面就是IR了，即中间表示。

IR是一套内部定义的标准让各个模块都按照这个标准来处理模型信息，厂商不同标准也不同的，比如intel的openvino里面用的肯定跟我们不一样了。

好了，到这基本解释清楚，AIPUBuilder是干啥的了！一言以蔽之：“AI 编译器”，负责将AI模型编译成能在AI芯片上跑的目标bin文件。

AIPUBuilder环境配置

咱们接着在说下如何配置AIPU的环境，使之能跑AI模型；

咱们首先第一步先看全志的手册《AW_R329_Tina_Linux_开发入门_v0.5》，在page18 的附录1：在ubuntu14中使用Conda搭建python3.6环境；注意哈，这里是指定了版本以及环境的：

我们跟着一顿操作，然后激活conda虚拟环境，总之跟着文档来就行啦~

然后我们会拿到一个安装包AIPUBuilder-3.0.120-cp36-cp36m-linux_x86_64.whl（没有的找我要~），使用pip安装就好了。

然后就开始安装了哇：pip install AIPUBuilder-3.0.120-cp36-cp36m-linux_x86_64.whl

由于网络不行，这里下载了好久，看到这里就说明，安装成功啦~

注意观察log可以看到tensorflow/pytorch的版本，这个你们在转模型的时候需要特别注意的点。
我们看下帮助指令：

原来是安装的版本与要求的版本不一致：

我们先卸载当前版本：

然后随便安装一个满足要求的版本：

又发现AQT里面用了PIL：

于是我们接着装pillow：

接着装networkx：

通过这亿点点操作终于环境ok啦~

如何使用GBuilder

我们去这里随便下载一个kws模型
https://github.com/ARM-software/ML-KWS-for-MCU

![在这里插入图片描述](https://img-blog.csdnimg.cn/122c376fecef4c349ab903f9848d3f08.jpg?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80NzU2OTAzMQ==,size_16,color_FFFFFF,t_70#pic_center)

然后直接把pb文件喂给AIPUBuilder，记得加上kws.cfg文件，这个文件的参数分析留到下一次博客吧，原因是，这节内容太多啦～
最后就会生成如下的三个文件：

然后adb push推送到开发板上，运行效果如下：

正常运行啦~

具体操作细节由于篇幅过大就留到下一章啦~

第四节我要怎样才能切图（异构计算）呀？

这部分打算配合tengine框架来用，他们的切图贼溜，但是我完全没时间，下次再写。

相关阅读：

R329 开发环境搭建
修改WiFi/BT模组—R329智能语音开发板入门

你可能感兴趣的:(Arm,技术,人工智能,语音识别,深度学习)

Android技术-修改SO导出符号 Tasfa android java so导出函数
背景经常在使用第三方SDK的时候会莫名其妙报错，其中最常见的一种就是SO符号冲突，比如libA.so静态链接了libC.a,而libB.so动态链接了libC.so。这样便会导致符号冲突。又或者在使用不同版本的动态库，也会造成符号冲突。报错案例案例1DEBUG:Abortmessage:'terminatingwithunexpectedexceptionoftypestd::bad_cast:s
【AI论文】OmniHuman-1: 重新思考一阶段条件式人体动画模型的扩展升级东临碣石82 人工智能
摘要：端到端的人体动画技术，如音频驱动的说话人物生成，近年来取得了显著的进步。然而，现有方法在大规模通用视频生成模型方面的扩展仍然存在困难，限制了它们在实际应用中的潜力。在本文中，我们提出了OmniHuman，一个基于扩散变换器的框架，该框架通过将运动相关条件融入训练阶段来扩展数据规模。为此，我们为这些混合条件引入了两种训练原则，以及相应的模型架构和推理策略。这些设计使OmniHuman能够充分利
前瞻技术：改变未来的关键趋势与应用 jiemidashi 经验分享
物联网IoT）在智能家居中的应用越来越广泛。智能家居通过互联网连接各种设备，使日常生活更加便捷。例如，智能灯泡可以通过手机控制。用户可以在外出时远程关灯，节约电量。这种智能化控制不仅提高了家居安全性，还提升了用户的生活质量。实现智能家居设备的控制需要几个步骤。首先，用户需要下载相关的智能家居应用。其次，设备如智能插座、安防摄像头等，需连接到同一网络。通过应用，用户可以轻松管理这些设备。比如，设定定
如何微调（Fine-tuning）大语言模型？看完这篇你就懂了！！ datian1234 语言模型人工智能 chatgpt LLM ai AI大模型大模型微调
前言本文介绍了微调的基本概念，以及如何对语言模型进行微调。从GPT3到ChatGPT、从GPT4到GitHubcopilot的过程，微调在其中扮演了重要角色。什么是微调（fine-tuning）？微调能解决什么问题？什么是LoRA？如何进行微调？本文将解答以上问题，并通过代码实例展示如何使用LoRA进行微调。微调的技术门槛并不高，如果微调的模型规模不大10B及10B以下所需硬件成本也不高（10B模
信息技术革新引领时代变革 JiYan_xiaohei 业界资讯
信息技术革新引领时代变革一、信息技术的飞速发展1．信息技术的概念及重要性信息技术，即信息的获取、传输、存储、处理和应用等技术的综合，已经成为现代社会不可或缺的基础设施。信息技术的飞速发展极大地改变了人们的生活方式和工作模式，推动了社会进步。2．信息技术的快速发展现状近年来，人工智能、大数据、云计算等前沿技术不断突破，展现出强大的潜力。这些新技术的出现不仅改变了数据处理和分析的方式，还催生了新的产业
信息技术革新引领社会变革 JiYan_yellow 业界资讯
信息技术革新引领社会变革一、信息技术推动数字化转型随着信息技术的迅猛发展，我们正处在一个数字化的时代。信息技术在推动产业数字化转型方面发挥着重要作用。云计算、大数据、人工智能等先进技术的应用，使得企业能够实现更高效的生产和运营。例如，在制造业领域，智能制造技术能够提高生产效率和质量，降低运营成本。此外，信息技术还在促进供应链管理、市场营销等环节的数字化转型，为企业提供更广阔的发展空间。信息技术还深
互联网新纪元：探索技术革新与数字生活的无限可能 2401_87961950 5g
互联网新纪元：探索技术革新与数字生活的无限可能在当今这个日新月异的时代，互联网已不仅仅是连接世界的桥梁，它更是推动社会进步、经济繁荣与文化交流的重要引擎。随着技术的不断革新，互联网正以前所未有的速度和广度重塑着我们的生活方式、工作模式乃至思维方式。本文旨在探讨互联网最新发展趋势，分析其对个人、企业及社会产生的深远影响，并展望互联网新纪元的无限可能。一、技术革新：驱动互联网发展的新动力1.5G与物联
自学人工智能大模型，满足7B模型的训练和微调以及推理，预算3万，如何选购电脑岁月的眸人工智能
如果你的预算是3万元人民币，希望训练和微调7B参数规模的人工智能大模型（如LLaMA、Mistral等），你需要一台高性能的深度学习工作站。在这个预算范围内，以下是推荐的配置：1.关键硬件配置(1)GPU(显卡)推荐显卡：NVIDIARTX4090(24GBVRAM)或者RTX3090（24GBVRAM）理由：7B模型推理：24GB显存足够跑7B模型的推理，但全参数训练可能吃力，适合LoRA等微调
技术革新让生活更便捷巴巴郭海鹄生活量子计算经验分享
量子通信是一种利用量子力学原理进行信息传递的技术。它的基本原理是量子纠缠和量子密钥分发。量子纠缠指两个粒子即使相隔很远，一个粒子的状态改变会立刻引起另一个粒子状态的相应变化。量子密钥分发则是通过量子态传输实现加密密钥的安全交换。在信息安全领域，量子通信具有显著优势。传统加密方法依赖于复杂的数学问题，但未来可能被量子计算机解密。而量子通信利用量子力学的不确定性，提供了一种理论上无法被窃听的安全通信方
功能测试常用方法概述机器视觉小小测试员功能测试
功能测试常用方法概述一、功能测试简介功能测试，亦称黑盒测试，其核心目标是验证软件功能是否按照需求规格说明书的要求准确运行，即确保软件各功能模块均能正常运作。在测试过程中，测试人员无需深入了解软件内部结构，仅依据需求规格说明书来设计测试用例，重点检验功能的正确性，涵盖输入数据、预期结果、界面操作、业务流程等多个方面。二、测试方法概述测试方法是在软件开发过程中用于验证和确认软件产品质量的一系列技术和策
多模态大模型（LMMs）与大语言模型（LLMs）的比较大F的智能小课底层技术解析人工智能语言模型
前言现在的大模型分为两大类：大语言模型（LargeLanguageModels，简称LLMs）和多模态大模型（LargeMultimodalModels，简称LMMs）。本文将从基础定义、输入数据、应用场景、训练过程这几方面讨论下两者的区别。基础定义LLMs(LargeLanguageModels,大型语言模型)-深度学习的应用之一，是基于深度学习的大规模机器学习模型，通常由数十亿到数万亿个参数构
【好书推荐2】AI提示工程实战：从零开始利用提示工程学习应用大语言模型是Yu欸粉丝福利人工智能深度学习 bert AIGC prompt gpt AI写作
【好书推荐2】AI提示工程实战：从零开始利用提示工程学习应用大语言模型写在最前面AI辅助研发方向一：AI辅助研发的技术进展方向二：行业应用案例方向三：面临的挑战与机遇方向四：未来趋势预测方向五：与法规的影响方向六：人才培养与教育《AI提示工程实战：从零开始利用提示工程学习应用大语言模型》关键点内容简介作者简介你好呀！我是是Yu欸2024每日百字篆刻时光，感谢你的陪伴与支持~欢迎一起踏上探险之旅，挖
人工智能之推荐系统实战系列(协同过滤,矩阵分解,FM与DeepFM算法) weixin_58351028 人工智能深度学习神经网络算法机器学习
一.推荐系统介绍和应用(1)推荐系统通俗解读推荐系统就是来了就别想走了。例如在大数据时代中京东越买越想买，抖音越刷越是自己喜欢的东西，微博越刷越过瘾。(2).推荐系统发展简介1)推荐系统无处不在，它是根据用户的行为决定推荐的内容。用户每天在互联网中都会留下足迹，这样就会越来越多的用户画像。2)为什么要推荐系统卖的好的商品就那几种，其它就不管了吗？答案是否定的。80%的销售来自20%的热门商品，要想
DeepSeek与ChatGPT正在改写学历规则？2025教育革命深度解析笑傲江湖2023 人工智能 chatgpt
一、颠覆性现状：AI如何解构学历价值1.知识获取民主化随着AI技术的不断进步，知识获取的方式正在发生翻天覆地的变化：DeepSeek-R1通过仅10%的训练成本，实现了与GPT-4o相当的性能，技术文档的生成效率提升了70%。这种高效的知识生成方式，使得人人都可以轻松获取和应用知识。斯坦福大学的研究显示，使用ChatGPT的大学生平均GPA提升了0.43分，但课程通过率却下降了11%（2024）。
手把手教你给 windows装个vmware虚拟机 python算法小白
附Java/C/C++/机器学习/算法与数据结构/前端/安卓/Python/程序员必读书籍书单大全：书单导航页（点击右侧极客侠栈即可打开个人博客）：极客侠栈①【Java】学习之路吐血整理技术书从入门到进阶最全50+本（珍藏版)②【算法数据结构+acm】从入门到进阶吐血整理书单50+本（珍藏版)③【数据库】从入门到进阶必读18本技术书籍网盘吐血整理网盘(珍藏版)④【Web前端】从HTML到JS到AJ
appium环境搭建 weixin_43516809 appium appuim
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言记录手机自动化环境搭建学习过程一、jdk安装配置（省略）二、AndroidSDK安装配置三、python环境安装配置四、pycharm开发工具安装五、安装node.js六、appium安装1.安装2.检查appium环境是否搭建成功七、appium工作原理总结前言记录手机自动化环境搭建学习过程一、jdk安装配置（省略）cm
Stable Diffusion AI软件绘画速成从入门到精通课兴兴 stable diffusion 人工智能
课兴兴资源圈创始人，更多课程干货，欢迎关注（课兴兴）KMastery-StableDiffusionAI软件绘画速成从入门到精通-中英字幕KMasteryStableDiffusionFromNovicetoArtist英文+中英字幕|1080P|14.5GBAI绘画软件速成课程：从初学者到专业人士欢迎来到人工智能绘画软件初学者速成班！无论您是刚刚开始探索绘画世界，还是希望使用人工智能技术增强您的
利用IDEA将Java.class文件反编译为Java文件：原理、实践与深度解析 .猫的树 Java反编译 IDEA技巧逆向工程
文章目录引言：当.class文件遇到源代码缺失第一章：反编译技术基础认知1.1Java编译执行原理1.2反编译的本质1.3法律与道德边界第二章：IDEA内置反编译工具详解2.1环境准备2.2三步完成基础反编译2.3高级反编译技巧2.3.1调试模式反编译2.3.2Lambda表达式处理2.3.3泛型类型恢复第三章：Fernflower反编译引擎深度配置3.1引擎参数调优3.2多文件批量反编译3.3结
DeepSeek 近况大揭秘：市场、技术与合作的多面剖析 InfiniteSea1019 ai
最近，AI领域的DeepSeek可谓是赚足了眼球，无论是在资本市场，还是在技术创新和行业应用方面，都有着令人瞩目的表现。今天，就让我们一起来深入了解一下DeepSeek的最新动态。DeepSeek概念股：分化与澄清并存在股票市场上，DeepSeek概念股曾一路高歌猛进，不过近期开始出现分化迹象。据Choice数据显示，2月12日，DeepSeek概念股中，青云科技、创业黑马、新致软件等70余股上涨
Web3 的虚实融合之路：从虚拟交互到元宇宙构建 dingzd95 web3 web3 交互
在这个数字技术日新月异的时代，我们正站在Web3的门槛上，见证着互联网的又一次革命。Web3不仅仅是技术的迭代，它代表了一种全新的交互方式和价值创造模式。本文将探讨Web3如何推动虚拟交互的发展，并最终实现元宇宙的构建，揭示这一技术演进背后的关键理念与现实意义。Web3：去中心化的新交互方式Web3，即第三代互联网，是一个去中心化、用户主权、数据自主的网络环境。它依托于区块链、分布式存储等技术，实
【OpenHarmony4.1 之 U-Boot 2024.07源码深度解析】006 - Makefile 编译脚本逐行深度解析小馋喵星人鸿蒙OH-v5.0源码分析之 Uboot+Kernel 部分 U-Boot armv8 Makefile
【OpenHarmony4.1之U-Boot2024.07源码深度解析】006-Makefile编译脚本逐行深度解析系列文章汇总：《【鸿蒙OH-v5.0源码分析之Uboot+Kernel部分】000-文章链接汇总》本文链接：《【OpenHarmony4.1之U-Boot2024.07源码深度解析】006-Makefile编译脚本逐行深度解析》本文开始，我们来分析下U-Boot的Makefile编译
解码DeepSeek家族系列：大语言模型赛道上的黑马传奇大F的智能小课语言模型人工智能自然语言处理
1.DeepSeek公司概况1.1成立背景与发展历程DeepSeek，全称杭州深度求索人工智能基础技术研究有限公司，于2023年7月17日正式成立。公司由知名量化资管巨头幻方量化孕育而生，其创始人梁文峰是幻方量化的联合创始人之一。DeepSeek自成立之初，便专注于开发先进的大语言模型（LLM）及相关技术，致力于通过数据蒸馏技术提取更精炼、有用的数据，以提升模型性能。在发展历程中，DeepSeek
【必看】凭啥？DeepSeek如何用1/179的训练成本干到GPT-4o 98%性能大F的智能小课人工智能算法
一、DeepSeek降低训练成本的核心方法1.1创新训练方法DeepSeek通过独特的训练方案显著降低了训练成本。其核心策略包括减少监督微调（SFT）步骤，仅依赖强化学习（RL）技术。DeepSeek-R1-Zero版本完全跳过SFT，仅通过RL进行训练。尽管初期计算开销较大，但添加少量冷启动数据后，训练稳定性和模型推理能力大幅提升。此外，DeepSeek还采用了组相对策略优化（GRPO）算法替代
Java微服务技术栈（2） Z-H-J Java笔记随录 java 微服务开发语言
写在前面高级篇里的很多知识我都没有去实践过，只是知道相关的原理，主要原因是：应用场景在多数情况下难以碰见（高并发）对于运行的要求过高（如果是单节点进行模拟，那么就必须有很大的运行内存）所以这部分记录更多是一个思路的梳理，可能无法作为各位全面掌握该部分知识的条目，望见谅7.微服务的保护技术：Sentinelsentiel分为sentinel控制台和sentinel客户端，具体的规则过滤都由配置在微服
十大工业物联网平台分析报告人工智能深度学习
目录1、工业物联网简介1.1、引言1.2、工业物联网平台架构剖析2、工业物联网发展趋势2.1、总体趋势2.2、技术趋势3、工业物联网平台市场预测3.1、工业物联网平台3.2、DCS3.3、实时数据库3.4、SCADA3.5、数字孪生3.6、设备全生命周期管理系统4、主要工业物联网平台供应商介绍4.1、蓝卓4.2、涂鸦智能4.3、中服云4.4、优锘4.5、树根互联4.6、力控科技4.7、中移物联4.
从需求分析到代码生成：AI如何重塑软件需求工程前端
软件开发的世界，一直以来都面临着巨大的挑战。传统软件开发过程中，需求分析往往耗时长、易出错，沟通成本高昂，这些都直接导致项目延期和成本超支。然而，随着人工智能技术的飞速发展，一个新的时代正在到来。AI代码生成器等AI技术的应用，为我们提供了自动化部分需求分析和代码生成过程的可能性，显著提高了效率，降低了成本。本文将探讨AI技术如何重塑软件需求工程，并以ScriptEcho为例，说明AI驱动的代码生
合合信息启信宝助力国家自然科学基金委员会重点专项推进人工智能大数据自然语言处理
近日，国家自然科学基金委员会公布了2024年度宏观调控专项“数据市场制度设计与关键技术”的评审结果。由中国科学院大学、中国社会科学院数量经济与技术经济研究所和清华大学共同申报的《数据资源统计监测与市场价值评估的理论与方法研究》项目成功获批立项。上海合合信息科技股份有限公司（股票代码：688615）作为课题支撑合作单位，将为课题研究团队提供多维度数据源支持与智能数据分析能力，共同为数字经济发展贡献力
软件工程中的认知负载管理：AI减负策略前端
软件工程师的工作常常被描述为高压、高强度，这并非夸大其词。繁琐的重复性工作、陡峭的学习曲线、复杂的项目管理以及持续的技术迭代，都给开发者带来了巨大的认知负载。这种超负荷的状态不仅影响开发效率，更严重损害开发者的身心健康。幸运的是，AI写代码工具的兴起为我们提供了一种减轻认知负载，提升开发效率的有效途径。认知负载的来源与类型在软件开发过程中，认知负载的来源广泛且复杂。从需求分析阶段的理解偏差，到代码
AI前端开发对未来职业规划的影响：拥抱变化，迎接挑战前端
随着人工智能技术的飞速发展，AI写代码工具（以及其他AI代码生成工具）的兴起正在深刻地改变着前端开发领域。从简单的代码片段生成到复杂的页面布局设计，AI已经开始扮演越来越重要的角色。这不仅给前端开发带来了前所未有的效率提升，也对前端开发者的职业规划提出了新的挑战和机遇。本文将探讨AI前端开发的未来趋势，以及如何利用AI工具，例如ScriptEcho，来帮助前端开发者适应未来，在竞争激烈的市场中保持
AI前端开发与个人品牌打造：乘风破浪会有时，直挂云帆济沧海前端
在数字化浪潮席卷全球的今天，前端开发领域正经历着前所未有的变革。得益于人工智能技术的快速发展，越来越多的AI写代码工具涌现，深刻地改变着前端开发的模式和效率。掌握AI前端开发技能，不仅能提升个人竞争力，更能助力个人品牌的打造，让你的职业生涯乘风破浪。AI前端开发技能如何提升个人竞争力在竞争日益激烈的IT行业，高效的开发能力是建立个人品牌的基础。而AI赋能的前端开发，正为开发者提供了前所未有的效率提
Hadoop(一) 朱辉辉33 hadoop linux
今天在诺基亚第一天开始培训大数据，因为之前没接触过Linux，所以这次一起学了，任务量还是蛮大的。首先下载安装了Xshell软件，然后公司给了账号密码连接上了河南郑州那边的服务器，接下来开始按照给的资料学习，全英文的，头也不讲解，说锻炼我们的学习能力，然后就开始跌跌撞撞的自学。这里写部分已经运行成功的代码吧. 在hdfs下，运行hadoop fs -mkdir /u
maven An error occurred while filtering resources blackproof maven 报错
转：http://stackoverflow.com/questions/18145774/eclipse-an-error-occurred-while-filtering-resources maven报错： maven An error occurred while filtering resources Maven -> Update Proje
jdk常用故障排查命令 daysinsun jvm
linux下常见定位命令： 1、jps 输出Java进程 -q 只输出进程ID的名称，省略主类的名称； -m 输出进程启动时传递给main函数的参数； &nb
java 位移运算与乘法运算周凡杨 java 位移运算乘法
对于 JAVA 编程中，适当的采用位移运算，会减少代码的运行时间，提高项目的运行效率。这个可以从一道面试题说起：问题：用最有效率的方法算出2 乘以8 等於几?” 答案：2 << 3 由此就引发了我的思考，为什么位移运算会比乘法运算更快呢？其实简单的想想，计算机的内存是用由 0 和 1 组成的二
java中的枚举(enmu) g21121 java
从jdk1.5开始，java增加了enum(枚举)这个类型，但是大家在平时运用中还是比较少用到枚举的，而且很多人和我一样对枚举一知半解，下面就跟大家一起学习下enmu枚举。先看一个最简单的枚举类型，一个返回类型的枚举： public enum ResultType { /** * 成功 */ SUCCESS, /** * 失败 */ FAIL,
MQ初级学习 510888780 activemq
1.下载ActiveMQ 去官方网站下载：http://activemq.apache.org/ 2.运行ActiveMQ 解压缩apache-activemq-5.9.0-bin.zip到C盘，然后双击apache-activemq-5.9.0-\bin\activemq-admin.bat运行ActiveMQ程序。启动ActiveMQ以后，登陆：http://localhos
Spring_Transactional_Propagation 布衣凌宇 spring transactional
//事务传播属性 @Transactional(propagation=Propagation.REQUIRED)//如果有事务，那么加入事务，没有的话新创建一个 @Transactional(propagation=Propagation.NOT_SUPPORTED)//这个方法不开启事务 @Transactional(propagation=Propagation.REQUIREDS_N
我的spring学习笔记12-idref与ref的区别 aijuans spring
idref用来将容器内其他bean的id传给<constructor-arg>/<property>元素，同时提供错误验证功能。例如： <bean id ="theTargetBean" class="..." /> <bean id ="theClientBean" class=&quo
Jqplot之折线图 antlove js jquery Web timeseries jqplot
timeseriesChart.html <script type="text/javascript" src="jslib/jquery.min.js"></script> <script type="text/javascript" src="jslib/excanvas.min.js&
JDBC中事务处理应用百合不是茶 java JDBC编程事务控制语句
解释事务的概念; 事务控制是sql语句中的核心之一;事务控制的作用就是保证数据的正常执行与异常之后可以恢复事务常用命令: Commit提交
[转]ConcurrentHashMap Collections.synchronizedMap和Hashtable讨论 bijian1013 java 多线程线程安全 HashMap
在Java类库中出现的第一个关联的集合类是Hashtable，它是JDK1.0的一部分。 Hashtable提供了一种易于使用的、线程安全的、关联的map功能，这当然也是方便的。然而，线程安全性是凭代价换来的――Hashtable的所有方法都是同步的。此时，无竞争的同步会导致可观的性能代价。Hashtable的后继者HashMap是作为JDK1.2中的集合框架的一部分出现的，它通过提供一个不同步的
ng-if与ng-show、ng-hide指令的区别和注意事项 bijian1013 JavaScript AngularJS
angularJS中的ng-show、ng-hide、ng-if指令都可以用来控制dom元素的显示或隐藏。ng-show和ng-hide根据所给表达式的值来显示或隐藏HTML元素。当赋值给ng-show指令的值为false时元素会被隐藏，值为true时元素会显示。ng-hide功能类似，使用方式相反。元素的显示或
【持久化框架MyBatis3七】MyBatis3定义typeHandler bit1129 TypeHandler
什么是typeHandler? typeHandler用于将某个类型的数据映射到表的某一列上，以完成MyBatis列跟某个属性的映射内置typeHandler MyBatis内置了很多typeHandler，这写typeHandler通过org.apache.ibatis.type.TypeHandlerRegistry进行注册，比如对于日期型数据的typeHandler，
上传下载文件rz,sz命令 bitcarter linux命令rz
刚开始使用rz上传和sz下载命令：因为我们是通过secureCRT终端工具进行使用的所以会有上传下载这样的需求：我遇到的问题： sz下载A文件10M左右，没有问题但是将这个文件A再传到另一天服务器上时就出现传不上去，甚至出现乱码，死掉现象，具体问题解决方法：上传命令改为;rz -ybe 下载命令改为：sz -be filename 如果还是有问题：那就是文
通过ngx-lua来统计nginx上的虚拟主机性能数据 ronin47 ngx-lua　统计解禁ip
介绍以前我们为nginx做统计,都是通过对日志的分析来完成.比较麻烦,现在基于ngx_lua插件,开发了实时统计站点状态的脚本,解放生产力.项目主页: https://github.com/skyeydemon/ngx-lua-stats 功能支持分不同虚拟主机统计, 同一个虚拟主机下可以分不同的location统计. 可以统计与query-times request-time
java-68-把数组排成最小的数。一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的。例如输入数组{32, 321}，则输出32132 bylijinnan java
import java.util.Arrays; import java.util.Comparator; public class MinNumFromIntArray { /** * Q68输入一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的一个。 * 例如输入数组{32, 321}，则输出这两个能排成的最小数字32132。请给出解决问题
Oracle基本操作 ccii Oracle SQL总结 Oracle SQL语法 Oracle基本操作 Oracle SQL
一、表操作 1. 常用数据类型 NUMBER(p,s)：可变长度的数字。p表示整数加小数的最大位数，s为最大小数位数。支持最大精度为38位 NVARCHAR2(size)：变长字符串，最大长度为4000字节（以字符数为单位） VARCHAR2(size)：变长字符串，最大长度为4000字节（以字节数为单位） CHAR(size)：定长字符串，最大长度为2000字节，最小为1字节，默认
[强人工智能]实现强人工智能的路线图 comsci 人工智能
1：创建一个用于记录拓扑网络连接的矩阵数据表 2:自动构造或者人工复制一个包含10万个连接(1000*1000)的流程图 3：将这个流程图导入到矩阵数据表中 4：在矩阵的每个有意义的节点中嵌入一段简单的
给Tomcat，Apache配置gzip压缩(HTTP压缩)功能 cwqcwqmax9 apache
背景： HTTP 压缩可以大大提高浏览网站的速度，它的原理是，在客户端请求网页后，从服务器端将网页文件压缩，再下载到客户端，由客户端的浏览器负责解压缩并浏览。相对于普通的浏览过程HTML ,CSS,Javascript , Text ，它可以节省40%左右的流量。更为重要的是，它可以对动态生成的，包括CGI、PHP , JSP , ASP , Servlet,SHTML等输出的网页也能进行压缩，
SpringMVC and Struts2 dashuaifu struts2 springMVC
SpringMVC VS Struts2 1: spring3开发效率高于struts 2: spring3 mvc可以认为已经100%零配置 3: struts2是类级别的拦截，一个类对应一个request上下文， springmvc是方法级别的拦截，一个方法对应一个request上下文，而方法同时又跟一个url对应所以说从架构本身上 spring3 mvc就容易实现r
windows常用命令行命令 dcj3sjt126com windows cmd command
在windows系统中，点击开始－运行，可以直接输入命令行，快速打开一些原本需要多次点击图标才能打开的界面，如常用的输入cmd打开dos命令行，输入taskmgr打开任务管理器。此处列出了网上搜集到的一些常用命令。winver 检查windows版本 wmimgmt.msc 打开windows管理体系结构(wmi) wupdmgr windows更新程序 wscrip
再看知名应用背后的第三方开源项目 dcj3sjt126com ios
知名应用程序的设计和技术一直都是开发者需要学习的，同样这些应用所使用的开源框架也是不可忽视的一部分。此前《 iOS第三方开源库的吐槽和备忘》中作者ibireme列举了国内多款知名应用所使用的开源框架，并对其中一些框架进行了分析，同样国外开发者 @iOSCowboy也在博客中给我们列出了国外多款知名应用使用的开源框架。另外txx's blog中详细介绍了 Facebook Paper使用的第三
Objective-c单例模式的正确写法 jsntghf 单例 ios iPhone
一般情况下，可能我们写的单例模式是这样的： #import <Foundation/Foundation.h> @interface Downloader : NSObject + (instancetype)sharedDownloader; @end #import "Downloader.h" @implementation
jquery easyui datagrid 加载成功，选中某一行 hae jquery easyui datagrid 数据加载
1.首先你需要设置datagrid的onLoadSuccess $( '#dg' ).datagrid({onLoadSuccess : function (data){ $( '#dg' ).datagrid( 'selectRow' ,3); }}); 2.onL
jQuery用户数字打分评价效果 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/5.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery用户数字打分评分代码 - HoverTree</
mybatis的paramType kerryg DAO sql
MyBatis传多个参数： 1、采用#{0},#{1}获得参数： Dao层函数方法： public User selectUser(String name,String area); 对应的Mapper.xml <select id="selectUser" result
centos 7安装mysql5.5 MrLee23 centos
首先centos7 已经不支持mysql，因为收费了你懂得，所以内部集成了mariadb，而安装mysql的话会和mariadb的文件冲突，所以需要先卸载掉mariadb，以下为卸载mariadb，安装mysql的步骤。 #列出所有被安装的rpm package rpm -qa | grep mariadb #卸载 rpm -e mariadb-libs-5.
利用thrift来实现消息群发 qifeifei thrift
Thrift项目一般用来做内部项目接偶用的，还有能跨不同语言的功能，非常方便，一般前端系统和后台server线上都是3个节点，然后前端通过获取client来访问后台server，那么如果是多太server，就是有一个负载均衡的方法，然后最后访问其中一个节点。那么换个思路，能不能发送给所有节点的server呢，如果能就
实现一个sizeof获取Java对象大小 teasp java HotSpot 内存对象大小 sizeof
由于Java的设计者不想让程序员管理和了解内存的使用，我们想要知道一个对象在内存中的大小变得比较困难了。本文提供了可以获取对象的大小的方法，但是由于各个虚拟机在内存使用上可能存在不同，因此该方法不能在各虚拟机上都适用，而是仅在hotspot 32位虚拟机上，或者其它内存管理方式与hotspot 32位虚拟机相同的虚拟机上适用。
SVN错误及处理 xiangqian0505 SVN提交文件时服务器强行关闭
在SVN服务控制台打开资源库“SVN无法读取current” ---摘自网络写道 SVN无法读取current修复方法 Can't read file : End of file found 文件：repository/db/txn_current、repository/db/current 其中current记录当前最新版本号，txn_current记录版本库中版本

探游·R329·AI部署实战（二）移植搭建AI环境

前言

第一节 我要怎样才能在R329上跑起来AIPU的呀？

第二节 我要怎样才能用R329的双核A53上跑起来NCNN呀？

第三节 我要怎样才能跑自己的模型呀？？

第四节 我要怎样才能切图（异构计算）呀？

你可能感兴趣的:(Arm,技术,人工智能,语音识别,深度学习)

第一节我要怎样才能在R329上跑起来AIPU的呀？

第二节我要怎样才能用R329的双核A53上跑起来NCNN呀？

第三节我要怎样才能跑自己的模型呀？？

第四节我要怎样才能切图（异构计算）呀？