STN_LCD

ARM NEON 编程系列3——使用ARM NEON Intrinsics加速Video Codec

http://www.jianshu.com/p/70601b36540f

前言

最近公司在视频直播项目中要使用H.265/HEVC，具体的是使用HW硬件编码H.264/AVC，云端转码成H.265/HEVC并推流的解决方案。方案中使用的解码器是FFMpeg中的H.265解码器，该解码器是从OpenHEVC直接获取的，比起备受好评的H.264/AVC解码器，这个解码器目前优化不足，在手机上占用资源较高。因此一个工作就是优化该解码器在手机上的性能表现，主要使用ARM提供的SIMD指令进行优化。

SIMD简介

Single Instruction Multiple Data (SIMD)，单指令多数据。从字面理解，就是在CPU执行中，一条操作指令可以同时操作多个寄存器，从而在物理上倍数的加速运行。我理解范畴内的X86平台上最早的SIMD指令应该是奔腾MMX上自带的MMX指令，其寄存器宽度是64位，可以同时操作8个字节。MultiMedia eXtensions (MMX)是多媒体扩展的意思，其最初的设计目的就是为了加速图像／视频等高并行数据的处理速度。

一个简单的SIMD示意图如下所示：

SIMD 8x8加法示意图

在这里，一条SIMD加法指令可以同时得到8个加法结果。就计算步骤本身而言，比单独使用8条加法指令能够获得8倍的加速比。从该示例也可以看出，随着寄存器长度的变长，单指令能够处理的数据量也越来越大，从而获得更高的加速性能。在Intel最新的AVX2指令集中，寄存器最大长度已经达到512位。

ARM NEON Intrinsics简介

NEON指令是从Armv7架构开始引入的SIMD指令，其共有16个128位寄存器。发展到最新的Arm64架构，其寄存器数量增加到32个，但是其长度仍然为最大128位，因此操作上并没有发生显著的变化。对于这样的寄存器，因为可以同时存储并处理多组数据，称之为向量寄存器。Intrinsics是使用C语言的方式对NEON寄存器进行操作，因为相比于传统的使用纯汇编语言，具有可读性强，开发速度快等优势。如果需要在代码中调用NEON Intrinsics函数，需要加入头文件"arm_neon.h"。

数据类型

NEON Intrinsics内置的整数数据类型主要包括以下几种:

(u)int8x8_t;
(u)int8x16_t;
(u)int16x4_t;
(u)int16x8_t;
(u)int32x2_t;
(u)int32x4_t;
(u)int64x1_t;

其中，第一个数字代表的是数据类型宽度为8/16/32/64位，第二个数字代表的是一个寄存器中该类型数据的数量。如int16x8_t代表16位有符号数，寄存器中共有8个数据。

常用指令

NEON Intrinsics支持的所有指令可参看ARM NEON Intrinsics，其包含了常用的arm汇编指令类型，如数学运算，逻辑运算等。另外，其引入了有针对性的加载／存储／转置／交叉存取等指令。部分常见的指令在会下面的示例环节中予以说明。需要注意的是，指令中的助记符与arm汇编是相同的。

示例1:

int16x8_t vqaddq_s16 (int16x8_t, int16x8_t)
int16x4_t vqadd_s16 (int16x4_t, int16x4_t)
第一个字母'v'指明是vector向量指令，也就是NEON指令；
第二个字母'q'指明是饱和指令，即后续的加法结果会自动饱和；
第三个字段'add'指明是加法指令；
第四个字段'q'指明操作寄存器宽度，为'q'时操作QWORD, 为128位；未指明时操作寄存器为DWORD，为64位；
第五个字段's16'指明操作的基本单元为有符号16位整数，其最大表示范围为-32768 ~ 32767；
形参和返回值类型约定与C语言一致。

其它可能用到的助记符包括:

l 长指令，数据扩展
w 宽指令，数据对齐
n 窄指令, 数据压缩

示例2

uint8x8_t vld1_u8 (const uint8_t *)
第二个字段'ld'表示加载指令
第三个字段'1'(注意是1，不是l)表示顺次加载。如果需要处理图像的RGB分量，可能会用到vld3。关于vld/vst指令更详细的说明，请自己参阅arm官方文档。

函数改写示例

1. 简单示例

原始代码

// uint8_t *_dst, uint8_t *_src, int16_t *src2
// int height, int width
for (y = 0; y < height; y++) {
  for (x = 0; x < width; x++) {
    dst[x] = av_clip_pixel(((src[x] << 6) + src2[x] + offset) >> shift);
  }
  src  += srcstride;
  dst  += dststride;
  src2 += MAX_PB_SIZE;
}
`

改写代码

int16x8_t result_16x8;
int16x8_t offset_16x8 = vmovq_n_s16(offset);
int16x8_t minusshift_16x8 = vmovq_n_s16(-1 * shift);
int16x8_t min_16x8 = vmovq_n_s16(0);
int16x8_t max_16x8 = vmovq_n_s16(255);

for (y = 0; y < height; y++) {
  for (x = 0; x < width; x+=8) {
    result_16x8 = vshlq_n_s16(vreinterpretq_s16_u16(vmovl_u8(vld1_u8(&src[x]))), 6);
            result_16x8 = vshlq_s16(vqaddq_s16(vqaddq_s16(result_16x8, vld1q_s16(&src2[x])), offset_16x8), minusshift_16x8);
            vst1_u8(&dst[x], vqmovn_u16(vreinterpretq_u16_s16(vmaxq_s16(vminq_s16(result_16x8, max_16x8), min_16x8))));
  }
  src  += srcstride;
  dst  += dststride;
  src2 += MAX_PB_SIZE;
}
`

说明：

这里只针对宽度为8的倍数进行了改写，实际代码中需要对传入参数进行判断
vld1_u8读取8字节数据，vmovl_u8对读取的uint8x8进行宽度扩展
vreinterpretq_s16_u16对数据类型进行强制转换
vshlq_n_s16对数据进行左移处理(P.S. NEON提供了右移指令，但是只能使用整数常量。需要根据变量进行右移时，只能使用左移负数位的方法。)
vqmovn_u16对处理结果进行宽度压缩
vst1_u8将处理后的int16x8_t数据写回内存

2.进阶示例

原始代码

/*
#define QPEL_FILTER(src, stride)   \
(filter[0] * src[x - 3 * stride] + \
 filter[1] * src[x - 2 * stride] + \
 filter[2] * src[x -     stride] + \
 filter[3] * src[x             ] + \
 filter[4] * src[x +     stride] + \
 filter[5] * src[x + 2 * stride] + \
 filter[6] * src[x + 3 * stride] + \
 filter[7] * src[x + 4 * stride])

DECLARE_ALIGNED(16, const int8_t, ff_hevc_qpel_filters[3][16]) = {
    { -1,  4,-10, 58, 17, -5,  1,  0, -1,  4,-10, 58, 17, -5,  1,  0},
    { -1,  4,-11, 40, 40,-11,  4, -1, -1,  4,-11, 40, 40,-11,  4, -1},
    {  0,  1, -5, 17, 58,-10,  4, -1,  0,  1, -5, 17, 58,-10,  4, -1}
};
*/
filter = ff_hevc_qpel_filters[mx - 1];
for (y = 0; y < height + QPEL_EXTRA; y++) {
  for (x = 0; x < width; x++)
    tmp[x] = QPEL_FILTER(src, 1);
  src += srcstride;
  tmp += MAX_PB_SIZE;
}

改写代码

/*
DECLARE_ALIGNED(16, const int8_t, ff_hevc_qpel_filtersT[3][64]) = {
    { -1, -1, -1, -1, -1, -1, -1, -1,  4,  4,  4,  4,  4,  4,  4,  4,//(0)
     -10,-10,-10,-10,-10,-10,-10,-10, 58, 58, 58, 58, 58, 58, 58, 58,
      17, 17, 17, 17, 17, 17, 17, 17, -5, -5, -5, -5, -5, -5, -5, -5,
       1,  1,  1,  1,  1,  1,  1,  1,  0,  0,  0,  0,  0,  0,  0,  0},
    { -1, -1, -1, -1, -1, -1, -1, -1,  4,  4,  4,  4,  4,  4,  4,  4,//(1)
     -11,-11,-11,-11,-11,-11,-11,-11, 40, 40, 40, 40, 40, 40, 40, 40,
      40, 40, 40, 40, 40, 40, 40, 40,-11,-11,-11,-11,-11,-11,-11,-11,
       4,  4,  4,  4,  4,  4,  4,  4, -1, -1, -1, -1, -1, -1, -1, -1},
    {  0,  0,  0,  0,  0,  0,  0,  0,  1,  1,  1,  1,  1,  1,  1,  1,//(2)
      -5, -5, -5, -5, -5, -5, -5, -5, 17, 17, 17, 17, 17, 17, 17, 17,
      58, 58, 58, 58, 58, 58, 58, 58,-10,-10,-10,-10,-10,-10,-10,-10,
       4,  4,  4,  4,  4,  4,  4,  4, -1, -1, -1, -1, -1, -1, -1, -1}
};
*/
int16x8_t filteT_16x8_0, filteT_16x8_1, filteT_16x8_2, filteT_16x8_3, filteT_16x8_4, filteT_16x8_5, filteT_16x8_6, filteT_16x8_7;
int16x8_t result_16x8;

filter = ff_hevc_qpel_filtersT[mx - 1];

filteT_16x8_0 = vmovl_s8(vld1_s8(&filter[0]));
filteT_16x8_1 = vmovl_s8(vld1_s8(&filter[8]));
filteT_16x8_2 = vmovl_s8(vld1_s8(&filter[16]));
filteT_16x8_3 = vmovl_s8(vld1_s8(&filter[24]));
filteT_16x8_4 = vmovl_s8(vld1_s8(&filter[32]));
filteT_16x8_5 = vmovl_s8(vld1_s8(&filter[40]));
filteT_16x8_6 = vmovl_s8(vld1_s8(&filter[48]));
filteT_16x8_7 = vmovl_s8(vld1_s8(&filter[56]));

for (y = 0; y < height + QPEL_EXTRA; y++) {
  for ( x = 0; x < width; x += 8 ) {
    // init the output reg
    result_16x8 = vmovq_n_s16(0);
    // (0)
    result_16x8 = vmlaq_s16(result_16x8, vreinterpretq_s16_u16(vmovl_u8(vld1_u8(&src[x-3]))), filteT_16x8_0);
    // (1)
    result_16x8 = vmlaq_s16(result_16x8, vreinterpretq_s16_u16(vmovl_u8(vld1_u8(&src[x-2]))), filteT_16x8_1);
    // (2)
    result_16x8 = vmlaq_s16(result_16x8, vreinterpretq_s16_u16(vmovl_u8(vld1_u8(&src[x-1]))), filteT_16x8_2);
    // (3)
    result_16x8 = vmlaq_s16(result_16x8, vreinterpretq_s16_u16(vmovl_u8(vld1_u8(&src[x]))), filteT_16x8_3);
    // (4)
    result_16x8 = vmlaq_s16(result_16x8, vreinterpretq_s16_u16(vmovl_u8(vld1_u8(&src[x+1]))), filteT_16x8_4);
    // (5)
    result_16x8 = vmlaq_s16(result_16x8, vreinterpretq_s16_u16(vmovl_u8(vld1_u8(&src[x+2]))), filteT_16x8_5);
    // (6)
    result_16x8 = vmlaq_s16(result_16x8, vreinterpretq_s16_u16(vmovl_u8(vld1_u8(&src[x+3]))), filteT_16x8_6);
    // (7)
    result_16x8 = vmlaq_s16(result_16x8, vreinterpretq_s16_u16(vmovl_u8(vld1_u8(&src[x+4]))), filteT_16x8_7);

    // store the output data
    vst1q_s16(&tmp[x], result_16x8);
  }
  src += srcstride;
  tmp += MAX_PB_SIZE;
}

说明:
在C实现中，每个结果需要读取包括自身在内的8个输入，乘以相应的系数并累加。最简单直观的实现方法是

output_16x8 = vmulq_s16( vreinterpretq_s16_u16(vmovl_u8(vld1_u8(&src[x-3]))), vmovl_s8(vld1_s8(ff_hevc_qpel_filters[mx - 1])));

这样实现，会使得8个乘积分布在同一个向量寄存器中，需要通过取寄存器的不同元素实现累加，加法部分无法并行。
在C实现中，其数学表示为两个1x8和8x1的矩阵之间的乘法。分析数据间的关系，将矩阵乘法转换为矩阵转置乘法，可以得出前文改写代码的实现。在该实现中，由于滤波器系统固定，因此预先定义了其转置矩阵并扩展。在进行'乘加'操作的过程中，一个循环将8个结果全部计算完毕，使得乘法/加法均实现了并行化。
P.S. 这里，单独设置了8个向量寄存器变量并展开使得代码较长，使用循环+数组的方式也可以得到同样的结果，且代码较短。但是在底层高频函数中，尽量展开循环可以最大化的提升效率。

结语

本文只介绍了使用ARM NEON Intrinsics的原理和基本应用。实际中需要对待优化的函数原理及能使用的资源了解清楚才能使用最有效的方法并行化程序。

作者：shaker
链接：http://www.jianshu.com/p/70601b36540f
來源：简书
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

你可能感兴趣的:(嵌入式基础)

嵌入式基础理论学习——1、嵌入式系统的概念及组成自立自律自强嵌入式理论学习学习嵌入式硬件
一、嵌入式系统的概念嵌入式系统是以应用为中心，以现代计算机技术为基础，能够根据用户需求(功能、可靠性、成本、体积、功耗、环境等)灵活裁剪软硬件模块的专用计算机系统。————来自百度百科我个人觉得百度百科这一段解释很贴切。计算机系统有许多的分类，同时也有许多的功能，而在实际的业务需求中，计算机系统的很多功能是不需要的，而为了避免浪费空间和资源，则需要对系统的多余部分进行阉割，只留下实际业务需要的，尽
嵌入式基础准备 | Linux命令（包括文件、目录和压缩、系统操作、vi、vim、ctags、cscope） Asher Gu 嵌入式相关 linux vim
1、使用ctrl+alt+t打开命令行2、按tab键补全文件名3、ctrl+c停止正在进行的过程4、向上键向下键翻历史的命令（只有在当前用户才有效，比如切换根用户之后就无了）5、根用户创建的文件其他用户只有查看内容的权限，不能修改6、具体命令：Linuxvi/vim使用1、文件、目录和压缩1.1目录操作$ls//查看里面有什么东西(浏览目录内容)默认开始进入主目录$tree//查看当前目录（直接出
蓝桥杯嵌入式STM32G431RBT6的学习（总大纲）（HAL库学习）板子介绍薛定谔的猫咪死了博客蓝桥杯 stm32 学习
我写蓝桥杯嵌入式大概用到的外设，都是非常常用的。我在这里汇总一下。GPIO的使用：蓝桥杯嵌入式基础模块——GPIO的使用（新板）STM32G431（HAL库开发）_薛定谔的猫咪死了的博客-CSDN博客串口的使用蓝桥杯嵌入式基础模块——串口的使用（新板）STM32G431（HAL库开发）_薛定谔的猫咪死了的博客-CSDN博客蓝桥杯嵌入式基础模块——串口的接收（新板）STM32G431（HAL库开发）
嵌入式基础知识学习：Flash、EEPROM、RAM、ROM Logintern09 学习嵌入式硬件
https://blog.csdn.net/y673533511/article/details/87913989FLASH存储器又称闪存，它结合了ROM和RAM的长处，不仅具备电子可擦出可编程(EEPROM)的性能，还不会断电丢失数据同时可以快速读取数据(NVRAM的优势)，U盘和MP3里用的就是这种存储器。在过去的20年里,嵌入式系统一直使用ROM(EPROM)作为它们的存储设备，然而近年来F
嵌入式基础知识学习：I2C通信协议 Logintern09 学习嵌入式
https://zhuanlan.zhihu.com/p/647656964https://blog.csdn.net/FYBZ2020/article/details/128486981I2C总线概述I2C（Inter-IntegratedCircuit）总线是两线式串行通信总线，是微电子通信控制领域广泛采用的一种总线标准。在介绍I2C总线工作原理之前，首先必须明确几个基本概念：发送器（Tran
STM32CubeMX+Keil+Proteus联合仿真初步实现 m0_53800738 stm32 单片机 proteus
笔者嵌入式基础很差，在学习ROS过程中时，为了防止对底盘硬件造成破坏，一直在寻找一套完整的仿真系统进行练习，所幸接触到了STM32CubeMX，按网上方法做了个初步练习，并做了以下记录。声明：博客借鉴了不限于一个人的内容，做整理使用。目标：实现LED的闪烁。工具：STM32CubeMA,Keil5,Proteus8目录：一、使用STM32CubeMX配置芯片和GPIO口，并生成Keil工程二丶使用
嵌入式基础知识-测试基础概念码农爱学习嵌入式系统基础嵌入式软件测试
本篇来介绍嵌入式项目开发中，软件测试的相关基础知识。1测试基础知识测试是指：在规定的条件下对程序进行操作，以发现错误，对软件质量进行评估测试的对象包括程序、数据和文档对于测试，并不是只有测试人员才需要了解，需要了解测试的人员包括：用户：参与需求验证和验收测试项目经理：参与测试计划指定程序员：完成单元测试测试员：设计和执行测试1.1测试原则系统测试的原则包括：软件测试的目的是发现软件的错误应尽早地、
嵌入式基础知识_1——C语言知识与数据结构 twx11213030422 嵌入式基础知识数据结构嵌入式
C语言篇关键字使用与说明1.static：这个可以将变量申明为静态的，限制变量/函数的使用范围（只限于本文件中）；延长变量的生命周期使变量和main函数的生命周期一致。变量申明——延长变量生命周期：voidTest(void){staticuint8_ti=0;i++;}函数申明——只能在本文件中使用：staticvoidTest(void){uint8_ti=0;i++;}2.extern：这个
2020-09-15 Wegame_7ce1
第1章嵌入式基础1.1嵌入式的概述1.1.1嵌入式的含义嵌入式系统，是一种“完全嵌入受控器件内部，为特定应用而设计的专用计算机系统”。1.1.2嵌入式的用途嵌入式系统用于控制、监视或者辅助操作机器和设备的装置。1.1.3生活中常见的嵌入式产品空调、洗衣机、冰箱、微波炉、消毒柜等。1.1.4嵌入式单片机与PC电脑的区别1.1.5单片机分类主要分为两大类：51单片机、ARM单片机51单片机：厂商---
（1）GD32E502C-START 开发板学习——点亮LED灯莫名的曾小贤 GD32E502 嵌入式硬件 stm32
一、前言默认读者有一定的嵌入式基础，本人也是才开始学习嵌入式，因此边学习边记录，有误地方请指出。不讲复杂的理论过程，简单易懂快速实现基本功能。首先，需要理解点亮LED灯的功能原理，下图为GD32E502C-START开发板的LED原理图，MCU对应的GPIO口（通用输入输出接口）分别为PA1、PF5、PC0、PC1，经过各自限流电阻R连接到LED灯（阴极）再到地GND，其为电流的通路流向从左到右（
为什么要好好学习？ STioPlato
前两天从北京实习回来，感觉实习公司是真的不负责任。刚才看了看实习公司的认知实习计划，好像没有哪一条是按照计划做到的，为我们提供的总共就是一上午的ppt关于公司内程序员概况的解说，然后有一天半的培训课程（给大三大四讲的一些嵌入式知识）。讲课的时候老师给我们提到过，你们虽然大一，但是认真听也是能听懂的。嗯···我们能听懂的大三大四还不会？最后由于我们对嵌入式基础知识的匮乏，大多数都放弃了听课，可是实习
嵌入式基础(四)：嵌入式微处理器体系结构 CC_ba72
姓名：童琪凯学号：19020100176学院:电子工程学院转自:https://blog.csdn.net/lr1916417519/article/details/81049468【嵌牛导读】在学习嵌入式过程中,我们经常被嵌入式微处理器给搞的晕头转向,对于它的结构我们必须了然于心,避免在项目实操过程中高成本、低性能,形成资源耗散。【嵌牛鼻子】嵌入式微处理器体系结构【嵌牛提问】嵌入式微处理器体系结
【嵌入式基础】Keil下编译代码并生成HEX文件 Xicun1984 单片机 stm32 嵌入式硬件
目录一、Keil环境搭建1、百度网盘分享下载2、Keil安装3、注册4、支持包安装二、在Keil环境下创建新项目1、创建新项目2、命名新文件编辑3、芯片选择和环境配置4、添加源文件三、代码编写，编译与调试1、代码编写2、程序编译3、程序调试四、分析生成的HEX文件1、拓展线性地址记录2、数据部分3、文件尾五、总结六、参考文献一、Keil环境搭建1、百度网盘分享下载mdk531安装链接：https:
嵌入式开发：嵌入式基础知识——正确启动固件项目的 10 条建议粤嵌教育嵌入式嵌入式开发嵌入式软件嵌入式培训嵌入式硬件嵌入式
对开发人员提出的快速获得结果的要求可能会导致在固件实施的开始阶段跳过一些关键步骤。为了节省调试阶段的时间，嵌入式开发人员在编写任何应用程序代码之前，请将这十条建议作为起点。1)建立一个目录结构，包括但不限于–应用–BSP–建造–库–图书馆–MCU驱动器2)添加文件和搜索路径时，使用工作区和项目的相对路径。3)使用构建文件夹来使用具有相同代码库的多个工具链。4)在所有工具链中设置空白和制表符间距，以
嵌入式基础长路漫漫2021 Embedded Software 嵌入式系统的硬件组成嵌入式处理器分类操作系统层OS OEM层 Windows CE开发工具
本篇文章主要转载自嵌入式复习，便于自己复习使用。1基本概念嵌入式系统概念：以应用为中心，以计算机为基础，软件、硬件可裁剪，功能、可靠性、成本、体积、功耗严格要求的专用计算机系统（国内）；用于控制、监控或辅助操作机器和设备的装置（IEEE）；嵌入式发展阶段：无操作系统阶段、简单操作系统阶段、实时操作系统阶段、面向Internet阶段；嵌入式应用领域：工业控制、交通管理、信息家电、家庭智能管理、网络及
C语言线上线下混合式教学,线上线下混合式教学探索与实践 weixin_39978444 C语言线上线下混合式教学
李建荣摘要：混合式教学方式是当今高校中较为流行的一种授课方式，但具体实施时也要因地制宜地使用。文章以嵌入式基础课程为例，从混合式教学的内容设计、过程设计、考核改革等几方面入手，基于本校的网络教学平台对混合式教学进行探索和研究。关键词：网络教学平台;混合式教学;线上中图分类号：G642.0文献标志码：A文章编号：1674-9324(2019)37-0164-02嵌入式基础课程是我校计算机科学与技术专
嵌入式基础01【转载】详解大端模式和小端模式 WenLang_M 嵌入式技术
————————————————版权声明：本文为CSDN博主「ce123」的原创文章，遵循CC4.0BY-SA版权协议，转载请附上原文出处链接及本声明。原文链接：https://blog.csdn.net/ce123_zhouwei/article/details/6971544详解大端模式和小端模式一、大端模式和小端模式的起源关于大端小端名词的由来，有一个有趣的故事，来自于JonathanSwi
嵌入式基础知识（2）——操作系统小乌龟打怪升级嵌入式知识 linux
1、自旋锁和信号量在互斥使用时需要注意的问题，在中断服务程序里面的互斥如何使用自旋锁和信号量自旋锁会一直自旋等待，不会休眠：而信号量是等待信号来唤醒进程，进程会睡眠。使用时注意希望长等待不吃系统资源时使用信号量，反过来短期的等待使用自旋锁，但会增加系统开销，中断后不可以使用信号量，因为中断不能睡眠。2、异步IO和同步IO的区别同步和异步来自于Linux内核态和用户态的切换，通常IO包括网络IO和来
Linux嵌入式基础知识 LingLong_roar Job linux 网络运维
一个嵌入式Linux系统从软件的角度看通常可以分为四个层次：1、引导加载程序:包括固化在固件(firmware)中的boot代码(可选)，和BootLoader两大部分。2、Linux内核:特定于嵌入式板子的定制内核以及内核的启动参数。3、文件系统:包括根文件系统和建立于Flash内存设备之上文件系统。通常用ramdisk来作为rootfs。4、用户应用程序:特定于用户的应用程序。有时在用户应用程
ChinaSoft 论坛巡礼 | 嵌入式基础软件论坛 pengxin_ce 数据库网络 microsoft 人工智能 linux
2022年CCF中国软件大会（CCFChinaSoft2022）将于2022年11月25-27日在线上举行。预期将有林惠民、陈左宁、邬江兴、何积丰、梅宏、吕建、柴洪峰、廖湘科、王怀民、郑纬民、蒋昌俊、王自力等10余位院士莅临。本次大会主题是“聚焦产教研用协同创新，提升关键软件供给能力”，包括学术、工业、教育等论坛活动40余场，期待您的参与！大会线上参会报名通道已经开启！点击文末“阅读原文”报名注册
嵌入式基础知识-RSA非对称加密基本原理码农爱学习嵌入式系统基础 RSA 非对称加密
之前的文章嵌入式基础知识-信息安全与加密，介绍过数据加密的一些基本概念，对称加密的原理比较简单，加密和解密的密钥相同，而非对称加密，两个密钥不同，本篇就来具体介绍RSA这种非对称加密的密钥计算原理。1RSA算法基本原理RSA加密算法是由罗纳德·李维斯特（RonaldLinnRivest）、阿迪·萨莫尔（AdiShamir）和伦纳德·阿德尔曼（LeonardAdleman）于1977年共同发明的。它
嵌入式基础——哈弗结构 New_Teen 微机原理单片机嵌入式硬件
文章目录1什么是哈弗结构？2哈弗结构单片机的特点3什么是改进的(Enhanced)哈弗结构?4写在最后1什么是哈弗结构？哈佛结构是一种将程序指令存储和数据存储分开的存储器结构，如图所示：哈佛结构是一种并行体系结构，它的主要特点是将程序和数据存储在不同的存储空间中，即程序存储器和数据存储器是两个独立的存储器，每个存储器独立编址、独立访问。与两个存储器相对应的是系统的4条总线，即程序的数据总线与地址总
C语言基础笔记（嵌入式基础学习1）摸鱼特长生. 嵌入式 C语言基础 c语言 vim linux ubuntu
（用于嵌入式基础巩固，是本人通过学习进行笔记记载，文章有不足指出，望各位博友指点一二，希望大家与我共进步）一、虚拟机基本操作1.基础VMware：虚拟机Ubuntu：Linux操作系统中的一种windows:GUI设计非常完善用户多系统不够稳定不够安全收费不开源Linux：GUI设计完善免费开源需要一定的学习一切皆文件1）Linux相关指令:①pwd:获取当前目录的绝对路径（从根目录/开始）②ls
初学者须知的嵌入式基础知识（三）附轮询系统、前后台系统、优先级继承协议和优先级天花板协议源代码•宸嵌入式操作系统程序人生
嵌入式系统的进程上下文切换使CPU从一个正在执行的进程转向另一个进程的机制称为上下文切换（又称文境切换）。文境切换必须是没有任何缺陷的，并且文境切换在CPU内能非常迅速地执行。文境切换的形式主要有两种：协作多任务处理采用协作多任务处理的系统中，正在执行的进程将主动地放弃CPU等资源，让给另一个进程。协作多任务处理的系统中，每个进程中包含一个对文境切换函数的调用，该函数调用并不启动一个新的进程执行，
【嵌入式学习笔记】嵌入式基础2——ARM与Cortex-M系列介绍 Zency_SUN 嵌入式学习专栏（STM32）学习笔记 arm开发嵌入式硬件 stm32
1.ARM公司ARM公司：只做内核设计和IP授权，不参与芯片设计，如图所示。ARM架构风靡全球是因为其产品有以下特点：低功耗、低成本、高性能支持16/32位双指令集拥有众多合作伙伴ARM公司推出了ARM内核，随后演变成了Coretex内核，许多厂商根据该公司设计的内核生产芯片（STM32等）2.Corte-x内核分类及特征3.Cortex-M3/4/7介绍
嵌入式基础知识-IP地址与子网划分码农爱学习嵌入式系统基础 tcp/ip 服务器网络协议
本篇介绍IP地址与子网划分的一些基础知识，在嵌入式开发，使用网络功能时，需要了解网络的一些基础知识。1IP地址1.1IPv4与IPv6对比信息IPv4IPv6长度32位128位地址表示形式点分十进制冒分十六进制表示示例192.168.5.1002002:0000:0000:0000:0000:0000:c0a8:05641.2IPv4地址详解IPv4地址分4段，每段8位，共32位二进制数组成。1.
嵌入式基础李易达嵌入式转载
1.嵌入式存储系统1.1.计算机组成原理从冯.诺依曼的存储程序工作原理及计算机的组成来说，计算机由运算器、控制器、存储器和输入/输出设备五大部件组成。其中运算器和控制器统称为中央处理器(CPU)，而存储系统分成内部存储器(内存)和外部存储器(外存)。输入/输出设备并非计算机所必需的，如果一个设备具有CPU，内存和外存，我们就可以说它是一台计算机。在很多嵌入式设备上，都没有输入/输出设备，所以从广义
面的嵌入式基础知识总结单片机一哥单片机编程嵌入式单片机 51单片机
面的嵌入式基础知识总结做嵌入式系统开发，经常要接触硬件。做嵌入式开发对数字电路和模拟电路要有一定的了解。这样才能深入的研究下去。下面我们简单的介绍嵌入式开发中的一些硬件相关的概念。最近很多小伙伴找我，说想要一些嵌入式机学习资料，然后我根据自己从业十年经验，熬夜搞了几个通宵，精心整理了一份「嵌入式入门到高级教程+工具包」，点个关注，全部无偿共享给大家！！！评论区回复“888”，关注我之后私信回复“6
嵌入式基础-常见的电子元件和三大定理爱玩的w同学嵌入式学习嵌入式硬件
目录1、电阻2、电容器3、电感器4、振荡电路5、分压器6、电压器7、戴维宁定理8、诺顿定理9、基尔霍夫定律1、电阻用于限制电路的大小，R=U/I，其中R表示电阻值，V表示电压，I表示电流。注：无论电阻有多大，在电流中都会有电流通过，只不过电流很小。2、电容器电容是一种储存电荷的电子元件，其作用是储存电能。当电容器接通电源时，它会充电并存储电荷，当断开电源后，它会把电荷释放出来。电容器的容量可以根据
嵌入式基础知识理论概述追逐太阳的星星单片机 fpga开发 stm32 嵌入式硬件
嵌入式基础知识理论概述摘要：当前我们正步入新时代、正面临新态势、正迈进新征程,嵌入式已经融入到我们的各行各业、日常生活之中，嵌入式无处不在。简要概述了嵌入式基础知识，供读者对嵌入式有一个基础的认知。关键词：ARM处理器芯片RISC（精简指令集）CISC（复杂指令集）MCUMPUDSPFPG嵌入式基础知识嵌入式系统是以应用为中心，以计算机技术为基础，软硬件可裁剪，适应应用系统对功能、可靠性、成本、体
深入浅出Java Annotation(元注解和自定义注解） Josh_Persistence Java Annotation 元注解自定义注解
一、基本概述　　 Annontation是Java5开始引入的新特征。中文名称一般叫注解。它提供了一种安全的类似注释的机制，用来将任何的信息或元数据（metadata）与程序元素（类、方法、成员变量等）进行关联。　　更通俗的意思是为程序的元素（类、方法、成员变量）加上更直观更明了的说明，这些说明信息是与程序的业务逻辑无关，并且是供指定的工具或
mysql优化特定类型的查询 annan211 java 工作 mysql
本节所介绍的查询优化的技巧都是和特定版本相关的，所以对于未来mysql的版本未必适用。 1 优化count查询对于count这个函数的网上的大部分资料都是错误的或者是理解的都是一知半解的。在做优化之前我们先来看看真正的count()函数的作用到底是什么。 count()是一个特殊的函数，有两种非常不同的作用，他可以统计某个列值的数量，也可以统计行数。在统
MAC下安装多版本JDK和切换几种方式棋子chessman jdk
环境： MAC AIR,OS X 10.10,64位历史：过去 Mac 上的 Java 都是由 Apple 自己提供，只支持到 Java 6，并且OS X 10.7 开始系统并不自带（而是可选安装）（原自带的是1.6）。后来 Apple 加入 OpenJDK 继续支持 Java 6，而 Java 7 将由 Oracle 负责提供。在终端中输入jav
javaScript （1） Array_06 JavaScript java 浏览器
JavaScript 1、运算符　　运算符就是完成操作的一系列符号，它有七类：　　赋值运算符（=,+=,-=,*=,/=,%=,<<=,>>=,|=,&=）、算术运算符(+,-,*,/,++,--,%)、比较运算符(>,<,<=,>=,==,===,!=,!==)、逻辑运算符(||,&&,!)、条件运算(?:)、位
国内顶级代码分享网站袁潇含 java jdk oracle .net PHP
现在国内很多开源网站感觉都是为了利益而做的当然利益是肯定的,否则谁也不会免费的去做网站 &
Elasticsearch、MongoDB和Hadoop比较随意而生 mongodb hadoop 搜索引擎
IT界在过去几年中出现了一个有趣的现象。很多新的技术出现并立即拥抱了“大数据”。稍微老一点的技术也会将大数据添进自己的特性，避免落大部队太远，我们看到了不同技术之间的边际的模糊化。假如你有诸如Elasticsearch或者Solr这样的搜索引擎，它们存储着JSON文档，MongoDB存着JSON文档，或者一堆JSON文档存放在一个Hadoop集群的HDFS中。你可以使用这三种配
mac os 系统科研软件总结张亚雄 mac os
1.1 Microsoft Office for Mac 2011 大客户版，自行搜索。 1.2 Latex （MacTex）: 系统环境：https://tug.org/mactex/ &nb
Maven实战（四）生命周期 AdyZhang maven
1. 三套生命周期 Maven拥有三套相互独立的生命周期，它们分别为clean，default和site。每个生命周期包含一些阶段，这些阶段是有顺序的，并且后面的阶段依赖于前面的阶段，用户和Maven最直接的交互方式就是调用这些生命周期阶段。以clean生命周期为例，它包含的阶段有pre-clean, clean 和 post
Linux下Jenkins迁移 aijuans Jenkins
1. 将Jenkins程序目录copy过去源程序在/export/data/tomcatRoot/ofctest-jenkins.jd.com下面 tar -cvzf jenkins.tar.gz ofctest-jenkins.jd.com &
request.getInputStream()只能获取一次的问题 ayaoxinchao request Inputstream
问题：在使用HTTP协议实现应用间接口通信时，服务端读取客户端请求过来的数据，会用到request.getInputStream()，第一次读取的时候可以读取到数据，但是接下来的读取操作都读取不到数据原因： 1. 一个InputStream对象在被读取完成后，将无法被再次读取，始终返回-1； 2. InputStream并没有实现reset方法（可以重
数据库SQL优化大总结之百万级数据库优化方案 BigBird2012 SQL优化
网上关于SQL优化的教程很多，但是比较杂乱。近日有空整理了一下，写出来跟大家分享一下，其中有错误和不足的地方，还请大家纠正补充。这篇文章我花费了大量的时间查找资料、修改、排版，希望大家阅读之后，感觉好的话推荐给更多的人，让更多的人看到、纠正以及补充。 1.对查询进行优化，要尽量避免全表扫描，首先应考虑在 where 及 order by 涉及的列上建立索引。 2.应尽量避免在 where
jsonObject的使用 bijian1013 java json
在项目中难免会用java处理json格式的数据，因此封装了一个JSONUtil工具类。 JSONUtil.java package com.bijian.json.study; import java.util.ArrayList; import java.util.Date; import java.util.HashMap;
[Zookeeper学习笔记之六]Zookeeper源代码分析之Zookeeper.WatchRegistration bit1129 zookeeper
Zookeeper类是Zookeeper提供给用户访问Zookeeper service的主要API，它包含了如下几个内部类首先分析它的内部类，从WatchRegistration开始，为指定的znode path注册一个Watcher， /** * Register a watcher for a particular p
【Scala十三】Scala核心七：部分应用函数 bit1129 scala
何为部分应用函数？ Partially applied function: A function that’s used in an expression and that misses some of its arguments.For instance, if function f has type Int => Int => Int, then f and f(1) are p
Tomcat Error listenerStart 终极大法 ronin47 tomcat
Tomcat报的错太含糊了，什么错都没报出来，只提示了Error listenerStart。为了调试，我们要获得更详细的日志。可以在WEB-INF/classes目录下新建一个文件叫logging.properties，内容如下 Java代码 handlers = org.apache.juli.FileHandler, java.util.logging.ConsoleHa
不用加减符号实现加减法 BrokenDreams 实现
今天有群友发了一个问题，要求不用加减符号(包括负号)来实现加减法。分析一下，先看最简单的情况，假设1+1，按二进制算的话结果是10，可以看到从右往左的第一位变为0，第二位由于进位变为1。
读《研磨设计模式》-代码笔记-状态模式-State bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 当一个对象的内在状态改变时允许改变其行为，这个对象看起来像是改变了其类状态模式主要解决的是当控制一个对象状态的条件表达式过于复杂时的情况把状态的判断逻辑转移到表示不同状态的一系列类中，可以把复杂的判断逻辑简化如果在
CUDA程序block和thread超出硬件允许值时的异常 cherishLC CUDA
调用CUDA的核函数时指定block 和 thread大小，该大小可以是dim3类型的（三维数组），只用一维时可以是usigned int型的。以下程序验证了当block或thread大小超出硬件允许值时会产生异常！！！GPU根本不会执行运算！！！所以验证结果的正确性很重要！！！在VS中创建CUDA项目会有一个模板，里面有更详细的状态验证。以下程序在K5000GPU上跑的。
诡异的超长时间GC问题定位 chenchao051 jvm cms GC hbase swap
HBase的GC策略采用PawNew+CMS, 这是大众化的配置，ParNew经常会出现停顿时间特别长的情况，有时候甚至长到令人发指的地步，例如请看如下日志： 2012-10-17T05:54:54.293+0800: 739594.224: [GC 739606.508: [ParNew: 996800K->110720K(996800K), 178.8826900 secs] 3700
maven环境快速搭建 daizj 安装 mavne 环境配置
一下载maven 安装maven之前，要先安装jdk及配置JAVA_HOME环境变量。这个安装和配置java环境不用多说。 maven下载地址：http://maven.apache.org/download.html，目前最新的是这个apache-maven-3.2.5-bin.zip，然后解压在任意位置，最好地址中不要带中文字符，这个做java 的都知道，地址中出现中文会出现很多
PHP网站安全，避免PHP网站受到攻击的方法 dcj3sjt126com PHP
对于PHP网站安全主要存在这样几种攻击方式:1、命令注入(Command Injection)2、eval注入(Eval Injection)3、客户端脚本攻击(Script Insertion)4、跨网站脚本攻击(Cross Site Scripting, XSS)5、SQL注入攻击(SQL injection)6、跨网站请求伪造攻击(Cross Site Request Forgerie
yii中给CGridView设置默认的排序根据时间倒序的方法 dcj3sjt126com GridView
public function searchWithRelated() { $criteria = new CDbCriteria; $criteria->together = true; //without th
Java集合对象和数组对象的转换 dyy_gusi java集合
在开发中，我们经常需要将集合对象（List，Set）转换为数组对象，或者将数组对象转换为集合对象。Java提供了相互转换的工具，但是我们使用的时候需要注意，不能乱用滥用。 1、数组对象转换为集合对象最暴力的方式是new一个集合对象，然后遍历数组，依次将数组中的元素放入到新的集合中，但是这样做显然过
nginx同一主机部署多个应用 geeksun nginx
近日有一需求，需要在一台主机上用nginx部署2个php应用，分别是wordpress和wiki，探索了半天，终于部署好了，下面把过程记录下来。 1. 在nginx下创建vhosts目录，用以放置vhost文件。 mkdir vhosts 2. 修改nginx.conf的配置，在http节点增加下面内容设置，用来包含vhosts里的配置文件 #
ubuntu添加admin权限的用户账号 hongtoushizi ubuntu useradd
ubuntu创建账号的方式通常用到两种：useradd 和adduser . 本人尝试了useradd方法，步骤如下： 1:useradd 使用useradd时，如果后面不加任何参数的话，如：sudo useradd sysadm 创建出来的用户将是默认的三无用户：无home directory ,无密码,无系统shell。顾应该如下操作：
第五章常用Lua开发库2-JSON库、编码转换、字符串处理 jinnianshilongnian nginx lua
JSON库在进行数据传输时JSON格式目前应用广泛，因此从Lua对象与JSON字符串之间相互转换是一个非常常见的功能；目前Lua也有几个JSON库，本人用过cjson、dkjson。其中cjson的语法严格（比如unicode \u0020\u7eaf），要求符合规范否则会解析失败（如\u002），而dkjson相对宽松，当然也可以通过修改cjson的源码来完成
Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解 yaerfeng1989 timer quartz 定时器
原创整理不易，转载请注明出处：Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解代码下载地址：http://www.zuidaima.com/share/1772648445103104.htm 有两种流行Spring定时器配置：Java的Timer类和OpenSymphony的Quartz。 1.Java Timer定时首先继承jav
Linux下df与du两个命令的差别？ pda158 linux
　一、df显示文件系统的使用情况，与du比較，就是更全盘化。　　最经常使用的就是 df -T，显示文件系统的使用情况并显示文件系统的类型。　　举比例如以下：　　[root@localhost ~]# df -T 　　Filesystem Type &n
[转]SQLite的工具类 ---- 通过反射把Cursor封装到VO对象 ctfzh VO android sqlite 反射 Cursor
在写DAO层时，觉得从Cursor里一个一个的取出字段值再装到VO(值对象)里太麻烦了，就写了一个工具类，用到了反射，可以把查询记录的值装到对应的VO里，也可以生成该VO的List。使用时需要注意：考虑到Android的性能问题，VO没有使用Setter和Getter，而是直接用public的属性。表中的字段名需要和VO的属性名一样，要是不一样就得在查询的SQL中
该学习笔记用到的Employee表 vipbooks oracle sql 工作
这是我在学习Oracle是用到的Employee表，在该笔记中用到的就是这张表，大家可以用它来学习和练习。 drop table Employee; -- 员工信息表 create table Employee( -- 员工编号 EmpNo number(3) primary key, -- 姓

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他