woqufan

性能优化篇（3）：NEON快速入门指南

Author:stormQ

Sunday, 24. November 2019 10:28PM

目录
- 向量数据类型
- 向量赋值
- 访问/存储向量的值
- 向量算术逻辑运算

向量数据类型

语法格式

向量类型：

_t

向量数组：

_t

注：type，表示数据类型，可选项：int（带符号整型）、uint（无符号整型）、float（浮点型）和 poly（多项式）。size，表示一个元素占用多少 bit。number_of_lanes，表示一个向量中包含的元素数量，第一个元素位于 lane[0] 的位置，第 n 个元素位于 lane[n-1] 的位置，lane[0] 对应向量寄存器最低位的size个 bit。length_of_array，向量数组的大小。

示例

向量类型	含义
uint8x8_t	一个包含八个元素，元素类型为 8-bit 无符号整型的向量
uint8x8x2_t	一个包含两个向量的向量数组，每个向量包含八个元素，元素类型为 8-bit 无符号整型

向量赋值

向量常数赋值
向量内存赋值
向量单个元素内存赋值

向量常数赋值

uint8x8_t 向量常数赋值（每个元素的值都相同）
uint8x8_t 向量常数赋值（每个元素的值可以不同）

返回上一级

uint8x8_t 向量常数赋值（每个元素的值都相同）

函数原型

uint8x8_t vdup_n_u8(uint32_t a);

作用
- 将类型为uint8x8_t的向量中每个元素的值设置为参数a的值。
注意事项
- 参数a的值大于 255 时会发生”整型截断“；每个元素的赋值互不影响。
代码示例

#include "arm_neon.h"

int main()
{
    // 声明一个包含八个元素的向量，每个元素的数据类型为 uint8_t
    uint8x8_t a_uint8x8;
    // 将向量的每个元素赋值为 255
    a_uint8x8 = vdup_n_u8(255);
    return 0;
}

注：使用NEON Intrinsics需要包含头文件arm_neon.h。

代码调试

; 语句 a_uint8x8 = vdup_n_u8(255); 对应的汇编指令：dup	v0.8b, w0
(gdb) disas
...
0x0000000000400a18 <+40>:	dup	v0.8b, w0
...
; 执行 dup	v0.8b, w0 前，打印 w0 寄存器的值
(gdb) p $w0
$2 = 255
...
; 执行 dup	v0.8b, w0 后，打印 v0 寄存器的值
(gdb) p $v0.b.u
$3 = {255, 255, 255, 255, 255, 255, 255, 255, 0, 0, 0, 0, 0, 0, 0, 0}
(gdb) p $v0.b.u[0]
$4 = 255
(gdb) p $v0.b.u[7]
$5 = 255
(gdb) p $v0.b.u[8]
$6 = 0

可以看出 v0 寄存器的低位 8 字节分别被赋值为 255。

返回上一级

uint8x8_t 向量常数赋值（每个元素的值可以不同）

函数原型

uint8x8_t vcreate_u8 (uint64_t __a);

作用
- 将参数a赋值给类型为uint8x8_t的向量。
注意事项
- 赋值顺序：参数__a的值从右到左每字节的内容依次赋值给向量的第一个元素到第八个元素（即lane[0]到lane[7]）。
代码示例

void print_uint8x8_t(uint8x8_t val)
{
    std::printf("lane0=0x%x\n", vget_lane_u8(val, 0));
    std::printf("lane1=0x%x\n", vget_lane_u8(val, 1));
    std::printf("lane2=0x%x\n", vget_lane_u8(val, 2));
    std::printf("lane3=0x%x\n", vget_lane_u8(val, 3));
    std::printf("lane4=0x%x\n", vget_lane_u8(val, 4));
    std::printf("lane5=0x%x\n", vget_lane_u8(val, 5));
    std::printf("lane6=0x%x\n", vget_lane_u8(val, 6));
    std::printf("lane7=0x%x\n", vget_lane_u8(val, 7));
    std::printf("\n");
}

void assign_different_constant()
{
    std::printf("assign_different_constant function..............\n");

    uint8x8_t a_uint8x8 = vcreate_u8(0x12345678abcdef01);
    print_uint8x8_t(a_uint8x8);
}

输出结果为：

assign_different_constant function..............
lane0=0x1
lane1=0xef
lane2=0xcd
lane3=0xab
lane4=0x78
lane5=0x56
lane6=0x34
lane7=0x12

可以看出，参数__a的值从右到左每字节的内容依次赋值给向量的第一个元素到第八个元素。

返回上一级

向量内存赋值

uint8x8_t 向量内存赋值
uint8x8x2_t 向量内存赋值

返回上一级

uint8x8_t 向量内存赋值

函数原型

uint8x8_t vld1_u8 (const uint8_t *a);

作用
- 将内存起始地址为a的后面八字节的内容赋值给类型为uint8x8_t的向量。
注意事项
- 如果参数a的有效元素数量小于8，那么会发生非法读。
代码示例

{
    // 源数据的有效元素数量等于8，合法
    uint8_t f_arr_uint8[] = {0xa1, 0xa2, 0xa3, 0xa4, 0xa5, 0xa6, 0xa7, 0xa8};
    uint8x8_t f_uint8x8 = vld1_u8(f_arr_uint8);
    print_uint8x8_t(f_uint8x8);
}

{
    // 源数据的有效元素数量小于8，最后一个元素为非法读
    uint8_t a_arr_uint8[] = {0xa1, 0xa2, 0xa3, 0xa4, 0xa5, 0xa6, 0xa7, 0xa8};
    uint8x8_t a_uint8x8 = vld1_u8(&a_arr_uint8[1]);
    print_uint8x8_t(a_uint8x8);
}

{
    // 源数据的有效元素数量大于8，合法
    uint8_t b_arr_uint8[] = {0xb0, 0xb1, 0xb2, 0xb3, 0xb4, 0xb5, 0xb6, 0xb7, 
                                0xb8, 0xb9, 0xba, 0xbb, 0xbc, 0xbd, 0xbe, 0xbf};
    uint8x8_t b_uint8x8 = vld1_u8(b_arr_uint8);
    print_uint8x8_t(b_uint8x8);
}

{
    // 源数据的有效元素数量小于8，第五个元素到第八个元素为非法读
    uint8_t c_arr_uint8[] = {0xc1, 0xc2, 0xc3, 0xc4};
    uint8x8_t c_uint8x8 = vld1_u8(c_arr_uint8);
    print_uint8x8_t(c_uint8x8);
}

{
    // 源数据的有效元素数量小于8，除第一个元素外其他元素为非法读
    uint8_t d_arr_uint8 = 0xd1;
    uint8x8_t d_uint8x8 = vld1_u8(&d_arr_uint8);
    print_uint8x8_t(d_uint8x8);
}

注：关于print_uint8x8_t函数的实现可以在其他示例中找到，此处省略。

代码调试

(gdb) x/b &a_arr_uint8[0]+8
0x7ffffff320:	0xff
; 打印 uint8x8_t a_uint8x8 = vld1_u8(&a_arr_uint8[1]); 执行的结果
(gdb) p/x $v0.b.u
$4 = {0xa2, 0xa3, 0xa4, 0xa5, 0xa6, 0xa7, 0xa8, 0xff, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0}
; 可以看出v0.b.u[7]的值为0xff，即内存地址为&a_arr_uint8[0]+8的值。验证了最后一个元素为非法读。

(gdb) x/4b c_arr_uint8+4
0x7ffffff31c:	0xb4	0xb5	0xb6	0xb7
; 打印 uint8x8_t c_uint8x8 = vld1_u8(c_arr_uint8); 执行的结果
(gdb) display/x $v0.b.u
1: /x $v0.b.u = {0xc1, 0xc2, 0xc3, 0xc4, 0xb4, 0xb5, 0xb6, 0xb7, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0}
; 可以看出v0.b.u[4]、v0.b.u[5]、v0.b.u[6]、v0.b.u[7]的值分别为0xb4、 0xb5、 0xb6、 0xb7，
; 即内存起始地址为c_arr_uint8+4后面4字节的值。验证了第五个元素到第八个元素为非法读。

(gdb) x/7b &d_arr_uint8+1
0x7ffffff2c8:	0x19	0xf3	0xff	0xff	0x7f	0x00	0x00
; 打印 uint8x8_t d_uint8x8 = vld1_u8(&d_arr_uint8); 执行的结果
(gdb) display/x $v0.b.u
1: /x $v0.b.u = {0xd1, 0x19, 0xf3, 0xff, 0xff, 0x7f, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0}
2: /x $v0.b.u = {0xd1, 0x19, 0xf3, 0xff, 0xff, 0x7f, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0}
; 可以看出v0.b.u[1]、v0.b.u[2]、v0.b.u[3]、v0.b.u[4]、v0.b.u[5]、v0.b.u[6]、v0.b.u[7]的值
; 分别为0x19、 0xf3、 0xff、 0xff、 0x7f、 0x0、 0x0，即内存起始地址为&d_arr_uint8+1后面7字节的值。
; 验证了除第一个元素外其他元素为非法读。

上述示例验证了：vld1_u8()函数作用是将参数的值作为内存起始地址，无条件地将其后面的八字节的值赋值给向量。但如果源数据的有效元素数量小于8，会发生非法读。

返回上一级

uint8x8x2_t 向量内存赋值

函数原型

uint8x8x2_t vld2_u8 (const uint8_t * __a);

作用
- 内存地址为__a、__a+2、__a+4、... __a+14的内容分别赋值给第一个向量的lane[0]、lane[1]、...、lane[7]，内存地址为__a+1、__a+3、__a+5、... __a+15的内容分别赋值给第二个向量的lane[0]、lane[1]、...、lane[7]。
代码示例

void print_uint8x8_t(uint8x8_t val)
{
    std::printf("lane0=0x%x\n", vget_lane_u8(val, 0));
    std::printf("lane1=0x%x\n", vget_lane_u8(val, 1));
    std::printf("lane2=0x%x\n", vget_lane_u8(val, 2));
    std::printf("lane3=0x%x\n", vget_lane_u8(val, 3));
    std::printf("lane4=0x%x\n", vget_lane_u8(val, 4));
    std::printf("lane5=0x%x\n", vget_lane_u8(val, 5));
    std::printf("lane6=0x%x\n", vget_lane_u8(val, 6));
    std::printf("lane7=0x%x\n", vget_lane_u8(val, 7));
    std::printf("\n");
}

void print_uint8x8x2_t(uint8x8x2_t data)
{
    std::printf("print val[0] ...\n");
    print_uint8x8_t(data.val[0]);
    std::printf("print val[1] ...\n");
    print_uint8x8_t(data.val[1]);
}

void assign_from_mem()
{
    std::printf("assign_from_mem function..............\n");

    uint8_t arr_uint8[] = {0xe1, 0xe2, 0xe3, 0xe4, 0xe5, 0xe6, 0xe7, 0xe8, 
                            0xf1, 0xf2, 0xf3, 0xf4, 0xf5, 0xf6, 0xf7, 0xf8};
    uint8x8x2_t a_uint8x8x2 = vld2_u8(arr_uint8);
    print_uint8x8x2_t(a_uint8x8x2);
}

输出结果为：

assign_from_mem function..............
print val[0] ...
lane0=0xe1
lane1=0xe3
lane2=0xe5
lane3=0xe7
lane4=0xf1
lane5=0xf3
lane6=0xf5
lane7=0xf7

print val[1] ...
lane0=0xe2
lane1=0xe4
lane2=0xe6
lane3=0xe8
lane4=0xf2
lane5=0xf4
lane6=0xf6
lane7=0xf8

返回上一级

向量单个元素内存赋值

uint8x8_t 向量单个元素内存赋值

返回上一级

uint8x8_t 向量单个元素内存赋值

宏定义

#define vld1_lane_u8(a, b, c)

作用
- 设置向量中指定元素的值，而不改变其他元素的值。参数a为指向数据类型为uint8_t的指针；参数b为指向数据类型为uint8x8_t的向量；参数c为向量中元素的索引，合法范围为0 <= c <=7。
代码示例

void print_uint8x8_t(uint8x8_t val)
{
    std::printf("lane0=0x%x\n", vget_lane_u8(val, 0));
    std::printf("lane1=0x%x\n", vget_lane_u8(val, 1));
    std::printf("lane2=0x%x\n", vget_lane_u8(val, 2));
    std::printf("lane3=0x%x\n", vget_lane_u8(val, 3));
    std::printf("lane4=0x%x\n", vget_lane_u8(val, 4));
    std::printf("lane5=0x%x\n", vget_lane_u8(val, 5));
    std::printf("lane6=0x%x\n", vget_lane_u8(val, 6));
    std::printf("lane7=0x%x\n", vget_lane_u8(val, 7));
    std::printf("\n");
}

void assign_lane()
{
    std::printf("assign_lane function..............\n");

    uint8_t a_arr_uint8[] = {0xa1, 0xa2, 0xa3, 0xa4, 0xa5, 0xa6, 0xa7, 0xa8};
    uint8x8_t a_uint8x8;
    
    std::printf("set lane[0] ...\n");
    a_uint8x8 = vld1_lane_u8(a_arr_uint8, a_uint8x8, 0);
    print_uint8x8_t(a_uint8x8);
    
    std::printf("set lane[1] ...\n");
    a_uint8x8 = vld1_lane_u8(a_arr_uint8 + 1, a_uint8x8, 1);
    print_uint8x8_t(a_uint8x8);
    
    std::printf("set lane[2] ...\n");
    a_uint8x8 = vld1_lane_u8(a_arr_uint8 + 2, a_uint8x8, 2);
    print_uint8x8_t(a_uint8x8);
    
    std::printf("set lane[3] ...\n");
    a_uint8x8 = vld1_lane_u8(a_arr_uint8 + 3, a_uint8x8, 3);
    print_uint8x8_t(a_uint8x8);
    
    std::printf("set lane[4] ...\n");
    a_uint8x8 = vld1_lane_u8(a_arr_uint8 + 4, a_uint8x8, 4);
    print_uint8x8_t(a_uint8x8);
    
    std::printf("set lane[5] ...\n");
    a_uint8x8 = vld1_lane_u8(a_arr_uint8 + 5, a_uint8x8, 5);
    print_uint8x8_t(a_uint8x8);
    
    std::printf("set lane[6] ...\n");
    a_uint8x8 = vld1_lane_u8(a_arr_uint8 + 6, a_uint8x8, 6);
    print_uint8x8_t(a_uint8x8);
    
    std::printf("set lane[7] ...\n");
    a_uint8x8 = vld1_lane_u8(a_arr_uint8 + 7, a_uint8x8, 7);
    print_uint8x8_t(a_uint8x8);
}

输出结果为：

assign_lane function..............
set lane[0] ...
lane0=0xa1
lane1=0xed
lane2=0x21
lane3=0xe3
lane4=0x7f
lane5=0x0
lane6=0x0
lane7=0x0

set lane[1] ...
lane0=0xa1
lane1=0xa2
lane2=0x21
lane3=0xe3
lane4=0x7f
lane5=0x0
lane6=0x0
lane7=0x0

set lane[2] ...
lane0=0xa1
lane1=0xa2
lane2=0xa3
lane3=0xe3
lane4=0x7f
lane5=0x0
lane6=0x0
lane7=0x0

set lane[3] ...
lane0=0xa1
lane1=0xa2
lane2=0xa3
lane3=0xa4
lane4=0x7f
lane5=0x0
lane6=0x0
lane7=0x0

set lane[4] ...
lane0=0xa1
lane1=0xa2
lane2=0xa3
lane3=0xa4
lane4=0xa5
lane5=0x0
lane6=0x0
lane7=0x0

set lane[5] ...
lane0=0xa1
lane1=0xa2
lane2=0xa3
lane3=0xa4
lane4=0xa5
lane5=0xa6
lane6=0x0
lane7=0x0

set lane[6] ...
lane0=0xa1
lane1=0xa2
lane2=0xa3
lane3=0xa4
lane4=0xa5
lane5=0xa6
lane6=0xa7
lane7=0x0

set lane[7] ...
lane0=0xa1
lane1=0xa2
lane2=0xa3
lane3=0xa4
lane4=0xa5
lane5=0xa6
lane6=0xa7
lane7=0xa8

返回上一级

访问/存储向量的值

访问 uint8x8_t 的值
存储 uint8x8_t 的值

访问 uint8x8_t 的值

函数原型

uint8_t vget_lane_u8(uint8x8_t __a, const int __b);

作用
- 返回类型为uint8x8_t向量（由参数__a确定）的第n个元素（由参数__b确定）的值。
注意事项
- 参数__b指明访问向量中第几个元素的值，有效范围为0 <= b <= 7。
- 如果参数__b的值不在有效范围，在编译时会报如下错误——error: lane 8 out of range 0 - 7。
- 参数__b的值必须在编译期确定。也就是说，参数__b只能是常数。如果不是，编译时会报如下错误——error: lane index must be a constant immediate。
代码示例

// 声明一个包含八个元素的向量，每个元素的数据类型为 uint8_t
uint8x8_t a_uint8x8;
// 将向量的每个元素赋值为 255
a_uint8x8 = vdup_n_u8(255);

// 分别打印变量 a_uint8x8 的八个元素的值（十六进制）
std::printf("a_uint8x8: lane0=0x%x\n", vget_lane_u8(a_uint8x8, 0));
std::printf("a_uint8x8: lane1=0x%x\n", vget_lane_u8(a_uint8x8, 1));
std::printf("a_uint8x8: lane2=0x%x\n", vget_lane_u8(a_uint8x8, 2));
std::printf("a_uint8x8: lane3=0x%x\n", vget_lane_u8(a_uint8x8, 3));
std::printf("a_uint8x8: lane4=0x%x\n", vget_lane_u8(a_uint8x8, 4));
std::printf("a_uint8x8: lane5=0x%x\n", vget_lane_u8(a_uint8x8, 5));
std::printf("a_uint8x8: lane6=0x%x\n", vget_lane_u8(a_uint8x8, 6));
std::printf("a_uint8x8: lane7=0x%x\n", vget_lane_u8(a_uint8x8, 7));

输出结果为：

a_uint8x8: lane0=0xff
a_uint8x8: lane1=0xff
a_uint8x8: lane2=0xff
a_uint8x8: lane3=0xff
a_uint8x8: lane4=0xff
a_uint8x8: lane5=0xff
a_uint8x8: lane6=0xff
a_uint8x8: lane7=0xff

返回上一级

存储 uint8x8_t 的值

函数原型

void vst1_u8 (uint8_t *a, uint8x8_t b);

作用
- 将类型为uint8x8_t向量（由参数b确定）的值存储到内存起始地址为a后面八字节的内存中。
注意事项
- 参数a所指向的合法内存必须不小于八字节，否则会产生非法写。
代码示例

void store_uint8x8_t(uint8x8_t val_uint8x8)
{
    {
        // 目的数据的元素数量等于8，合法
        uint8_t f_arr_uint8[] = {0x1, 0x2, 0x3, 0x4, 0x5, 0x6, 0x7, 0x8};
        std::printf("f_arr_uint8 ...\n");
        vst1_u8(f_arr_uint8, val_uint8x8);
    }

    {
        // 目的数据的元素数量等于8，但参数不是首元素的地址，最后一个元素为非法写
        uint8_t a_arr_uint8[] = {0xa1, 0xa2, 0xa3, 0xa4, 0xa5, 0xa6, 0xa7, 0xa8};
        std::printf("a_arr_uint8 ...\n");
        vst1_u8(&a_arr_uint8[1], val_uint8x8);
    }

    {
        // 目的数据的元素数量大于8，只写数组b_arr_uint8的前八个元素，合法
        uint8_t b_arr_uint8[] = {0xb0, 0xb1, 0xb2, 0xb3, 0xb4, 0xb5, 0xb6, 0xb7, 
                                    0xb8, 0xb9, 0xba, 0xbb, 0xbc, 0xbd, 0xbe, 0xbf};
        std::printf("b_arr_uint8 ...\n");
        vst1_u8(b_arr_uint8, val_uint8x8);
    }

    {
        // 目的数据的元素数量小于8，最后四个元素为非法写
        uint8_t c_arr_uint8[] = {0xc1, 0xc2, 0xc3, 0xc4};
        std::printf("c_arr_uint8 ...\n");
        vst1_u8(c_arr_uint8, val_uint8x8);
    }

    {
        // 目的数据是标量，最后七个元素为非法写
        uint8_t d_arr_uint8 = 0xd1;
        std::printf("d_arr_uint8 ...\n");
        vst1_u8(&d_arr_uint8, val_uint8x8);
    }
}

注：参数val_uint8x8的值为：{0xf1, 0xf2, 0xf3, 0xf4, 0xf5, 0xf6, 0xf7, 0xf8}，参数val_uint8x8的值为：{0x01, 0x02, 0x03, 0x04, 0x05, 0x06, 0x07, 0x08}。

代码调试

(gdb) p/x &f_arr_uint8[0]
$1 = 0x7ffffff2c8
(gdb) display/9ubx 0x7ffffff2c8
1: x/9xb 0x7ffffff2c8
0x7ffffff2c8:	0x01	0x02	0x03	0x04	0x05	0x06	0x07	0x08
0x7ffffff2d0:	0xf1
(gdb) n
f_arr_uint8 ...
34	        vst1_u8(f_arr_uint8, val_uint8x8);
1: x/9xb 0x7ffffff2c8
0x7ffffff2c8:	0x01	0x02	0x03	0x04	0x05	0x06	0x07	0x08
0x7ffffff2d0:	0xf1
(gdb) n
39	        uint8_t a_arr_uint8[] = {0xa1, 0xa2, 0xa3, 0xa4, 0xa5, 0xa6, 0xa7, 0xa8};
1: x/9xb 0x7ffffff2c8
0x7ffffff2c8:	0xf1	0xf2	0xf3	0xf4	0xf5	0xf6	0xf7	0xf8
0x7ffffff2d0:	0xf1
; 可以看出，“第九个元素”（0x7ffffff2d0处的内容）没有被修改，验证了目的数据的元素数量等于8，合法。


(gdb) n
40	        std::printf("a_arr_uint8 ...\n");
1: x/9xb 0x7ffffff2c8
0x7ffffff2c8:	0xa1	0xa2	0xa3	0xa4	0xa5	0xa6	0xa7	0xa8
0x7ffffff2d0:	0xf1
(gdb) 
a_arr_uint8 ...
41	        vst1_u8(&a_arr_uint8[1], val_uint8x8);
1: x/9xb 0x7ffffff2c8
0x7ffffff2c8:	0xa1	0xa2	0xa3	0xa4	0xa5	0xa6	0xa7	0xa8
0x7ffffff2d0:	0xf1
(gdb) 
47	                                    0xb8, 0xb9, 0xba, 0xbb, 0xbc, 0xbd, 0xbe, 0xbf};
1: x/9xb 0x7ffffff2c8
0x7ffffff2c8:	0xa1	0xf1	0xf2	0xf3	0xf4	0xf5	0xf6	0xf7
0x7ffffff2d0:	0xf8
; 可以看出，“第八个元素”（0x7ffffff2d0处的内容）的值由0xf1变成了0xf8，但这个元素不是有效的，发生了非法写。


(gdb) n
48	        std::printf("b_arr_uint8 ...\n");
1: x/9xb 0x7ffffff2c8
0x7ffffff2c8:	0xb0	0xb1	0xb2	0xb3	0xb4	0xb5	0xb6	0xb7
0x7ffffff2d0:	0xb8
(gdb) 
b_arr_uint8 ...
49	        vst1_u8(b_arr_uint8, val_uint8x8);
1: x/9xb 0x7ffffff2c8
0x7ffffff2c8:	0xb0	0xb1	0xb2	0xb3	0xb4	0xb5	0xb6	0xb7
0x7ffffff2d0:	0xb8
(gdb) 
54	        uint8_t c_arr_uint8[] = {0xc1, 0xc2, 0xc3, 0xc4};
1: x/9xb 0x7ffffff2c8
0x7ffffff2c8:	0xf1	0xf2	0xf3	0xf4	0xf5	0xf6	0xf7	0xf8
0x7ffffff2d0:	0xb8
(gdb) x/16ubx 0x7ffffff2c8
0x7ffffff2c8:	0xf1	0xf2	0xf3	0xf4	0xf5	0xf6	0xf7	0xf8
0x7ffffff2d0:	0xb8	0xb9	0xba	0xbb	0xbc	0xbd	0xbe	0xbf
; 可以看出，只有b_arr_uint8的前八个元素被修改了，合法


(gdb) n
55	        std::printf("c_arr_uint8 ...\n");
1: x/9xb 0x7ffffff2c8
0x7ffffff2c8:	0xc1	0xc2	0xc3	0xc4	0xf5	0xf6	0xf7	0xf8
0x7ffffff2d0:	0xb8
(gdb) 
c_arr_uint8 ...
56	        vst1_u8(c_arr_uint8, val2_uint8x8);
1: x/9xb 0x7ffffff2c8
0x7ffffff2c8:	0xc1	0xc2	0xc3	0xc4	0xf5	0xf6	0xf7	0xf8
0x7ffffff2d0:	0xb8
(gdb) 
61	        uint8_t d_arr_uint8 = 0xd1;
1: x/9xb 0x7ffffff2c8
0x7ffffff2c8:	0x01	0x02	0x03	0x04	0x05	0x06	0x07	0x08
0x7ffffff2d0:	0xb8
; 可以看出，c_arr_uint8[3]后面的四个元素被修改了，但这几个元素不是有效的，发生了非法写。


(gdb) undisplay 
Delete all auto-display expressions? (y or n) y
(gdb) n
61	        uint8_t d_arr_uint8 = 0xd1;
(gdb) 
62	        std::printf("d_arr_uint8 ...\n");
(gdb) p/x &d_arr_uint8
$1 = 0x7ffffff277
(gdb) display/8ubx 0x7ffffff277
1: x/8xb 0x7ffffff277
0x7ffffff277:	0xd1	0xc9	0xf2	0xff	0xff	0x7f	0x00	0x00
(gdb) n
d_arr_uint8 ...
63	        vst1_u8(&d_arr_uint8, val_uint8x8);
1: x/8xb 0x7ffffff277
0x7ffffff277:	0xd1	0xc9	0xf2	0xff	0xff	0x7f	0x00	0x00
(gdb) 
65	}
1: x/8xb 0x7ffffff277
0x7ffffff277:	0xf1	0xf2	0xf3	0xf4	0xf5	0xf6	0xf7	0xf8
; 可以看出，&d_arr_uint8后面的七个元素被修改了，但这几个元素不是有效的，发生了非法写。

返回上一级

向量算术逻辑运算

向量加法运算

向量加法运算

两个 uint8x8_t 相加

返回上一级

两个 uint8x8_t 相加

函数原型

uint8x8_t vadd_u8(uint8x8_t a, uint8x8_t b);

作用
- 将两个类型为uint8x8_t向量的对应位置元素相加，任意对应位置元素相加的结果（可能会进位或溢出）不会影响其他位置相加的结果。
代码示例

uint8x8_t a_uint8x8, b_uint8x8;
a_uint8x8 = vdup_n_u8(0x12);
b_uint8x8 = vdup_n_u8(0x34);

uint8x8_t sum_uint8x8;
sum_uint8x8 = vadd_u8(a_uint8x8, b_uint8x8);

// 分别打印变量 sum_uint8x8 的八个元素的值（十六进制）
std::printf("sum_uint8x8: lane0=0x%x\n", vget_lane_u8(sum_uint8x8, 0));
std::printf("sum_uint8x8: lane1=0x%x\n", vget_lane_u8(sum_uint8x8, 1));
std::printf("sum_uint8x8: lane2=0x%x\n", vget_lane_u8(sum_uint8x8, 2));
std::printf("sum_uint8x8: lane3=0x%x\n", vget_lane_u8(sum_uint8x8, 3));
std::printf("sum_uint8x8: lane4=0x%x\n", vget_lane_u8(sum_uint8x8, 4));
std::printf("sum_uint8x8: lane5=0x%x\n", vget_lane_u8(sum_uint8x8, 5));
std::printf("sum_uint8x8: lane6=0x%x\n", vget_lane_u8(sum_uint8x8, 6));
std::printf("sum_uint8x8: lane7=0x%x\n", vget_lane_u8(sum_uint8x8, 7));

输出结果为：

sum_uint8x8: lane0=0x46
sum_uint8x8: lane1=0x46
sum_uint8x8: lane2=0x46
sum_uint8x8: lane3=0x46
sum_uint8x8: lane4=0x46
sum_uint8x8: lane5=0x46
sum_uint8x8: lane6=0x46
sum_uint8x8: lane7=0x46

返回上一级

如果你觉得本文对你有所帮助，欢迎关注公众号，支持一下！

你可能感兴趣的:(性能优化)

Oracle数据库中JOIN连接查询的高效应用与性能优化教程 caifox菜狐狸 Oracle相关知识笔记 Oracle PL/SQL 编程入门数据库 oracle JOIN LEFT JOIN FULL JOIN INNER JOIN 连接查询
在Oracle数据库的日常使用中，JOIN连接查询是实现多表数据关联查询的核心手段。无论是企业级的数据分析，还是日常的业务报表生成，JOIN操作都扮演着不可或缺的角色。然而，JOIN查询的性能优化一直是数据库开发和运维人员面临的挑战。一个低效的JOIN查询可能会导致查询响应时间过长，甚至拖垮整个数据库系统的性能。因此，掌握JOIN连接查询的高效应用技巧和性能优化方法，对于提升数据库的整体性能和用户
Python（28）Python循环语句指南：从语法糖到CPython字节码的底层探秘一个天蝎座白勺程序猿 Python爬虫入门到高阶实战 python 开发语言
目录引言一、推导式家族全解析1.1基础语法对比1.2性能对比测试二、CPython实现揭秘2.1字节码层面的秘密2.2临时变量机制三、高级特性实现3.1嵌套推导式优化3.2条件表达式处理四、性能优化指南4.1内存使用对比4.2执行时间优化技巧五、最佳实践建议六、总结Python爬虫相关文章（推荐）引言在Python编程中，循环语句是控制流程的核心工具。传统for循环虽然直观，但在处理大数据时往往面
Spring Boot多数据源实现方案深度对比：优缺点分析与实战指南 xiaoyu❅ java #springboot spring boot 后端 java
目录一、为什么需要多数据源？二、5大主流实现方案对比三、方案实现详解方案1：手动配置多DataSource（基础版）方案2：AbstractRoutingDataSource（动态路由）方案3：MyBatis-Plus多数据源（推荐）方案4：JPA多数据源配置方案5：ShardingSphere（企业级方案）四、事务管理解决方案1.分布式事务（XA协议）2.BASE柔性事务五、性能优化策略1.连接
移动开发：WebView的性能优化工具推荐与使用
移动开发：WebView的性能优化工具推荐与使用关键词：WebView、性能优化、移动开发、渲染性能、内存管理、调试工具、缓存策略摘要：本文深入探讨移动开发中WebView的性能优化策略和工具。我们将从WebView的核心原理出发，分析其性能瓶颈，介绍一系列实用的性能优化工具和技术，包括ChromeDevTools、AndroidProfiler、Systrace等。文章还将提供详细的代码示例和优
Android WebView 性能优化指南
AndroidWebView性能优化指南WebView优化需要从多个维度综合考虑：优化维度关键措施预期收益初始化延迟加载、实例复用降低内存峰值渲染硬件加速、合理布局提升流畅度20%+内存独立进程、泄漏防护减少OOM风险网络缓存策略、资源拦截节省流量30%+安全漏洞修复、接口限制提升安全性监控性能埋点、远程调试快速定位问题WebView是Android中用于展示网页内容的组件，但如果不进行优化，可能
国产高兼容性ADC的突破：CYD7606N对比AD7606的核心优势上海宸屿电子电子元器件国产替代
在工业自动化、电力监测等领域的核心数据采集系统中，多通道同步采样ADC始终扮演着关键角色。目前AD7606长期主导这一市场，而上海宸屿电子推出的国产芯片CYD7606N正凭借深度兼容性与性能优化，成为极具竞争力的国产替代方案。其核心价值体现在三大技术突破：硬件与软件全兼容，实现零成本迁移CYD7606N采用与AD7606完全一致的64引脚LQFP封装（10mm×10mm），引脚功能定义实现100%
Vue2中的keep-alive：组件状态缓存与性能优化实战指南编程随想▿ Vue 前端 javascript 开发语言 vue.js
目录一、什么是keep-alive？与普通组件切换的对比二、核心用法详解1.基础用法：动态组件缓存2.路由视图缓存3.生命周期钩子三、进阶配置与优化1.精准控制缓存组件（1）include/exclude属性（2）max属性限制缓存数量四、实战场景与案例1.表单数据保存2.标签页切换优化3.动态控制缓存五、避坑指南1.组件必须定义name属性2.避免过度缓存3.相同路由不同参数导致缓存失效六、性能
React金融数据分析应用性能优化实战：借助AI辅助解决18万数据量栈溢出Bug 马特说 REACT react.js 金融数据分析
React金融数据分析应用性能优化实战：借助AI辅助解决18万数据量栈溢出Bug前言在现代前端开发中，处理大数据量的实时金融应用已成为常态。最近我在开发一个React-based金融数据分析应用时，遇到了典型的"Maximumcallstacksizeexceeded"错误。通过AI辅助分析和系统性优化，最终成功解决了这个复杂的性能问题。这篇文章将分享从问题发现到最终解决的完整过程。项目背景这是一
DeepSeek-V3 私有化部署配置方案（以 vLLM / FastDeploy 为主）
以下是DeepSeek-V3私有化部署配置方案（基于vLLM/FastDeploy），适用于对模型性能、数据隐私、推理效率有要求的企业/个人部署场景。目标：在本地或私有服务器中部署DeepSeek-V3或其MoE结构变体支持高并发推理、高效资源利用提供HTTP接口供前端/插件/Agent调用方案对比方案支持MoE性能优化推荐场景vLLM部分支持高（KVCache/连续批次）高并发API服务Fast
前端开发避坑指南：从浏览器兼容到性能优化，这些 “坑“ 你踩过几个？？？敲代码的苦13 HTML 性能优化 html5 前端 css
一、浏览器兼容性：前端开发者的"跨次元挑战"不同浏览器对HTML、CSS、JavaScript的解析规则存在差异，这是前端开发中最常见的"拦路虎"。CSS样式错乱：例如IE浏览器不支持flex布局的部分属性，或对box-sizing的默认值与Chrome不同，导致页面在不同浏览器中显示效果千差万别。JavaScript语法兼容：旧版浏览器（如IE11）不支持ES6+的箭头函数、Promise等语法
Cursor黑科技：AI编程实战
引言AI编程工具的崛起与Cursor的定位Cursor的核心功能概述（代码生成、补全、对话式调试等）目标读者：开发者、技术团队、AI工具探索者核心功能解析智能代码生成基于自然语言描述生成代码（如“实现一个Python快速排序”）多语言支持（Python、JavaScript、Go等）示例对比代码补全与优化实时上下文感知补全（比传统IDE更精准）代码重构建议（如性能优化、冗余删除）对话式交互调试通过
Flutter开发者 3.29版本关注要点 2501_91395209 http udp https websocket 网络安全网络协议 tcp/ip
哈喽，我是老刘Flutter3.29已经发布有一段时间了，老刘写Flutter代码已经6年多，对这种例行的Flutter版本更新基本上已经是内心毫无波澜。不过最近有不少朋友问要不要更新到最新版，这里罗列一下从开发者角度看比较重要的更新，大家自己判断。一、架构与性能优化Dart代码执行线程调整Dart代码现直接在Android/iOS的主线程运行，减少了线程切换开销，但需注意可能加剧平台UI线程的负
使用reactor-rabbitmq库监听Rabbitmq 后会无期77 message queue Java日记 rabbitmq ruby 分布式
文章目录ReactorRabbitMQ简介ReactorRabbitMQ核心特性使用方法添加依赖创建连接发送消息接收消息高级配置消息确认模式错误处理集群监听（自动ACK）集群监听手动ACK性能优化建议适用场景ReactorRabbitMQ简介ReactorRabbitMQ是Reactor项目的一部分，旨在提供基于ProjectReactor的RabbitMQ响应式编程支持。它将RabbitMQ的消
鸿蒙开发进阶（HarmonyOS）相机拍照功能(ArkTS)
鸿蒙NEXT开发实战往期必看文章：一分钟了解”纯血版！鸿蒙HarmonyOSNext应用开发！“非常详细的”鸿蒙HarmonyOSNext应用开发学习路线！（从零基础入门到精通）HarmonyOSNEXT应用开发案例实践总结合（持续更新......）HarmonyOSNEXT应用开发性能优化实践总结（持续更新......）拍照是相机的最重要功能之一，拍照模块基于相机复杂的逻辑，为了保证用户拍出的照
鸿蒙开发进阶（HarmonyOS ）应用账号密码更新保存凹~凸~曼鸿蒙开发 HarmonyOS OpenHarmony harmonyos 华为前端 android 鸿蒙系统 ui 移动开发
鸿蒙NEXT开发实战往期必看文章：一分钟了解”纯血版！鸿蒙HarmonyOSNext应用开发！“非常详细的”鸿蒙HarmonyOSNext应用开发学习路线！（从零基础入门到精通）HarmonyOSNEXT应用开发案例实践总结合（持续更新......）HarmonyOSNEXT应用开发性能优化实践总结（持续更新......）密码保险箱在应用的登录、注册、修改密码等场景具备自动保存用户名和密码的能力。
二维码在视频内容分发中的技术实现与优化策略菜包eo 酷播云视频安全 polyv 音视频网络人工智能
引言：视频传播的技术挑战与二维码解决方案在数字化内容爆炸的时代，视频作为信息传递效率最高的媒介形式，其分发方式一直面临着格式兼容性、存储成本和用户体验的多重挑战。传统视频分享依赖于平台审核和链接传播，不仅受限于第三方规则，还存在加载缓慢、操作复杂等问题。二维码技术作为连接物理世界与数字内容的桥梁，为视频分发提供了全新的技术路径。本文将深入探讨二维码与视频技术的融合应用，从编码原理、性能优化到安全策
Java对象哈希值深度解析小W求学之旅 java 哈希算法 spring
在Java开发中，对象的哈希值（hashCode()）是一个看似基础却暗藏玄机的概念。它不仅影响着HashMap、HashSet等集合框架的性能，还涉及到JVM内存模型和对象相等性判断的核心逻辑。本文将从JVM底层实现、哈希冲突处理、性能优化等多个维度，一起深入理解Java对象哈希值的工作原理。一、JVM如何生成默认哈希值？Java中所有类都继承自Object类，其hashCode()方法是一个本
深入理解Java锁原理（一）：偏向锁的设计原理与性能优化小W求学之旅锁 java 偏向锁 spring
如果大家对偏向锁有一定了解，可以直接往后看：深入理解Java锁原理（二）：轻量级锁的设计原理到实战优化一、引言在Java多线程编程中，锁是实现线程安全的重要工具。然而，传统的锁机制（如重量级锁）存在较大的性能开销，尤其是在无竞争的场景下。为了优化这种情况，Java6引入了偏向锁（BiasedLocking），它通过预测锁的使用模式，将无竞争场景下的锁获取和释放成本降为零。本文将深入探讨偏向锁的设计
MySQL Buffer Pool 深度解析：从架构设计到性能优化（附详细结构图解）小W求学之旅 mysql 性能优化数据库 spring java BufferPool
在MySQL数据库的世界里，有一个决定性能上限的"神秘仓库"——BufferPool。它就像超市的货架，把最常用的商品（数据）放在最方便拿取的地方，避免每次都要去仓库（磁盘）取货。今天我们就来深入了解BufferPool内部结构，以及它如何在高并发场景下高效工作。一、BufferPool：数据库的"高速缓存"1.1为什么需要BufferPool？想象一下：磁盘读写速度约为100次/秒，而内存读写速
FPGA原型验证方法学：提升芯片设计验证效率的利器窦莎言Firm
FPGA原型验证方法学：提升芯片设计验证效率的利器去发现同类优质开源项目:https://gitcode.com/项目介绍在芯片设计领域，验证阶段是确保设计功能正确性和性能优化的关键环节。传统的验证方法虽然有效，但在复杂性和效率上存在一定的局限性。为了解决这一问题，FPGA原型验证方法学应运而生。本项目提供了一个名为“FPGA原型验证方法学”的资源文件，旨在帮助芯片设计工程师、验证工程师以及其他相
快速创建Chrome浏览器二维码生成插件的完全指南不爱说话的我
本文还有配套的精品资源，点击获取简介：Chrome简易二维码插件是一个JavaScript开发的浏览器扩展，用于快速生成链接或文本内容的二维码，方便用户扫描分享。该插件简化了二维码生成过程，提升用户体验。开发此插件需要掌握浏览器扩展开发、事件监听、二维码库使用、DOM操作、错误处理等关键技术点。开发者还应考虑性能优化、设备适配及无障碍设计原则。本插件的实际案例能够帮助开发者提高Web开发技能，并为
MyISAM和InnoDB的区别分析咖啡啡不加糖 java mysql 数据库
对于每一位Java开发者而言，MySQL无疑是我们最亲密的伙伴之一。而在使用MySQL时，我们常常会遇到一个经典问题：存储引擎该如何选择？其中，MyISAM和InnoDB作为两大最主流的存储引擎，它们之间的区别与联系，关乎数据库设计与性能优化的关键所在。1.核心区别概览在深入细节之前，我们先通过一个表格，宏观地了解MyISAM与InnoDB的核心区别。特性MyISAMInnoDB事务支持不支持支持
Vue3响应式卡顿？3招性能优化技巧让页面提速200%（附源码对比）程序猿全栈の董（董翔）性能优化 vue.js 前端
一、引言Vue3发布以来，其响应式系统凭借Proxy的强大能力，为开发者带来了更高效的数据绑定体验。然而，在处理复杂数据结构或大量数据时，许多开发者发现Vue3的响应式性能不如预期，甚至出现页面卡顿的情况。根据我们团队对多个大型项目的性能分析，在某些极端场景下，Vue3的响应式更新可能比直接操作DOM慢2-3倍。这种性能差距在数据量超过1000条记录时尤为明显。本文将深入分析Vue3响应式系统的性
Spring Boot + 本地部署大模型实现：优化与性能提升代码老y spring boot 后端 java
在将大语言模型集成到SpringBoot应用中时，性能优化是一个关键环节。本地部署的大模型虽然提供了强大的功能，但也可能带来一些性能挑战，如响应时间较长、资源占用较高等问题。本文将介绍如何在SpringBoot应用中优化本地部署大模型的性能，确保应用的高效运行。一、性能优化策略（一）缓存机制缓存生成结果：对于一些常见的输入，可以将生成的结果缓存起来。当相同的输入再次出现时，直接返回缓存的结果，而不
Java在AI与量子计算时代的新突破：2025年技术前瞻与实践指南〃冷·夏ぐ java 人工智能量子计算
在2025年的技术浪潮中，Java作为一门历经近30年发展的编程语言，不仅没有显出疲态，反而在AI、量子计算、云原生等前沿领域展现出惊人的适应力和创新力。本文将深入探讨Java在2025年的最新技术趋势，包括Java24的重大更新、AI与量子计算支持、性能优化策略以及现代Java开发的最佳实践，帮助开发者掌握这些变革性技术，提升技术竞争力。Java24重磅发布：AI与量子计算时代的语言革新2025
Fiddler中文版抓包工具如何帮助前端开发者高效调试 HTTPwise http udp https websocket 网络安全网络协议 tcp/ip
前端开发早已不再是“写好页面就完事”的工作。随着业务复杂度提升，前端开发者需要直面接口联调、性能优化、跨域排查、HTTPS调试等一系列和网络请求紧密相关的任务。抓包工具成为这些环节中不可替代的得力助手，而Fiddler抓包工具因其全面的功能和灵活的配置能力，被无数开发者选作日常调试首选。然而，Fiddler并不是万能工具，只有与Postman、Charles等常用工具协同使用，才能让调试效率最大化
AI编程基础：学习Python是进入AI领域的必经之路（文末含学习路线与知识推荐） Clf丶忆笙 AI 人工智能开发全栈教程学习 python 人工智能 ai
文章目录Python市场行情：AI开发的首选语言为什么学习Python对AI至关重要AI开发所需的Python知识体系Python编程基础科学计算与数据处理机器学习与深度学习性能优化与并行计算Python学习路线推荐阶段一：Python编程基础（1-2个月）阶段二：科学计算与数据处理（1-2个月）阶段三：机器学习基础（2-3个月）阶段四：深度学习与AI专项（3-6个月）阶段五：进阶与专项深化（持续
UniApp 中实现智能吸顶 Tab 标签导航效果儿歌八万首 uniapp uni-app javascript 前端
前言在移动端应用开发中，Tab标签导航是一种常见的交互模式。本文将详细介绍如何在UniApp中实现一个功能完善的智能吸顶Tab导航组件，该组件具有以下特性：智能显示：根据滚动位置动态显示/隐藏吸顶效果：Tab栏固定在顶部，不随页面滚动自动切换：根据滚动位置自动高亮对应Tab平滑滚动：点击Tab平滑滚动到对应内容区域⚡性能优化：节流防抖，确保流畅体验效果预览当用户向下滚动超过200px时，Tab导航
Webpack 5 核心机制详解与打包性能优化实践
作者简介：水煮白菜王，一个web开发工程师文章专栏：前端专栏，记录一下平时在博客写作中，总结出的一些开发技巧和知识归纳总结✍。感谢支持目录Webpack5相较于Webpack4的主要改进安装生命周期CompilerHooksusehookswebpack中的loader（转换器）工作原理常用loader自定义loaderwebpack中的plugins（插件）工作原理自定义plugins打包过程加
Web Workers在前端性能优化中的深度实践：从多线程编程到任务调度策略瑕疵热点资讯前端性能优化
博客主页：瑕疵的CSDN主页Gitee主页：瑕疵的gitee主页⏩文章专栏：《热点资讯》WebWorkers在前端性能优化中的深度实践：从多线程编程到任务调度策略WebWorkers在前端性能优化中的深度实践：从多线程编程到任务调度策略WebWorkers在前端性能优化中的深度实践：从多线程编程到任务调度策略引言一、WebWorkers基础与工作原理1.1WebWorkers的核心特性1.2Web
关于旗正规则引擎下载页面需要弹窗保存到本地目录的问题何必如此 jsp 超链接文件下载窗口
生成下载页面是需要选择“录入提交页面”，生成之后默认的下载页面<a>标签超链接为：<a href="<%=root_stimage%>stimage/image.jsp?filename=<%=strfile234%>&attachname=<%=java.net.URLEncoder.encode(file234filesourc
【Spark九十八】Standalone Cluster Mode下的资源调度源代码分析 bit1129 cluster
在分析源代码之前，首先对Standalone Cluster Mode的资源调度有一个基本的认识：首先，运行一个Application需要Driver进程和一组Executor进程。在Standalone Cluster Mode下，Driver和Executor都是在Master的监护下给Worker发消息创建(Driver进程和Executor进程都需要分配内存和CPU，这就需要Maste
linux上独立安装部署spark daizj linux 安装 spark 1.4 部署
下面讲一下linux上安装spark，以 Standalone Mode 安装 1）首先安装JDK 下载JDK：jdk-7u79-linux-x64.tar.gz ，版本是1.7以上都行，解压 tar -zxvf jdk-7u79-linux-x64.tar.gz 然后配置 ~/.bashrc&nb
Java 字节码之解析一周凡杨 java 字节码 javap
一： Java 字节代码的组织形式类文件 { OxCAFEBABE ，小版本号，大版本号，常量池大小，常量池数组，访问控制标记，当前类信息，父类信息，实现的接口个数，实现的接口信息数组，域个数，域信息数组，方法个数，方法信息数组，属性个数，属性信息数组 } &nbs
java各种小工具代码 g21121 java
1.数组转换成List import java.util.Arrays; Arrays.asList(Object[] obj); 2.判断一个String型是否有值 import org.springframework.util.StringUtils; if (StringUtils.hasText(str)) 3.判断一个List是否有值 import org.spring
加快FineReport报表设计的几个心得体会老A不折腾 finereport
一、从远程服务器大批量取数进行表样设计时，最好按“列顺序”取一个“空的SQL语句”，这样可提高设计速度。否则每次设计时模板均要从远程读取数据，速度相当慢！！二、找一个富文本编辑软件（如NOTEPAD+）编辑SQL语句，这样会很好地检查语法。有时候带参数较多检查语法复杂时，结合FineReport中生成的日志，再找一个第三方数据库访问软件（如PL/SQL）进行数据检索，可以很快定位语法错误。
mysql linux启动与停止墙头上一根草
如何启动/停止/重启MySQL一、启动方式1、使用 service 启动：service mysqld start2、使用 mysqld 脚本启动：/etc/inint.d/mysqld start3、使用 safe_mysqld 启动：safe_mysqld&二、停止1、使用 service 启动：service mysqld stop2、使用 mysqld 脚本启动：/etc/inin
Spring中事务管理浅谈 aijuans spring 事务管理
Spring中事务管理浅谈 By Tony Jiang@2012-1-20 Spring中对事务的声明式管理拿一个XML举例 [html] view plain copy print ? <?xml version="1.0" encoding="UTF-8"?>&nb
php中隐形字符65279（utf-8的BOM头）问题 alxw4616
php中隐形字符65279（utf-8的BOM头）问题今天遇到一个问题. php输出JSON 前端在解析时发生问题:parsererror. 调试: 1.仔细对比字符串发现字符串拼写正确.怀疑是非打印字符的问题. 2.逐一将字符串还原为unicode编码. 发现在字符串头的位置出现了一个 65279的非打印字符.
调用对象是否需要传递对象(初学者一定要注意这个问题) 百合不是茶对象的传递与调用技巧
类和对象的简单的复习,在做项目的过程中有时候不知道怎样来调用类创建的对象,简单的几个类可以看清楚,一般在项目中创建十几个类往往就不知道怎么来看为了以后能够看清楚,现在来回顾一下类和对象的创建,对象的调用和传递(前面写过一篇) 类和对象的基础概念: JAVA中万事万物都是类类有字段(属性),方法,嵌套类和嵌套接
JDK1.5 AtomicLong实例 bijian1013 java thread java多线程 AtomicLong
JDK1.5 AtomicLong实例类 AtomicLong 可以用原子方式更新的 long 值。有关原子变量属性的描述，请参阅 java.util.concurrent.atomic 包规范。AtomicLong 可用在应用程序中（如以原子方式增加的序列号），并且不能用于替换 Long。但是，此类确实扩展了 Number，允许那些处理基于数字类的工具和实用工具进行统一访问。
自定义的RPC的Java实现 bijian1013 java rpc
网上看到纯java实现的RPC，很不错。 RPC的全名Remote Process Call，即远程过程调用。使用RPC，可以像使用本地的程序一样使用远程服务器上的程序。下面是一个简单的RPC 调用实例，从中可以看到RPC如何
【RPC框架Hessian一】Hessian RPC Hello World bit1129 Hello world
什么是Hessian The Hessian binary web service protocol makes web services usable without requiring a large framework, and without learning yet another alphabet soup of protocols. Because it is a binary p
【Spark九十五】Spark Shell操作Spark SQL bit1129 shell
在Spark Shell上，通过创建HiveContext可以直接进行Hive操作 1. 操作Hive中已存在的表 [hadoop@hadoop bin]$ ./spark-shell Spark assembly has been built with Hive, including Datanucleus jars on classpath Welcom
F5　往header加入客户端的ip ronin47
when HTTP_RESPONSE {if {[HTTP::is_redirect]}{ HTTP::header replace Location [string map {:port/ /} [HTTP::header value Location]]HTTP::header replace Lo
java-61-在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差. 求所有数对之差的最大值。例如在数组{2, 4, 1, 16, 7, 5, bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/2541117420116135376632/ 写了个java版的 public class GreatestLeftRightDiff { /** * Q61.在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差。 * 求所有数对之差的最大值。例如在数组
mongoDB 索引开窍的石头 mongoDB索引
在这一节中我们讲讲在mongo中如何创建索引得到当前查询的索引信息 db.user.find(_id:12).explain(); cursor: basicCoursor 指的是没有索引 &
[硬件和系统]迎峰度夏 comsci 系统
从这几天的气温来看，今年夏天的高温天气可能会维持在一个比较长的时间内所以，从现在开始准备渡过炎热的夏天。。。。每间房屋要有一个落地电风扇，一个空调(空调的功率和房间的面积有密切的关系) 坐的，躺的地方要有凉垫，床上要有凉席电脑的机箱
基于ThinkPHP开发的公司官网 cuiyadll 行业系统
后端基于ThinkPHP，前端基于jQuery和BootstrapCo.MZ 企业系统轻量级企业网站管理系统运行环境:PHP5.3+, MySQL5.0 系统预览系统下载：http://www.tecmz.com 预览地址：http://co.tecmz.com 各种设备自适应响应式的网站设计能够对用户产生友好度，并且对于
Transaction and redelivery in JMS (JMS的事务和失败消息重发机制) darrenzhu jms 事务承认 MQ acknowledge
JMS Message Delivery Reliability and Acknowledgement Patterns http://wso2.com/library/articles/2013/01/jms-message-delivery-reliability-acknowledgement-patterns/ Transaction and redelivery in
Centos添加硬盘完全教程 dcj3sjt126com linux centos hardware
Linux的硬盘识别: sda 表示第1块SCSI硬盘 hda 表示第1块IDE硬盘 scd0 表示第1个USB光驱一般使用“fdisk -l”命
yii2 restful web服务路由 dcj3sjt126com PHP yii2
路由随着资源和控制器类准备，您可以使用URL如 http://localhost/index.php?r=user/create访问资源，类似于你可以用正常的Web应用程序做法。在实践中，你通常要用美观的URL并采取有优势的HTTP动词。例如，请求POST /users意味着访问user/create动作。这可以很容易地通过配置urlManager应用程序组件来完成如下所示
MongoDB查询(4)——游标和分页[八] eksliang mongodb MongoDB游标 MongoDB深分页
转载请出自出处：http://eksliang.iteye.com/blog/2177567 一、游标数据库使用游标返回find的执行结果。客户端对游标的实现通常能够对最终结果进行有效控制，从shell中定义一个游标非常简单，就是将查询结果分配给一个变量（用var声明的变量就是局部变量），便创建了一个游标，如下所示： > var
Activity的四种启动模式和onNewIntent() gundumw100 android
Android中Activity启动模式详解　　在Android中每个界面都是一个Activity，切换界面操作其实是多个不同Activity之间的实例化操作。在Android中Activity的启动模式决定了Activity的启动运行方式。　　Android总Activity的启动模式分为四种： Activity启动模式设置： <acti
攻城狮送女友的CSS3生日蛋糕 ini html Web html5 css css3
在线预览：http://keleyi.com/keleyi/phtml/html5/29.htm 代码如下： <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>攻城狮送女友的CSS3生日蛋糕-柯乐义<
读源码学Servlet（1）GenericServlet 源码分析 jzinfo tomcat Web servlet 网络应用网络协议
Servlet API的核心就是javax.servlet.Servlet接口，所有的Servlet 类（抽象的或者自己写的）都必须实现这个接口。在Servlet接口中定义了5个方法，其中有3个方法是由Servlet 容器在Servlet的生命周期的不同阶段来调用的特定方法。先看javax.servlet.servlet接口源码： package
JAVA进阶：VO(DTO)与PO(DAO)之间的转换 snoopy7713 java VO Hibernate po
PO即 Persistence Object　　VO即 Value Object 　VO和PO的主要区别在于：　　VO是独立的Java Object。　　PO是由Hibernate纳入其实体容器（Entity Map）的对象，它代表了与数据库中某条记录对应的Hibernate实体，PO的变化在事务提交时将反应到实际数据库中。　实际上，这个VO被用作Data Transfer
mongodb group by date 聚合查询日期统计每天数据（信息量） qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 1 */ { "_id" : ObjectId("557ac1e2153c43c320393d9d"), "msgType" : "text", "sendTime" : ISODate("2015-06-12T11:26:26.000Z")
java之18天常用的类(一) Luob. Math Date System Runtime Rundom
System类 import java.util.Properties; /** * System: * out:标准输出,默认是控制台 * in:标准输入,默认是键盘 * * 描述系统的一些信息 * 获取系统的属性信息:Properties getProperties(); * * * */ public class Sy
maven wuai maven
1、安装maven：解压缩、添加M2_HOME、添加环境变量path 2、创建maven_home文件夹，创建项目mvn_ch01,在其下面建立src、pom.xml，在src下面简历main、test、main下面建立java文件夹 3、编写类，在java文件夹下面依照类的包逐层创建文件夹，将此类放入最后一级文件夹 4、进入mvn_ch01 4.1、mvn compile ,执行后会在

性能优化篇（3）：NEON快速入门指南

​性能优化篇（3）：NEON快速入门指南

向量数据类型

向量赋值

向量常数赋值

uint8x8_t 向量常数赋值（每个元素的值都相同）

uint8x8_t 向量常数赋值（每个元素的值可以不同）

向量内存赋值

uint8x8_t 向量内存赋值

uint8x8x2_t 向量内存赋值

向量单个元素内存赋值

uint8x8_t 向量单个元素内存赋值

访问/存储向量的值

访问 uint8x8_t 的值

存储 uint8x8_t 的值

向量算术逻辑运算

向量加法运算

两个 uint8x8_t 相加

你可能感兴趣的:(性能优化)

性能优化篇（3）：NEON快速入门指南