猪崽滚滚

arm汇编解析——qnnpack卷积实现

前言

基础直通车

arm基础知识

arm指令释义

qnn汇编代码解析

前言

最近在移植QNNPACK神经网络加速库，涉及到对卷积arm汇编的修改，这边做个记录，对汇编部分的内容进行注释，顺便学习一下汇编的语法。

基础直通车

首先要补充arm汇编基础知识，特别是如何传参一定要搞清楚，另外对arm寄存器要了然于胸，剩下的就是指令的用法了：

利用堆栈入参参考：https://www.cnblogs.com/qq78292959/p/4013356.html

arm 32位NEON寄存器：https://blog.csdn.net/SoaringLee_fighting/article/details/81743505

ARM汇编器对ARM的寄存器预定义：https://blog.csdn.net/SoaringLee_fighting/article/details/81287824

ARM汇编指令：https://blog.csdn.net/zhangmiaoping23/article/details/8875193

arm基础知识

R0-R15和r0-r15
a1-a4(参数,结果或者临时寄存器,与r0-r3同意)
v1-v8(变量寄存器,与r4-r11同意)
sb和SB(静态基址寄存器,与r9同意)
sl和SL(堆栈限制寄存器,与r10同意)
fp和FP(帧指针,与r11同意)
ip和IP(过程调用中间临时寄存器,与r12同意)
sp和SP(堆栈指针,与r13同意)
lr和LR(连接寄存器,与r14同意)
pc和PC(程序计数器,与r15同意)
cpsr和CPSR(程序状态寄存器)
spsr和SPSR(程序状态寄存器)
f0-f7和F0-F7(FPA寄存器)
s0-s31和S0-S31(VFP单精度寄存器)
d0-d15和D0-D15(VFP双精度寄存器)
p0-p15(协处理器0-15)
c0-c15(协处理器寄存器0-15)
使用说明：
1、当参数少于4个时，子程序间通过寄存器R0~R3来传递参数；当参数个数多于4个时，将多余的参数通过数据栈进行传递，入栈顺序与参数顺序正好相反，子程序返回前无需恢复R0~R3的值；
2、在子程序中，使用R4~R11保存局部变量，若使用需要入栈保存，子程序返回前需要恢复这些寄存器；R12是临时寄存器，使用不需要保存。
3、R13用作数据帧指针，记作SP；R14用作链接寄存器，记作LR，用于保存子程序返回时的地址；R15是程序计数器，记作PC。
4、ATPCS规定堆栈是满递减堆栈FD；
5、子程序返回32位的整数，使用R0返回；返回64位整数时，使用R0返回低位，R1返回高位。

Arm32位寄存器主要分为ARM寄存器和NEON寄存器。
ARM32寄存器包括15个通用寄存器R0~R14和一个程序计数器PC，共16个，均为32位宽。
ARM32位寄存器的调用规则：遵循ATPCS调用规则

32位 NEON寄存器：
包括：32个S寄存器，S0~S31,（单字，32bit）
32个D寄存器，D0~D31，（双字，64bit）
16个Q寄存器，Q0~Q15，（四字，128bit）
寄存器的对应关系如下图所示：

使用说明：
1、NEON寄存器将每个寄存器均视为一个向量，该向量又包含1，2，4，8或16个大小和类型均相同的元素。也可以将各个元素当做标量访问。
NEON的这三种寄存器是重叠的，物理地址是一样的。
2、NEON寄存器在使用时，如果用到d8~d15寄存器，需要先入栈保存vpush {d8-d15}，使用完之后要出栈vpop {d8-d15}

arm指令释义

条件分支：

CMP：算数处理指令，用于把一个寄存器的内容和另一个寄存器的内容或立即数进行减法比较，不存储结果，都会更改标志位

BNE: 数据跳转指令，标志寄存器中Z标志位不等于零时, 跳转到BNE后标签处

BNE 3f 0b f：forward，b：backward

BEQ: 数据跳转指令，标志寄存器中Z标志位等于零时, 跳转到BEQ后标签处

BLO指令小于（无符号数）跳转

数据加载及存储：

ldr ip,[sp],#4 将sp中内容存入ip,之后sp=sp+4;

ldr ip,[sp,#4] 将sp+4这个新地址下内容存入ip,之后sp值保持不变

ldr ip,[sp,#4]!将sp+4这个新地址下内容存入ip,之后sp=sp+4将新地址值赋给sp

str ip,[sp],#4 将ip存入sp地址处,之后sp=sp+4;

str ip,[sp,#4] 将ip存入sp+4这个新地址,之后sp值保持不变

str ip,[sp,#4]!将ip存入sp+4这个新地址,之后sp=sp+4将新地址值赋给sp

qnn汇编代码解析

先对BEGIN_FUNCTION定义说明:

#ifdef __ELF__ //linux系统编译宏

.macro BEGIN_FUNCTION name

.text

.align 2

.global \name

.type \name, %function

\name:

.endm

.macro END_FUNCTION name

.size \name, .-\name

.endm

#elif defined(__MACH__) //ios/machos系统编译宏

.macro BEGIN_FUNCTION name

.text

.align 2

.global _\name

.private_extern _\name

_\name:

.endm

.macro END_FUNCTION name

.endm

#endif

卷积汇编代码：
/*
* Copyright (c) Facebook, Inc. and its affiliates.
* All rights reserved.
*
* This source code is licensed under the BSD-style license found in the
* LICENSE file in the root directory of this source tree.

.include "assembly.h"

.syntax unified

# void q8conv_ukernel_4x8__aarch32_neon(
# size_t mr,
# size_t nr,
# size_t kc,
# size_t ks,
# const uint8_t**restrict a, ###### r8 [sp, 96] ,3
# const void*restrict w, ###### ip [sp, 4] ,1
# uint8_t*restrict c, -> int32_t*restrict c, ###### r2, r3, [sp, 104] ,4
# size_t c_stride,
# const union qnnp_conv_quantization_params quantization_params[restrict static 1]) ###### r9 [sp, 112] ,2

#关于参数说明:从a开始的参数因为超过了4个，采用堆栈方式传参，从最后一个参数params入栈，入栈方式为满减栈（从上往下递减）

BEGIN_FUNCTION q8conv_ukernel_4x8__aarch32_neon
   .arm
#ifndef __APPLE__
   .arch armv7-a
   .fpu neon
#endif
   # Load w
   # - ip = w

   # ip==r12:temp register; sp==r13:top stack;
   # ip=sp+4=w,the 4 is size of ptr a（地址偏移都以字节为单位）
   LDR ip, [sp, 4]
   PUSH {r4, r5, r6, r7, r8, r9, r10, r11} #压入栈中保存r4-r11的值。r4-r11用作局部变量

VPUSH {d8-d15} #压栈保存

   # Load bias0123, bias4567
   VLDM ip!, {d16-d19}    # load bias:8xint32 = 4x64(d16-d19)
   # Load params:
   # - r9 = params
   LDR r9, [sp, 112] #sizeof(r4-r11) + sizeof(d8-d15) +sizeof(a+w+c+c_stride)=32/8*8+64/8*8+4*4=112

   # q10 := vacc1x0123
   VMOV.I32 q10, q8 # mov 32x4 bias t0 q10(sizeof(q8)==128 bits)
   MOV r4, 4
   # q11 := vacc1x4567
   VMOV.I32 q11, q9 # 将q9中的4个32赋值为q11
   # Load a
   # - r8 = a
   LDR r8, [sp, 96]  #sizeof(r4-r11) + sizeof(d8-d15) = 32/8*8 + 64/8*8=96
   # q12 := vacc2x0123
   VMOV.I32 q12, q8
   # q13 := vacc2x4567
   VMOV.I32 q13, q9
   # q14 := vacc3x0123
   VMOV.I32 q14, q8
   # Load b_zero_point:
   # - d15 = b_zero_point
   VLD1.8 {d15[]}, [r9], r4   # mov the value from r9 to all d15(per 8bit); r9=r9+r4(per 8bit)
   # q15 := vacc3x4567
   VMOV.I32 q15, q9
   # Load multiplier:
   # - d12 = vmultiplier
   VLD1.32 {d12[]}, [r9]!

.p2align 5
0:
SUBS r10, r2, 8

   # Load a0, a1, a2, a3
   # - r4 = a0
   # - r5 = a1
   # - r6 = a2
   # - r7 = a3
   LDM r8!, {r4-r7}

BLO 2f

1:
   # Load va0
   # - d1 = va0
   VLD1.8 {d1}, [r4]!

   # Load va1
   # - d3 = va1
   VLD1.8 {d3}, [r5]!

   # Load vb0-vb7 (channel 0)
   # - d9 = vb0-vb7
   VLD1.8 {d9}, [ip:64]!

   # Load va2
   # - d5 = va2
   VLD1.8 {d5}, [r6]!

# q0 = va0 = a0
VMOVL.U8 q0, d1

   # Load va3
   # - d7 = va3
   VLD1.8 {d7}, [r7]!

# q1 = va1 = a1
VMOVL.U8 q1, d3

   # q4 = b0:7 - vb_zero_point
   # - d8 = vb0123 (channel 0)
   # - d9 = vb4567 (channel 0)
   VSUBL.U8 q4, d9, d15

   # q2 = va2 = a2
   VMOVL.U8 q2, d5
   # q3 = va3 = a3
   VMOVL.U8 q3, d7

### Channel 0 ###

   # Load b0-b7 (channel 1)
   # - d11 = b0-b7
   VLD1.8 {d11}, [ip:64]!

   # vacc0x0123 += vb0123 * va0[0]
   VMLAL.S16 q8, d8, d0[0]
   # vacc0x4567 += vb4567 * va0[0]
   VMLAL.S16 q9, d9, d0[0]

   # vacc1x0123 += vb0123 * va1[0]
   VMLAL.S16 q10, d8, d2[0]
   # vacc1x4567 += vb4567 * va1[0]
   VMLAL.S16 q11, d9, d2[0]

   # vacc2x0123 += vb0123 * va2[0]
   VMLAL.S16 q12, d8, d4[0]
   # vacc2x4567 += vb4567 * va2[0]
   VMLAL.S16 q13, d9, d4[0]

   # q5 = b0:7 - vb_zero_point
   # - d10 = vb0123 (channel 1)
   # - d11 = vb4567 (channel 1)
   VSUBL.U8 q5, d11, d15

   # vacc3x0123 += vb0123 * va3[0]
   VMLAL.S16 q14, d8, d6[0]
   # vacc3x4567 += vb4567 * va3[0]
   VMLAL.S16 q15, d9, d6[0]

### Channel 1 ###

   # Load b0-b7 (channel 2)
   # - d9 = b0-b7
   VLD1.8 {d9}, [ip:64]!

   # vacc0x0123 += vb0123 * va0[1]
   VMLAL.S16 q8, d10, d0[1]
   # vacc0x4567 += vb4567 * va0[1]
   VMLAL.S16 q9, d11, d0[1]

   # vacc1x0123 += vb0123 * va1[1]
   VMLAL.S16 q10, d10, d2[1]
   # vacc1x4567 += vb4567 * va1[1]
   VMLAL.S16 q11, d11, d2[1]

   # vacc2x0123 += vb0123 * va2[1]
   VMLAL.S16 q12, d10, d4[1]
   # vacc2x4567 += vb4567 * va2[1]
   VMLAL.S16 q13, d11, d4[1]

   # q4 = b0:7 - vb_zero_point
   # - d8 = vb0123 (channel 2)
   # - d9 = vb4567 (channel 2)
   VSUBL.U8 q4, d9, d15

   # vacc3x0123 += vb0123 * va3[1]
   VMLAL.S16 q14, d10, d6[1]
   # vacc3x4567 += vb4567 * va3[1]
   VMLAL.S16 q15, d11, d6[1]

### Channel 2 ###

   # Load b0-b7 (channel 3)
   # - d11 = b0-b7
   VLD1.8 {d11}, [ip:64]!

   # vacc0x0123 += vb0123 * va0[2]
   VMLAL.S16 q8, d8, d0[2]
   # vacc0x4567 += vb4567 * va0[2]
   VMLAL.S16 q9, d9, d0[2]

   # vacc1x0123 += vb0123 * va1[2]
   VMLAL.S16 q10, d8, d2[2]
   # vacc1x4567 += vb4567 * va1[2]
   VMLAL.S16 q11, d9, d2[2]

   # vacc2x0123 += vb0123 * va2[2]
   VMLAL.S16 q12, d8, d4[2]
   # vacc2x4567 += vb4567 * va2[2]
   VMLAL.S16 q13, d9, d4[2]

   # q5 = b0:7 - vb_zero_point
   # - d10 = vb0123 (channel 3)
   # - d11 = vb4567 (channel 3)
   VSUBL.U8 q5, d11, d15

   # vacc3x0123 += vb0123 * va3[2]
   VMLAL.S16 q14, d8, d6[2]
   # vacc3x4567 += vb4567 * va3[2]
   VMLAL.S16 q15, d9, d6[2]

### Channel 3 ###

   # Load b0-b7 (channel 4)
   # - d9 = b0-b7
   VLD1.8 {d9}, [ip:64]!

   # vacc0x0123 += vb0123 * va0[3]
   VMLAL.S16 q8, d10, d0[3]
   # vacc0x4567 += vb4567 * va0[3]
   VMLAL.S16 q9, d11, d0[3]

   # vacc1x0123 += vb0123 * va1[3]
   VMLAL.S16 q10, d10, d2[3]
   # vacc1x4567 += vb4567 * va1[3]
   VMLAL.S16 q11, d11, d2[3]

   # vacc2x0123 += vb0123 * va2[3]
   VMLAL.S16 q12, d10, d4[3]
   # vacc2x4567 += vb4567 * va2[3]
   VMLAL.S16 q13, d11, d4[3]

   # q5 = b0:7 - vb_zero_point
   # - d10 = vb0123 (channel 4)
   # - d11 = vb4567 (channel 4)
   VSUBL.U8 q4, d9, d15

   # vacc3x0123 += vb0123 * va3[3]
   VMLAL.S16 q14, d10, d6[3]
   # vacc3x4567 += vb4567 * va3[3]
   VMLAL.S16 q15, d11, d6[3]

### Channel 4 ###

   # Load b0-b7 (channel 5)
   # - d11 = b0-b7
   VLD1.8 {d11}, [ip:64]!

   # vacc0x0123 += vb0123 * va0[4]
   VMLAL.S16 q8, d8, d1[0]
   # vacc0x4567 += vb4567 * va0[4]
   VMLAL.S16 q9, d9, d1[0]

   # vacc1x0123 += vb0123 * va1[4]
   VMLAL.S16 q10, d8, d3[0]
   # vacc1x4567 += vb4567 * va1[4]
   VMLAL.S16 q11, d9, d3[0]

   # vacc2x0123 += vb0123 * va2[4]
   VMLAL.S16 q12, d8, d5[0]
   # vacc2x4567 += vb4567 * va2[4]
   VMLAL.S16 q13, d9, d5[0]

   # q4 = b0:7 - vb_zero_point
   # - d8 = vb0123 (channel 5)
   # - d9 = vb4567 (channel 5)
   VSUBL.U8 q5, d11, d15

   # vacc3x0123 += vb0123 * va3[4]
   VMLAL.S16 q14, d8, d7[0]
   # vacc3x4567 += vb4567 * va3[4]
   VMLAL.S16 q15, d9, d7[0]

### Channel 5 ###

   # Load b0-b7 (channel 6)
   # - d9 = b0-b7
   VLD1.8 {d9}, [ip:64]!

   # vacc0x0123 += vb0123 * va0[5]
   VMLAL.S16 q8, d10, d1[1]
   # vacc0x4567 += vb4567 * va0[5]
   VMLAL.S16 q9, d11, d1[1]

   # vacc1x0123 += vb0123 * va1[5]
   VMLAL.S16 q10, d10, d3[1]
   # vacc1x4567 += vb4567 * va1[5]
   VMLAL.S16 q11, d11, d3[1]

   # vacc2x0123 += vb0123 * va2[5]
   VMLAL.S16 q12, d10, d5[1]
   # vacc2x4567 += vb4567 * va2[5]
   VMLAL.S16 q13, d11, d5[1]

   # q4 = b0:7 - vb_zero_point
   # - d8 = vb0123 (channel 6)
   # - d9 = vb4567 (channel 6)
   VSUBL.U8 q4, d9, d15

   # vacc3x0123 += vb0123 * va3[5]
   VMLAL.S16 q14, d10, d7[1]
   # vacc3x4567 += vb4567 * va3[5]
   VMLAL.S16 q15, d11, d7[1]

### Channel 6 ###

   # Load b0-b7 (channel 7)
   # - d11 = b0-b7
   VLD1.8 {d11}, [ip:64]!

   # vacc0x0123 += vb0123 * va0[6]
   VMLAL.S16 q8, d8, d1[2]
   # vacc0x4567 += vb4567 * va0[6]
   VMLAL.S16 q9, d9, d1[2]

   # vacc1x0123 += vb0123 * va1[6]
   VMLAL.S16 q10, d8, d3[2]
   # vacc1x4567 += vb4567 * va1[6]
   VMLAL.S16 q11, d9, d3[2]

# vacc2x0123 += vb0123 * va2[6]
VMLAL.S16 q12, d8, d5[2]

   # q5 = b0:7 - vb_zero_point
   # - d10 = vb0123 (channel 7)
   # - d11 = vb4567 (channel 7)
   VSUBL.U8 q5, d11, d15

# vacc2x4567 += vb4567 * va2[6]
VMLAL.S16 q13, d9, d5[2]

   # vacc3x0123 += vb0123 * va3[6]
   VMLAL.S16 q14, d8, d7[2]
   # vacc3x4567 += vb4567 * va3[6]
   VMLAL.S16 q15, d9, d7[2]

### Channel 8 ###
SUBS r10, r10, 8

   # vacc0x0123 += vb0123 * va0[7]
   VMLAL.S16 q8, d10, d1[3]
   # vacc0x4567 += vb4567 * va0[7]
   VMLAL.S16 q9, d11, d1[3]

   # vacc1x0123 += vb0123 * va1[7]
   VMLAL.S16 q10, d10, d3[3]
   # vacc1x4567 += vb4567 * va1[7]
   VMLAL.S16 q11, d11, d3[3]

   # vacc2x0123 += vb0123 * va2[7]
   VMLAL.S16 q12, d10, d5[3]
   # vacc2x4567 += vb4567 * va2[7]
   VMLAL.S16 q13, d11, d5[3]

   # vacc3x0123 += vb0123 * va3[7]
   VMLAL.S16 q14, d10, d7[3]
   # vacc3x4567 += vb4567 * va3[7]
   VMLAL.S16 q15, d11, d7[3]

BHS 1b

2:
CMP r10, -8
BEQ 3f

   # Adjust a0, a1, a2, a3
   ADD r4, r10
   ADD r5, r10
   ADD r6, r10
   ADD r7, r10

   # a_shift = 8 * k - 64
   LSL r10, r10, 3
   VDUP.32 d13, r10

   # Load va0
   # - d1 = va0
   VLD1.8 {d1}, [r4]

   # Load va1
   # - d3 = va1
   VLD1.8 {d3}, [r5]

   # Load b0-b7 (channel 0)
   # - d9 = b0-b7
   VLD1.8 {d9}, [ip:64]!

   # Load a2
   # - d5 = a2
   VLD1.8 {d5}, [r6]

   # q0 = va0 = a0
   VSHL.U64 d1, d1, d13
   VMOVL.U8 q0, d1

   # Load a3
   # - d7 = a3
   VLD1.8 {d7}, [r7]

   # q1 = va1 = a1
   VSHL.U64 d3, d3, d13
   VMOVL.U8 q1, d3

   # q4 = b0:7 - vb_zero_point
   # - d8 = vb0123 (channel 0)
   # - d9 = vb4567 (channel 0)
   VSUBL.U8 q4, d9, d15

   # q2 = va2 = a2
   VSHL.U64 d5, d5, d13
   VMOVL.U8 q2, d5
   # q3 = va3 = a3
   VSHL.U64 d7, d7, d13
   VMOVL.U8 q3, d7

### Channel 0 ###

   # vacc0x0123 += vb0123 * va0[0]
   VMLAL.S16 q8, d8, d0[0]
   # vacc0x4567 += vb4567 * va0[0]
   VMLAL.S16 q9, d9, d0[0]

   # vacc1x0123 += vb0123 * va1[0]
   VMLAL.S16 q10, d8, d2[0]
   # vacc1x4567 += vb4567 * va1[0]
   VMLAL.S16 q11, d9, d2[0]

   # vacc2x0123 += vb0123 * va2[0]
   VMLAL.S16 q12, d8, d4[0]
   # vacc2x4567 += vb4567 * va2[0]
   VMLAL.S16 q13, d9, d4[0]

   # vacc3x0123 += vb0123 * va3[0]
   VMLAL.S16 q14, d8, d6[0]
   # vacc3x4567 += vb4567 * va3[0]
   VMLAL.S16 q15, d9, d6[0]

CMP r10, -48
BLO 3f

### Channel 1 ###

   # Load b0-b7 (channel 1)
   # - d11 = b0-b7
   VLD1.8 {d11}, [ip:64]!

   # q5 = b0:7 - vb_zero_point
   # - d10 = vb0123 (channel 1)
   # - d11 = vb4567 (channel 1)
   VSUBL.U8 q5, d11, d15

   # vacc0x0123 += vb0123 * va0[1]
   VMLAL.S16 q8, d10, d0[1]
   # vacc0x4567 += vb4567 * va0[1]
   VMLAL.S16 q9, d11, d0[1]

   # vacc1x0123 += vb0123 * va1[1]
   VMLAL.S16 q10, d10, d2[1]
   # vacc1x4567 += vb4567 * va1[1]
   VMLAL.S16 q11, d11, d2[1]

   # vacc2x0123 += vb0123 * va2[1]
   VMLAL.S16 q12, d10, d4[1]
   # vacc2x4567 += vb4567 * va2[1]
   VMLAL.S16 q13, d11, d4[1]

   # vacc3x0123 += vb0123 * va3[1]
   VMLAL.S16 q14, d10, d6[1]
   # vacc3x4567 += vb4567 * va3[1]
   VMLAL.S16 q15, d11, d6[1]

### Channel 2 ###
BLS 3f

   # Load b0-b7 (channel 2)
   # - d9 = b0-b7
   VLD1.8 {d9}, [ip:64]!

   # q4 = b0:7 - vb_zero_point
   # - d8 = vb0123 (channel 2)
   # - d9 = vb4567 (channel 2)
   VSUBL.U8 q4, d9, d15

   # vacc0x0123 += vb0123 * va0[2]
   VMLAL.S16 q8, d8, d0[2]
   # vacc0x4567 += vb4567 * va0[2]
   VMLAL.S16 q9, d9, d0[2]

   # vacc1x0123 += vb0123 * va1[2]
   VMLAL.S16 q10, d8, d2[2]
   # vacc1x4567 += vb4567 * va1[2]
   VMLAL.S16 q11, d9, d2[2]

   # vacc2x0123 += vb0123 * va2[2]
   VMLAL.S16 q12, d8, d4[2]
   # vacc2x4567 += vb4567 * va2[2]
   VMLAL.S16 q13, d9, d4[2]

   # vacc3x0123 += vb0123 * va3[2]
   VMLAL.S16 q14, d8, d6[2]
   # vacc3x4567 += vb4567 * va3[2]
   VMLAL.S16 q15, d9, d6[2]

   ### Channel 3 ###
   CMP r10, -32
   BLO 3f

   # Load b0-b7 (channel 3)
   # - d9 = b0-b7
   VLD1.8 {d11}, [ip:64]!

   # q4 = b0:7 - vb_zero_point
   # - d8 = vb0123 (channel 3)
   # - d9 = vb4567 (channel 3)
   VSUBL.U8 q5, d11, d15

   # vacc0x0123 += vb0123 * va0[3]
   VMLAL.S16 q8, d10, d0[3]
   # vacc0x4567 += vb4567 * va0[3]
   VMLAL.S16 q9, d11, d0[3]

   # vacc1x0123 += vb0123 * va1[3]
   VMLAL.S16 q10, d10, d2[3]
   # vacc1x4567 += vb4567 * va1[3]
   VMLAL.S16 q11, d11, d2[3]

   # vacc2x0123 += vb0123 * va2[3]
   VMLAL.S16 q12, d10, d4[3]
   # vacc2x4567 += vb4567 * va2[3]
   VMLAL.S16 q13, d11, d4[3]

   # vacc3x0123 += vb0123 * va3[3]
   VMLAL.S16 q14, d10, d6[3]
   # vacc3x4567 += vb4567 * va3[3]
   VMLAL.S16 q15, d11, d6[3]

### Channel 4 ###
BLS 3f

   # Load b0-b7 (channel 4)
   # - d11 = b0-b7
   VLD1.8 {d9}, [ip:64]!

   # q5 = b0:7 - vb_zero_point
   # - d10 = vb0123 (channel 4)
   # - d11 = vb4567 (channel 4)
   VSUBL.U8 q4, d9, d15

   # vacc0x0123 += vb0123 * va0[4]
   VMLAL.S16 q8, d8, d1[0]
   # vacc0x4567 += vb4567 * va0[4]
   VMLAL.S16 q9, d9, d1[0]

   # vacc1x0123 += vb0123 * va1[4]
   VMLAL.S16 q10, d8, d3[0]
   # vacc1x4567 += vb4567 * va1[4]
   VMLAL.S16 q11, d9, d3[0]

   # vacc2x0123 += vb0123 * va2[4]
   VMLAL.S16 q12, d8, d5[0]
   # vacc2x4567 += vb4567 * va2[4]
   VMLAL.S16 q13, d9, d5[0]

   # vacc3x0123 += vb0123 * va3[4]
   VMLAL.S16 q14, d8, d7[0]
   # vacc3x4567 += vb4567 * va3[4]
   VMLAL.S16 q15, d9, d7[0]

   ### Channel 5 ###
   CMP r10, -16
   BLO 3f

   # Load b0-b7 (channel 5)
   # - d13 = b0-b7
   VLD1.8 {d11}, [ip:64]!

   # q5 = b0:7 - vb_zero_point
   # - d10 = vb0123 (channel 5)
   # - d11 = vb4567 (channel 5)
   VSUBL.U8 q5, d11, d15

   # vacc0x0123 += vb0123 * va0[5]
   VMLAL.S16 q8, d10, d1[1]
   # vacc0x4567 += vb4567 * va0[5]
   VMLAL.S16 q9, d11, d1[1]

   # vacc1x0123 += vb0123 * va1[5]
   VMLAL.S16 q10, d10, d3[1]
   # vacc1x4567 += vb4567 * va1[5]
   VMLAL.S16 q11, d11, d3[1]

   # vacc2x0123 += vb0123 * va2[5]
   VMLAL.S16 q12, d10, d5[1]
   # vacc2x4567 += vb4567 * va2[5]
   VMLAL.S16 q13, d11, d5[1]

   # vacc3x0123 += vb0123 * va3[5]
   VMLAL.S16 q14, d10, d7[1]
   # vacc3x4567 += vb4567 * va3[5]
   VMLAL.S16 q15, d11, d7[1]

### Channel 6 ###
BLS 3f

   # Load b0-b7 (channel 6)
   # - d9 = b0-b7
   VLD1.8 {d9}, [ip:64]!

   # q4 = b0:7 - vb_zero_point
   # - d8 = vb0123 (channel 6)
   # - d9 = vb4567 (channel 6)
   VSUBL.U8 q4, d9, d15

   # vacc0x0123 += vb0123 * va0[6]
   VMLAL.S16 q8, d8, d1[2]
   # vacc0x4567 += vb4567 * va0[6]
   VMLAL.S16 q9, d9, d1[2]

   # vacc1x0123 += vb0123 * va1[6]
   VMLAL.S16 q10, d8, d3[2]
   # vacc1x4567 += vb4567 * va1[6]
   VMLAL.S16 q11, d9, d3[2]

   # vacc2x0123 += vb0123 * va2[6]
   VMLAL.S16 q12, d8, d5[2]
   # vacc2x4567 += vb4567 * va2[6]
   VMLAL.S16 q13, d9, d5[2]

   # vacc3x0123 += vb0123 * va3[6]
   VMLAL.S16 q14, d8, d7[2]
   # vacc3x4567 += vb4567 * va3[6]
   VMLAL.S16 q15, d9, d7[2]

   .p2align 4
3:
   SUBS r3, r3, 1
   BNE 0b

   # Load c, c_stride:
   # - r2 = c
   # - r3 = c_stride
   LDRD r2, r3, [sp, 104]
   # r3 = c_stride*4;
   MOV r3, r3, LSL 2

ADD r4, r2, r3

   CMP r0, 2
   #if r0<2 r4=r2
   MOVLO r4, r2

   ADD r5, r4, r3
   #if r0==2 r5=r4
   MOVLS r5, r4

   CMP r0, 4
   ADD r3, r5, r3
   #if r0!=4 r3=r5
   MOVNE r3, r5

CMP r1, 8
BNE 5f

   VST1.I32 {d16-d19}, [r2]
   VST1.I32 {d20-d23}, [r4]
   VST1.I32 {d24-d27}, [r5]
   VST1.I32 {d28-d31}, [r3]

   VPOP {d8-d15}
   POP {r4, r5, r6, r7, r8, r9, r10, r11}
   BX lr

   .p2align 3
5:
   CMP r1, 4
   BLO 6f

   VST1.32 {d16-d17}, [r2:128]!
   VST1.32 {d20-d21}, [r4:128]!
   VST1.32 {d24-d25}, [r5:128]!
   VST1.32 {d28-d29}, [r3:128]!

   SUB r1, 4
   VMOV.I32 q8, q9
   VMOV.I32 q10, q11
   VMOV.I32 q12, q13
   VMOV.I32 q14, q15

6:
CMP r1, 2
BLO 7f

   VST1.32 {d16}, [r2:64]!
   VST1.32 {d20}, [r4:64]!
   VST1.32 {d24}, [r5:64]!
   VST1.32 {d28}, [r3:64]!

   SUB r1, 2
   VEXT.32 q8, q8, q8, 2
   VEXT.32 q10, q10, q10, 2
   VEXT.32 q12, q12, q12, 2
   VEXT.32 q14, q14, q14, 2

7:
TEQ r1, 0
BEQ 8f

   VST1.32 {d16}, [r2]
   VST1.32 {d20}, [r4]
   VST1.32 {d24}, [r5]
   VST1.32 {d28}, [r3]

8:
   VPOP {d8-d15}
   POP {r4, r5, r6, r7, r8, r9, r10, r11}
   BX lr #bx lr 的作用等同于 mov pc,lr 即跳转到lr中存放的地址处
END_FUNCTION q8conv_ukernel_4x8__aarch32_neon

#ifdef __ELF__
.section ".note.GNU-stack","",%progbits
#endif

你可能感兴趣的:(arm汇编)

【iOS内功】ARM汇编实战,解析iOS14 UICollectionView死循环问题 iOS鑫
image.png【iOS内功】ARM汇编实战,解析iOS14UICollectionView死循环问题背景9月初iOS14正式发布，线上版本新冒出许多Crash。有一个Crash,UICollectionView刷新逻辑死循环，卡死了主线程。阳差阳错，中美两个程序员的“误会”造成了这个Crash。App有一个页面，自定义了一个XXCollectionView。XXCollectionView嵌套
ARM汇编指令 my_王老汉 #ARM内核单片机 stm32 arm开发 arm开发汇编
文章目录ARM汇编指令ARM指令集LDR和STRLDM和STMMOV运算操作比较指令分支跳转SWI软中断指令SVC系统服务调用饱和指令指令表Thumb指令集MRS和MSRIT指令块CBZ和CBNZTBB和TBHREV,REVH,RBITBFC/BFI，UBFX/SBFXUBFX/SBFX(位段提取指令)函数调用约定函数使用寄存器堆栈平衡ARM汇编程序符号，标号伪操作伪操作——ARM编译器伪操作——
c和汇编语言混合的限制符号含义表,C与汇编语言混合2011.ppt weixin_39612332
C与汇编语言混合2011C与汇编语言混合编程1、ATPCS介绍2、内嵌汇编3、C和ARM汇编程序间相互调用1、ATPCS介绍ATPCS(ARM-ThumbProduceCallStandard)是ARM程序和Thumb程序中子程序调用的基本规则，目的是为了使单独编译的C语言程序和汇编程序之间能够相互调用。这些基本规则包括子程序调用过程中寄存器的使用规则、数据栈的使用规则和参数的传递规则。寄存器的使
ARM汇编之寄存器快乐至上 Arm寄存器
原文摘自：http://blog.csdn.net/tigerjb/article/details/6050649ARM寄存器-------------------------------------------------------------Author:tiger-johnWebSite:blog.csdn.net/tigerjbEmail：[email protected]
【学习笔记】ARM Cortex-A(armv7)编程手册踏流星学习 arm开发
第一章介绍了ARMCortex-A系列处理器的基本功能，介绍ARM体系结构的基础知识，涵盖各种寄存器；第二章和第三章提供了有关各个处理器的模式和一些背景知识；第四章和第五章简要介绍了ARM汇编语言编程，以及汇编语言说明；第六章和第七章中的介绍浮点和ARM高级SIMD扩展，相关主题的介绍；第八章、第九章和第十章介绍内存系统，缓存，内存管理，内存排序；第十一章和第十二章介绍了处理异常和中断；第十三章概
ARM汇编基础(iOS逆向) 编程怪才_凌雨画
ARM汇编基础在逆向一个功能的时候,往往需要分析大量的汇编代码,在iOS逆向中,ARM汇编是必须掌握的语言,本文总结了ARM汇编的基础知识,如果你想了解更多,请参考狗神的小黄书《iOS逆向逆向工程》或ARM官方手册.寄存器,内存和栈在ARM汇编里,操作对象是寄存器,内存和栈ARM的栈遵循先进后出,是满递减的,向下增长,也就是开口向下,新的变量被存到栈底的位置;越靠近栈底,内存地址越小一个名为sta
ARM汇编之TCP Bind Shell Dr. 熊
bindshell作为一个bindshell，也就是在服务器上运行的shellcode，等待hacker去主动连接，所以它的主要工作就是监听固定端口，等待外部连接即可C代码（Linux，都是使用man命令查询的命令介绍）指令介绍socketintsocket(intdomain,inttype,intprotocol);创建通信端点并返回描述符bindintbind(intsockfd,const
3.7 GNU ARM汇编语言 fantasy_arch gnu arm开发服务器
在ARM平台下从事嵌入式软件开发，大家会遇到各种不同的集成开发环境和编译器，例如IAR,ADSI，RVDSKeilMDKRealVidewMDKARM交叉编译器aarm-linux-gcc等，如果将这些不同的IDE归类，一般可以分为两大类，一类IDE内部集成了ARM编译器，另一类则使用开源的GNUGCCforARM编译器。为了方便，在后续的文字中我们简称为GNUARM编译器。3.7.1重新认识编译
ARM实验-ARM主程序调用ARM/C语言子程序实名吃香菜 ARM arm开发 c语言开发语言
一、实验名称：ARM主程序调用ARM/C语言子程序二、实验目的：了解ARM应用程序框架。了解ARM汇编程序函数和C语言程序函数相互调用时，遵循的ATPCS标准；了解和掌握ARM汇编程序调用C语言程序函数的基本方法；了解和掌握ARM汇编程序调用C语言程序函数的参数传递过程。三、实验原理：ARM工程由于C语言便于理解，有大量的支持库，所以它是当前ARM程序设计所使用的主要编程语言。对硬件系统的初始化、
ARM汇编 3.arm异常 linqwer1 ARM汇编 arm开发汇编
软件中断指令（swi）异常：是由应用程序自己调用时产生的，用户程序申请访问硬件资料时需要调用该指令。如Printf函数，打印需要申请显示器，用户程序没有外设硬件的使用权，只能通过使用软件中断指令切换到内核态。（为了保护操作系统的安全和硬件资源的合理使用，在SVC模式下处理）异常优先级异常处理流程硬件阶段->异常处理->异常返回
ARM汇编 2.arm常用指令 linqwer1 ARM汇编 arm开发汇编
MOV赋值操作寄存器机器码存在一定的规则：（也不用记，只需要有这个概念）移位操作LSL（或ASL）逻辑（算术）左移MOVR0,R1,LSL#2将R1中的内容左移两位后传送到R0，低位用0填充LSR逻辑右移，高位补0MOVR0,R1,LSR#2ASR算术右移，高位用原第31位的值（符号位）填充MOVR0,R1,ASR#2ROR循环右移，高位用低位移出的位来填充MOVR0,R1,ROR#2RRX带扩展
ARM汇编 4.GNU伪指令、内联汇编 linqwer1 ARM汇编 arm开发汇编
汇编伪指令格式标号symbol（label）注释符号：@整行注释：#语句分离：；立即数前缀：#或$分段：.section伪操作，用于自定义新的段.text：代码段.data：初始化的数据段.bss：未初始化的数据段.rodata：字符串和#define定义的常量heap、stack、常量段汇编程序的缺省入口是**_start标号**数据定义杂项伪操作符：.global定义全局符号.align指定数
STM32学习笔记——六、启动文件详解孟庆磊 STM32学习笔记 stm32 学习笔记
STM32学习笔记——六、启动文件详解1启动文件简介2如何查找ARM汇编指令2启动文件代码讲解2.1Stack——栈2.2Heap——堆2.3向量表2.4复位程序2.5终端服务程序2.6用户堆栈初始化1启动文件简介startup_stm32f10x_hd.s：简单介绍，后续《启动文件详解》章节详细介绍芯片上电后，首先执行这个汇编程序，建立起C语言的运行环境使用汇编语言写好了基本程序（Cortex-
ARM汇编 1.arm架构 linqwer1 ARM汇编 arm开发汇编架构
ARM处理器工作模式Cortex-A系列的8种工作模式，比起Cortex-M系列多了monitor模式只需掌握用户模式、一般中断模式、管理模式异常源不同的异常源会进入不同的工作模式FIQ异常=>FIQ模式IRQ异常=>IRQ模式Prefetch、Data异常=>中止模式Undef=>未定义指令中止模式SWI、reset异常=>管理模式ARM寄存器R8-R14对于另外6种异常模式有不同的含义，和系统
《安富莱嵌入式周报》第331期：单片机实现全功能软件无线电，开源电源EEZ升级主控，ARM 汇编用户指南，UDS统一诊断服务解析，半导体可靠性设计手册硬汉嵌入式嵌入式周报单片机开源 arm开发
周报汇总地址：嵌入式周报-uCOS&uCGUI&emWin&embOS&TouchGFX&ThreadX-硬汉嵌入式论坛-PoweredbyDiscuz!目录：1、单片机实现低配版全功能软件无线电，范围0.5-30MHz，支持SSB、AM、FM和CW2、TI整理的ARM汇编用户指南3、ADI差分链路的SPI扩展器LTC4332，支持1200米4、开源串口，SPI，I2C和1-Wire开发工具5、软
嵌入式培训机构四个月实训课程笔记（完整版）-Linux ARM平台编程第二天-ARM汇编（物联技术666） vx349014857 嵌入式培训课程笔记笔记 linux arm开发
链接：https://pan.baidu.com/s/1bG0tuVaACATvjLwD05j1FQ?pwd=1688提取码：1688上午：ARM编程模型下午：常用ARM指令教学内容：1、ARM数据类型字节（Byte）：在ARM体系结构及常见的8位/16位处理器体系结构中，字节的长度均为8位字（Word）：在ARM体系结构中，字的长度为32位，而在8位/16位处理器体系结构中，字的长度一般为16位
初识汇编指令进击的菜鸟子 ARM 汇编
1.ARM汇编指令目的认识汇编,从而更好的进行C语言编程RAM指令格式:了解4字节宽度地址4字节对齐方便寻址1.1指令码组成部分:condition:高4bit[31:28]条件码0-15（16个值）条件码:用于指令的条件执行,ARM指定绝大部分都可以条件执行可以让程序不必要跳转而执行分支结构不打断流水线效率更高指令操作码:[24:21]指令本身的编号可以有16种指令Rn:第一操作寄存器第一个操作
C/C++安卓手游内存逆向、手游call教程（类人猿学院）类人猿学院 c语言 c++android
主要内容和方向：从C语言基础知识讲起；x86/x64/arm汇编基础、逆向手游内部数据、内存读写和call调用、内部hook；注入call框架编写；辅助控制界面和通讯；内部封包逆向数据分析。目前全网就我们能搞安卓手机、模拟器call分析和调用一套龙教程，学会基本是手游脚本辅助行业领先。欢迎各大逆向爱好者来学习和建议。编程语言：主要C语言，部分用C++或者易语言或者脚本语言第一套：C语言入门到进阶部
Kotlin 语言中的解构声明（Destructuring Declarations） Android安全工程学习笔记 kotlin android 开发语言
笔者专注于Android安全领域，欢迎关注个人的微信公众号《Android安全工程》（可点击进行扫码关注）。个人微信公众号主要围绕Android应用的安全防护和逆向分析，分享各种安全攻防手段、Hook技术、ARM汇编等Android相关的知识。在Kotlin中，解构声明（DestructuringDeclarations）是一种方便的语言特性，允许你将一个对象或数据结构的属性解构到多个变量中。这个
arm汇编指令之数据块传输（LDM,STM）详见子曰小玖逆向工程汇编 arm 汇编
http://blog.chinaunix.net/uid-28458801-id-3791987.html数据块传输指令用于加载（LDM）或者存储（STM）当前有效寄存器的任意子集。它们支持所有可能的堆栈模式，维持空或者满的堆栈，此堆栈可以向上或者向下，在保存或者恢复内容，移动主存储器的大数据块是非常有效的。1，指令格式：{cond}Rn{!},{^}*{cond}条件代码*指令类型*Rn基址寄
ARM 汇编指令学习:[1]ARM指令寻址方式 techping 嵌入式汇编汇编 arm 寻址方式
ARM汇编指令学习:[1]ARM指令寻址方式一、数据处理指令的操作数的寻址方式{}{S},,通常具有下面3种格式：1、立即数方式#其中，#=immed_8循环右移(2*rotate_imm)。使用说明这里需要注意关于立即数的合法性以立即数编码的规则。示例MOVR0,#0xFC02、寄存器方式其中，指定操作数所在的寄存器。使用说明当R15(PC)用作第一个源操作数Rn或者第二操作数Rm时，操作数即为
读写锁（arm）这个我好像学过 linux 数据库运维
参考文章读写锁-ARM汇编同步机制实例（四）_汇编prefetchw-CSDN博客读写锁允许多个执行流并发访问临界区。但是写访问是独占的。适用于读多写少的场景另外好像有些还区分了读优先和写优先读写锁定义typedefstruct{arch_rwlock_traw_lock;#ifdefCONFIG_GENERIC_LOCKBREAKunsignedintbreak_lock;#endif#ifde
GDB调试arm汇编程序-入门勤学奋进小郎君
程序生成步骤转自：https://azeria-labs.com/writing-arm-assembly-part-1/写好汇编代码到helloworld.s编译文件（但是没有链接）只编译不链接形成.o文件。里面包含了对各个函数的入口标记，描述，当程序要执行时还需要链接(link)链接就是把多个.o文件链成一个可执行文件ashelloworld.s-ohelloworld.o链接文件，形成可执行
嵌入式软件开发人员有必要学习系统移植的知识吗？【ppt获取见文末】一口Linux 从0学arm 原创 Linux驱动学习
《从零开始学ARM》的配套视频说明为了让粉丝更好的学习我的新书里面的知识，一口君特地录制了配套学习视频，《从0学ARM第一期》《从0学ARM第一期》视频已经免费发布在B站，而书中除了ARM汇编、裸机开发等知识，还涉及到系统移植的一些知识点所以一口君干脆录制了一期《系统移植》的视频系统移植相关知识是否需要学习？现在很多芯片厂家为了方便客户进行二次开发，将很多系统移植的软件包、制作工具等都封装在sdk
C与ARM汇编结合实现mini2440串口uart简单程序 _int_me 嵌入式 C语言嵌入式 c语言
C与ARM汇编结合实现mini2440串口uart简单程序最近学完了ARM的一些基础知识，开始在mini2440上开发一些简单的程序，串口发送程序是一开始涉及多个寄存器的例子，稍有繁多的步骤应该是开发过程中要慢慢适应的境况下面的程序的目的是实现mini2440串口的发送功能，向超级终端打印简单字符。设备：mini2440如图，软件为gcc交叉编译工具，minitools与超级终端，主机环境为Win
ARM汇编指令 Omedetou。 arm开发汇编
数据和指令类型ARM采用的是32位架构ARM约定:Byte：8bitsHalfword：16bits(2byte)Word：32bits(4byte)Doubleword：64-bits（8byte）（Cortex-A处理器）大部分ARMcore提供：ARM指令集（32-bit）Thumb指令集（16-bit）Cortex-A处理器16位和32位Thumb-2指令集16位和32位ThumbEE指令
嵌入式系统复习--基于ARM的嵌入式程序设计 ˇasushiro 嵌入式系统 arm开发笔记
文章目录上一篇编译环境ADS编译环境下的伪操作GNU编译环境下的伪操作ARM汇编语言的伪指令汇编语言程序设计相关运算操作符汇编语言格式汇编语言程序重点C语言的一些技巧下一篇上一篇嵌入式系统复习–Thumb指令集编译环境ADS/SDTIDE开发环境：它由ARM公司开发，使用了CodeWarrior公司的编译器一般的：集成了GNU开发工具的IDE开发环境：它由GNU的汇编器as、交叉编译器gcc、和链
ARM——arm汇编和c/c++的混合编程 Nik_TellYou ARM嵌入式开发
1）为何要混合编程？例子：LInux内核中的一些代码就包含有汇编和c代码2）汇编和c/c++混合编程的方式3）C语言嵌入汇编如在linux内核代码中的asmvolatile{}汇编代码,asm开头表示该段代码为汇编例子：C语言中嵌入arm汇编,实现一个copy函数#includevoidmy_strcopy(char*src,char*dest){charch;__asm{//汇编loop:LDR
C++ 从入门到放弃 (Day-03) 麦兜兜买兜兜
引用的本质◼引用的本质就是指针，只是编译器削弱了它的功能，所以引用就是弱化了的指针◼一个引用占用一个指针的大小汇编语言◼汇编语言的种类8086汇编(16bit)x86汇编(32bit)x64汇编(64bit)ARM汇编(嵌入式、移动设备)......◼x64汇编根据编译器的不同，有2种书写格式IntelAT&T◼汇编语言不区分大小写x64汇编–寄存器image.pngx64汇编–寄存
【嵌入式系统基础第三周作业】--ARM汇编程序入门实践 @aln 单片机 stm32 嵌入式硬件
文章目录1.搭建并配置Keil嵌入式开发环境，完成一个基于STM32汇编程序的编写。1.1搭建并配置Keil嵌入式开发环境1.2完成一个基于STM32汇编程序的编写2.学习在没有硬件条件下进行仿真调试的方法，观察ARM寄存器变化状况2.1在没有硬件条件下进行仿真调试，观察ARM寄存器变化状况。2.2记录build生成的hex文件各段的大小，了解Hex文件格式及其前8个字节内容含义3.总结4.参考一
设计模式介绍 tntxia 设计模式
设计模式来源于土木工程师克里斯托弗亚历山大（http://en.wikipedia.org/wiki/Christopher_Alexander）的早期作品。他经常发表一些作品，内容是总结他在解决设计问题方面的经验，以及这些知识与城市和建筑模式之间有何关联。有一天，亚历山大突然发现，重复使用这些模式可以让某些设计构造取得我们期望的最佳效果。亚历山大与萨拉-石川佳纯和穆雷西乐弗斯坦合作
android高级组件使用(一) 百合不是茶 android RatingBar Spinner
1、自动完成文本框（AutoCompleteTextView） AutoCompleteTextView从EditText派生出来，实际上也是一个文本编辑框，但它比普通编辑框多一个功能：当用户输入一个字符后，自动完成文本框会显示一个下拉菜单，供用户从中选择，当用户选择某个菜单项之后，AutoCompleteTextView按用户选择自动填写该文本框。使用AutoCompleteTex
[网络与通讯]路由器市场大有潜力可挖掘 comsci 网络
如果国内的电子厂商和计算机设备厂商觉得手机市场已经有点饱和了,那么可以考虑一下交换机和路由器市场的进入问题..... 这方面的技术和知识,目前处在一个开放型的状态,有利于各类小型电子企业进入 &nbs
自写简单Redis内存统计shell 商人shang Linux shell 统计Redis内存
#!/bin/bash address="192.168.150.128:6666,192.168.150.128:6666" hosts=(${address//,/ }) sfile="staticts.log" for hostitem in ${hosts[@]} do ipport=(${hostitem
单例模式(饿汉 vs懒汉) oloz 单例模式
package 单例模式; /* * 应用场景:保证在整个应用之中某个对象的实例只有一个 * 单例模式种的《懒汉模式》 * */ public class Singleton { //01 将构造方法私有化，外界就无法用new Singleton()的方式获得实例 private Singleton(){}; //02 申明类得唯一实例 priva
springMvc json支持杨白白 json springmvc
1.Spring mvc处理json需要使用jackson的类库，因此需要先引入jackson包 2在spring mvc中解析输入为json格式的数据:使用@RequestBody来设置输入 @RequestMapping("helloJson") public @ResponseBody JsonTest helloJson() {
android播放，掃描添加本地音頻文件小桔子
最近幾乎沒有什麽事情，繼續鼓搗我的小東西。想在項目中加入一個簡易的音樂播放器功能，就像華為p6桌面上那麼大小的音樂播放器。用過天天動聽或者QQ音樂播放器的人都知道，可已通過本地掃描添加歌曲。不知道他們是怎麼實現的，我覺得應該掃描設備上的所有文件，過濾出音頻文件，每個文件實例化為一個實體，記錄文件名、路徑、歌手、類型、大小等信息。具體算法思想，
oracle常用命令 aichenglong oracle dba 常用命令
1 创建临时表空间 create temporary tablespace user_temp tempfile 'D:\oracle\oradata\Oracle9i\user_temp.dbf' size 50m autoextend on next 50m maxsize 20480m extent management local
25个Eclipse插件 AILIKES eclipse插件
提高代码质量的插件1. FindBugsFindBugs可以帮你找到Java代码中的bug，它使用Lesser GNU Public License的自由软件许可。2. CheckstyleCheckstyle插件可以集成到Eclipse IDE中去，能确保Java代码遵循标准代码样式。3. ECLemmaECLemma是一款拥有Eclipse Public License许可的免费工具，它提供了
Spring MVC拦截器+注解方式实现防止表单重复提交 baalwolf spring mvc
原理：在新建页面中Session保存token随机码，当保存时验证，通过后删除，当再次点击保存时由于服务器端的Session中已经不存在了，所有无法验证通过。 1.新建注解： ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
《Javascript高级程序设计(第3版)》闭包理解 bijian1013 JavaScript
“闭包是指有权访问另一个函数作用域中的变量的函数。”--《Javascript高级程序设计(第3版)》看以下代码： <script type="text/javascript"> function outer() { var i = 10; return f
AngularJS Module类的方法 bijian1013 JavaScript AngularJS Module
AngularJS中的Module类负责定义应用如何启动，它还可以通过声明的方式定义应用中的各个片段。我们来看看它是如何实现这些功能的。一.Main方法在哪里如果你是从Java或者Python编程语言转过来的，那么你可能很想知道AngularJS里面的main方法在哪里？这个把所
[Maven学习笔记七]Maven插件和目标 bit1129 maven插件
插件(plugin)和目标(goal) Maven，就其本质而言，是一个插件执行框架，Maven的每个目标的执行逻辑都是由插件来完成的，一个插件可以有1个或者几个目标，比如maven-compiler-plugin插件包含compile和testCompile，即maven-compiler-plugin提供了源代码编译和测试源代码编译的两个目标使用插件和目标使得我们可以干预
【Hadoop八】Yarn的资源调度策略 bit1129 hadoop
1. Hadoop的三种调度策略 Hadoop提供了3中作业调用的策略， FIFO Scheduler Fair Scheduler Capacity Scheduler 以上三种调度算法，在Hadoop MR1中就引入了，在Yarn中对它们进行了改进和完善.Fair和Capacity Scheduler用于多用户共享的资源调度 2. 多用户资源共享的调度
Nginx使用Linux内存加速静态文件访问 ronin47
Nginx是一个非常出色的静态资源web服务器。如果你嫌它还不够快，可以把放在磁盘中的文件，映射到内存中，减少高并发下的磁盘IO。先做几个假设。nginx.conf中所配置站点的路径是/home/wwwroot/res，站点所对应文件原始存储路径：/opt/web/res shell脚本非常简单，思路就是拷贝资源文件到内存中，然后在把网站的静态文件链接指向到内存中即可。具体如下：
关于Unity3D中的Shader的知识 brotherlamp unity unity资料 unity教程 unity视频 unity自学
首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，然后我们来看下Unity3D自带的60多个S
CopyOnWriteArrayList vs ArrayList bylijinnan java
package com.ljn.base; import java.util.ArrayList; import java.util.Iterator; import java.util.List; import java.util.concurrent.CopyOnWriteArrayList; /** * 总述： * 1.ArrayListi不是线程安全的，CopyO
内存中栈和堆的区别 chicony 内存
1、内存分配方面：堆：一般由程序员分配释放，若程序员不释放，程序结束时可能由OS回收。注意它与数据结构中的堆是两回事，分配方式是类似于链表。可能用到的关键字如下：new、malloc、delete、free等等。栈：由编译器(Compiler)自动分配释放，存放函数的参数值，局部变量的值等。其操作方式类似于数据结构中
回答一位网友对Scala的提问 chenchao051 scala map
本来准备在私信里直接回复了，但是发现不太方便，就简要回答在这里。问题写道对于scala的简洁十分佩服，但又觉得比较晦涩，例如一例，Map("a" -> List(11,111)).flatMap(_._2)，可否说下最后那个函数做了什么，真正在开发的时候也会如此简洁？谢谢先回答一点，在实际使用中，Scala毫无疑问就是这么简单。
mysql 取每组前几条记录 daizj mysql 分组最大值最小值每组三条记录
一、对分组的记录取前N条记录：例如：取每组的前3条最大的记录 1.用子查询： SELECT * FROM tableName a WHERE 3> (SELECT COUNT(*) FROM tableName b WHERE b.id=a.id AND b.cnt>a. cnt) ORDER BY a.id,a.account DE
HTTP深入浅出 http请求 dcj3sjt126com http
HTTP(HyperText Transfer Protocol)是一套计算机通过网络进行通信的规则。计算机专家设计出HTTP，使HTTP客户（如Web浏览器）能够从HTTP服务器(Web服务器)请求信息和服务，HTTP目前协议的版本是1.1.HTTP是一种无状态的协议，无状态是指Web浏览器和Web服务器之间不需要建立持久的连接，这意味着当一个客户端向服务器端发出请求，然后We
判断MySQL记录是否存在方法比较 dcj3sjt126com mysql
把数据写入到数据库的时，常常会碰到先要检测要插入的记录是否存在，然后决定是否要写入。　　我这里总结了判断记录是否存在的常用方法：　　sql语句： select count ( * ) from tablename; 　　然后读取count(*)的值判断记录是否存在。对于这种方法性能上有些浪费，我们只是想判断记录记录是否存在，没有必要全部都查出来。
对HTML XML的一点认识 e200702084 html xml
感谢http://www.w3school.com.cn提供的资料 HTML 文档中的每个成分都是一个节点。节点根据 DOM，HTML 文档中的每个成分都是一个节点。 DOM 是这样规定的：整个文档是一个文档节点每个 HTML 标签是一个元素节点包含在 HTML 元素中的文本是文本节点每一个 HTML 属性是一个属性节点注释属于注释节点 Node 层次
jquery分页插件 genaiwei jquery Web 前端分页插件
//jquery页码控件// 创建一个闭包 (function($) { // 插件的定义 $.fn.pageTool = function(options) { var totalPa
Mybatis与Ibatis对照入门于学习 Josh_Persistence mybatis ibatis 区别联系
一、为什么使用IBatis/Mybatis 对于从事 Java EE 的开发人员来说，iBatis 是一个再熟悉不过的持久层框架了，在 Hibernate、JPA 这样的一站式对象 / 关系映射（O/R Mapping）解决方案盛行之前，iBaits 基本是持久层框架的不二选择。即使在持久层框架层出不穷的今天，iBatis 凭借着易学易用、
C中怎样合理决定使用那种整数类型？秋风扫落叶 c 数据类型
如果需要大数值(大于32767或小于32767), 使用long 型。否则, 如果空间很重要 (如有大数组或很多结构), 使用 short 型。除此之外, 就使用 int 型。如果严格定义的溢出特征很重要而负值无关紧要, 或者你希望在操作二进制位和字节时避免符号扩展的问题, 请使用对应的无符号类型。但是, 要注意在表达式中混用有符号和无符号值的情况。 &nbs
maven问题 zhb8015 maven问题
问题1： Eclipse 中新建maven项目无法添加src/main/java 问题 eclipse创建maevn web项目，在选择maven_archetype_web原型后，默认只有src/main/resources这个Source Floder。按照maven目录结构，添加src/main/ja
(二)androidpn-server tomcat版源码解析之--push消息处理 spjich java androdipn 推送
在 (一)androidpn-server tomcat版源码解析之--项目启动这篇中，已经描述了整个推送服务器的启动过程，并且把握到了消息的入口即XmppIoHandler这个类，今天我将继续往下分析下面的核心代码，主要分为3大块，链接创建，消息的发送，链接关闭。先贴一段XmppIoHandler的部分代码 /** * Invoked from an I/O proc
用js中的formData类型解决ajax提交表单时文件不能被serialize方法序列化的问题中华好儿孙 JavaScript Ajax Web 上传文件 FormData
var formData = new FormData($("#inputFileForm")[0]); $.ajax({ type:'post', url:webRoot+"/electronicContractUrl/webapp/uploadfile", data:formData, async: false, ca
mybatis常用jdbcType数据类型 ysj5125094 mybatis mapper jdbcType
MyBatis 通过包含的jdbcType 类型 BIT FLOAT CHAR