phenix_lord

关于memory barrier/memory ordering 的笔记和总结(2)

Memory ordering

Memory ordering用来描述系统中的processor对内存的操作如何对其它processor可见(可见的定义见前面的描述)。同时需要说明的是，大多数文献都采用reorder这个表达方式，是从执行等价的角度来描述的：比如P1上执行两个写操作WRITE(A)和WRITE(B)，如果对于观察者P2来说P1|WRITE(B)先于P2|WRITE(A)可见，那么就可以认为P1的写操作发生了reorder。对读操作也是类似的。

影响memoryordering的因素很多，包括：

体系结构，X86和ARM的memory ordering就截然不同；
内存的类型，体系结构一般都会定义若干种内存类型，不同的内存类型有不同的memoryordering，比如X86分为Strong Uncacheable (UC)、Uncacheable (UC-)、Write Combining (WC)、Write Through (WT)、Write Back (WB)和Write Protected (WP)，而ARM的内存类型用memory type和memory attribute来描述，不同的内存类型通常对应了不同的用途(具体情况见对应的厂商文档)。本文描述的是一般情况，也就是不做特殊处理，直接通过内存分配接口分配到的内存，也就是X86的WB类型，ARM的Shareable Normal memory。
具体的指令，比如INTEL的REP MOVSB和REP STOSB的memory ordering就和一般的mov指令不一样。除非特别说明，而本文描述的是普通的内存访问指令，通常是C语言的赋值语句对应的汇编指令。

和前面描述SC的时候一样，X、Y、Z表示变量，初始值都为0，P1 P2表示processor，R(X)=1表示从X中读到了值1，W(X)=1表示向X中写入了值1。P1|R(X)=1表示P1执行R(X)=1。符号A->B表示动作A先于动作B发生。

X86的memory ordering

X86的memory ordering属于strong order，其与SC的要求接近，在大多数典型场景，没有必要使用memory barrier指令。即使是和外设的DMA操作共享的内存，X86也能通过bus snoop完成强顺序保证(查看linux内核分配一致性内存的接口dma_alloc_coherent，你会发现尼玛就是分配内存咯，并没有设置页表的PWT/PCD标识，也没有设置Memory type range registers(MTRRs))。

普通内存操作

X86实现的memory ordering比较接近SC的要求，其违反SC的场景是：读操作可能和按照program order中在前面的对不同地址的写操作发生reorder，也就是读操作先于program order在其前面的对其他地址的写操作对外生效。注意：这里仅限于对不同地址的读和写。

也就是以下执行在X86上是可以发生的，但是并不满足SC的要求：

P1: W(X)=1，R(Y)=0

P2: W(Y)=1，R(X)=0

本例子明显不符合SC的要求，因为如果P1|R(Y)=0，那么必然有P1|R(Y)=0 –> P2|W(Y)=1

结合SC按照program order生效的要求，很容易得到P1|W(X)=1 -> P2|R(X)=0的悖论。

而X86允许读操作先于按照program order在其前面的写操作对外生效，P1|W(X)=1 -> P1|R(Y)=0不一定成立,使得上面的序列在X86上变得合法。

以上执行序列可以看成是X86的write buffer对程序员的体现，write buffer是CPU上的一个部件，当一个写操作由于种种原因不能立即放到cache/内存中的时候，CPU可以先把它放到本CPU的write buffer中，后续再刷新到内存中，这个write buffer只对本CPU可见。这就造成对一个地址的写操作在本 CPU看来已经完成，但是对其它CPU还不可见，而CPU继续执行后续的读操作，在其它CPU看起来，就造成了读和先前的写发生了reorder。

Memory barrier指令

X86的memory barrier指令包括lfence sfence mfence，这些指令通常在使用内存模型（比如Write Combining的操作），特殊的指令(REP MOVSB 和REP STOSB)才需要关注。

lfence

lfence确保program order在其前面的读不会和program order在其后面的读和写发生reorder，也就是lfence前面的读操作总是比lfence后面的读操作和写操作先生效。
sfence

sfence确保program order在其前面的写不会和program order在其后面的写发生reorder，也就是sfence前面的写操作总是比sfence后面的写操作先生效
mfence

mfence确保program order在其前面的写和写不会和program order在其后面的读和写发生reorder，也就是sfence前面的读操作和写操作总是比sfence后面的读操作和写操作先生效

隐含的memor barrier指令

serializing instructions、I/O instructions、locked instructions，这些指令会可以产生和mfence类似的附加效果。其中

serializinginstructions一般关心的主要就是IRET指令(还有一些比如LGDTLIDT，一般的用户基本不会接触到，详细的列表可以从INTEL的文档中找到)，也就是硬中断完成的时候CPU自动执行的指令。
I/Oinstruction是用于访问外设的IN和OUT指令。
lockedinstructions是带LOCK前缀的指令，这些指令通常用于完成原子操作。

ARM的memory ordering

ARM的memory order属于weak order，与SC差距极大。如果涉及到免锁设计，对ARM体系结构， memorybarrier的使用是不可避免的。

ARM的memory order和对应内存的memory type、Shareability domain紧密相关，memory type用页表(page descriptor)中的memory attributes index field来描述，Shareability domain通过Shareability field来描述。其中memory type可以分为Normal和device，这里描述的是Normal memory，也是我们通常使用的内存，device memory通常是外设映射的register，不是我们讨论的对象。Shareability domain包括Non-shareable(NSH)、Inner Shareable(ISH)、Outer Shareable(OSH)、Full system(SY),通常情况下ISH对应一个OS管理的processor，OSH除了ISH外通常还包含外设映射的内存，full system则指的是整个系统(这些概念我不是很清晰，看起来是为虚拟化准备的？)。LINUX系统没有区分这些，统统使用SY。

普通内存操作

对相同内存地址的操作

不同processor对相同地址的操作相关的一致性，被称为coherence，由cache的相关机制来保证，ARM体系中其在memory ordering上有以下特征：

对相同地址的写操作符合SC的要求，具有全局一致性；也就是所有的写操作体现出全局一致的顺序。
相同processor对相同地址的读操作对外体现的顺序和program order一致。

例：

X的初始值为0

T1: W(X)=1

T2:R(X)=1,R(X)=0

以上的序列是不可能出现的，因为在T2中，由于规则2，有T2|R(X)=1 -> T2|R(X)=0，按照规则1，X对所有processors体现的值的顺序应该是0，1，不可能先读到1，然后读到0。

注意：ARM不保证对同一地址的读操作和写操作之间也对其它processor可见的顺序也和programorder一致，也就是在其它processor看来，可能发生乱序。

X和Y的初始值都是0

T1: W(X)=1，R(X)=1, [address dependency],W(Y)=1

T2: R(Y)=1，[address dependency],R(X)=0

address dependency是地址依赖（后面有详细描述）以上的序列是允许的，因为T1|W(X)=1和T1|R(X)=1自己对T2的可见顺序上是没有保证的。可能T1|W(X)=1在T1|R(X)=1完成后很久才传播到T2。

对不同内存地址的操作

除了存在特殊情况，对ARM系统，我们可以认为内存操作可以按照任何顺序对其他processor可见，也就是以任何顺序reorder。这里说的特殊情况，包括后续描述的存在特殊指令和存在依赖关系的内存操作。

例子：

P1: W(X)=1 ，W(Y)=1

P2: R(Y)=1 ，R(X)=0

对于X86,以上的执行序列是不允许的，因为X86的写操作之间不能reorder，读操作之间也不能reorder，P2|R(Y)=1意味着P1|W(Y)=1 -> P2|R(Y)=1，根据X86的要求，有P1|W(X)=1->P1|W(Y)=1 ,和P2|R(Y)=1->P2|R(X)=0，也就是：P1|W(X)=1 -> P2|R(X)=0，这显然是不合法的，因此是不允许的。

而对ARM，如上描述，其运行读操作之前reorder，也允许写操作之间reorder，那么无论是写的reorder使得P1对P2体现的执行序列为: P1|W(Y)=1 -> P2|R(X)=1还是读的reorder使得P2对P1体现的执行序列为：P2|R(X)=0->P2|R(Y)=1，都会允许例子中的序列发生。

需要注意的是：通过汇编方式，对寄存器的重用不会使得内存操作对其它processor变得有序，例子：

R3=X , R1=R3, R3=Y

其中R1和R3为寄存器，X和Y为共享变量。R3=X表示使用汇编把共享变量X读入寄存器R3。以上序列读取X和Y的时候重用了寄存器R3，这种重用不会确保在其它processor看来，对X的读入先于对Y的读入，也就是在其它processor看来，对Y的读入可能先于对X的读入。
写操作不保证全局顺序的一致性（就更不是multi-copy atomic的了），也就是对于processor A W(X)=1先于W(Y)= 2生效，其它的processor可能看到的是相反的顺序。而对比X86，X86是保证写操作的全局一致性的。

T1: W(X)=1

T2: R(X)=1, W(Y) =1

T3: R(Y)=1, R(X) =0

已经明确（T2读到了X的值为1）对T2有如下的内存操作顺序T1|W(X)=1 -> T2|R(X)=1 T2|R(X)=1->T2|W(Y) =1(比如T2和T3的读操作和后续的写操作之间存在address dependency)，并不能认为对其它processor有内存操作顺序T1|W(X)=1-> T2|W(Y) =1的存在。X86是保证写操作顺序可传递和全局一致的。
如果一个写操作(包括写的地址、写下去的值)在程序的单线程顺序执行中不会出现，那么ARM保证在并发环境其也就不会对其他processor可见。这其实就规定了如果一个写操作与之前的读操作存在依赖关系(数据依赖、地址依赖、控制依赖)，这个读操作和写操作对其他processor以program order可见。

有依赖关系的内存操作

Address Dependency

如果一个读操作获取到的值被用来计算后续内存操作的地址，无论获取到的值是否改变了后续的内存操作的地址，这个读操作和这些的内存操作都存在Address Dependency。存在Address Dependency的读操作和其后对应内存操作，对所有processor可见的顺序和program order一致，也就是不会reorder。

比如：

r1=y
r3=(r1 xor r1)//运算不会改变r2=*(&x+ r3)中的实际地址，但是仍然构成addressdependency
r2=*(&x + r3)

虽然r3=(r1 xorr1),得到的r3始终为0，不会影响r2=*(&x + r3)，但是仍然构成了address dependency，这被称为artificial dependency。不过需要说明的是：这里是为了方便说明使用了C语句，如果你想用C语言直接这样写，绝大多数编译器会识别出r3=(r1 xor r1) 这个运算不会改变r2=*(&x + r3)中的地址，而优化掉这个操作，就不能达到构造一个addressdependency的目的。如果实在需要，只能使用嵌入式汇编了：

LDR R0,[R4]
STR R0,[R2] EOR R1,R0,R0
DMB LDR R2,[R1,R3]

address dependency还有一个作用：对于有依赖关系的读操作和写操作，该写操作之后的其它内存操作不能在该写操作的地址读取完成前执行，因为由于不清楚该写操作要操作的地址，是否和后续的内存操作的地址一致，故必须等待该写操作的地址确定后才能继续执行

Control Dependency

如果一个读操作读取的值被用于后续的条件判断，那么该读操作和条件判断操作之后的内存操作存在control dependency，无论后续的内存操作是不是受条件判断的影响，无论其是否处于条件判断产生的一个分支。比如：

a = READ(X);//局部变量a为读取全局量X的值

if(a == 1){

b = READ(Y);

}

WRITE(Y) = 1;

其中的读操作READ(X)与读操作READ(Y)形成了control dependency，也和写操作WRITE(Y)=1形成了control denpendency(尽管WRITE(Y) = 1是否执行不受读取出的之影响)。同时和address dependency一样，是否形成control dependency不受读取的值是否改变了条件判断的结果的影响。

对于产生了controldependency的读操作和后续的写操作，对所有processor可见的顺序和program order一致，也就是不会reorder，这一点可以和ARM官方文档中的“Writesthat would not occur in a simple sequential execution of the program cannot beobserved by other observers.”对应。。注意：只有对于获取用于条件计算的值的读和后续的写操作才能确保操作顺序，对于获取用于条件计算的值的读和后续的读操作是不行的。

Data Dependency

如果一个读操作获取的值被用于后续的写操作写入的值的计算，那么这个读操作和后续的写操作就存在data dependency，且读操作先于写操作对所有的processor生效。和Address dependency、Control dependency一样，读操作读取的值只要用于了待写入值的计算，无论是否改变了结果，data dependency都成立。

a = READ(X);//局部变量a为读取全局量X的值

WRITE(Y) = a XOR a + 1;

其中写到Y的值的计算用到了READ(X)读到的值，经过该值并不会影响写入到Y中的值，data dependency依然成立，READ(X)和WRITE(Y)不会乱序。

总结

以上的依赖关系，只存在于读操作以及特定模式的后续操作中，写操作和后续的操作不存在依赖关系。

特殊指令(包括barrier)

以下描述DMB和DSB指令都有两个属性(参数)，用来表达该barrier生效的Shareability Domain ( NSH表示Non-shareable、ISH表示Inner Shareable、OSH表示Outer Shareable、SY表示Full system，缺省是SY)和内存操作类型(LD表示读操作，ST表示写操作，缺省表示读写操作)，比如DMB ISHST 表示对Inner Shareability Domain的读写操作生效，如果单单使用DMB，表示对整个系统的读写操作都生效，在linux系统中，只单独使用DMB，没有带参数。

以下的描述中PEe指的执行barrier指令的processor，PEx/PEy指的是任意的processor

DMB指令

DMB(Data memory barrier)指令用来实现内存栅，它把内存操作分成两部分：group A和group B

group A：所有在DMB指令之前已经对PEe可见的所有内存操作(当然就包含了PEe中program order上在该DMB指令之前的内存操作)；以及processorPEx在执行group A中内存操作执行之前对PEx可见的所有内存操作。

group B：所有PEe中按照programorder在DMB之后的内存操作；以及其它processor中需要读取到group B中的写操作的写入值后才会执行的内存操作（没太明白，这里说的其实是controldependency?）。

DMB指令保证，对所有的processor，group A中的内存操作先于group B中的内存操作可见(生效)。按照reorder的方式理解就是：group A中的内存操作不会与group B中的内存操作发生乱序。

注意：按照以上的描述，即使是使用DMB指令，也无法实现multi-copyatomic，因为其保证的是内存操作对同一个processor生效的相对顺序，对内存操作在不同processor之间的生效顺序是无保障的。

使用DMB——简单场景：

P1: W(X)=1，DMB，W(Y)=1

P2: R(Y)=1，DMB，R(X)=0

使用DMB——cumulative场景：

这也是ARM不能保证写操作顺序全局一致性的典型例子。

X Y的初始值都是0

T1: W(X)=1

T2: R(X)=1, [artificial address dependency]R(Y) =0

T3:W(Y)=1

T4:R(Y)=1,[artificial address dependency]R(X) =0

对于RAM，以上的系列是可能的，也就是T1和T3对X和对Y的写操作，对T2和T4呈现出不同的可见顺序(注意：artificialaddress dependency已经确保了读操作不会乱序),对T2，W(X)=1先发生，而对T4,W(Y)=1先发生。为了确保W(X)和W(Y)对T2和T4体现一样的顺序，可以采用：

T1: W(X)=1

T2: R(X)=1, DMB,R(Y)=0

T3:W(Y)=1

T4:R(Y)=1, DMB, R(X)=0

这样的话，以上的序列就是不可能出现的。由于T2读到了X为1，因此，对T2,T1|W(X)=1 -> T2|R(X)=1，按照DMB的语义，对所有processor（包括T4/T2）：T1|W(X)=1 -> T2|R(Y)=0；同样可以得到对所有的processor（包括T2/T4）: T3|W(Y)=1 -> T4|R(X)=0，这是不可能的,因为：T4|R(X)=0，那么对T4,必然有T4|R(X)=0 –> T1|W(X)=1，就是上面的三个关系需要对T4都成立，于是对T4：T3|W(Y)=1->T4|R(Y)=0(DMB) ->T4|R(X)=0 –> T1|W(X)=1->T2|R(Y)=0，按照DMB的要求对所有processor：T3|W(Y)=1->T2|R(Y)=0，对T2来讲，这是不可能的。

DMB能够保证以上序列不出现的关键在于：DMB不仅保持了本processor内部的操作对外的可见顺序，也保证了DMB之前对该processor可见的其他操作对外的可见顺序。这个区别于各种依赖关系的特性，被称为cumulative

DSB指令

DSB指令保证：在执行DSB指令前对PEe生效的内存操作，在DSB指令执行完成前对其它processor生效。program order中在DSB指令之后指令只能在DSB指令完成后才能开始执行

Load acquire-Store release

这两个指令通常用来实现原子操作，其功能和X86的XCHG(CAS,compare and swap)指令类似（不同的是，其没有ABA问题），对于ARM环境，内核采用该指令实现原子操作、互斥原语。

Load acquire-Store release作用的Shareability Domain为Load acquire和Store release指令指定的地址所在的Shareability Domain。
Load acquire-Store release对所有的memory type生效。
Load acquire和紧跟的Store release指令按照program order对其它PE可见(也就是对所有PE，总有Load acquire->Store release)。
Load acquire是一个读操作，该读操作先于按照program order在其之后的读写操作对所有processor生效。
Store release是一个写操作，该写操作后于按照program order在其之前读写操作对所有processor生效。在PEe(执行Store release的PE)执行Store release前对PEe可见的写操作，对其它PE都在Store release的写操作之前生效。只有在Store release要写入的地址在对应的Load acquire之后没有被写入过，Store release才会成功(允许对其它非Load acquire preserve的地址的写操作)，只有成功的Storerelease才有以上的memoryordering特性。
Store release的写操作是multi-copy atomic的，也就是如果其对一个PE生效，那么其对所有的PE生效。

一些资料上认为Loadacquire-Store release可以完全取代DMB指令，这是不对的，因为Loadacquire-Store release保证这两个指令之间的读写不会“外泄”，却无法保证两个指令之外的指令不会入侵，这一点，看看内核atomic64_sub_return就明白了:

static inline u64 atomic64_add_return(u64i, atomic64_t *v)

{

u64result;

unsignedlong tmp;

smp_mb();

__asm____volatile__("@ atomic64_add_return\n"

"1: ldrexd %0, %H0, [%3]\n"

" adds%0, %0, %4\n"

" adc %H0, %H0, %H4\n"

" strexd %1, %0, %H0, [%3]\n"

" teq %1, #0\n"

" bne 1b"

:"=&r" (result), "=&r" (tmp), "+Qo"(v->counter)

:"r" (&v->counter), "r" (i)

:"cc");

smp_mb();

returnresult;

}

DMB vs依赖关系

DMB和依赖关系(address dependency/control dependency/data dependency)的差别在于其影响的内存操作的范围：

address dependency/control dependency/data dependency能确保顺序的内存操作的是本processor上和依赖相关的读操作和其后对应的内存操作(addressdependency是需要使用读取到的值计算地址的读写操作，control dependency是使用读取的值作条件判断的判断语句之后的写操作，data dependency是使用读取到的值作为写入值的写操作)，影响的范围不会波及本processor上的其它内存操作，更加不会影响其它processor上的内存操作的顺序。
依赖关系仅仅存在与读操作和后续的其它内存操作之间，写操作和后续的内存操作之前不存在类似的关系。
DMB等barrier指令影响的内存操作的范围比依赖关系要大，在本processor上，其会影响program order上在DMB指令前后的所有指令；同时其还具有积累/传递效应，可以影响到其它processor上的内存操作(比如其他CPU上所有对DMB的执行processor生效的操作)。

例1：

X Y Z的初始值都是0

T1: W(X)=1

T2: R(X)=1, [artificial address dependency]W(Y) =1

T3: R(Y)=1, [artificial address dependency]R(X) =0

其中的artificialaddress dependency就是故意制造的address dependency，确保了读操作和后面的写操作之间不会乱序。

T1: W(X)=1

T2: R(X)=1, DMB, W(Y) =1

T3: R(Y)=1, [artificial address dependency]R(X) =1

这样，T3|R(X)=0就不会出现了，因为DMB指令确保了：对(共享域内)所有的processor，DMB之前对T2可见的内存操作先于DMB之后的内存操作可见。T2|R(X)=1表明T1|W(X)=1在DMB指令之前已经对T2可见，因此对所有processor，包括T3，有T1|W(X)=1 -> T2|W(Y)=1；且T3|R(Y)=1表明对T3, T2|W(Y)=1 -> T3|R(Y) =1, address dependency确保了T3|R(Y)=1 -> T3|R(X)=1，因此对T3, T1|W(X)=1->T3|R(X) 很明显不可能出现T3|R(X)=0。

可见依赖关系能够确保的只是当前processor内的内存操作对外的可见顺序，涉及到其它processor的就无能为力，而DMB等内存栅指令能够做到这一点。

从CPU的结构上理解我们可以认为ARM的写操作propagate到各个CPU核心上的顺序是不确定的，address dependency只关注本CPU核心的执行顺序，不会影响到这个扩散顺序，而DMB指令则能够保证内存操作扩散顺序的一致性。

你可能感兴趣的:(linux内核)

linux内核路由子系统,深入理解Linux网络技术内幕——路由子系统的概念与高级路由... 罗心澄 linux内核路由子系统
本文讨论IPv4的路由子系统。(IPv6对路由的处理不同)。基本概念路由子系统工作在三层，用来转发入口流量。路由子系统主要设计路由器、路由、路由表等概念。路由器：配备多个网络接口卡(NIC)，并且能利用自身网络信息进行入口流量转发的设备。路由：流量转发，决定目的地的过程路由表：转发信息库，该库中储存路由需要本地接收还是转发的信息，以及转发流量时所需要的信息。(即，信息库用来判断，要不要转发，如果要
深度剖析linux内核万能--双向链表,Hash链表模版 Engineer-Bruce_Yang C语言-算法与数据结构编程 C语言在开发中的应用
我们都知道，链表是数据结构中用得最广泛的一种数据结构，对于数据结构，有顺序存储，数组就是一种。有链式存储，链表算一种。当然还有索引式的，散列式的，各种风格的说法，叫法层出不穷，但是万变不离其中，只要知道什么场合用什么样的数据结构，那就行了。那么，标题说的内核万能链表，其实就是内核链表，它到底和我们平常大学学的数据结构的链表有什么不同呢？？内核链表，是在linux内核里的一种普遍存在的数据结构，比如
Linux内核中的数据结构与算法（三）哈希链表木木0o0欧尼 Linux 链表数据结构 linux
四，哈希链表谈到链表就不得不谈Linux内核中另外一个重要的结构，哈希链表。讨论这个结构前，你需要对哈希的最基本的概念要清楚哦，由于我们已经讲过Linux内核中的普通链表的结构，这里我们对比他们的区别来了解哈希链表会直观一些。Linux链表认为双指针表头双循环链表对于HASH表来说过于浪费，因而设计了一套用于HASH表的hlist的数据结构，单指针表头双循环链表。hlish表头仅有一个指向首节点的
Linux内核网络源码分析——发送数据 hellolwl Android/Linux linux内核网络 struct output socket constructor
原文地址:http://www.penna.cn/blog/?p=218UDP发送：|sys_writefs/read_write.c|sock_writevnet/socket.c|sock_sendmsgnet/socket.c|inet_sendmsgnet/ipv4/af_inet.c|udp_sendmsgnet/ipv4/udp.c|ip_build_xmitnet/ipv4/ip_o
编译乱序 vs 执行乱序三境界操作系统 linux 驱动开发
背景今天留意了一下linux内核对writel和readl的实现，涉及到了dmb，imb这类屏障指令，过去对这类机制的了解比较模糊，所以查阅了一些资料，做一下记录。#if__LINUX_ARM_ARCH__>=7#defineisb(option)__asm____volatile__("isb"#option:::"memory")#definedsb(option)__asm____volat
Docker 容器基础技术：namespace 寻雾&启示 docker 容器运维
在容器内进程是隔离的，比如容器有自己的网络和文件系统，容器内进程的PID为1，这些都是依赖于Linuxnamespace所提供的隔离机制。本篇我们来了解下Linux有哪些namespace，以及它们是如何实现隔离的。文中案例代码均由ChatGPT生成，在Linux内核5.15.0-124-generic，ubuntu22.04LTS系统上测试通过。namespace类型每个进程都有自己所属的nam
Linux内核同步机制之（八）：mutex ikt4435 程序员编程 Java 架构 java spring mysql
一、Mutex锁简介在linux内核中，互斥量（mutex，即mutualexclusion）是一种保证串行化的睡眠锁机制。和spinlock的语义类似，都是允许一个执行线索进入临界区，不同的是当无法获得锁的时候，spinlock原地自旋，而mutex则是选择挂起当前线程，进入阻塞状态。正因为如此，mutex无法在中断上下文使用。和mutex更类似的机制（无法获得锁时都会阻塞）是binarysem
Linux内核网络设备注册与地址族协同机制深度解析 109702008 #C语言编程网络网络人工智能 c语言
在Linux网络子系统中，网络设备注册与地址族（AddressFamily）的协同工作机制是构建高性能网络应用的核心基础。本文将以IPoIB（InfiniBandoverIP）驱动为例，深入解析register_netdev函数在设备注册中的作用，地址族的选择对网络通信的影响，以及如何通过自定义协议实现灵活的网络控制。一、网络设备注册机制解析1.1register_netdev的核心作用regis
Qt上位机编程命名规范-执行版有追求的菜鸟 qt 开发语言
主要规范原则参考Qt上位机编程命名规范。1.文件/文件夹大小写分析考虑跨平台性，全小写是一种约定俗成的风格，在许多大型开源项目中（如Linux内核、Python标准库）被广泛使用。1.1.配合文件扩展名通常文件名小写配合小写扩展名（如.h,.cpp,.json），使整体风格统一：main.cppconfig.jsonutils.h1.2.文件夹和pri文件命名通常小写、下划线分开：control_
LInux内核学习 -- perCPU变量 lagransun linux 学习运维
文章目录环境关于perCPU变量perCPU变量：__entry_task环境linux4.19关于perCPU变量percpu变量的介绍，这位老哥做了介绍，包括为什么要有这样的变量以及优势：linux内核之Per-CPU变量，我把这个老哥的总结复制下来：通过Per-cpu变量除了可以分配内存，还有一个最大的好处就是不需要考虑同步。最好的同步技术就是把不需要同步的内核放在首位，因为每种显示的同步原
Linux内核学习之 -- epoll()一族系统调用分析笔记 lagransun linux 学习笔记
背景linux4.19epoll()也是一种I/O多路复用的技术，但是完全不同于select()/poll()。更加高效，高效的原因其他博客也都提到了，这篇笔记主要是从源码的角度来分析一下实现过程。作为自己的学习笔记，分析都在代码注释中，后续回顾的时候看注释好一点。相关链接：Linux内核学习之–ARMv8架构的系统调用笔记Linux内核学习之–系统调用open()和write()的实现笔记Lin
Android 和 Linux 之间关联和区别测试也是会开发的 android linux 运维
1.核心：基于Linux内核底层依赖：Android的核心系统服务（如进程管理、内存管理、硬件驱动等）依赖于Linux内核。Android使用Linux内核的修改版本（如AndroidCommonKernel），并针对移动设备的特性（电源管理、低内存优化等）进行了定制。开源协议：Linux内核采用GPL协议，因此Android对内核的修改必须开源（厂商发布的Android设备内核代码需公开）。2.
Linux内核srio驱动,Zynq—Linux移植学习笔记（十四）：RapidIO驱动开发 weixin_39942572 Linux内核srio驱动
#defineDRIVER_NAME"xiic-rio"#defineSRIO_ZYNQ_BASEADDR0x40000000#defineSRIO_ZYNQ_NODE_BASEADDR0x10100#defineSRIO_ZYNQ_MAX_HOPCOUNT13structxiic_rio{structmutexlock;u8*data;};/*Weneedglobalvarriableforma
Docker下载，包含Win、Mac 码码哈哈0.0 实用工具 docker 容器运维
介绍Docker是一种开源的容器化平台，通过操作系统级虚拟化技术实现应用的快速开发、部署和运行。以下从多个维度对Docker进行详细介绍：一、Docker的核心概念与功能容器化技术Docker利用Linux内核的容器隔离技术（如Cgroups和Namespace），将应用及其依赖打包为轻量级、可移植的容器。容器与虚拟机不同，它无需模拟完整操作系统，而是共享主机内核，因此启动更快、资源占用更低。核心
Linux系统移植篇（七）Linux 内核kernel 启动流程 7yewh 【Linux 系统移植】linux 运维服务器驱动开发
链接脚本vmlinux.lds要分析Linux启动流程，同样需要先编译一下Linux源码，因为有很多文件是需要编译才会生成的。首先分析Linux内核的连接脚本文件arch/arm/kernel/vmlinux.lds，通过链接脚本可以找到Linux内核的第一行程序是从哪里执行的。（跟Uboot启动流程的ids一样）492OUTPUT_ARCH(arm)493ENTRY(stext)494jiffi
tiny linux: 内核精简的根文件系统制作 SunliyMonkey 一一『操作系统』tiny linux qemu busybox 根文件系统
tinylinuxtiny_linux要求实现以下两点：精简linux内核镜像，要求在支持TCP/IP数据传输的情况下，内核镜像和正常运行所需内存能够做到尽可能的小。采用busybox制作根文件系统，利用kernelmodelinux补丁，使得busybox运行在内核态。欢迎访问tiny_linux,这里有编译好的内核镜像，根文件系统镜像以及相关脚本，供大家使用。涉及知识点qemu使用linux内
linux内核mmap映射区域 fantasy_arch linux 服务器数据库
当用户使用malloc申请大于128KB的堆内存时，内存分配器会通过mmap系统调用，在linux进程虚拟空间中直接映射一片内存给用户使用，这片使用mmap映射的内存区域比较神秘。当我们运行一个程序时，需要从磁盘上将该可执行文件加载到内存。将文件加载到内存有两种常用的操作方法，一种是通过常规的文件I/O操作，如read/write等系统调用接口，一种是使用mmap系统调用将文件映射到进程的虚拟空间
Ubuntu 将更改版本规则，使用最新内核发布发行版 CIb0la 树莓派运维程序人生 ubuntu linux
众所周知，Canonical开发的Ubuntu发行版每半年发布一个新版本，而Linux内核却是大约每2-3个月发布一个新版本。这导致一个问题，Ubuntu发行版永远使用的不是最新内核。因为按照Ubuntu的开发周期，Ubuntu开发阶段选择使用的版本到正式发布时肯定已经落后于上游的最新稳定版本。现在CanonicalKernelTeam(CKT)宣布将改变内核选择方法，即在发布冻结日期时采用最新可
Linux内核--进程管理(十一)多核下的负载均衡文艺小少年 CPU性能分析与操作系统的构建 linux 负载均衡运维
目录一、引言二、调度机制介绍------>2.1、线程的多核运行------>2.2、RT进程多核负载均衡------>2.3、普通进程多核负载均衡------>2.4、设置CPUtaskaffinity三、中断负载均衡、RPS软中断负载均衡四、linux非实时系统------>4.1、优化措施一、引言本文延续前一章的内容，介绍调度器的其他内容：关于多核、分群、硬实时二、多核下的负载均衡tips:
嵌入式Linux网络编程实战：基于DNS解析的HTTP客户端实现银河码 Linux网络编程网络 linux http c语言 windows vscode json
嵌入式Linux网络编程实战：基于DNS解析的HTTP客户端实现【本文代码已在树莓派4B（Linux内核5.10）平台验证通过，适用于物联网设备数据上报等场景】一、需求场景与功能亮点1.1典型物联网通信场景嵌入式设备DNS服务器云服务器域名解析请求返回目标IP发送传感器数据返回HTTP响应嵌入式设备DNS服务器云服务器1.2代码核心功能DNS智能解析：支持域名自动转换为IPv4地址协议合规性：严格
linux的防火墙（iptables） JM丫 linux centos
防火墙的作用：linux防火墙主要是工作在网络层，针对TCP/IP数据包实施过滤和限制，属于典型的包过滤防火墙（或者为网络层防火墙）linux的防火墙分为两种，分别为netfiter和iptables，这两种都被称为防火墙，但是又有一些区别，具体的区别在于：1、netfilter：称为内核空间，是linux内核中实现包过滤的防火墙的内部结构，属于“内核态，又称为内核空间”防火墙功能体系。2、ipt
【Android】adb shell基本使用教程 Vesper63 android adb
adbshell是AndroidDebugBridge(ADB)工具中的一个命令，用于在连接的Android设备或模拟器上执行shell命令。通过adbshell，你可以直接与设备的Linux内核交互，执行各种操作。基本用法启动adbshell：在终端或命令提示符中输入以下命令：adbshell这将进入设备的shell环境，提示符通常会变为$或#（#表示root权限）。执行单个命令：如果你只想执行
Linux中断机制详解：从原理到实践 AllenBright #Linux linux 运维服务器
想象一下医院的急诊科：当有危重病人到达时，护士会立即按下紧急呼叫按钮，打断医生当前的常规工作，优先处理最紧急的情况。这种中断响应机制正是计算机系统中中断（Interrupt）的核心思想。在Linux内核中，中断是硬件与软件交互的核心机制，直接关系到系统的响应速度、吞吐量和稳定性。本文将深入剖析Linux中断的工作原理，并演示如何在实际操作中管理和优化中断。1.中断的本质与分类1.1什么是中断？中断
浅谈Linux中的Shell及其原理有梦想的电信狗 linux 服务器 ssh unix 开发语言 c语言 c++
浅谈Linux中的Shell及其原理Linux中Shell的运行原理github地址前言一、Linux内核与Shell的关系1.1操作系统核心1.2用户与内核的隔离二、Shell的演进与核心机制2.1发展历程2.2核心功能解析2.3shell的工作流程1.用户输入命令2.解析器拆分指令3.扩展器处理动态内容变量替换通配符扩展命令替换4.执行器运行命令5.内核处理系统调用6.返回结果关键组件协作三、
Linux驱动开发IO操作之阻塞与非阻塞暗夜之眼007 Linux驱动驱动开发
阻塞IO当应用程序通过read读取或write写入设备文件的某些数据时，就会调用驱动程序的read或者write函数，此时可能会遇到没有数据可读或者写满的情况，这时如果驱动程序会进入睡眠，当有数据可读或者可写的时候唤醒再返回，我们称这种操作为阻塞IO。下图是阻塞式IO访问示意图：阻塞IO相关函数init_waitqueue_head函数init_waitqueue_head‌是Linux内核中用于
嵌入式面试真题——Linux内核空间与用户空间 70000cc 嵌入式面试真题 linux c语言嵌入式硬件面试单片机
本文以32位系统为例介绍内核空间(kernelspace)和用户空间(userspace)。对32位操作系统而言，它的寻址空间（虚拟地址空间，或叫线性地址空间）为4G（2的32次方）。也就是说一个进程的最大地址空间为4G。操作系统的核心是内核(kernel)，它独立于普通的应用程序，可以访问受保护的内存空间，也有访问底层硬件设备的所有权限。为了保证内核的安全，现在的操作系统一般都强制用户进程不能直
Linux内核课程学习心得萝卜cherish linux 内核分析 linux内核学习总结
罗晓波+原创作品转载请注明出处+《Linux内核分析》MOOC课程http://mooc.study.163.com/course/USTC-1000029000不知不觉，八周课程一晃而过，回想起当初选择这门课到学习完最后一个课件，也是一个习惯的养成了，到现在我倒是习惯性地在周五和周日上一下课程主页，不过在这八周的线上课程学习中，我还是有所收获的，下面把我的一点小感想分享一下吧。课程第一周，通过一
Linux内核地址空间布局详解 Linux加油站 linux 网络
1.简介虽然x86_64的物理地址范围为64bit，但是因为地址空间太大目前不可能完全用完，当前支持57bit和48bit两种虚拟地址模式。地址模式单个空间用户地址空间内核地址空间32位2G0x00000000-0x7FFFFFFF0x80000000-0xFFFFFFFF64位(48bit)128T0x0000000000000000-0x00007FFFFFFFFFFF0xFFFF800000
Linux内核——遍历 net_device 结构唯独不开心 linux内核代码学习 net_device
linux内核版本：2.6.32dev_base_head,dev_list)#definefor_each_netdev_reverse(net,d)\list_for_each_entry_reverse(d,&(net)->dev_base_head,dev_list)#definefor_each_netdev_rcu(net,d)\list_for_each_entry_rcu(d,&(
Linux系统移植 —— Kernel编译、安装、开发 Fang- Linux学习笔记 linux 系统移植内核移植内核编译安装
=======================1Linux内核配置与编译=======================一、清除临时文件、中间文件、配置文件makeclean清除编译生成的文件，保留配置文件makemrproper清除编译生成的文件和配置文件makedistclean清除所有文件二、配置内核一般会以一个参考的配置文件（如：arch/arm/），在该文件基础上进行配置。makeconf
书其实只有三类西蜀石兰类
一个人一辈子其实只读三种书，知识类、技能类、修心类。知识类的书可以让我们活得更明白。类似十万个为什么这种书籍，我一直不太乐意去读，因为单纯的知识是没法做事的，就像知道地球转速是多少一样（我肯定不知道），这种所谓的知识，除非用到，普通人掌握了完全是一种负担，维基百科能找到的东西，为什么去记忆？知识类的书，每个方面都涉及些，让自己显得不那么没文化，仅此而已。社会认为的学识渊博，肯定不是站在
《TCP/IP 详解，卷1：协议》学习笔记、吐槽及其他 bylijinnan tcp
《TCP/IP 详解，卷1：协议》是经典，但不适合初学者。它更像是一本字典，适合学过网络的人温习和查阅一些记不清的概念。这本书，我看的版本是机械工业出版社、范建华等译的。这本书在我看来，翻译得一般，甚至有明显的错误。如果英文熟练，看原版更好： http://pcvr.nl/tcpip/ 下面是我的一些笔记，包括我看书时有疑问的地方，也有对该书的吐槽，有不对的地方请指正： 1.
Linux—— 静态IP跟动态IP设置 eksliang linux IP
一.在终端输入 vi /etc/sysconfig/network-scripts/ifcfg-eth0 静态ip模板如下： DEVICE="eth0" #网卡名称 BOOTPROTO="static" #静态IP（必须） HWADDR="00:0C:29:B5:65:CA" #网卡mac地址 IPV6INIT=&q
Informatica update strategy transformation 18289753290
更新策略组件：标记你的数据进入target里面做什么操作，一般会和lookup配合使用，有时候用0,1,1代表 forward rejected rows被选中，rejected row是输出在错误文件里，不想看到reject输出，将错误输出到文件，因为有时候数据库原因导致某些column不能update，reject就会output到错误文件里面供查看，在workflow的
使用Scrapy时出现虽然队列里有很多Request但是却不下载，造成假死状态酷的飞上天空 request
现象就是：程序运行一段时间，可能是几十分钟或者几个小时，然后后台日志里面就不出现下载页面的信息，一直显示上一分钟抓取了0个网页的信息。刚开始已经猜到是某些下载线程没有正常执行回调方法引起程序一直以为线程还未下载完成，但是水平有限研究源码未果。经过不停的google终于发现一个有价值的信息，是给twisted提出的一个bugfix 连接地址如下http://twistedmatrix.
利用预测分析技术来进行辅助医疗蓝儿唯美医疗
2014年，克利夫兰诊所（Cleveland Clinic）想要更有效地控制其手术中心做膝关节置换手术的费用。整个系统每年大约进行2600例此类手术，所以，即使降低很少一部分成本，都可以为诊所和病人节约大量的资金。为了找到适合的解决方案，供应商将视野投向了预测分析技术和工具，但其分析团队还必须花时间向医生解释基于数据的治疗方案意味着什么。克利夫兰诊所负责企业信息管理和分析的医疗
java 线程(一)：基础篇 DavidIsOK java 多线程线程
&nbs
Tomcat服务器框架之Servlet开发分析 aijuans servlet
最近使用Tomcat做web服务器，使用Servlet技术做开发时，对Tomcat的框架的简易分析：疑问：为什么我们在继承HttpServlet类之后，覆盖doGet(HttpServletRequest req, HttpServetResponse rep)方法后，该方法会自动被Tomcat服务器调用，doGet方法的参数有谁传递过来？怎样传递？分析之我见： doGet方法的
揭秘玖富的粉丝营销之谜与小米粉丝社区类似 aoyouzi 揭秘玖富的粉丝营销之谜
玖富旗下悟空理财凭借着一个微信公众号上线当天成交量即破百万，第七天成交量单日破了1000万;第23天时，累计成交量超1个亿……至今成立不到10个月，粉丝已经超过500万，月交易额突破10亿，而玖富平台目前的总用户数也已经超过了1800万，位居P2P平台第一位。很多互联网金融创业者慕名前来学习效仿，但是却鲜有成功者，玖富的粉丝营销对外至今仍然是个谜。　　近日，一直坚持微信粉丝营销
Java web的会话跟踪技术百合不是茶 url会话 Cookie会话 Seession会话 Java Web 隐藏域会话
会话跟踪主要是用在用户页面点击不同的页面时,需要用到的技术点会话:多次请求与响应的过程 1,url地址传递参数,实现页面跟踪技术格式:传一个参数的 url?名=值传两个参数的 url?名=值 &名=值关键代码
web.xml之Servlet配置 bijian1013 java web.xml Servlet配置
定义： <servlet> <servlet-name>myservlet</servlet-name> <servlet-class>com.myapp.controller.MyFirstServlet</servlet-class> <init-param> <param-name>
利用svnsync实现SVN同步备份 sunjing SVN 同步 E000022 svnsync 镜像
1. 在备份SVN服务器上建立版本库 svnadmin create test 2. 创建pre-revprop-change文件 cd test/hooks/ cp pre-revprop-change.tmpl pre-revprop-change 3. 修改pre-revprop-
【分布式数据一致性三】MongoDB读写一致性 bit1129 mongodb
本系列文章结合MongoDB，探讨分布式数据库的数据一致性，这个系列文章包括：数据一致性概述与CAP 最终一致性(Eventually Consistency) 网络分裂(Network Partition)问题多数据中心(Multi Data Center) 多个写者(Multi Writer)最终一致性一致性图表(Consistency Chart) 数据
Anychart图表组件-Flash图转IMG普通图的方法白糖_ Flash
问题背景：项目使用的是Anychart图表组件，渲染出来的图是Flash的，往往一个页面有时候会有多个flash图，而需求是让我们做一个打印预览和打印功能，让多个Flash图在一个页面上打印出来。那么我们打印预览的思路是获取页面的body元素，然后在打印预览界面通过$("body").append(html)的形式显示预览效果，结果让人大跌眼镜：Flash是
Window 80端口被占用 WHY? bozch 端口占用 window
平时在启动一些可能使用80端口软件的时候，会提示80端口已经被其他软件占用，那一般又会有那些软件占用这些端口呢？下面坐下总结： 1、web服务器是最经常见的占用80端口的，例如：tomcat , apache , IIS , Php等等； 2
编程之美-数组的最大值和最小值-分治法（两种形式） bylijinnan 编程之美
import java.util.Arrays; public class MinMaxInArray { /** * 编程之美数组的最大值和最小值分治法 * 两种形式 */ public static void main(String[] args) { int[] t={11,23,34,4,6,7,8,1,2,23}; int[]
Perl正则表达式 chenbowen00 正则表达式 perl
首先我们应该知道 Perl 程序中，正则表达式有三种存在形式，他们分别是：匹配：m/<regexp>;/ （还可以简写为 /<regexp>;/ ，略去 m）替换：s/<pattern>;/<replacement>;/ 转化：tr/<pattern>;/<replacemnt>;
[宇宙与天文]行星议会是否具有本行星大气层以外的权力呢? comsci
举个例子: 地球,地球上由200多个国家选举出一个代表地球联合体的议会,那么现在地球联合体遇到一个问题,地球这颗星球上面的矿产资源快要采掘完了....那么地球议会全体投票,一致通过一项带有法律性质的议案,既批准地球上的国家用各种技术手段在地球以外开采矿产资源和其它资源........ &
Oracle Profile 使用详解 daizj oracle profile 资源限制
Oracle Profile 使用详解转一、目的： Oracle系统中的profile可以用来对用户所能使用的数据库资源进行限制，使用Create Profile命令创建一个Profile，用它来实现对数据库资源的限制使用，如果把该profile分配给用户，则该用户所能使用的数据库资源都在该profile的限制之内。二、条件：创建profile必须要有CREATE PROFIL
How HipChat Stores And Indexes Billions Of Messages Using ElasticSearch & Redis dengkane elasticsearch Lucene
This article is from an interview with Zuhaib Siddique, a production engineer at HipChat, makers of group chat and IM for teams. HipChat started in an unusual space, one you might not
循环小示例，菲波拉契序列，循环解一元二次方程以及switch示例程序 dcj3sjt126com c 算法
# include <stdio.h> int main(void) { int n; int i; int f1, f2, f3; f1 = 1; f2 = 1; printf("请输入您需要求的想的序列："); scanf("%d", &n); for (i=3; i<n; i
macbook的lamp环境 dcj3sjt126com lamp
sudo vim /etc/apache2/httpd.conf /Library/WebServer/Documents 是默认的网站根目录重启Mac上的Apache服务这个命令很早以前就查过了，但是每次使用的时候还是要在网上查：停止服务：sudo /usr/sbin/apachectl stop 开启服务：s
java ArrayList源码下 shuizhaosi888 ArrayList源码
版本 jdk-7u71-windows-x64 JavaSE7 ArrayList源码上：http://flyouwith.iteye.com/blog/2166890 /** * 从这个列表中移除所有c中包含元素 */ public boolean removeAll(Collection<?> c) {
Spring Security（08）——intercept-url配置 234390216 Spring Security intercept-url 访问权限访问协议请求方法
intercept-url配置目录 1.1 指定拦截的url 1.2 指定访问权限 1.3 指定访问协议 1.4 指定请求方法 1.1 &n
Linux环境下的oracle安装 jayung oracle
linux系统下的oracle安装本文档是Linux(redhat6.x、centos6.x、redhat7.x) 64位操作系统安装Oracle 11g(Oracle Database 11g Enterprise Edition Release 11.2.0.4.0 - 64bit Production)，本文基于各种网络资料精心整理而成，共享给有需要的朋友。如有问题可联系：QQ：52-7
hotspot虚拟机 leichenlei java HotSpot jvm 虚拟机文档
JVM参数 http://docs.oracle.com/javase/6/docs/technotes/guides/vm/index.html JVM工具 http://docs.oracle.com/javase/6/docs/technotes/tools/index.html JVM垃圾回收 http://www.oracle.com
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” noaighost Web node.js
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” 眼里的Node.JS 初初接触node是一年前的事，那时候年少不更事。还在纠结什么语言可以编写出牛逼的程序，想必每个码农都会经历这个月经性的问题：微信用什么语言写的？facebook为什么推荐系统这么智能，用什么语言写的？dota2的外挂这么牛逼，用什么语言写的？……用什么语言写这句话，困扰人也是阻碍
快速开发Android应用 rensanning android
Android应用开发过程中，经常会遇到很多常见的类似问题，解决这些问题需要花时间，其实很多问题已经有了成熟的解决方案，比如很多第三方的开源lib，参考 Android Libraries 和 Android UI/UX Libraries。编码越少，Bug越少，效率自然会高。但可能由于根本没听说过、听说过但没用过、特殊原因不能用、自己已经有了解决方案等等原因，这些成熟的解决
理解Java中的弱引用 tomcat_oracle java 工作面试
　不久之前，我面试了一些求职Java高级开发工程师的应聘者。我常常会面试他们说，“你能给我介绍一些Java中得弱引用吗？”，如果面试者这样说，“嗯，是不是垃圾回收有关的？”，我就会基本满意了，我并不期待回答是一篇诘究本末的论文描述。　　然而事与愿违，我很吃惊的发现，在将近20多个有着平均5年开发经验和高学历背景的应聘者中，居然只有两个人知道弱引用的存在，但是在这两个人之中只有一个人真正了
标签输出html标签" target="_blank">关于标签输出html标签 xshdch jsp
http://back-888888.iteye.com/blog/1181202 关于<c:out value=""/>标签的使用，其中有一个属性是escapeXml默认是true(将html标签当做转移字符，直接显示不在浏览器上面进行解析)，当设置escapeXml属性值为false的时候就是不过滤xml，这样就能在浏览器上解析html标签， &nb