唐稚骅

Linux:sk_buff完全剖析与理解【转】

sk_buff

http://note.youdao.com/share/?id=7dce6efd7d8d96bf8f769f3427430023&type=note#/

1 sk_buff介绍

2 sk_buff组成

3 struct sk_buff 结构体

4 sk_buff成员变量

4.1 Layout布局

4.2 General通用

4.3 Feature-specific功能相关

5 sk_buff管理和操作函数

5.1缓冲区操作函数 skb_reserve skb_put skb_push skb_pull

5.2发送tcp报文示例

5.3 缓冲区分配、克隆和释放函数alloc_skb skb_clone pskb_copy skb_copy kfree_skb

1 sk_buff介绍

sk_buff（socket buffer）结构是linux网络代码中重要的数据结构，它管理和控制接收或发送数据包的信息。

2 sk_buff组成

Packet data：通过网卡收发的报文，包括链路层、网络层、传输层的协议头和携带的应用数据，包括head room,data,tail room三部分。

skb_shared_info 作为packet data的补充，用于存储ip分片，其中sk_buff *frag_list是一系列子skbuff链表，而frag[]是由一组单独的page组成的数据缓冲区。

Data buffer：用于存储packet data的缓冲区，分为以上两部分。

Sk_buff：缓冲区控制结构sk_buff。

整个sk_buff结构图如图1。

图1 sk_buff结构图

3 struct sk_buff 结构体

/* struct sk_buff - socket buffer */

struct sk_buff {

/* These two members must be first. */

struct sk_buff *next;

struct sk_buff *prev;

struct sock *sk;

struct skb_timeval tstamp; /* Time we arrived，记录接收或发送报文的时间戳*/

struct net_device *dev; /*通过该设备接收或发送，记录网络接口的信息和完成操作

struct net_device *input_dev; /*接收数据的网络设备

struct net_device *curlayer_input_dev;

struct net_device *_input_dev;

union {

struct tcphdr *th;

struct udphdr *uh;

struct icmphdr *icmph;

struct igmphdr *igmph;

struct iphdr *ipiph;

struct ipv6hdr *ipv6h;

unsigned char *raw;

} h; //传输层报头

union {

struct iphdr *iph;

struct ipv6hdr *ipv6h;

struct arphdr *arph;

unsigned char *raw;

} nh; //网络层报头

union {

unsigned char *raw;

} mac; //链路层报头

unsigned int len, //len缓冲区中数据部分的长度。

data_len, // data_len只计算分片中数据的长度

mac_len, //mac头的长度

csum; //校验和

__u32 priority;

__u8 local_df:1,

cloned:1, //表示该结构是另一个sk_buff克隆的

ip_summed:2,

nohdr:1,

nfctinfo:3;

__u8 pkt_type:3,

fclone:2,

ipvs_property:1;

__be16 protocol;

__u32 flag; /*packet flags*/

/* These elements must be at the end, see alloc_skb() for details. */

unsigned int truesize; //这是缓冲区的总长度，包括sk_buff结构和数据部分

atomic_t users;

unsigned char *head, //指向缓冲区的头部

*data,// 指向实际数据的头部

*tail, //指向实际数据的尾部

*end;//指向缓冲区的尾部

};

4 sk_buff成员变量

Sk_buff成员变量主要包括以下3类

1 Layout布局

2 General通用

3 Feature-specific功能相关

4.1 Layout布局

1 struct sk_buff *next, struct sk_buff *prev

有些sk_buff成员变量的作用是方便查找，或者是连接数据结构本身. 内核可以把sk_buff组织成一个双向链表。当然，这个链表的结构要比常见的双向链表的结构复杂一点。就像任何一个双向链表一样，sk_buff中有两个指针next和prev，其中，next指向下一个节点，而prev指向上一个节点。但是，这个链表还有另一个需求：每个sk_buff结构都必须能够很快找到链表头节点。为了满足这个需求，在第一个节点前面会插入另一个结构sk_buff_head，这是一个辅助节点，它的定义如下

sk_buff和sk_buff_head的前两个元素是一样的：next和prev指针。这使得它们可以放到同一个链表中，尽管sk_buff_head要比sk_buff小得多。另外，相同的函数可以同样应用于sk_buff和sk_buff_head。

图2

2 struct sock *sk

这是一个指向拥有这个sk_buff的sock结构的指针。这个指针在网络包由本机发出或者由本机进程接收时有效，因为插口相关的信息被L4（TCP或UDP）或者用户空间程序使用。如果sk_buff只在转发中使用(这意味着，源地址和目的地址都不是本机地址)，这个指针是NULL。

3 unsigned int len

这是缓冲区中数据部分的长度。它包括主缓冲区中的数据长度（data指针指向它）和分片中的数据长度。它的值在缓冲区从一个层向另一个层传递时改变，因为往上层传递，旧的头部就没有用了，而往下层传递，需要添加本层的头部。len同样包含了协议头的长度。

4 unsigned int data_len

和len不同，data_len只计算分片中数据的长度。

5 unsigned int mac_len

这是mac头的长度。

6 atomic_t users

这是一个引用计数，用于计算有多少实体引用了这个sk_buff缓冲区。它的主要用途是防止释放sk_buff后，还有其他实体引用这个sk_buff。因此，每个引用这个缓冲区的实体都必须在适当的时候增加或减小这个变量。这个计数器只保护sk_buff结构本身，而缓冲区的数据部分由类似的计数器(dataref)来保护。有时可以用atomic_inc和atomic_dec函数来直接增加或减小users，但是，通常还是使用函数skb_get和kfree_skb来操作这个变量。

7 unsigned int truesize

这是缓冲区的总长度，包括sk_buff结构和数据部分。如果申请一个len字节的缓冲区，alloc_skb函数会把它初始化成len+sizeof(sk_buff)。

8 unsigned char *head ，*end， *data， *tail

它们表示缓冲区和数据部分的边界。在每一层申请缓冲区时，它会分配比协议头或协议数据大的空间。head和end指向缓冲区的头部和尾部，而data和tail指向实际数据的头部和尾部，参见图3。每一层会在head和data之间填充协议头，或者在tail和end之间添加新的协议数据。图3中右边数据部分会在尾部包含一个附加的头部。

图3

9 void (*destructor)(...)

这个函数指针可以初始化成一个在缓冲区释放时完成某些动作的函数。如果缓冲区不属于一个socket，这个函数指针通常是不会被赋值的。如果缓冲区属于一个socket，这个函数指针会被赋值为sock_rfree或sock_wfree(分别由skb_set_owner_r或skb_set_owner_w函数初始化)。这两个sock_xxx函数用于更新socket队列中的内存容量。

4.2 General通用

本节描述sk_buff的主要成员变量，这些成员变量与特定的内核功能无关。

1 struct timeval tstamp

这个变量只对接收到的包有意义。它代表包接收时的时间戳，或者有时代表包准备发出时的时间戳。它在netif_rx里面由函数net_timestamp设置，而netif_rx是设备驱动收到一个包后调用的函数。

2 struct net_device *dev

这个变量的类型是net_device，net_device它代表一个网络设备。dev的作用与这个包是准备发出的包，还是刚接收的包有关。当收到一个包时，设备驱动会把sk_buff的dev指针指向收到这个包的设备的数据结构，就像下面的vortex_rx里的一段代码所做的一样，这个函数属于3c59x系列以太网卡驱动，用于接收一个帧。(drivers/net/3c59x.c)：

当一个包被发送时，这个变量代表将要发送这个包的设备。在发送网络包时设置这个值的代码要比接收网络包时设置这个值的代码复杂。有些网络功能可以把多个网络设备组成一个虚拟的网络设备(也就是说，这些设备没有和物理设备直接关联)，并由一个虚拟网络设备驱动管理。当虚拟设备被使用时，dev指针指向虚拟设备的net_device结构。而虚拟设备驱动会在一组设备中选择一个设备并把dev指针修改为这个设备的net_device结构。因此，在某些情况下，指向传输设备的指针会在包处理过程中被改变。

3 struct net_device *input_dev

这是收到包的网络设备的指针。如果包是本地生成的，这个值为NULL。对以太网设备来说，这个值由eth_type_trans初始化，它主要被流量控制代码使用。

4 struct net_device *real_dev

这个变量只对虚拟设备有意义，它代表与虚拟设备关联的真实设备。例如，Bonding和VLAN设备都使用它来指向收到包的真实设备。

5 union {...} h union {...} nh union {...} mac

这些是指向TCP/IP各层协议头的指针：h指向L4，nh指向L3，mac指向L2。每个指针的类型都是一个联合，包含多个数据结构，每一个数据结构都表示内核在这一层可以解析的协议。例如，h是一个包含内核所能解析的L4协议的数据结构的联合。每一个联合都有一个raw变量用于初始化，后续的访问都是通过协议相关的变量进行的。

当接收一个包时，处理n层协议头的函数从n-1层收到一个缓冲区，它的skb->data指向n层协议的头。处理n层协议的函数把本层的指针(例如，L3对应的是skb->nh指针)初始化为skb->data，因为这个指针的值会在处理下一层协议时改变(skb->data将被初始化成缓冲区里的其他地址)。在处理n层协议的函数结束时，在把包传递给n+1层的处理函数前，它会把skb->data指针指向n层协议头的末尾，这正好是n+1层协议的协议头(参见图4)。

发送包的过程与此相反，但是由于要为每一层添加新的协议头，这个过程要比接收包的过程复杂。

图4

6 struct dst_entry dst 这个变量在路由子系统中使用。

7 char cb[40]

这是一个控制缓存，或者说是一个私有信息的存储空间，由每一层自己维护并使用。它在分配sk_buff结构时分配(它目前的大小是40字节，已经足够为每一层存储必要的私有信息了)。在每一层中，访问这个变量的代码通常用宏实现，以增强代码的可读性。例如，TCP用这个变量存储tcp_skb_cb结构，这个结构在include/net/tcp.h中定义：

下面这个宏被TCP代码用来访问cb变量。在这个宏里面，有一个简单的类型转换：

#define TCP_SKB_CB(__skb) ((struct tcp_skb_cb *)&((__skb)->cb[0]))

下面的例子是TCP子系统在收到一个分段时填充相关数据结构的代码：

int tcp_v4_rcv(struct sk_buff *skb)

8 unsigned int csum unsigned char ip_summed

表示校验和以及相关状态标记。

unsigned char cloned

一个布尔标记，当被设置时，表示这个结构是另一个sk_buff的克隆。

9 unsigned char pkt_type

这个变量表示帧的类型，分类是由L2的目的地址来决定的。可能的取值都在include/linux/if_packet.h中定义。对以太网设备来说，这个变量由eth_type_trans函数初始化。

10 __u32 priority

这个变量描述发送或转发包的QoS类别。如果包是本地生成的，socket层会设置priority变量。如果包是将要被转发的，rt_tos2priority函数会根据ip头中的Tos域来计算赋给这个变量的值。这个变量的值与DSCP(DiffServ CodePoint)没有任何关系。

unsigned short protocol

这个变量是高层协议从二层设备的角度所看到的协议。典型的协议包括IP，IPV6和ARP。完整的列表在include/linux/if_ether.h中。由于每个协议都有自己的协议处理函数来处理接收到的包，因此，这个域被设备驱动用于通知上层调用哪个协议处理函数。每个网络驱动都调用netif_rx来通知上层网络协议的协议处理函数，因此protocol变量必须在这些协议处理函数调用之前初始化。

unsigned short security

这是包的安全级别。这个变量最初由IPSec子系统使用，但现在已经作废了。

4.3 Feature-specific功能相关

linux内核是模块化的，你可以选择包含或者删除某些功能。因此，sk_buff结构里面的一些成员变量只有在内核选择支持某些功能时才有效，比如防火墙(netfilter)或者qos：

1 unsigned long nfmark __u32 nfcache __u32 nfctinfo struct nf_conntrack *nfct

unsigned int nfdebug struct nf_bridge_info *nf_bridge

这些变量被netfilter使用(防火墙代码)，内核编译选项是“Device Drivers->Networking support-> Networking options-> Network packet filtering”和两个子选项“Network packet filtering debugging”和“Bridged IP/ARP packets filtering”

2 union {...} private

这个联合结构被高性能并行接口(HIPPI)使用。相应的内核编译选项是“Device->Drivers ->Networking support ->Network device support ->HIPPI driver support”

3 __u32 tc_index __u32 tc_verd __u32 tc_classid

这些变量被流量控制代码使用，内核编译选项是“Device Drivers ->Networking->support ->Networking options ->QoS and/or fair queueing”和它的子选项“Packetclassifier API”

4 struct sec_path *sp

这个变量被IPSec协议用于跟踪传输的信息。

5 sk_buff管理和操作函数

5.1缓冲区操作函数

有很多函数，通常都比较短小而且简单，内核用这些函数操作sk_buff的成员变量或者sk_buff链表。首先来看分配和释放缓冲区的函数，然后是一些通过移动指针在缓冲区的头部或尾部预留空间的函数。如果你看过include/linux/skbuff.h和net/core/skbuff.c中的函数，你会发现，基本上每个函数都有两个版本，名字分别是do_something和__do_something。通常第一种函数是一个包装函数，它会在第二种函数的基础上增加合法性检查或者锁。一般来说，类似__do_something的函数不能被直接调用(除非满足特定的条件，比如说锁)。那些违反这条规则而直接引用这些函数的不良代码会最终被更正。

各操作函数缓冲区与移动指针变化如图5所示。

图5 操作前与操作后指针变化图: (a)skb_put, (b)skb_push, (c)skb_pull, and (d)skb_reserve

1 unsigned char *skb_put(struct sk_buff *skb, unsigned int len)

在缓冲区的尾部空间扩充len字节数据区l，将tail指针下移，并增加skb的len值。data和tail之间的空间就是可以存放网络报文的空间。这个操作增加了可以存储网络报文的空间，但是增加不能使 tail的值大于end的值，skb的len值大于truesize 的值。

2 unsigned char *skb_push(struct sk_buff *skb, unsigned int len)

在缓冲区的头部空间扩充len字节的数据区。将data指针上移，并增加skb的len值。这个操作在存储空间的头部增加了一段可以存储网络报文的空间，但是增加不能使data的值小于 head的值，skb的len值大于truesize的值。

3 unsigned char * skb_pull(struct sk_buff *skb, unsigned int len)

从缓冲区的数据区删除len字节，把腾出的内存归还给头部空间。将data指针下移，并减小skb的len值。这个操作使data指针指向下一层网络报文的头部。

4 void skb_reserve(struct sk_buff *skb, unsigned int len)

从空白缓冲区中分配len字节的数据区，通过减少尾部空间，增加一个空&sk_buff的首部空间，将data指针和tail指针同时下移。这个操作在存储空间的头部预留len长度的空隙。

如果查看某个以太网设备驱动的收包函数(例如，drivers/net/3c59x.c中的vortex_rx)，你就会发现它在分配缓冲区之后，在向缓冲区中填充数据之前，会调用下面的函数：

由于以太网帧的头部长度是14个八位组，这个函数把缓冲区的头部指针向后移动了2个字节。这样，紧跟在以太网头部之后的IP头部在缓冲区中存储时就可以在16字节的边界上对齐。如图6所示。

图6 (a) skb_reserve开始前, (b) skb_reserve后(c) 复制数据到缓冲区

5.2发送tcp报文示例

发送报文时，在不同协议层处理数据时，该数据要添加相应的协议头。因此，最高层添加数据和自身的协议头。alloc_skb用来申请一个sk_buff。skb_reserve用来创建头空间。skb_put用来创建用户数据空间，用户数据复制到sk->data指向的数据区。接下来使用skb_push是在用户数据的前面加上各层协议头。

图7是发送tcp报文的整个过程示意图。

1）当TCP发送数据时，它根据一些条件分配一个缓冲区(比如，TCP的最大分段长度(mss)，是否支持散读散写I/O等

2）TCP在缓冲区的头部预留足够的空间(用skb_reserve)用于填充各层的头部(如TCP，IP，链路层等)。MAX_TCP_HEADER参数是各层头部长度的总和，它考虑了最坏的情况：由于tcp层不知道将要用哪个接口发送包，它为每一层预留了最大的头部长度。它甚至考虑了出现多个IP头的可能性(如果内核编译支持IP over IP，我们就会遇到多个IP头的情况)。

3）把TCP的负载拷贝到缓冲区（用skb_put，复制数据）。需要注意的是：图7只是一个例子。TCP的负载可能会被组织成其他形式。例如它可以存储到分片中。

4）TCP层添加自己的头部（用skb_push）。

5）TCP层把缓冲区传递给IP层，IP层同样添加自己的头部（用skb_push）。

6）IP层把缓冲区传递给邻居层，邻居层添加链路层头部（用skb_push）。

Tcp报文发送过程如图6所示。

接收报文时：当缓冲区在协议栈中向下层传递时，每一层都把skb->data指针向下移动，然后拷贝自己的头部，同时更新skb->len。

图7 tcp报文发送过程

5.3 缓冲区分配、克隆和释放函数分析

1 alloc_skb

alloc_skb是net/core/skbuff.c里面定义的，用于分配缓冲区的函数。我们已经知道，数据缓冲区和缓冲区的描述结构(sk_buff结构)是两种不同的实体，这就意味着，在分配一个缓冲区时，需要分配两块内存(一个是缓冲区，一个是缓冲区的描述结构sk_buff)。

alloc_skb函数起始可以看作三部分，第一部分是从cache中分配内存，第二部分是初始化分配的skb的相关域。第三部分是处理fclone。

1)分配内存

首先调用函数kmem_cache_alloc从缓存中获取一个sk_buff结构，然后调用kmalloc_cachhe_alloc_node分配缓冲区(如果有缓存的话，它同样从缓存中获取内存)。

2)初始化

在调用kmalloc前，size参数通过SKB_DATA_ALIGN宏强制对齐。在函数返回前，它会初始化结构中的一些变量。

3)处理fclone

每次skb_clone一个skb的时候，都是要调用kmem_cache_alloc从cache中alloc一块新的内存。而现在当我们拥有了fastclone之后，通过调用alloc_skb_fclone函数来分配一块大于sizeof(structsk_buff)的内存，也就是在这次请求的skb的下方多申请了一些内存，然后返回的时候设置返回的skb的fclone标记为SKB_FCLONE_ORIG，而多申请的那块内存的sk_buff的fclone为SKB_FCLONE_UNAVAILABLE，这样当我们调用skb_clone克隆这个skb的时候看到fclone的标记就可以直接将skb的指针+1,而不需要从cache中取了。这样的话节省了一次内存存取，提高了clone的效率，不过调用flcone一般都是我们确定接下来这个skb会被clone很多次。

4)skb指针状态

alloc_skb之后的skb的指针的状态如图8所示。在图7右边所示的内存块的底部，可以能看到对齐操作所带来的填充区域（padding）。

图8 skb指针状态

2 克隆skb_clone

如果一个缓冲区需要被不同的用户独立地操作，而这些用户可能会修改sk_buff中某些变量的值(比如h和nh值)，内核没有必要为每个用户复制一份完整的 sk_buff以及相应的缓冲区。相反，为提高性能，内核克隆一个缓冲区。克隆过程只复制sk_buff结构，同时修改缓冲区的引用计数以避免共享的数据被提前释放。克隆缓冲区使用skb_clone函数。

一个使用包克隆的场景是：一个接收包的过程需要把这个包传递给多个接收者，例如包处理函数或者一个或多个网络模块。

被克隆的sk_buff不会放在任何链表中，同时也不会有到socket的引用。原始的和克隆的sk_buff中的skb->cloned值都被置为1。克隆包的skb->users值被置为1，这样，在释放时，可以先释放sk_buff结构。同时，缓冲区的引用计数(dataref)增加1 (因为有多个sk_buff结构指向它)。克隆缓冲区的结构如图9。

图9

clone的意思就是只复制skb而不复制data域。

1它会先判断将要被clone的skb的fclone段，以便与决定是否重新分配一块内存来保存skb。2调用__skb_clone来初始化相关的域。

3 pskb_copy, skb_copy

当一个skb被clone之后，这个skb的数据区是不能被修改的，这就意为着，我们存取数据不需要任何锁。可是有时我们需要修改数据区，这个时候会有两个选择，一个是我们只修改linear段，也就是head和end之间的段使用，可以使用pskb_copy来复制这部分数据，一种是还要修改切片数据，也就是skb_shared_info，就必须使用skb_copy。

这样就有两个函数供我们选择，第一个是pskb_copy,第二个是skb_copy.

pskb_copy,函数

先alloc一个新的skb，然后调用skb_copy_from_linear_data来复制线性区的数据，并更新相关域，最后复制切片数据的指针。

skb_copy 函数

先alloc一个新的skb，然后复制skb的所有数据段，包括切片数据。

pskb_copy: alloc一个新的skb, 复制数据，更新相关域

复制切片数据指针

skb_copy: alloc一个新的skb, 复制所有数据

psb_copy和skb_copy调用后的内存模型如图9，其中a是pskb_copy,b是skb_copy:

图9

4 释放缓冲区 kfree_skb

kfree_skb函数释放缓冲区，并把它返回给缓冲池(缓存)。只有在skb->users为1的情况下才释放内存(没有人引用这个结构)。否则，它只是简单地减小skb->users。如果缓冲区有三个引用者，那么只有第三次调用kfree_skb时才释放内存。

kfree_skb(skb)à__kfree_skb(skb)àkfree_skbmem(skb)àkmem_cache_free(skbuff_head_cache, skb)

最终kfree_skb把sk_buff结构返回给skbuff_head_cache缓存。

你可能感兴趣的:(Linux内核)

C++常见知识掌握 nfgo c++开发语言
1.Linux软件开发、调试与维护内核与系统结构Linux内核是操作系统的核心，负责管理硬件资源，提供系统服务，它是系统软件与硬件之间的桥梁。主要组成部分包括：进程管理：内核通过调度器分配CPU时间给各个进程，实现进程的创建、调度、终止等操作。使用进程描述符（task_struct）来存储进程信息，包括状态（就绪、运行、阻塞等）、优先级、内存映射等。内存管理：包括物理内存和虚拟内存管理。通过页表映
KVM虚拟机源代码分析【转】 xidianjiapei001 #虚拟化技术
1.KVM结构及工作原理1.1KVM结构KVM基本结构有两部分组成。一个是KVMDriver，已经成为Linux内核的一个模块。负责虚拟机的创建，虚拟内存的分配，虚拟CPU寄存器的读写以及虚拟CPU的运行等。另外一个是稍微修改过的Qemu，用于模拟PC硬件的用户空间组件，提供I/O设备模型以及访问外设的途径。KVM基本结构如图1所示。其中KVM加入到标准的Linux内核中，被组织成Linux中标准
Android shell 常用 debug 命令晨春计 Audio debug android linux
目录1、查看版本2、am命令3、pm命令4、dumpsys命令5、sed命令6、log定位查看APK进程号7、log定位使用场景1、查看版本1.1、Android串口终端执行getpropro.build.version.release#获取Android版本uname-a#查看linux内核版本信息uname-r#单独查看内核版本1.2、linux服务器执行lsb_release-a#查看Lin
讲解Linux内核操作系统——进程状态与转换 Linux加油站网络服务器运维
一.进程控制进程控制的主要功能是对系统中的所有进程实施有效的管理，它具有创建新进程、撤销已有进程、实现进程状态转换等功能。在操作系统中，一般把进程控制用的程序段称为原语，原语的特点是执行期间不允许中断，它是一个不可分割的基本单位。1.1创建进程UNIX中进程为树状层次结构，Windows下所有进程没有层次结构允许一个进程创建另一个进程，创建者称为父进程，被创建的进程称为子进程。子进程可以继承父进程
Ubuntu系统入门指南：常用命令详解像风一样自由2020 ubuntu ubuntu linux 运维
Ubuntu系统入门指南：常用命令详解引言Ubuntu是一个基于Linux内核的开源操作系统，由Canonical公司和社区共同开发和维护。它以易用性、稳定性和广泛的软件支持而著称，广泛应用于个人电脑、服务器和云计算环境。对于新手来说，掌握Ubuntu的基本命令行操作可以大大提高工作效率和系统管理能力。Ubuntu通常每六个月发布一个新版本，每两年会推出一个长期支持（LTS）版本，提供五年的安全更
framebuffer帧缓存我相遇拾年缓存
framebuffer:帧缓冲，帧缓存Linux内核为显示提供的一套应用程序接口。（驱动内核支持）framebuffer本质上是一块显示缓存，往显示缓存中写入特定格式的数据就意味着向屏幕输出内容。framebuffer驱动程序控制LCD显示设备，通过映射framebuffer设备到用户空间，应用程序可以直接对显存进行操作，从而控制LCD显示内容framebuffer使用显示屏：800*600（横向
linux查看git log目录,教你玩转Git-查看提交历史郁清叔叔 linux查看git log目录
导读Git是一个开源的分布式版本控制系统，用于敏捷高效地处理任何或小或大的项目。Git是LinusTorvalds为了帮助管理Linux内核开发而开发的一个开放源码的版本控制软件。Git与常用的版本控制工具CVS,Subversion等不同，它采用了分布式版本库的方式，不必服务器端软件支持。在使用Git提交了若干更新之后，又或者克隆了某个项目，想回顾下提交历史，我们可以使用gitlog命令查看。针
Android的内核 setsailgo android runtime
Android的内核是基于Linux的长期支持版本的“Android通用内核(ACK)”。Android作为一个广泛使用的操作系统，其根基在于内核的设计和功能。下面将深入探讨Android内核的各个方面，从其基本结构到与Linux内核的关系，再到内核的版本管理及在设备上的应用：Android内核的基础结构基于Linux的内核：Android内核是构建在Linux长期支持版本之上的，这使得其能够充分
数据结构—内核链表 LEE_C17 数据结构链表 arm开发
一，内核链表内核链表是一种在操作系统内核中广泛使用的数据结构，特别是在Linux内核中。它主要用于高效地管理和遍历内核中的对象，如进程、设备、文件等。内核链表通常基于双向链表或双向循环链表实现，具有以下特点：双向性：每个链表节点都包含指向前一个节点和后一个节点的指针，这使得从任何节点出发都可以方便地遍历整个链表。通用性：内核链表的设计使其能够通用于不同类型的内核对象。通过在结构体中包含一个指向链表
解锁前端新潜能：如何使用 Rust 锈化前端工具链京东零售技术前端 taro 前端 taro
前言近年来，Rust的受欢迎程度不断上升。首先，在操作系统领域，Rust已成为Linux内核官方认可的开发语言之一，Windows也宣布将使用Rust来重写内核，并重写部分驱动程序。此外，国内手机厂商Vivo也宣布使用Rust开发了名为“蓝河”的操作系统。除此之外，Rust在图形渲染、游戏开发、中间件开发、边缘计算、计算安全等领域也是遍地开花，可以说，Rust正在以惊人的速度重塑着各个领域的发展，
io_uring异步IO 天夏123 php 开发语言
io_uring介绍io_uring是一个Linux内核的异步I/O框架，它提供了高性能的异步I/O操作，io_uring的目标是通过减少系统调用和上下文切换的开销来提高I/O操作的性能。在网络编程中，我们通常使用epollIO多路复用来处理网络IO，然而epoll也并不是异步网络IO，仅仅是内核提供了IO复用机制，epoll回调通知的是数据可以读取或者写入了，具体的读写操作仍然需要用户去做，而不
Linux内核以后会分块逐步用Rust重写吗? 纵然间 linux rust 运维
Linux内核已经积累了大量的代码，包括数百万行的C和C++代码。要想重写这些代码需要巨大的人力和时间投入，且存在很高的风险。这些代码已经过长时间的测试和验证，具有很高的稳定性和可靠性。Rust虽然是一种强调安全性和性能的系统编程语言，但其相对于C和C++来说仍然较新，在Linux内核开发领域的应用还相对较少。用Rust重写Linux内核需要开发者具备深厚的Rust编程技能和经验，以及对Linux
深入理解Linux内核：一部开源的探索之旅宋溪普Gale
深入理解Linux内核：一部开源的探索之旅项目介绍linux-insides-ko是一个致力于将原始英文版《linux-insides》翻译成韩语的开源项目，旨在为那些对Linux内核和底层操作机制感兴趣的读者提供深入浅出的教程。这本书详细阐述了Linux内核的工作原理以及其内部结构，无论你是初学者还是经验丰富的开发者，都能从中受益匪浅。项目技术分析该项目以Markdown格式编写，易于阅读且便于
linux启动优化内核裁剪详细说明（2） keep study linux
第一部分Linux内核裁减（1）安装新内核:i)将新内核copy到/usr/src下并解压：#tar-zxvflinux-2.6.38.4.tar.gzii)将名为linux的符号链接删掉,这是旧版本内核的符号链接.#ln-slinux-2.6.38.4linux（2）设置内核.#cd/usr/src/linux#makemrproper-----删除不必要的文件和目录.#makemenuconf
6.11 linux内核管理：内核版本阳光的王小草 linux整理 linux 内核版本
6.11linux内核管理：内核版本cat/proc/versionLinuxversion3.10.0-229.4.2.el7.x86_64([email protected])(gccversion4.8.220140120(RedHat4.8.2-16)(GCC))#1SMPWedMay1310:06:09UTC2015uname-aLinuxjenkins3.1
一篇文章带你读懂 io_uring 的接口与实现 Linux高级开发 Linux服务器开发 linux 运维服务器 epoll accept
io_uring是Linux提供的一个异步I/O接口。io_uring在2019年加入Linux内核，经过了两年的发展，现在已经变得非常强大。本文基于Linux5.12.10介绍io_uring接口。io_uring的实现主要在fs/io_uring.c中。io_uring的用户态APIio_uring的实现仅仅使用了三个syscall：io_uring_setup,io_uring_enter和
【io_uring】简介和使用 ywang_wnlo 存储 liburing io_uring
文章目录简介使用系统调用liburing样例代码流程编译参考资料简介io_uring是Linux在5.1版本引入的一套新的异步IO实现。相比Linux在2.6版本引入的AIO，io_uring性能强很多，接近SPDK[1]，同时支持bufferIOio_uring的作者JensAxboe是Linux内核块层和其他块设备的维护者，同时也是CFQ、Noop、Deadline调度器、blktrace以及
linux内核调度,深入linux内核架构--核心调度器编程幽谷隐士 linux内核调度
内存中保存了每个进程的唯一描述信息，并通过若干结构与其他进程连接起来，那么调度器的核心任务就是高效公平的执行各个进程中的内存代码段。那么一个好的调度器，需要满足哪些条件呢？高效性：应该尽量减小调度器产生的额外开销。公平性：应该尽量保证每个作业都能被执行，也应该保证每个cpu都有均衡的作业。灵活性：可以动态的设置作业的优先级，良好的迁移能力，不同作业具有不同的权利等。隔离性：不让作业之间彼此影响。控
浅谈Docker引擎秦偏执 docker引擎
在Docker首次发布的时候，Docker引擎由两个核心构成，即：LXC和Dockerdaemon。由LXC来基于Linux内核的容器虚拟化技术来提供像NameSpace,Cgruop等基础工具的操作技术；由Daemon来统一负责镜像的管理，容器生命周期的管理，认证等工作。这样做也带来了很多的缺点，首先：LXC是基于Linux的，这对于一个立志与跨平台的项目来说本身就是一个瓶颈；其次，使用一个外部
嵌入式设备上SystemTap调试工具使用塵觴葉杂谈 linux bpf
SystemTap调试工具简介SystemTap调试器常用于Linux内核的动态调试，不过该工具集也可用于应用的跟踪调试。随着Linux内核及其应用程序的复杂度不断加深，使用一些在功能上区别于传统的GDB调试工具就变得越来越重要了。这类调试工具具有低延时(LowLatency)，高性能，动态调试的特点。嵌入式Linux设备的系统软件通常不需从头开发，这些调试工具可以帮助开发者快速理解Linux内核
systemtap原理及使用 csr_hema
SystemTap的架构SystemTap用于检查运行的内核的两种方法是Kprobes和返回探针。但是理解任何内核的最关键要素是内核的映射，它提供符号信息（比如函数、变量以及它们的地址）。有了内核映射之后，就可以解决任何符号的地址，以及更改探针的行为。Kprobes从2.6.9版本开始就添加到主流的Linux内核中，并且为探测内核提供一般性服务。它提供一些不同的服务，但最重要的两种服务是Kprob
zybo上运行linux,Zybo开发板linux作业系统移植周行文 zybo上运行linux
文章主要介紹zyboboard上linux作业系统移植过程。分别介绍了开发环境搭建、U-boot编译、linux内核编译、busybox制作等流程及注意事项。文章使用的开发板是zynq7000系列的zyboboard。Vivado版本是2015.1.主机系统是Debian9.1.开发环境搭建工欲善其事必先利其器，做开发前搭建好编译环境是重要的一步，这些步骤大体上都相同，然而对于不同的系统平台、硬件
Android内核介绍 zhang_li_bin Android Android Linux C C#C++
Android内核介绍Android内核介绍发布时间：2010年4月8日作者：EasyAndroidtags：已经有一些的文章介绍Android内核了，本系列篇将从Linux内核的角度来分析Android的内核，希望给初学者提够有用的信息。本章将简单的介绍Android内核的全貌，起到一个抛砖引玉的作用。从下一篇开始将详细介绍每一个Android内核驱动程序及其作用。Android内核是基于Lin
linux驱动 -- PWM配置和SysFs操作方法悟凡爱学习 linux驱动 linux 运维服务器
1：PWM介绍PWM的定义为:可调节脉冲调节器，换句话来说就是一个总周期不变，占空比可调节的方波。2：PWM的总周期和占空比、有效点平方波：在信号领域一般分为数字信号和模拟信号，数字信号就两种状态：0和1，相互交替成为方波。总周期：从1状态到1状态。也就是总周期为：从一个电平再回到这个电平。占空比：有效电平占据占总周期的比例有效电平：器件生效的电平3：linux内核下的PWM3.1linux下的P
8.12（LVS负载均衡） WPFwpf_ lvs 负载均衡运维
一、LVS（一）什么是LVSlinuxvirturalserver的简称，也就是linxu虚拟机服务器，这是一个由章文岩博士发起的开源项目，官网是http://www.linuxvirtualserver.org,现在lvs已经是linux内核标准的-部分，使用lvS可以达到的技术目标是:通过linux达到负载均衡技术和linux操作系统实现一个高性能高可用的linux服务器集群，他具有良好的可性
页面缓存（Page Cache） TABE_ 操作系统页缓存操作系统
我们知道文件一般存放在硬盘（机械硬盘或固态硬盘）中，CPU并不能直接访问硬盘中的数据，而是需要先将硬盘中的数据读入到内存中，然后才能被CPU访问。由于读写硬盘的速度比读写内存要慢很多（DDR4内存读写速度是机械硬盘500倍，是固态硬盘的200倍）。为了避免每次读写文件时，都需要对硬盘进行读写操作，Linux内核会以页大小（4KB）为单位，将文件划分为多数据块，当用户对文件中的某个数据块进行读写操作
ARM64的函数调用标准和栈布局奔跑吧Linux社区 linux
欢迎订阅奔跑吧linux社区微信公众号本文节选自《奔跑吧Linux内核》第二版卷1第1.6章函数调用标准（ProcedureCallStandard，PCS）用来描述父/子函数是如何编译、链接的，特别是父函数和子函数之间调用关系的约定，如栈的布局、参数的传递等。每个处理器架构都有不同的函数调用标准，本章重点介绍ARM64的函数调用标准。ARM公司有一份描述ARM64架构函数调用的标准和规范文档，这
深入理解 Linux epoll：高性能事件驱动的核心技术程序修炼之道 c++linux 音视频计算机网络
介绍在高并发网络编程中，有效地管理大量的客户端连接是至关重要的。传统的I/O多路复用技术如select和poll在连接数较少时表现良好，但在连接数增加时性能下降明显。而Epoll则是一种高效的I/O多路复用技术，被广泛应用于服务器编程中，特别是在大规模并发连接的场景下。Epoll概述Epoll是Linux内核提供的一种事件通知机制，用于处理大量的I/O事件。Epoll在管理大量连接时具有更高的效率
Linux内核0.11学习九阳道人 linux 学习内核
Linux内核0.11学习文章目录Linux内核0.11学习一、计算机开机的过程1、启动BIOS2、BIOS在内存中加载中断向量表和中断服务程序Linux内核最新已经版本已经到5.18了，代码量千万行的级别，一天看五百行也要看两万天，然而很多程序员能不能活到两万天都是个大问题，所以不可能看得完。Linux0.11内核虽然是三十多年前的产物，就像孙子兵法、黄帝内经等古书一样，不代表它们没有学习的价值
云原生 | 在 Kubernetes 中使用 Cilium 替代 Calico 网络插件实践指南! 全栈工程师修炼指南企业IT运维实践云原生 kubernetes 网络容器
[知识是人生的灯塔，只有不断学习，才能照亮前行的道路]0x00简述介绍什么是Cilium?Cilium是一款开源软件，它基于一种名为eBPF的新的Linux内核技术提供动力，用于透明地保护使用Docker和Kubernetes等Linux容器管理平台中部署的应用程序服务之间的网络连接，Cilium主要使用场景是在Kubernetes中，但Cilium的优势并不仅限于Kubernetes环境。在Ku
jQuery 键盘事件keydown ,keypress ,keyup介绍 107x js jquery keydown keypress keyup
本文章总结了下些关于jQuery 键盘事件keydown ,keypress ,keyup介绍，有需要了解的朋友可参考。一、首先需要知道的是： 1、keydown() keydown事件会在键盘按下时触发. 2、keyup() 代码如下复制代码 $('input').keyup(funciton(){
AngularJS中的Promise bijian1013 JavaScript AngularJS Promise
一.Promise Promise是一个接口，它用来处理的对象具有这样的特点：在未来某一时刻（主要是异步调用）会从服务端返回或者被填充属性。其核心是，promise是一个带有then()函数的对象。为了展示它的优点，下面来看一个例子，其中需要获取用户当前的配置文件： var cu
c++ 用数组实现栈类 CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T, int SIZE = 50> class Stack{ private: T list[SIZE];//数组存放栈的元素 int top;//栈顶位置 public: Stack(
java和c语言的雷同麦田的设计者 java 递归 scaner
软件启动时的初始化代码，加载用户信息2015年5月27号从头学java二 1、语言的三种基本结构：顺序、选择、循环。废话不多说，需要指出一下几点： a、return语句的功能除了作为函数返回值以外，还起到结束本函数的功能，return后的语句不会再继续执行。 b、for循环相比于whi
LINUX环境并发服务器的三种实现模型被触发 linux
服务器设计技术有很多，按使用的协议来分有TCP服务器和UDP服务器。按处理方式来分有循环服务器和并发服务器。 1 循环服务器与并发服务器模型在网络程序里面，一般来说都是许多客户对应一个服务器，为了处理客户的请求，对服务端的程序就提出了特殊的要求。目前最常用的服务器模型有： ·循环服务器：服务器在同一时刻只能响应一个客户端的请求 ·并发服务器：服
Oracle数据库查询指令肆无忌惮_ oracle数据库
20140920 单表查询 -- 查询************************************************************************************************************ -- 使用scott用户登录 -- 查看emp表 desc emp
ext右下角浮动窗口知了ing JavaScript ext
第一种 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/
浅谈REDIS数据库的键值设计矮蛋蛋 redis
http://www.cnblogs.com/aidandan/ 原文地址：http://www.hoterran.info/redis_kv_design 丰富的数据结构使得redis的设计非常的有趣。不像关系型数据库那样，DEV和DBA需要深度沟通，review每行sql语句，也不像memcached那样，不需要DBA的参与。redis的DBA需要熟悉数据结构，并能了解使用场景。
maven编译可执行jar包 alleni123 maven
http://stackoverflow.com/questions/574594/how-can-i-create-an-executable-jar-with-dependencies-using-maven <build> <plugins> <plugin> <artifactId>maven-asse
人力资源在现代企业中的作用百合不是茶 HR 企业管理
//人力资源在在企业中的作用人力资源为什么会存在，人力资源究竟是干什么的人力资源管理是对管理模式一次大的创新，人力资源兴起的原因有以下点：工业时代的国际化竞争，现代市场的风险管控等等。所以人力资源在现代经济竞争中的优势明显的存在，人力资源在集团类公司中存在着明显的优势(鸿海集团)，有一次笔者亲自去体验过红海集团的招聘，只知道人力资源是管理企业招聘的当时我被招聘上了，当时给我们培训的人
Linux自启动设置详解 bijian1013 linux
linux有自己一套完整的启动体系，抓住了linux启动的脉络，linux的启动过程将不再神秘。阅读之前建议先看一下附图。本文中假设inittab中设置的init tree为： /etc/rc.d/rc0.d /etc/rc.d/rc1.d /etc/rc.d/rc2.d /etc/rc.d/rc3.d /etc/rc.d/rc4.d /etc/rc.d/rc5.d /etc
Spring Aop Schema实现 bijian1013 java spring AOP
本例使用的是Spring2.5 1.Aop配置文件spring-aop.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmln
【Gson七】Gson预定义类型适配器 bit1129 gson
Gson提供了丰富的预定义类型适配器，在对象和JSON串之间进行序列化和反序列化时，指定对象和字符串之间的转换方式， DateTypeAdapter public final class DateTypeAdapter extends TypeAdapter<Date> { public static final TypeAdapterFacto
【Spark八十八】Spark Streaming累加器操作（updateStateByKey) bit1129 update
在实时计算的实际应用中，有时除了需要关心一个时间间隔内的数据，有时还可能会对整个实时计算的所有时间间隔内产生的相关数据进行统计。比如：对Nginx的access.log实时监控请求404时，有时除了需要统计某个时间间隔内出现的次数，有时还需要统计一整天出现了多少次404，也就是说404监控横跨多个时间间隔。 Spark Streaming的解决方案是累加器，工作原理是，定义
linux系统下通过shell脚本快速找到哪个进程在写文件 ronin47
一个文件正在被进程写我想查看这个进程文件一直在增大找不到谁在写使用lsof也没找到这个问题挺有普遍性的，解决方法应该很多，这里我给大家提个比较直观的方法。 linux下每个文件都会在某个块设备上存放，当然也都有相应的inode, 那么透过vfs.write我们就可以知道谁在不停的写入特定的设备上的inode。幸运的是systemtap的安装包里带了inodewatch.stp，位
java-两种方法求第一个最长的可重复子串 bylijinnan java 算法
import java.util.Arrays; import java.util.Collections; import java.util.List; public class MaxPrefix { public static void main(String[] args) { String str="abbdabcdabcx";
Netty源码学习-ServerBootstrap启动及事件处理过程 bylijinnan java netty
Netty是采用了Reactor模式的多线程版本，建议先看下面这篇文章了解一下Reactor模式： http://bylijinnan.iteye.com/blog/1992325 Netty的启动及事件处理的流程，基本上是按照上面这篇文章来走的文章里面提到的操作，每一步都能在Netty里面找到对应的代码其中Reactor里面的Acceptor就对应Netty的ServerBo
servelt filter listener 的生命周期 cngolon filter listener servelt 生命周期
1. servlet 当第一次请求一个servlet资源时，servlet容器创建这个servlet实例，并调用他的 init(ServletConfig config)做一些初始化的工作，然后调用它的service方法处理请求。当第二次请求这个servlet资源时，servlet容器就不在创建实例，而是直接调用它的service方法处理请求，也就是说
jmpopups获取input元素值 ctrain JavaScript
jmpopups 获取弹出层form表单首先，我有一个div，里面包含了一个表单，默认是隐藏的，使用jmpopups时，会弹出这个隐藏的div，其实jmpopups是将我们的代码生成一份拷贝。当我直接获取这个form表单中的文本框时，使用方法：$('#form input[name=test1]').val()；这样是获取不到的。我们必须到jmpopups生成的代码中去查找这个值，$(
vi查找替换命令详解 daizj linux 正则表达式替换查找 vim
一、查找查找命令 /pattern<Enter> ：向下查找pattern匹配字符串 ?pattern<Enter>：向上查找pattern匹配字符串使用了查找命令之后，使用如下两个键快速查找： n：按照同一方向继续查找 N：按照反方向查找字符串匹配 pattern是需要匹配的字符串，例如： 1: /abc<En
对网站中的js,css文件进行打包 dcj3sjt126com PHP 打包
一，为什么要用smarty进行打包 apache中也有给js,css这样的静态文件进行打包压缩的模块，但是本文所说的不是以这种方式进行的打包，而是和smarty结合的方式来把网站中的js,css文件进行打包。为什么要进行打包呢，主要目的是为了合理的管理自己的代码。现在有好多网站，你查看一下网站的源码的话，你会发现网站的头部有大量的JS文件和CSS文件，网站的尾部也有可能有大量的J
php Yii: 出现undefined offset 或者 undefined index解决方案 dcj3sjt126com undefined
在开发Yii 时，在程序中定义了如下方式： if($this->menuoption[2] === 'test')，那么在运行程序时会报：undefined offset:2，这样的错误主要是由于php.ini 里的错误等级太高了，在windows下错误等级
linux 文件格式（1） sed工具 eksliang linux linux sed工具 sed工具 linux sed详解
转载请出自出处： http://eksliang.iteye.com/blog/2106082 简介 sed 是一种在线编辑器，它一次处理一行内容。处理时，把当前处理的行存储在临时缓冲区中，称为“模式空间”（pattern space），接着用sed命令处理缓冲区中的内容，处理完成后，把缓冲区的内容送往屏幕。接着处理下一行，这样不断重复，直到文件末尾
Android应用程序获取系统权限 gqdy365 android
引用如何使Android应用程序获取系统权限第一个方法简单点，不过需要在Android系统源码的环境下用make来编译： 1. 在应用程序的AndroidManifest.xml中的manifest节点
HoverTree开发日志之验证码 hvt .net C#asp.net hovertree webform
HoverTree是一个ASP.NET的开源CMS，目前包含文章系统，图库和留言板功能。代码完全开放，文章内容页生成了静态的HTM页面，留言板提供留言审核功能，文章可以发布HTML源代码，图片上传同时生成高品质缩略图。推出之后得到许多网友的支持，再此表示感谢！留言板不断收到许多有益留言，但同时也有不少广告，因此决定在提交留言页面增加验证码功能。ASP.NET验证码在网上找，如果不是很多，就是特别多
JSON API：用 JSON 构建 API 的标准指南中文版 justjavac json
译文地址：https://github.com/justjavac/json-api-zh_CN 如果你和你的团队曾经争论过使用什么方式构建合理 JSON 响应格式，那么 JSON API 就是你的 anti-bikeshedding 武器。通过遵循共同的约定，可以提高开发效率，利用更普遍的工具，可以是你更加专注于开发重点：你的程序。基于 JSON API 的客户端还能够充分利用缓存，
数据结构随记_2 lx.asymmetric 数据结构笔记
第三章栈与队列一．简答题 1. 在一个循环队列中，队首指针指向队首元素的前一个位置。 2.在具有n个单元的循环队列中，队满时共有 n-1 个元素。 3. 向栈中压入元素的操作是先移动栈顶指针&n
Linux下的监控工具dstat 网络接口 linux
1) 工具说明dstat是一个用来替换 vmstat,iostat netstat,nfsstat和ifstat这些命令的工具, 是一个全能系统信息统计工具. 与sysstat相比, dstat拥有一个彩色的界面, 在手动观察性能状况时, 数据比较显眼容易观察; 而且dstat支持即时刷新, 譬如输入dstat 3, 即每三秒收集一次, 但最新的数据都会每秒刷新显示. 和sysstat相同的是,
C 语言初级入门--二维数组和指针 1140566087 二维数组 c/c++指针
/* 二维数组的定义和二维数组元素的引用二维数组的定义：当数组中的每个元素带有两个下标时，称这样的数组为二维数组； (逻辑上把数组看成一个具有行和列的表格或一个矩阵); 语法：类型名数组名[常量表达式1][常量表达式2] 二维数组的引用：引用二维数组元素时必须带有两个下标，引用形式如下：例如： int a[3][4]; 引用：
10点睛Spring4.1-Application Event wiselyman application
10.1 Application Event Spring使用Application Event给bean之间的消息通讯提供了手段应按照如下部分实现bean之间的消息通讯继承ApplicationEvent类实现自己的事件实现继承ApplicationListener接口实现监听事件使用ApplicationContext发布消息