noshysky

epoll源码实现分析

epoll源码实现分析[整理]

Posted on 2013-08-03 15:30 Apprentice89 阅读( 319) 评论( 0) 编辑收藏

epoll用法回顾

先简单回顾下如何使用C库封装的3个epoll相关的系统调用。更详细的用法参见http://www.cnblogs.com/apprentice89/archive/2013/05/06/3063039.html

int epoll_create(int size);

int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);

int epoll_wait(int epfd, struct epoll_event *events,int maxevents, int timeout);

使用起来很清晰，首先要调用epoll_create建立一个epoll fd。参数size是内核保证能够正确处理的最大文件描述符数目（现在内核使用红黑树组织epoll相关数据结构，不再使用这个参数）。

epoll_ctl可以操作上面建立的epoll fd，例如，将刚建立的socket fd加入到epoll中让其监控，或者把 epoll正在监控的某个socket fd移出epoll，不再监控它等等。

epoll_wait在调用时，在给定的timeout时间内，当在监控的这些文件描述符中的某些文件描述符上有事件发生时，就返回用户态的进程。

epoll为什么高效（相比select）

l 仅从上面的调用方式就可以看出epoll比select/poll的一个优势：select/poll每次调用都要传递所要监控的所有fd给select/poll系统调用（这意味着每次调用都要将fd列表从用户态拷贝到内核态，当fd数目很多时，这会造成低效）。而每次调用epoll_wait时（作用相当于调用select/poll），不需要再传递fd列表给内核，因为已经在epoll_ctl中将需要监控的fd告诉了内核（epoll_ctl不需要每次都拷贝所有的fd，只需要进行增量式操作）。所以，在调用epoll_create之后，内核已经在内核态开始准备数据结构存放要监控的fd了。每次epoll_ctl只是对这个数据结构进行简单的维护。

l 此外，内核使用了slab机制，为epoll提供了快速的数据结构：

在内核里，一切皆文件。所以，epoll向内核注册了一个文件系统，用于存储上述的被监控的fd。当你调用epoll_create时，就会在这个虚拟的epoll文件系统里创建一个file结点。当然这个file不是普通文件，它只服务于epoll。epoll在被内核初始化时（操作系统启动），同时会开辟出epoll自己的内核高速cache区，用于安置每一个我们想监控的fd，这些fd会以红黑树的形式保存在内核cache里，以支持快速的查找、插入、删除。这个内核高速cache区，就是建立连续的物理内存页，然后在之上建立slab层，简单的说，就是物理上分配好你想要的size的内存对象，每次使用时都是使用空闲的已分配好的对象。

l epoll的第三个优势在于：当我们调用epoll_ctl往里塞入百万个fd时，epoll_wait仍然可以飞快的返回，并有效的将发生事件的fd给我们用户。这是由于我们在调用epoll_create时，内核除了帮我们在epoll文件系统里建了个file结点，在内核cache里建了个红黑树用于存储以后epoll_ctl传来的fd外，还会再建立一个list链表，用于存储准备就绪的事件，当epoll_wait调用时，仅仅观察这个list链表里有没有数据即可。有数据就返回，没有数据就sleep，等到timeout时间到后即使链表没数据也返回。所以，epoll_wait非常高效。而且，通常情况下即使我们要监控百万计的fd，大多一次也只返回很少量的准备就绪fd而已，所以，epoll_wait仅需要从内核态copy少量的fd到用户态而已。那么，这个准备就绪list链表是怎么维护的呢？当我们执行epoll_ctl时，除了把fd放到epoll文件系统里file对象对应的红黑树上之外，还会给内核中断处理程序注册一个回调函数，告诉内核，如果这个fd的中断到了，就把它放到准备就绪list链表里。所以，当一个fd（例如socket）上有数据到了，内核在把设备（例如网卡）上的数据copy到内核中后就来把fd（socket）插入到准备就绪list链表里了。

如此，一颗红黑树，一张准备就绪fd链表，少量的内核cache，就帮我们解决了大并发下的fd（socket）处理问题。

1.执行epoll_create时，创建了红黑树和就绪list链表。

2.执行epoll_ctl时，如果增加fd（socket），则检查在红黑树中是否存在，存在立即返回，不存在则添加到红黑树上，然后向内核注册回调函数，用于当中断事件来临时向准备就绪list链表中插入数据。

3.执行epoll_wait时立刻返回准备就绪链表里的数据即可。

源码分析如下：

static int __init eventpoll_init(void)

{

mutex_init(&pmutex);

ep_poll_safewake_init(&psw);

epi_cache = kmem_cache_create("eventpoll_epi", sizeof(struct epitem), 0, SLAB_HWCACHE_ALIGN|EPI_SLAB_DEBUG|SLAB_PANIC, NULL);

pwq_cache = kmem_cache_create("eventpoll_pwq", sizeof(struct eppoll_entry), 0, EPI_SLAB_DEBUG|SLAB_PANIC, NULL);

return 0;

}

epoll用kmem_cache_create（slab分配器）分配内存用来存放struct epitem和struct eppoll_entry。

当向系统中添加一个fd时，就创建一个epitem结构体，这是内核管理epoll的基本数据结构：

struct epitem {

struct rb_node rbn; //用于主结构管理的红黑树

struct list_head rdllink; //事件就绪队列

struct epitem *next; //用于主结构体中的链表

struct epoll_filefd ffd; //这个结构体对应的被监听的文件描述符信息

int nwait; //poll操作中事件的个数

struct list_head pwqlist; //双向链表，保存着被监视文件的等待队列，功能类似于select/poll中的poll_table

struct eventpoll *ep; //该项属于哪个主结构体（多个epitm从属于一个eventpoll）

struct list_head fllink; //双向链表，用来链接被监视的文件描述符对应的struct file。因为file里有f_ep_link,用来保存所有监视这个文件的epoll节点

struct epoll_event event; //注册的感兴趣的事件,也就是用户空间的epoll_event

}

而每个epoll fd（epfd）对应的主要数据结构为：

struct eventpoll {

spin_lock_t lock; //对本数据结构的访问

struct mutex mtx; //防止使用时被删除

wait_queue_head_t wq; //sys_epoll_wait() 使用的等待队列

wait_queue_head_t poll_wait; //file->poll()使用的等待队列

struct list_head rdllist; //事件满足条件的链表

struct rb_root rbr; //用于管理所有fd的红黑树（树根）

struct epitem *ovflist; //将事件到达的fd进行链接起来发送至用户空间

}

struct eventpoll在epoll_create时创建。

long sys_epoll_create(int size) {

struct eventpoll *ep;

...

ep_alloc(&ep); //为ep分配内存并进行初始化

/* 调用anon_inode_getfd 新建一个file instance，

也就是epoll可以看成一个文件（匿名文件）。

因此我们可以看到epoll_create会返回一个fd。

epoll所管理的所有的fd都是放在一个大的结构eventpoll(红黑树)中，

将主结构体struct eventpoll *ep放入file->private项中进行保存（sys_epoll_ctl会取用）*/

fd = anon_inode_getfd("[eventpoll]", &eventpoll_fops, ep, O_RDWR | (flags & O_CLOEXEC));

return fd;

}

其中，ep_alloc(struct eventpoll **pep)为pep分配内存，并初始化。

其中，上面注册的操作eventpoll_fops定义如下：

static const struct file_operations eventpoll_fops = {

.release= ep_eventpoll_release,

.poll = ep_eventpoll_poll,

};

这样说来，内核中维护了一棵红黑树，大致的结构如下：

接着是epoll_ctl函数（省略了出错检查等代码）：

asmlinkage long sys_epoll_ctl(int epfd,int op,int fd,struct epoll_event __user *event) {

int error;

struct file *file,*tfile;

struct eventpoll *ep;

struct epoll_event epds;

error = -FAULT;

//判断参数的合法性，将 __user *event 复制给 epds。

if(ep_op_has_event(op) && copy_from_user(&epds,event,sizeof(struct epoll_event)))

goto error_return; //省略跳转到的代码

file = fget (epfd); // epoll fd 对应的文件对象

tfile = fget(fd); // fd 对应的文件对象

//在create时存入进去的（anon_inode_getfd），现在取用。

ep = file->private->data;

mutex_lock(&ep->mtx);

//防止重复添加（在ep的红黑树中查找是否已经存在这个fd）

epi = epi_find(ep,tfile,fd);

switch(op)

{

...

case EPOLL_CTL_ADD: //增加监听一个fd

if(!epi)

{

epds.events |= EPOLLERR | POLLHUP; //默认包含POLLERR和POLLHUP事件

error = ep_insert(ep,&epds,tfile,fd); //在ep的红黑树中插入这个fd对应的epitm结构体。

} else //重复添加（在ep的红黑树中查找已经存在这个fd）。

error = -EEXIST;

break;

...

}

return error;

}

ep_insert的实现如下：

static int ep_insert(struct eventpoll *ep, struct epoll_event *event, struct file *tfile, int fd)

{

int error ,revents,pwake = 0;

unsigned long flags ;

struct epitem *epi;

struct ep_queue{

poll_table pt;

struct epitem *epi;

} */

struct ep_pqueue epq;

//分配一个epitem结构体来保存每个加入的fd

if(!(epi = kmem_cache_alloc(epi_cache,GFP_KERNEL)))

goto error_return;

//初始化该结构体

ep_rb_initnode(&epi->rbn);

INIT_LIST_HEAD(&epi->rdllink);

INIT_LIST_HEAD(&epi->fllink);

INIT_LIST_HEAD(&epi->pwqlist);

epi->ep = ep;

ep_set_ffd(&epi->ffd,tfile,fd);

epi->event = *event;

epi->nwait = 0;

epi->next = EP_UNACTIVE_PTR;

epq.epi = epi;

//安装poll回调函数

init_poll_funcptr(&epq.pt, ep_ptable_queue_proc );

/* 调用poll函数来获取当前事件位，其实是利用它来调用注册函数ep_ptable_queue_proc（poll_wait中调用）。

如果fd是套接字，f_op为socket_file_ops，poll函数是

sock_poll()。如果是TCP套接字的话，进而会调用

到tcp_poll()函数。此处调用poll函数查看当前

文件描述符的状态，存储在revents中。

在poll的处理函数(tcp_poll())中，会调用sock_poll_wait()，

在sock_poll_wait()中会调用到epq.pt.qproc指向的函数，

也就是ep_ptable_queue_proc()。 */

revents = tfile->f_op->poll(tfile, &epq.pt);

spin_lock(&tfile->f_ep_lock);

list_add_tail(&epi->fllink,&tfile->f_ep_lilnks);

spin_unlock(&tfile->f_ep_lock);

ep_rbtree_insert(ep,epi); //将该epi插入到ep的红黑树中

spin_lock_irqsave(&ep->lock,flags);

// revents & event->events：刚才fop->poll的返回值中标识的事件有用户event关心的事件发生。

// !ep_is_linked(&epi->rdllink)：epi的ready队列中有数据。ep_is_linked用于判断队列是否为空。

/* 如果要监视的文件状态已经就绪并且还没有加入到就绪队列中,则将当前的

epitem加入到就绪队列中.如果有进程正在等待该文件的状态就绪,则

唤醒一个等待的进程。 */

if((revents & event->events) && !ep_is_linked(&epi->rdllink)) {

list_add_tail(&epi->rdllink,&ep->rdllist); //将当前epi插入到ep->ready队列中。

/* 如果有进程正在等待文件的状态就绪，

也就是调用epoll_wait睡眠的进程正在等待，

则唤醒一个等待进程。

waitqueue_active(q) 等待队列q中有等待的进程返回1，否则返回0。

if(waitqueue_active(&ep->wq))

__wake_up_locked(&ep->wq,TAKS_UNINTERRUPTIBLE | TASK_INTERRUPTIBLE);

/* 如果有进程等待eventpoll文件本身（???）的事件就绪，

则增加临时变量pwake的值，pwake的值不为0时，

在释放lock后，会唤醒等待进程。 */

if(waitqueue_active(&ep->poll_wait))

pwake++;

}

spin_unlock_irqrestore(&ep->lock,flags);

if(pwake)

ep_poll_safewake(&psw,&ep->poll_wait);//唤醒等待eventpoll文件状态就绪的进程

return 0;

}

init_poll_funcptr(&epq.pt, ep_ptable_queue_proc);

revents = tfile->f_op->poll(tfile, &epq.pt);

这两个函数将ep_ptable_queue_proc注册到epq.pt中的qproc。

typedef struct poll_table_struct {

poll_queue_proc qproc;

unsigned long key;

}poll_table;

执行f_op->poll(tfile, &epq.pt)时，XXX_poll(tfile, &epq.pt)函数会执行poll_wait()，poll_wait()会调用epq.pt.qproc函数，即ep_ptable_queue_proc。

ep_ptable_queue_proc函数如下：

/* 在文件操作中的poll函数中调用，将epoll的回调函数加入到目标文件的唤醒队列中。

如果监视的文件是套接字，参数whead则是sock结构的sk_sleep成员的地址。 */

static void ep_ptable_queue_proc(struct file *file, wait_queue_head_t *whead, poll_table *pt) {

/* struct ep_queue{

poll_table pt;

struct epitem *epi;

} */

struct epitem *epi = ep_item_from_epqueue(pt); //pt获取struct ep_queue的epi字段。

struct eppoll_entry *pwq;

if (epi->nwait >= 0 && (pwq = kmem_cache_alloc(pwq_cache, GFP_KERNEL))) {

init_waitqueue_func_entry(&pwq->wait, ep_poll_callback);

pwq->whead = whead;

pwq->base = epi;

add_wait_queue(whead, &pwq->wait);

list_add_tail(&pwq->llink, &epi->pwqlist);

epi->nwait++;

} else {

/* We have to signal that an error occurred */

* 如果分配内存失败，则将nwait置为-1，表示

* 发生错误，即内存分配失败，或者已发生错误

epi->nwait = -1;

}

其中struct eppoll_entry定义如下：

struct eppoll_entry {

struct list_head llink;

struct epitem *base;

wait_queue_t wait;

wait_queue_head_t *whead;

};

ep_ptable_queue_proc 函数完成 epitem 加入到特定文件的wait队列任务。

ep_ptable_queue_proc有三个参数：

struct file *file; 该fd对应的文件对象

wait_queue_head_t *whead; 该fd对应的设备等待队列（同select中的mydev->wait_address）

poll_table *pt; f_op->poll(tfile, &epq.pt)中的epq.pt

在ep_ptable_queue_proc函数中，引入了另外一个非常重要的数据结构eppoll_entry。eppoll_entry主要完成epitem和epitem事件发生时的callback（ep_poll_callback）函数之间的关联。首先将eppoll_entry的whead指向fd的设备等待队列（同select中的wait_address），然后初始化eppoll_entry的base变量指向epitem，最后通过add_wait_queue将epoll_entry挂载到fd的设备等待队列上。完成这个动作后，epoll_entry已经被挂载到fd的设备等待队列。

由于ep_ptable_queue_proc函数设置了等待队列的ep_poll_callback回调函数。所以在设备硬件数据到来时，硬件中断处理函数中会唤醒该等待队列上等待的进程时，会调用唤醒函数ep_poll_callback（参见博文http://www.cnblogs.com/apprentice89/archive/2013/05/09/3068274.html）。

static int ep_poll_callback(wait_queue_t *wait, unsigned mode, int sync, void *key) {

int pwake = 0;

unsigned long flags;

struct epitem *epi = ep_item_from_wait(wait);

struct eventpoll *ep = epi->ep;

spin_lock_irqsave(&ep->lock, flags);

//判断注册的感兴趣事件

//#define EP_PRIVATE_BITS (EPOLLONESHOT | EPOLLET)

//有非EPOLLONESHONT或EPOLLET事件

if (!(epi->event.events & ~EP_PRIVATE_BITS))

goto out_unlock;

if (unlikely(ep->ovflist != EP_UNACTIVE_PTR)) {

if (epi->next == EP_UNACTIVE_PTR) {

epi->next = ep->ovflist;

ep->ovflist = epi;

}

goto out_unlock;

}

if (ep_is_linked(&epi->rdllink))

goto is_linked;

//***关键***，将该fd加入到epoll监听的就绪链表中

list_add_tail(&epi->rdllink, &ep->rdllist);

//唤醒调用epoll_wait()函数时睡眠的进程。用户层epoll_wait(...) 超时前返回。

if (waitqueue_active(&ep->wq))

__wake_up_locked(&ep->wq, TASK_UNINTERRUPTIBLE | TASK_INTERRUPTIBLE);

if (waitqueue_active(&ep->poll_wait))

pwake++;

out_unlock: spin_unlock_irqrestore(&ep->lock, flags);

if (pwake)

ep_poll_safewake(&psw, &ep->poll_wait);

return 1;

}

所以ep_poll_callback函数主要的功能是将被监视文件的等待事件就绪时，将文件对应的epitem实例添加到就绪队列中，当用户调用epoll_wait()时，内核会将就绪队列中的事件报告给用户。

epoll_wait实现如下：

SYSCALL_DEFINE4(epoll_wait, int, epfd, struct epoll_event __user *, events, int, maxevents, int, timeout) {

int error;

struct file *file;

struct eventpoll *ep;

/* 检查maxevents参数。 */

if (maxevents <= 0 || maxevents > EP_MAX_EVENTS)

return -EINVAL;

/* 检查用户空间传入的events指向的内存是否可写。参见__range_not_ok()。 */

if (!access_ok(VERIFY_WRITE, events, maxevents * sizeof(struct epoll_event))) {

error = -EFAULT;

goto error_return;

}

/* 获取epfd对应的eventpoll文件的file实例，file结构是在epoll_create中创建。 */

error = -EBADF;

file = fget(epfd);

if (!file)

goto error_return;

/* 通过检查epfd对应的文件操作是不是eventpoll_fops 来判断epfd是否是一个eventpoll文件。如果不是则返回EINVAL错误。 */

error = -EINVAL;

if (!is_file_epoll(file))

goto error_fput;

/* At this point it is safe to assume that the "private_data" contains */

ep = file->private_data;

/* Time to fish for events ... */

error = ep_poll(ep, events, maxevents, timeout);

error_fput:

fput(file);

error_return:

return error;

}

epoll_wait调用ep_poll，ep_poll实现如下：

static int ep_poll(struct eventpoll *ep, struct epoll_event __user *events, int maxevents, long timeout) {

int res, eavail;

unsigned long flags;

long jtimeout;

wait_queue_t wait;

/* timeout是以毫秒为单位，这里是要转换为jiffies时间。这里加上999(即1000-1)，是为了向上取整。 */

jtimeout = (timeout < 0 || timeout >= EP_MAX_MSTIMEO) ?MAX_SCHEDULE_TIMEOUT : (timeout * HZ + 999) / 1000;

retry:

spin_lock_irqsave(&ep->lock, flags);

res = 0;

if (list_empty(&ep->rdllist)) {

/* 没有事件，所以需要睡眠。当有事件到来时，睡眠会被ep_poll_callback函数唤醒。*/

init_waitqueue_entry(&wait, current); //将current进程放在wait这个等待队列中。

wait.flags |= WQ_FLAG_EXCLUSIVE;

/* 将当前进程加入到eventpoll的等待队列中，等待文件状态就绪或直到超时，或被信号中断。 */

__add_wait_queue(&ep->wq, &wait);

for (;;) {

/* 执行ep_poll_callback()唤醒时应当需要将当前进程唤醒，所以当前进程状态应该为“可唤醒”TASK_INTERRUPTIBLE */

set_current_state(TASK_INTERRUPTIBLE);

/* 如果就绪队列不为空，也就是说已经有文件的状态就绪或者超时，则退出循环。*/

if (!list_empty(&ep->rdllist) || !jtimeout)

break;

/* 如果当前进程接收到信号，则退出循环，返回EINTR错误 */

if (signal_pending(current)) {

res = -EINTR;

break;

}

spin_unlock_irqrestore(&ep->lock, flags);

/* 主动让出处理器，等待ep_poll_callback()将当前进程唤醒或者超时,返回值是剩余的时间。

从这里开始当前进程会进入睡眠状态，直到某些文件的状态就绪或者超时。

当文件状态就绪时，eventpoll的回调函数ep_poll_callback()会唤醒在ep->wq指向的等待队列中的进程。*/

jtimeout = schedule_timeout(jtimeout);

spin_lock_irqsave(&ep->lock, flags);

}

__remove_wait_queue(&ep->wq, &wait);

set_current_state(TASK_RUNNING);

}

/* ep->ovflist链表存储的向用户传递事件时暂存就绪的文件。

* 所以不管是就绪队列ep->rdllist不为空，或者ep->ovflist不等于

* EP_UNACTIVE_PTR，都有可能现在已经有文件的状态就绪。

* ep->ovflist不等于EP_UNACTIVE_PTR有两种情况，一种是NULL，此时

* 可能正在向用户传递事件，不一定就有文件状态就绪，

* 一种情况时不为NULL，此时可以肯定有文件状态就绪，

* 参见ep_send_events()。

eavail = !list_empty(&ep->rdllist) || ep->ovflist != EP_UNACTIVE_PTR;

spin_unlock_irqrestore(&ep->lock, flags);

/* Try to transfer events to user space. In case we get 0 events and there's still timeout left over, we go trying again in search of more luck. */

/* 如果没有被信号中断，并且有事件就绪，但是没有获取到事件(有可能被其他进程获取到了)，并且没有超时，则跳转到retry标签处，重新等待文件状态就绪。 */

if (!res && eavail && !(res = ep_send_events(ep, events, maxevents)) && jtimeout)

goto retry;

/* 返回获取到的事件的个数或者错误码 */

return res;

}

ep_send_events函数向用户空间发送就绪事件。

ep_send_events()函数将用户传入的内存简单封装到ep_send_events_data结构中，然后调用ep_scan_ready_list() 将就绪队列中的事件传入用户空间的内存。

用户空间访问这个结果，进行处理。

主要参考：

http://blog.chinaunix.net/uid-20687780-id-2105154.html

http://blog.chinaunix.net/uid-20687780-id-2105157.html

http://blog.chinaunix.net/uid-20687780-id-2105159.html

http://www.cnblogs.com/debian/archive/2012/02/16/2354454.html

http://blog.csdn.net/moonvs2010/article/details/8506890

你可能感兴趣的:(linux内核)

Docker下载，包含Win、Mac 码码哈哈0.0 实用工具 docker 容器运维
介绍Docker是一种开源的容器化平台，通过操作系统级虚拟化技术实现应用的快速开发、部署和运行。以下从多个维度对Docker进行详细介绍：一、Docker的核心概念与功能容器化技术Docker利用Linux内核的容器隔离技术（如Cgroups和Namespace），将应用及其依赖打包为轻量级、可移植的容器。容器与虚拟机不同，它无需模拟完整操作系统，而是共享主机内核，因此启动更快、资源占用更低。核心
Linux系统移植篇（七）Linux 内核kernel 启动流程 7yewh 【Linux 系统移植】linux 运维服务器驱动开发
链接脚本vmlinux.lds要分析Linux启动流程，同样需要先编译一下Linux源码，因为有很多文件是需要编译才会生成的。首先分析Linux内核的连接脚本文件arch/arm/kernel/vmlinux.lds，通过链接脚本可以找到Linux内核的第一行程序是从哪里执行的。（跟Uboot启动流程的ids一样）492OUTPUT_ARCH(arm)493ENTRY(stext)494jiffi
tiny linux: 内核精简的根文件系统制作 SunliyMonkey 一一『操作系统』tiny linux qemu busybox 根文件系统
tinylinuxtiny_linux要求实现以下两点：精简linux内核镜像，要求在支持TCP/IP数据传输的情况下，内核镜像和正常运行所需内存能够做到尽可能的小。采用busybox制作根文件系统，利用kernelmodelinux补丁，使得busybox运行在内核态。欢迎访问tiny_linux,这里有编译好的内核镜像，根文件系统镜像以及相关脚本，供大家使用。涉及知识点qemu使用linux内
linux内核mmap映射区域 fantasy_arch linux 服务器数据库
当用户使用malloc申请大于128KB的堆内存时，内存分配器会通过mmap系统调用，在linux进程虚拟空间中直接映射一片内存给用户使用，这片使用mmap映射的内存区域比较神秘。当我们运行一个程序时，需要从磁盘上将该可执行文件加载到内存。将文件加载到内存有两种常用的操作方法，一种是通过常规的文件I/O操作，如read/write等系统调用接口，一种是使用mmap系统调用将文件映射到进程的虚拟空间
Ubuntu 将更改版本规则，使用最新内核发布发行版 CIb0la 树莓派运维程序人生 ubuntu linux
众所周知，Canonical开发的Ubuntu发行版每半年发布一个新版本，而Linux内核却是大约每2-3个月发布一个新版本。这导致一个问题，Ubuntu发行版永远使用的不是最新内核。因为按照Ubuntu的开发周期，Ubuntu开发阶段选择使用的版本到正式发布时肯定已经落后于上游的最新稳定版本。现在CanonicalKernelTeam(CKT)宣布将改变内核选择方法，即在发布冻结日期时采用最新可
Linux内核--进程管理(十一)多核下的负载均衡文艺小少年 CPU性能分析与操作系统的构建 linux 负载均衡运维
目录一、引言二、调度机制介绍------>2.1、线程的多核运行------>2.2、RT进程多核负载均衡------>2.3、普通进程多核负载均衡------>2.4、设置CPUtaskaffinity三、中断负载均衡、RPS软中断负载均衡四、linux非实时系统------>4.1、优化措施一、引言本文延续前一章的内容，介绍调度器的其他内容：关于多核、分群、硬实时二、多核下的负载均衡tips:
嵌入式Linux网络编程实战：基于DNS解析的HTTP客户端实现银河码 Linux网络编程网络 linux http c语言 windows vscode json
嵌入式Linux网络编程实战：基于DNS解析的HTTP客户端实现【本文代码已在树莓派4B（Linux内核5.10）平台验证通过，适用于物联网设备数据上报等场景】一、需求场景与功能亮点1.1典型物联网通信场景嵌入式设备DNS服务器云服务器域名解析请求返回目标IP发送传感器数据返回HTTP响应嵌入式设备DNS服务器云服务器1.2代码核心功能DNS智能解析：支持域名自动转换为IPv4地址协议合规性：严格
linux的防火墙（iptables） JM丫 linux centos
防火墙的作用：linux防火墙主要是工作在网络层，针对TCP/IP数据包实施过滤和限制，属于典型的包过滤防火墙（或者为网络层防火墙）linux的防火墙分为两种，分别为netfiter和iptables，这两种都被称为防火墙，但是又有一些区别，具体的区别在于：1、netfilter：称为内核空间，是linux内核中实现包过滤的防火墙的内部结构，属于“内核态，又称为内核空间”防火墙功能体系。2、ipt
【Android】adb shell基本使用教程 Vesper63 android adb
adbshell是AndroidDebugBridge(ADB)工具中的一个命令，用于在连接的Android设备或模拟器上执行shell命令。通过adbshell，你可以直接与设备的Linux内核交互，执行各种操作。基本用法启动adbshell：在终端或命令提示符中输入以下命令：adbshell这将进入设备的shell环境，提示符通常会变为$或#（#表示root权限）。执行单个命令：如果你只想执行
Linux中断机制详解：从原理到实践 AllenBright #Linux linux 运维服务器
想象一下医院的急诊科：当有危重病人到达时，护士会立即按下紧急呼叫按钮，打断医生当前的常规工作，优先处理最紧急的情况。这种中断响应机制正是计算机系统中中断（Interrupt）的核心思想。在Linux内核中，中断是硬件与软件交互的核心机制，直接关系到系统的响应速度、吞吐量和稳定性。本文将深入剖析Linux中断的工作原理，并演示如何在实际操作中管理和优化中断。1.中断的本质与分类1.1什么是中断？中断
浅谈Linux中的Shell及其原理有梦想的电信狗 linux 服务器 ssh unix 开发语言 c语言 c++
浅谈Linux中的Shell及其原理Linux中Shell的运行原理github地址前言一、Linux内核与Shell的关系1.1操作系统核心1.2用户与内核的隔离二、Shell的演进与核心机制2.1发展历程2.2核心功能解析2.3shell的工作流程1.用户输入命令2.解析器拆分指令3.扩展器处理动态内容变量替换通配符扩展命令替换4.执行器运行命令5.内核处理系统调用6.返回结果关键组件协作三、
Linux驱动开发IO操作之阻塞与非阻塞暗夜之眼007 Linux驱动驱动开发
阻塞IO当应用程序通过read读取或write写入设备文件的某些数据时，就会调用驱动程序的read或者write函数，此时可能会遇到没有数据可读或者写满的情况，这时如果驱动程序会进入睡眠，当有数据可读或者可写的时候唤醒再返回，我们称这种操作为阻塞IO。下图是阻塞式IO访问示意图：阻塞IO相关函数init_waitqueue_head函数init_waitqueue_head‌是Linux内核中用于
嵌入式面试真题——Linux内核空间与用户空间 70000cc 嵌入式面试真题 linux c语言嵌入式硬件面试单片机
本文以32位系统为例介绍内核空间(kernelspace)和用户空间(userspace)。对32位操作系统而言，它的寻址空间（虚拟地址空间，或叫线性地址空间）为4G（2的32次方）。也就是说一个进程的最大地址空间为4G。操作系统的核心是内核(kernel)，它独立于普通的应用程序，可以访问受保护的内存空间，也有访问底层硬件设备的所有权限。为了保证内核的安全，现在的操作系统一般都强制用户进程不能直
Linux内核课程学习心得萝卜cherish linux 内核分析 linux内核学习总结
罗晓波+原创作品转载请注明出处+《Linux内核分析》MOOC课程http://mooc.study.163.com/course/USTC-1000029000不知不觉，八周课程一晃而过，回想起当初选择这门课到学习完最后一个课件，也是一个习惯的养成了，到现在我倒是习惯性地在周五和周日上一下课程主页，不过在这八周的线上课程学习中，我还是有所收获的，下面把我的一点小感想分享一下吧。课程第一周，通过一
Linux内核地址空间布局详解 Linux加油站 linux 网络
1.简介虽然x86_64的物理地址范围为64bit，但是因为地址空间太大目前不可能完全用完，当前支持57bit和48bit两种虚拟地址模式。地址模式单个空间用户地址空间内核地址空间32位2G0x00000000-0x7FFFFFFF0x80000000-0xFFFFFFFF64位(48bit)128T0x0000000000000000-0x00007FFFFFFFFFFF0xFFFF800000
Linux内核——遍历 net_device 结构唯独不开心 linux内核代码学习 net_device
linux内核版本：2.6.32dev_base_head,dev_list)#definefor_each_netdev_reverse(net,d)\list_for_each_entry_reverse(d,&(net)->dev_base_head,dev_list)#definefor_each_netdev_rcu(net,d)\list_for_each_entry_rcu(d,&(
Linux系统移植 —— Kernel编译、安装、开发 Fang- Linux学习笔记 linux 系统移植内核移植内核编译安装
=======================1Linux内核配置与编译=======================一、清除临时文件、中间文件、配置文件makeclean清除编译生成的文件，保留配置文件makemrproper清除编译生成的文件和配置文件makedistclean清除所有文件二、配置内核一般会以一个参考的配置文件（如：arch/arm/），在该文件基础上进行配置。makeconf
linux 学习笔记 IT 古月方源 linux 学习笔记
#Linux学习笔记##1Linux入门###1.1概述Linux内核最初只是芬兰人在赫尔辛基大学上学时处于个人爱好而编写的。Linux是一套免费使用和自由传播的类Unix操作系统，是一个基于POSIX和UNIX的多用户、多任务、支持多线程和多CPU的操作系统。Linux能运行主要的UNIX工具软件、应用程序和网络协议。它支持32位和64位硬件。Linux继承了Unix以网络为核心的设计思想，是一
alios与centos操作系统有什么区别？ wordpress爱好者 centos linux 运维
阿里云AliOS与CentOS操作系统：差异与比较结论：阿里云AliOS和CentOS，两者都是操作系统领域的重量级选手，但它们的核心理念、使用场景以及技术特性却大相径庭。阿里云AliOS基于Linux内核，专注于物联网(IoT)领域，强调安全性、定制化和云端服务的无缝对接；而CentOS则是一个基于RHEL（RedHatEnterpriseLinux）的开源操作系统，主要服务于企业级市场，以其稳
Linux学习(十五)(故障排除(ICMP,Ping,Traceroute,网络统计,数据包分析)) solomonzw linux 学习网络
故障排除是任何Linux用户或管理员的基本技能。这涉及识别和解决Linux系统中的问题。这些问题的范围包括常见的系统错误、硬件或软件问题、网络连接问题以及系统资源的管理。Linux中的故障排除过程通常涉及使用命令行工具、检查系统和应用程序日志文件、了解系统进程，有时还涉及深入研究Linux内核。有效故障排除的关键是了解Linux的工作原理并熟悉常见的命令行工具。此外，能够解释错误消息、使用Linu
简要分析NETLINK_KOBJECT_UEVENT参数 TJ_Dream 基础内核函数分析网络
NETLINK_KOBJECT_UEVENT时Linux内核中Netlink协议族的一个特定类型，专门用于传递内核对象（kobject）相关的设备事件消息（称为uevent）。它是实现动态设备管理（如热插拔、驱动加载）的核心机制，支撑了udev、systemd-udevd等用户空间设备管理服务的工作。一、核心作用1.传递设备状态变更事件当设备被添加（如USB插入）、移除（如硬盘拔出）、状态变化（如
简要分析NETLINK_ROUTE参数 TJ_Dream 基础内核函数分析 linux 网络运维
NETLINK_ROUTE时Linux内核中Netlink协议族的一个子类型，专用于用户空间与内核网络子系统之间的通信，它是实现动态网络配置（如路由表、网络接口、地址管理）的核心机制，为现代网络管理工具（如iproute2）提供了底层支持。一、NETLINK_ROUTE的核心作用1.路由表管理添加、删除路由条目（如静态路由、策略路由）查询当前路由表状态（IPv4/IPv6）2.网络接口控制创建、删
Linux基础——操作系统（OS）、操作系统内核（Kernel）和Shell D3Zane Linux基础 linux
文章目录前言一、操作系统（OS）和操作系统内核（Kernel）1.操作系统架构2.内核在操作系统中的具体位置二、了解Shell1.Shell是什么？2.Shell的类型3.Shell的功能？4.Shell的工作原理？5.Shell示例三、Linux命令的执行的过程（原理）总结前言首先，先向Linux创始人LinusTorvalds以及Linux的整个开源社区致敬，没有Linus的Linux内核，没
Linux 内核移植 River-D Driver
NXP官方开发板Linux内核编译37.2.1修改顶层Makefile修改顶层Makefile，直接在顶层Makefile文件里面定义ARCH和CROSS_COMPILE这两个的变量值为arm和arm-linux-gnueabihf-37.2.2配置并编译Linux内核和uboot一样，在编译Linux内核之前要先配置Linux内核。每个板子都有其对应的默认配置文件，这些默认配置文件保存在arch
linux防火墙iptables、ufw、firewalld 思静鱼 Linux&运维安装 linux 运维服务器
文章目录防火墙iptables、ufw、firewalld的区别iptables、ufw和firewalld都可以在CentOS和Ubuntu上使用防火墙iptables、ufw、firewalld的区别iptables、ufw和firewalld是Linux系统中常用的防火墙管理工具，它们在功能和使用方式上有所不同。以下是它们的区别：iptables定义:iptables是Linux内核中的防火
深入Linux内核架构：操作系统的核心奥秘 Echo_Wish 运维探秘让你快速入坑运维 linux 架构运维
Linux是一种广泛使用的开源操作系统，其核心组件——Linux内核，承担着系统资源管理与硬件交互的关键任务。对于系统运维人员和开发者来说，理解Linux内核的架构不仅有助于高效管理系统，还能优化性能，排查复杂问题。本文将深入浅出地介绍Linux内核架构的核心组成，并配以简单的代码示例和逻辑说明，帮助您更好地理解这一重要领域。一、什么是Linux内核？Linux内核是操作系统的核心，它为上层应用提
Git与GitHub：理解两者差异及其关系抱抱宝 git github
目录Git与GitHub：理解两者差异及其关系Git：分布式版本控制系统概述主要特点GitHub：基于Web的托管服务概述主要特点Git和GitHub如何互补关系现代开发工作流结论Git与GitHub：理解两者差异及其关系Git：分布式版本控制系统概述什么是Git？Git是一个设计用来高效处理从小到大项目的分布式版本控制系统（DVCS）。它由林纳斯·托瓦兹于2005年为Linux内核的开发而创建。
Android USB Camera(1) : 调试记录 LittleProgrammer2S MTK Android USB-Camera UVC V4L2
1.前言前段时间调试了一个uvc摄像头，这里做下记录。硬件平台为mt6735，软件平台为android5.02.底层配置UVC全称是usbvideoclass，一种usb视频规范。所有遵循uvc协议的摄像头都不需要安装额外的驱动，只需要一个通用驱动即可。Linux内核已经集成了uvc驱动，代码路径是kernel-3.10/drivers/media/usb/uvc/2.1打开配置Linux内核需要
鸿蒙的底层是linux吗？博览鸿蒙鸿蒙 harmonyos linux 华为
结论：鸿蒙系统的底层技术确实与Linux有关联，但并非完全基于Linux开发。下面详细解释这一点：鸿蒙系统与Linux的关系‌技术根基‌：鸿蒙系统采用了Linux内核作为其底层的一部分，但华为在Linux的基础上进行了大量的优化和改进，以适应鸿蒙系统的特定需求和华为自家的硬件设备及软件生态。这意味着鸿蒙系统虽然利用了Linux内核的某些优势，但并非简单地复用Linux的代码或架构。‌自主可控‌：由
linux git 搭建 debian,如何在Debian服务器上安装公共Git存储库高江Takae linux git 搭建 debian
如何在Debian服务器上安装公共Git存储库Git是一个免费的分布式版本控制，最初由LinusTorvalds为Linux内核开发创建。它主要在Linux上开发，但可用于其他Unix操作系统，包括BSD，Solaris和Darwin。基于POSIX的系统，如Linux，Git非常快。它与svn不同，并在远程服务器上创建一个私有存储库。一些流行的项目使用Git：*YUI*Merb*DragonFl
LeetCode[位运算] - #137 Single Number II Cwind java Algorithm LeetCode 题解位运算
原题链接：#137 Single Number II 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现三次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：与#136类似，都是考察位运算。不过出现两次的可以使用异或运算的特性 n XOR n = 0, n XOR 0 = n，即某一
《JavaScript语言精粹》笔记 aijuans JavaScript
0、JavaScript的简单数据类型包括数字、字符创、布尔值（true/false）、null和undefined值，其它值都是对象。 1、JavaScript只有一个数字类型，它在内部被表示为64位的浮点数。没有分离出整数，所以1和1.0的值相同。 2、NaN是一个数值，表示一个不能产生正常结果的运算结果。NaN不等于任何值，包括它本身。可以用函数isNaN(number)检测NaN,但是
你应该更新的Java知识之常用程序库 Kai_Ge java
在很多人眼中，Java 已经是一门垂垂老矣的语言，但并不妨碍 Java 世界依然在前进。如果你曾离开 Java，云游于其它世界，或是每日只在遗留代码中挣扎，或许是时候抬起头，看看老 Java 中的新东西。 Guava Guava[gwɑ:və]，一句话，只要你做Java项目，就应该用Guava（Github）。 guava 是 Google 出品的一套 Java 核心库，在我看来，它甚至应该
HttpClient 120153216 httpclient
/** * 可以传对象的请求转发，对象已流形式放入HTTP中 */ public static Object doPost(Map<String,Object> parmMap,String url) { Object object = null; HttpClient hc = new HttpClient(); String fullURL
Django model字段类型清单 2002wmj django
Django 通过 models 实现数据库的创建、修改、删除等操作，本文为模型中一般常用的类型的清单，便于查询和使用： AutoField：一个自动递增的整型字段，添加记录时它会自动增长。你通常不需要直接使用这个字段；如果你不指定主键的话，系统会自动添加一个主键字段到你的model。(参阅自动主键字段) BooleanField：布尔字段,管理工具里会自动将其描述为checkbox。 Cha
在SQLSERVER中查找消耗CPU最多的SQL 357029540 SQL Server
返回消耗CPU数目最多的10条语句 SELECT TOP 10 total_worker_time/execution_count AS avg_cpu_cost, plan_handle, execution_count, (SELECT SUBSTRING(text, statement_start_of
Myeclipse项目无法部署，Undefined exploded archive location 7454103 eclipse MyEclipse
做个备忘！错误信息为： Undefined exploded archive location 原因：在工程转移过程中，导致工程的配置文件出错；解决方法：
GMT时间格式转换 adminjun GMT 时间转换
普通的时间转换问题我这里就不再罗嗦了，我想大家应该都会那种低级的转换问题吧，现在我向大家总结一下如何转换GMT时间格式，这种格式的转换方法网上还不是很多，所以有必要总结一下，也算给有需要的朋友一个小小的帮助啦。 1、可以使用 SimpleDateFormat SimpleDateFormat EEE-三位星期 d-天 MMM-月 yyyy-四位年
Oracle数据库新装连接串问题 aijuans oracle数据库
割接新装了数据库，客户端登陆无问题，apache/cgi-bin程序有问题，sqlnet.log日志如下： Fatal NI connect error 12170. VERSION INFORMATION: TNS for Linux: Version 10.2.0.4.0 - Product
回顾java数组复制 ayaoxinchao java 数组
在写这篇文章之前，也看了一些别人写的，基本上都是大同小异。文章是对java数组复制基础知识的回顾，算是作为学习笔记，供以后自己翻阅。首先，简单想一下这个问题：为什么要复制数组？我的个人理解：在我们在利用一个数组时，在每一次使用，我们都希望它的值是初始值。这时我们就要对数组进行复制，以达到原始数组值的安全性。java数组复制大致分为3种方式：①for循环方式 ②clone方式 ③arrayCopy方
java web会话监听并使用spring注入 bewithme Java Web
在java web应用中，当你想在建立会话或移除会话时，让系统做某些事情，比如说，统计在线用户，每当有用户登录时，或退出时，那么可以用下面这个监听器来监听。 import java.util.ArrayList; import java.ut
NoSQL数据库之Redis数据库管理(Redis的常用命令及高级应用) bijian1013 redis 数据库 NoSQL
一 .Redis常用命令 Redis提供了丰富的命令对数据库和各种数据库类型进行操作，这些命令可以在Linux终端使用。 a.键值相关命令 b.服务器相关命令 1.键值相关命令 &
java枚举序列化问题 bingyingao java 枚举序列化
对象在网络中传输离不开序列化和反序列化。而如果序列化的对象中有枚举值就要特别注意一些发布兼容问题: 1.加一个枚举值新机器代码读分布式缓存中老对象，没有问题，不会抛异常。老机器代码读分布式缓存中新对像，反序列化会中断，所以在所有机器发布完成之前要避免出现新对象，或者提前让老机器拥有新增枚举的jar。 2.删一个枚举值新机器代码读分布式缓存中老对象，反序列
【Spark七十八】Spark Kyro序列化 bit1129 spark
当使用SparkContext的saveAsObjectFile方法将对象序列化到文件，以及通过objectFile方法将对象从文件反序列出来的时候，Spark默认使用Java的序列化以及反序列化机制，通常情况下，这种序列化机制是很低效的，Spark支持使用Kyro作为对象的序列化和反序列化机制，序列化的速度比java更快，但是使用Kyro时要注意，Kyro目前还是有些bug。 Spark
Hybridizing OO and Functional Design bookjovi erlang haskell
推荐博文： Tell Above, and Ask Below - Hybridizing OO and Functional Design 文章中把OO和FP讲的深入透彻，里面把smalltalk和haskell作为典型的两种编程范式代表语言，此点本人极为同意，smalltalk可以说是最能体现OO设计的面向对象语言，smalltalk的作者Alan kay也是OO的最早先驱，
Java-Collections Framework学习与总结-HashMap BrokenDreams Collections
开发中常常会用到这样一种数据结构，根据一个关键字，找到所需的信息。这个过程有点像查字典，拿到一个key，去字典表中查找对应的value。Java1.0版本提供了这样的类java.util.Dictionary(抽象类)，基本上支持字典表的操作。后来引入了Map接口，更好的描述的这种数据结构。 &nb
读《研磨设计模式》-代码笔记-职责链模式-Chain Of Responsibility bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 业务逻辑：项目经理只能处理500以下的费用申请，部门经理是1000，总经理不设限。简单起见，只同意“Tom”的申请 * bylijinnan */ abstract class Handler { /*
Android中启动外部程序 cherishLC android
1、启动外部程序引用自： http://blog.csdn.net/linxcool/article/details/7692374 //方法一 Intent intent=new Intent(); //包名包名+类名（全路径） intent.setClassName("com.linxcool", "com.linxcool.PlaneActi
summary_keep_rate coollyj SUM
BEGIN /*DECLARE minDate varchar(20) ; DECLARE maxDate varchar(20) ;*/ DECLARE stkDate varchar(20) ; DECLARE done int default -1; /* 游标中注册服务器地址 */ DE
hadoop hdfs 添加数据目录出错 daizj hadoop hdfs 扩容
由于原来配置的hadoop data目录快要用满了，故准备修改配置文件增加数据目录，以便扩容，但由于疏忽，把core-site.xml, hdfs-site.xml配置文件dfs.datanode.data.dir 配置项增加了配置目录，但未创建实际目录，重启datanode服务时，报如下错误： 2014-11-18 08:51:39,128 WARN org.apache.hadoop.h
grep 目录级联查找 dongwei_6688 grep
在Mac或者Linux下使用grep进行文件内容查找时，如果给定的目标搜索路径是当前目录，那么它默认只搜索当前目录下的文件，而不会搜索其下面子目录中的文件内容，如果想级联搜索下级目录，需要使用一个“-r”参数： grep -n -r "GET" . 上面的命令将会找出当前目录“.”及当前目录中所有下级目录
yii 修改模块使用的布局文件 dcj3sjt126com yii layouts
方法一：yii模块默认使用系统当前的主题布局文件，如果在主配置文件中配置了主题比如: 'theme'=>'mythm', 那么yii的模块就使用 protected/themes/mythm/views/layouts 下的布局文件；如果未配置主题，那么 yii的模块就使用 protected/views/layouts 下的布局文件，总之默认不是使用自身目录 pr
设计模式之单例模式 come_for_dream 设计模式单例模式懒汉式饿汉式双重检验锁失败无序写入
今天该来的面试还没来，这个店估计不会来电话了，安静下来写写博客也不错，没事翻了翻小易哥的博客甚至与大牛们之间的差距，基础知识不扎实建起来的楼再高也只能是危楼罢了，陈下心回归基础把以前学过的东西总结一下。 *********************************
8、数组豆豆咖啡二维数组数组一维数组
一、概念数组是同一种类型数据的集合。其实数组就是一个容器。二、好处可以自动给数组中的元素从0开始编号，方便操作这些元素三、格式 //一维数组 1,元素类型[] 变量名 = new 元素类型[元素的个数] int[] arr =
Decode Ways hcx2013 decode
A message containing letters from A-Z is being encoded to numbers using the following mapping: 'A' -> 1 'B' -> 2 ... 'Z' -> 26 Given an encoded message containing digits, det
Spring4.1新特性——异步调度和事件机制的异常处理 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
squid3(高命中率)缓存服务器配置 liyonghui160com
系统:centos 5.x 需要的软件:squid-3.0.STABLE25.tar.gz 1.下载squid wget http://www.squid-cache.org/Versions/v3/3.0/squid-3.0.STABLE25.tar.gz tar zxf squid-3.0.STABLE25.tar.gz &&
避免Java应用中NullPointerException的技巧和最佳实践 pda158 java
1) 从已知的String对象中调用equals()和equalsIgnoreCase()方法，而非未知对象。　　总是从已知的非空String对象中调用equals()方法。因为equals()方法是对称的，调用a.equals(b)和调用b.equals(a)是完全相同的，这也是为什么程序员对于对象a和b这么不上心。如果调用者是空指针，这种调用可能导致一个空指针异常 Object unk
如何在Swift语言中创建http请求 shoothao http swift
概述：本文通过实例从同步和异步两种方式上回答了”如何在Swift语言中创建http请求“的问题。如果你对Objective-C比较了解的话，对于如何创建http请求你一定驾轻就熟了，而新语言Swift与其相比只有语法上的区别。但是，对才接触到这个崭新平台的初学者来说，他们仍然想知道“如何在Swift语言中创建http请求？”。在这里,我将作出一些建议来回答上述问题。常见的
Spring事务的传播方式 uule spring事务
传播方式：新建事务 required required_new - 挂起当前非事务方式运行 supports &nbs