hjkfcz

kprobe实现原理解析

一、简介

kprobe是内核的动态探测工具，几乎可以探测任何一条内核指令。kprobe根据探测点类型可分为三种： kprobes, jprobes和kretprobes (也叫返回探测点)。 kprobes是可以被插入到内核的任何指令位置的探测点，jprobes则只能被插入到一个内核函数的入口，而kretprobes则是在指定的内核函数返回时才被执行。

kprobe根据实现原理也可以分为三种：基于动态ftrace的kprobe，基于int3的kprobe和基于jump相对跳转指令实现的kprobe。

这里主要介绍基于int3的kprobe实现以及kprobe和kretprobe的实现和使用。

内核版本基于3.10.33，x86_64平台。

二、注册流程

一个kprobe探测实例是struct kprobe。

struct kprobe {       //哈希链表, 被静态全局变量kprobe_table管理, 每个被监测地址作为索引       
      struct hlist_node hlist; //如果一个地址存在多个kprobe则该哈希节点会用aggregate节点替代  
      struct list_head list;     //对于一个地址存在的多个kprobe的链表
      unsigned long nmissed;     //因断点指令不能重入处理, 当多个kprobe一起触发时会放弃执行后面的probe, 同时该计数增加   
      kprobe_opcode_t *addr;    //观察点对应的地址, 用户在调用注册接口时可以指定地址, 也可以传入函数名让内核自己查找   
      const char *symbol_name;//观察点对应的函数名, 在注册kprobe时会将其翻译为十六进制地址并修改addr  
      unsigned int offset; //相对于入口点地址的偏移, 会在计算addr以后再加上offset得到最终的addr    
      kprobe_pre_handler_t pre_handler;  //在执行kprobe地址addr指令之前执行的handler  
      kprobe_post_handler_t post_handler;  //在执行kprobe地址addr指令之后执行的handler 
      kprobe_fault_handler_t fault_handler; //异常处理句柄, 在执行pre_handler返回值非0时会调用 
 /* * ... called if breakpoint trap occurs in probe handler.       * Return 1 if it handled break, otherwise kernel will see it. 24      */ 
      kprobe_break_handler_t break_handler;    
      kprobe_opcode_t opcode;     //保存的操作码, 当注册kprobe后对应地址会用中断指令替代  
      struct arch_specific_insn ainsn;   //平台相关结构, 具体见下     
      u32 flags; 32 //状态标记, 被kprobe_mutex保护
};

struct arch_specific_insn用来备份原来的探测指令的。

 struct arch_specific_insn {
     /* copy of the original instruction */
     kprobe_opcode_t *insn; //原指令opcode的拷贝
     /*
      * boostable = -1: This instruction type is not boostable.
      * boostable = 0: This instruction type is boostable.
      * boostable = 1: This instruction has been boosted: we have
      * added a relative jump after the instruction copy in insn,
      * so no single-step and fixup are needed (unless there's
      * a post_handler or break_handler).
      */
     int boostable;
     bool if_modifier;
 };
 typedef u8 kprobe_opcode_t

register_kprobe函数完成kprobe的注册。

 int __kprobes register_kprobe(struct kprobe *p)
 {
     int ret;
     struct kprobe *old_p;
     struct module *probed_mod;
     kprobe_opcode_t *addr;
 
     /* Adjust probe address from symbol */
     addr = kprobe_addr(p);
     if (IS_ERR(addr))
         return PTR_ERR(addr);
     p->addr = addr;
 
     ret = check_kprobe_rereg(p);
     if (ret)
         return ret;
 
     /* User can pass only KPROBE_FLAG_DISABLED to register_kprobe */
     p->flags &= KPROBE_FLAG_DISABLED;
     p->nmissed = 0;
     INIT_LIST_HEAD(&p->list);
 
     ret = check_kprobe_address_safe(p, &probed_mod);
     if (ret)
         return ret;
 
     mutex_lock(&kprobe_mutex);
 
     old_p = get_kprobe(p->addr);
     if (old_p) {
         /* Since this may unoptimize old_p, locking text_mutex. */
         ret = register_aggr_kprobe(old_p, p);
         goto out;
     }
 
     mutex_lock(&text_mutex);    /* Avoiding text modification */
     ret = prepare_kprobe(p);
     mutex_unlock(&text_mutex);
     if (ret)
         goto out;
 
     INIT_HLIST_NODE(&p->hlist);
     hlist_add_head_rcu(&p->hlist,
                &kprobe_table[hash_ptr(p->addr, KPROBE_HASH_BITS)]);
 
     if (!kprobes_all_disarmed && !kprobe_disabled(p))                                                                                                                                            
         arm_kprobe(p);
 
     /* Try to optimize kprobe */
     try_to_optimize_kprobe(p);
 
 out:
     mutex_unlock(&kprobe_mutex);
 
     if (probed_mod)
         module_put(probed_mod);
      return ret;
}

register_kprobe主要完成如下工作：

(1)通过kprobe_addr函数获取要探测的具体位置。根据用户提供的symbol_name调用kallsyoms_lookup_name获取函数的首地址，再加上要探测的函数offset。这里的offset必须是一条汇编指令的开始地址，不能是指令的中间。

(2)通过check_kprobe_rereg检测本kprobe时候已经注册，如果已经注册，直接返回完成注册。

(3)调用check_kprobe_address_safe函数检查探测的地址。主要检查这几项：

调用ftrace_location函数检测探测地址是否属于动态ftrace的探测点mcount段。一般是函数开始5个nop指令。如果是这个地址，那么置位p->flags的 KPROBE_FLAG_FTRACE，本次kprobe将走动态ftrace路径，不走int3异常。

检查探测地址是否属于内核代码段，否则不能探测。

是否在kprobe本身实现的关键函数地址内，是的话不允许探测。

探测地址不能是内核jump label的保留地址。

如果探测的是内核模块的地址，需要增加模块计数。没有这个计数的话，模块卸载之后，等到unregister_kprobe的时候会恢复原指令，或导致内核内存被被修改。

如果该探测地址已经注册了kprobe，会调用register_aggr_kprobe注册一个aggregate kprobe，用来管理所有同一探测地址的的kprobe。

(4)prepare_kprobe函数负责kprobe注册准备工作。


 static int __kprobes prepare_kprobe(struct kprobe *p)
 {
     if (!kprobe_ftrace(p))
         return arch_prepare_kprobe(p);
 
     return arch_prepare_kprobe_ftrace(p);
 }

如果探测的是动态ftrace的mcount段地址，那么调用arch_prepare_kprobe_ftrace走ftrace kprobe的路径。

负责调用arch_prepare_kprobe位int3 kprobe的准备工作。

arch_prepare_kprobe首先调用can_probe检查探测地址是否地址所在代码的指令的边界地址，不是的话不能探测。

调用get_insn_slot函数为kprobe的insn在x86的可执行page里申请一段内存用来备份完整原指令，kprobe执行流程中的单步环节需要在这里执行，所以需要执行权限。

最后arch_copy_kprobe备份原指令到kprobe->ainsn.insn里面，并把原指令的opcode保存到kprobe->opcode。

(5)将kprobe通过hlist字段添加到系统kprobe_table的hash table里面。

(6)调用arm_kprobe函数替换原指令的opcode为int3指令(0xcc)。

至此，kprobe注册完成。

三、kprobe的执行

(1) int3指令属于x86上的断点指令，对应的异常属于trap类型，即异常恢复的时候执行int3后面的下一条指令。

内核执行到被kprobe探测的指令，触发int3异常。

paranoidzeroentry_ist int3 do_int3 DEBUG_STACK
......
.macro paranoidzeroentry_ist sym do_sym ist
ENTRY(\sym)
    INTR_FRAME
    ASM_CLAC
    PARAVIRT_ADJUST_EXCEPTION_FRAME
    pushq_cfi $-1       /* ORIG_RAX: no syscall to restart */
    subq $ORIG_RAX-R15, %rsp
    CFI_ADJUST_CFA_OFFSET ORIG_RAX-R15
    call save_paranoid
    TRACE_IRQS_OFF_DEBUG
    movq %rsp,%rdi      /* pt_regs pointer */
    xorl %esi,%esi      /* no error code */
    subq $EXCEPTION_STKSZ, INIT_TSS_IST(\ist)
    call \do_sym
    addq $EXCEPTION_STKSZ, INIT_TSS_IST(\ist)
    jmp paranoid_exit   /* %ebx: no swapgs flag */
    CFI_ENDPROC
END(\sym)
.endm

int3异常后进入ENTRY(int3)，call_paranoid保存寄存到栈里，并将栈顶rsp和错误码0作为第一第二个参数调用do_int3函数。

(2)do_int3()

dotraplinkage void __kprobes notrace do_int3(struct pt_regs *regs, long error_code)
{
    ......

    if (notify_die(DIE_INT3, "int3", regs, error_code, X86_TRAP_BP,
            SIGTRAP) == NOTIFY_STOP)
        goto exit;
    ......

}

调用notifier_die向通知链die_chain通知DIE_INT3事件。在int_kprobe的时候会向die_chain注册了回调函数kprobe_exceptions_notify函数，且为最高优先级。现在执行kprobe_exceptions_notify。

（3）kprobe_exceptions_notify根据DIE_INT3事件码调用kprobe_handler函数，kprobe_handler里kprobe的pre_handler执行。

 static int __kprobes kprobe_handler(struct pt_regs *regs)
 {
     kprobe_opcode_t *addr;
     struct kprobe *p;
     struct kprobe_ctlblk *kcb;
 
     addr = (kprobe_opcode_t *)(regs->ip - sizeof(kprobe_opcode_t));
     preempt_disable();
     kcb = get_kprobe_ctlblk();
     p = get_kprobe(addr);
 
     if (p) {
         if (kprobe_running()) {
             if (reenter_kprobe(p, regs, kcb))
                 return 1;
         } else {
             set_current_kprobe(p, regs, kcb);
             kcb->kprobe_status = KPROBE_HIT_ACTIVE;

             if (!p->pre_handler || !p->pre_handler(p, regs))
                 setup_singlestep(p, regs, kcb, 0);
             return 1;
        }
     } else if (*addr != BREAKPOINT_INSTRUCTION) {
         
         regs->ip = (unsigned long)addr;
         preempt_enable_no_resched();
         return 1;
     } else if (kprobe_running()) {
         p = __this_cpu_read(current_kprobe);
         if (p->break_handler && p->break_handler(p, regs)) {
            if (!skip_singlestep(p, regs, kcb))
                 setup_singlestep(p, regs, kcb, 0);
             return 1;
         }
     } /* else: not a kprobe fault; let the kernel handle it */
 
     preempt_enable_no_resched();
     return 0;
 }

13行如果当前cpu上有其他kprobe正在运行，本次kprobe的handler不会执行，仅增加nmissed计数。

16是正常流程，设置当前kprobe为正在运行的kprobe。如果有pre_handler，执行pre_handler。存在pre_handler并且pre_hanler返回值为0，调用setup_singlestep设置单步模式。函数开始是关抢占的，所以kprobe的pre_handler的执行上下文是关抢占的。

（4）被探测原指令单步执行

static void __kprobe setup_singlestep(struct kprobe *p, struct pt_regs *regs, struct kprobe_ctlblk *kcb, int reenter)
 {
     if (setup_detour_execution(p, regs, reenter))
         return;
 
 #if !defined(CONFIG_PREEMPT)
     if (p->ainsn.boostable == 1 && !p->post_handler) {
         /* Boost up -- we can execute copied instructions directly */
         if (!reenter)
             reset_current_kprobe();
         regs->ip = (unsigned long)p->ainsn.insn;
         preempt_enable_no_resched();
         return;
     }
 #endif
     if (reenter) {
         save_previous_kprobe(kcb);
         set_current_kprobe(p, regs, kcb);
         kcb->kprobe_status = KPROBE_REENTER;
     } else
         kcb->kprobe_status = KPROBE_HIT_SS;
     /* Prepare real single stepping */
     clear_btf();
     regs->flags |= X86_EFLAGS_TF;
     regs->flags &= ~X86_EFLAGS_IF;
     /* single step inline if the instruction is an int3 */
     if (p->opcode == BREAKPOINT_INSTRUCTION)
         regs->ip = (unsigned long)p->addr;
     else
         regs->ip = (unsigned long)p->ainsn.insn;
 }

设置reg->flags的x86_EFLAGS_IF，如果原来指令本身就是int3指令，那么直接在原探测地址上执行单步。正常情况下，设置单步地址为kprobe备份指令所在的slot地址。

设置完单步模式，kprobe_handler函数返回后，int3异常就正常返回了。int3异常会恢复到异常前的函数上下文，但此时EFLAGS寄存器被设置位单步模式，pc指向备份指令的所在的地址。会单步执行备份指令。

单步执行完之后，会触发单步异常。

(5)单步异常里执行kprobe的post_handler

备份指令单步执行完毕之后，会触发单步调试异常，对应int 1异常，因为和int3异常很类似，这里简要介绍下他的流程。int1异常触发后，进入debug函数，debug函数保存寄存器线程栈里，调用do_debug。do_debug调用notify_die向die_chain报告DIE_DEBUG事件，然后执行kprobe的通知回调函数kprobe_exceptions_notify。

kprobe_exceptions_notify函数根据DIE_DEBUG事件码执行post_kprobe_handler函数。

static int __kprobes post_kprobe_handler(struct pt_regs *regs)
{
     struct kprobe *cur = kprobe_running();
     struct kprobe_ctlblk *kcb = get_kprobe_ctlblk();
 
     if (!cur)
         return 0;
 
     resume_execution(cur, regs, kcb);
     regs->flags |= kcb->kprobe_saved_flags;
 
     if ((kcb->kprobe_status != KPROBE_REENTER) && cur->post_handler) {
         kcb->kprobe_status = KPROBE_HIT_SSDONE;
         cur->post_handler(cur, regs, 0);
     }
 
     /* Restore back the original saved kprobes variables and continue. */             
     if (kcb->kprobe_status == KPROBE_REENTER) {
         restore_previous_kprobe(kcb);
         goto out;
     }
     reset_current_kprobe();
out:
     preempt_enable_no_resched(); 
  
     if (regs->flags & X86_EFLAGS_TF)
         return 0;
 
     return 1;
 }

首先调用resume_execution为int1调试异常恢复到正常执行流程做准备。具体来说：

清除regs->flags的X86_EFLAGS_TF标志，否则int1异常返回后，每执行一条指令都是单步模式。

如果单步的备份指令是绝对跳转指令，那么regs->ip就是指向正确的下一条指令，无需修正。

如果是单步的备份指令是相对跳转指令，那么需要修正regs->ip。执行完单步之后regs->ip的值是基于当前位置，也就是备份指令的位置+offset算出来的，所以要修正为基于原指令位置的偏移，加上kprobe->addr 和copy instruction的地址的差值即可。

如果单步的备份指令是call指令，单步之后，call自动将返回地址push，也就是已经把备份指令的之后的位置入栈到regs->sp的位置，此时需要把regs->sp指向的内容替换位kprobe->addr所在指令的下一条指令的地址。

如果kprobe->ainsn.boostable == 0，则在备份指令的下一条指令的位置构造一个jump指令，跳转到探测地址所在的指令的下一条指令的地址，前提是分配的slot空间要大于等于备份指令长度+5，5是相对跳转的指令的长度。设置成功后，kprobe->ainsn.boostable = 1。如果系统没有使能抢占，并且kprobe的post_handler位空，那么下次在int3异常中执行完pre_handler不需要在设置备份指令为单步模式，直接设置regs->ip位备份指令的位置，boost执行效率。

继续kprobe_post_handler函数，执行kprobe->post_handler函数，函数最后开抢占。所以的kprobe的post_handler的执行上下文也是关抢占下执行的。

int1异常返回后，恢复到正常执行流程。整个kprobe触发执行流程结束。

C++常见知识掌握 nfgo c++开发语言
1.Linux软件开发、调试与维护内核与系统结构Linux内核是操作系统的核心，负责管理硬件资源，提供系统服务，它是系统软件与硬件之间的桥梁。主要组成部分包括：进程管理：内核通过调度器分配CPU时间给各个进程，实现进程的创建、调度、终止等操作。使用进程描述符（task_struct）来存储进程信息，包括状态（就绪、运行、阻塞等）、优先级、内存映射等。内存管理：包括物理内存和虚拟内存管理。通过页表映
KVM虚拟机源代码分析【转】 xidianjiapei001 #虚拟化技术
1.KVM结构及工作原理1.1KVM结构KVM基本结构有两部分组成。一个是KVMDriver，已经成为Linux内核的一个模块。负责虚拟机的创建，虚拟内存的分配，虚拟CPU寄存器的读写以及虚拟CPU的运行等。另外一个是稍微修改过的Qemu，用于模拟PC硬件的用户空间组件，提供I/O设备模型以及访问外设的途径。KVM基本结构如图1所示。其中KVM加入到标准的Linux内核中，被组织成Linux中标准
Android shell 常用 debug 命令晨春计 Audio debug android linux
目录1、查看版本2、am命令3、pm命令4、dumpsys命令5、sed命令6、log定位查看APK进程号7、log定位使用场景1、查看版本1.1、Android串口终端执行getpropro.build.version.release#获取Android版本uname-a#查看linux内核版本信息uname-r#单独查看内核版本1.2、linux服务器执行lsb_release-a#查看Lin
讲解Linux内核操作系统——进程状态与转换 Linux加油站网络服务器运维
一.进程控制进程控制的主要功能是对系统中的所有进程实施有效的管理，它具有创建新进程、撤销已有进程、实现进程状态转换等功能。在操作系统中，一般把进程控制用的程序段称为原语，原语的特点是执行期间不允许中断，它是一个不可分割的基本单位。1.1创建进程UNIX中进程为树状层次结构，Windows下所有进程没有层次结构允许一个进程创建另一个进程，创建者称为父进程，被创建的进程称为子进程。子进程可以继承父进程
Ubuntu系统入门指南：常用命令详解像风一样自由2020 ubuntu ubuntu linux 运维
Ubuntu系统入门指南：常用命令详解引言Ubuntu是一个基于Linux内核的开源操作系统，由Canonical公司和社区共同开发和维护。它以易用性、稳定性和广泛的软件支持而著称，广泛应用于个人电脑、服务器和云计算环境。对于新手来说，掌握Ubuntu的基本命令行操作可以大大提高工作效率和系统管理能力。Ubuntu通常每六个月发布一个新版本，每两年会推出一个长期支持（LTS）版本，提供五年的安全更
framebuffer帧缓存我相遇拾年缓存
framebuffer:帧缓冲，帧缓存Linux内核为显示提供的一套应用程序接口。（驱动内核支持）framebuffer本质上是一块显示缓存，往显示缓存中写入特定格式的数据就意味着向屏幕输出内容。framebuffer驱动程序控制LCD显示设备，通过映射framebuffer设备到用户空间，应用程序可以直接对显存进行操作，从而控制LCD显示内容framebuffer使用显示屏：800*600（横向
linux查看git log目录,教你玩转Git-查看提交历史郁清叔叔 linux查看git log目录
导读Git是一个开源的分布式版本控制系统，用于敏捷高效地处理任何或小或大的项目。Git是LinusTorvalds为了帮助管理Linux内核开发而开发的一个开放源码的版本控制软件。Git与常用的版本控制工具CVS,Subversion等不同，它采用了分布式版本库的方式，不必服务器端软件支持。在使用Git提交了若干更新之后，又或者克隆了某个项目，想回顾下提交历史，我们可以使用gitlog命令查看。针
Android的内核 setsailgo android runtime
Android的内核是基于Linux的长期支持版本的“Android通用内核(ACK)”。Android作为一个广泛使用的操作系统，其根基在于内核的设计和功能。下面将深入探讨Android内核的各个方面，从其基本结构到与Linux内核的关系，再到内核的版本管理及在设备上的应用：Android内核的基础结构基于Linux的内核：Android内核是构建在Linux长期支持版本之上的，这使得其能够充分
数据结构—内核链表 LEE_C17 数据结构链表 arm开发
一，内核链表内核链表是一种在操作系统内核中广泛使用的数据结构，特别是在Linux内核中。它主要用于高效地管理和遍历内核中的对象，如进程、设备、文件等。内核链表通常基于双向链表或双向循环链表实现，具有以下特点：双向性：每个链表节点都包含指向前一个节点和后一个节点的指针，这使得从任何节点出发都可以方便地遍历整个链表。通用性：内核链表的设计使其能够通用于不同类型的内核对象。通过在结构体中包含一个指向链表
解锁前端新潜能：如何使用 Rust 锈化前端工具链京东零售技术前端 taro 前端 taro
前言近年来，Rust的受欢迎程度不断上升。首先，在操作系统领域，Rust已成为Linux内核官方认可的开发语言之一，Windows也宣布将使用Rust来重写内核，并重写部分驱动程序。此外，国内手机厂商Vivo也宣布使用Rust开发了名为“蓝河”的操作系统。除此之外，Rust在图形渲染、游戏开发、中间件开发、边缘计算、计算安全等领域也是遍地开花，可以说，Rust正在以惊人的速度重塑着各个领域的发展，
io_uring异步IO 天夏123 php 开发语言
io_uring介绍io_uring是一个Linux内核的异步I/O框架，它提供了高性能的异步I/O操作，io_uring的目标是通过减少系统调用和上下文切换的开销来提高I/O操作的性能。在网络编程中，我们通常使用epollIO多路复用来处理网络IO，然而epoll也并不是异步网络IO，仅仅是内核提供了IO复用机制，epoll回调通知的是数据可以读取或者写入了，具体的读写操作仍然需要用户去做，而不
Linux内核以后会分块逐步用Rust重写吗? 纵然间 linux rust 运维
Linux内核已经积累了大量的代码，包括数百万行的C和C++代码。要想重写这些代码需要巨大的人力和时间投入，且存在很高的风险。这些代码已经过长时间的测试和验证，具有很高的稳定性和可靠性。Rust虽然是一种强调安全性和性能的系统编程语言，但其相对于C和C++来说仍然较新，在Linux内核开发领域的应用还相对较少。用Rust重写Linux内核需要开发者具备深厚的Rust编程技能和经验，以及对Linux
深入理解Linux内核：一部开源的探索之旅宋溪普Gale
深入理解Linux内核：一部开源的探索之旅项目介绍linux-insides-ko是一个致力于将原始英文版《linux-insides》翻译成韩语的开源项目，旨在为那些对Linux内核和底层操作机制感兴趣的读者提供深入浅出的教程。这本书详细阐述了Linux内核的工作原理以及其内部结构，无论你是初学者还是经验丰富的开发者，都能从中受益匪浅。项目技术分析该项目以Markdown格式编写，易于阅读且便于
linux启动优化内核裁剪详细说明（2） keep study linux
第一部分Linux内核裁减（1）安装新内核:i)将新内核copy到/usr/src下并解压：#tar-zxvflinux-2.6.38.4.tar.gzii)将名为linux的符号链接删掉,这是旧版本内核的符号链接.#ln-slinux-2.6.38.4linux（2）设置内核.#cd/usr/src/linux#makemrproper-----删除不必要的文件和目录.#makemenuconf
6.11 linux内核管理：内核版本阳光的王小草 linux整理 linux 内核版本
6.11linux内核管理：内核版本cat/proc/versionLinuxversion3.10.0-229.4.2.el7.x86_64([email protected])(gccversion4.8.220140120(RedHat4.8.2-16)(GCC))#1SMPWedMay1310:06:09UTC2015uname-aLinuxjenkins3.1
一篇文章带你读懂 io_uring 的接口与实现 Linux高级开发 Linux服务器开发 linux 运维服务器 epoll accept
io_uring是Linux提供的一个异步I/O接口。io_uring在2019年加入Linux内核，经过了两年的发展，现在已经变得非常强大。本文基于Linux5.12.10介绍io_uring接口。io_uring的实现主要在fs/io_uring.c中。io_uring的用户态APIio_uring的实现仅仅使用了三个syscall：io_uring_setup,io_uring_enter和
【io_uring】简介和使用 ywang_wnlo 存储 liburing io_uring
文章目录简介使用系统调用liburing样例代码流程编译参考资料简介io_uring是Linux在5.1版本引入的一套新的异步IO实现。相比Linux在2.6版本引入的AIO，io_uring性能强很多，接近SPDK[1]，同时支持bufferIOio_uring的作者JensAxboe是Linux内核块层和其他块设备的维护者，同时也是CFQ、Noop、Deadline调度器、blktrace以及
linux内核调度,深入linux内核架构--核心调度器编程幽谷隐士 linux内核调度
内存中保存了每个进程的唯一描述信息，并通过若干结构与其他进程连接起来，那么调度器的核心任务就是高效公平的执行各个进程中的内存代码段。那么一个好的调度器，需要满足哪些条件呢？高效性：应该尽量减小调度器产生的额外开销。公平性：应该尽量保证每个作业都能被执行，也应该保证每个cpu都有均衡的作业。灵活性：可以动态的设置作业的优先级，良好的迁移能力，不同作业具有不同的权利等。隔离性：不让作业之间彼此影响。控
浅谈Docker引擎秦偏执 docker引擎
在Docker首次发布的时候，Docker引擎由两个核心构成，即：LXC和Dockerdaemon。由LXC来基于Linux内核的容器虚拟化技术来提供像NameSpace,Cgruop等基础工具的操作技术；由Daemon来统一负责镜像的管理，容器生命周期的管理，认证等工作。这样做也带来了很多的缺点，首先：LXC是基于Linux的，这对于一个立志与跨平台的项目来说本身就是一个瓶颈；其次，使用一个外部
嵌入式设备上SystemTap调试工具使用塵觴葉杂谈 linux bpf
SystemTap调试工具简介SystemTap调试器常用于Linux内核的动态调试，不过该工具集也可用于应用的跟踪调试。随着Linux内核及其应用程序的复杂度不断加深，使用一些在功能上区别于传统的GDB调试工具就变得越来越重要了。这类调试工具具有低延时(LowLatency)，高性能，动态调试的特点。嵌入式Linux设备的系统软件通常不需从头开发，这些调试工具可以帮助开发者快速理解Linux内核
systemtap原理及使用 csr_hema
SystemTap的架构SystemTap用于检查运行的内核的两种方法是Kprobes和返回探针。但是理解任何内核的最关键要素是内核的映射，它提供符号信息（比如函数、变量以及它们的地址）。有了内核映射之后，就可以解决任何符号的地址，以及更改探针的行为。Kprobes从2.6.9版本开始就添加到主流的Linux内核中，并且为探测内核提供一般性服务。它提供一些不同的服务，但最重要的两种服务是Kprob
zybo上运行linux,Zybo开发板linux作业系统移植周行文 zybo上运行linux
文章主要介紹zyboboard上linux作业系统移植过程。分别介绍了开发环境搭建、U-boot编译、linux内核编译、busybox制作等流程及注意事项。文章使用的开发板是zynq7000系列的zyboboard。Vivado版本是2015.1.主机系统是Debian9.1.开发环境搭建工欲善其事必先利其器，做开发前搭建好编译环境是重要的一步，这些步骤大体上都相同，然而对于不同的系统平台、硬件
Android内核介绍 zhang_li_bin Android Android Linux C C#C++
Android内核介绍Android内核介绍发布时间：2010年4月8日作者：EasyAndroidtags：已经有一些的文章介绍Android内核了，本系列篇将从Linux内核的角度来分析Android的内核，希望给初学者提够有用的信息。本章将简单的介绍Android内核的全貌，起到一个抛砖引玉的作用。从下一篇开始将详细介绍每一个Android内核驱动程序及其作用。Android内核是基于Lin
linux驱动 -- PWM配置和SysFs操作方法悟凡爱学习 linux驱动 linux 运维服务器
1：PWM介绍PWM的定义为:可调节脉冲调节器，换句话来说就是一个总周期不变，占空比可调节的方波。2：PWM的总周期和占空比、有效点平方波：在信号领域一般分为数字信号和模拟信号，数字信号就两种状态：0和1，相互交替成为方波。总周期：从1状态到1状态。也就是总周期为：从一个电平再回到这个电平。占空比：有效电平占据占总周期的比例有效电平：器件生效的电平3：linux内核下的PWM3.1linux下的P
8.12（LVS负载均衡） WPFwpf_ lvs 负载均衡运维
一、LVS（一）什么是LVSlinuxvirturalserver的简称，也就是linxu虚拟机服务器，这是一个由章文岩博士发起的开源项目，官网是http://www.linuxvirtualserver.org,现在lvs已经是linux内核标准的-部分，使用lvS可以达到的技术目标是:通过linux达到负载均衡技术和linux操作系统实现一个高性能高可用的linux服务器集群，他具有良好的可性
页面缓存（Page Cache） TABE_ 操作系统页缓存操作系统
我们知道文件一般存放在硬盘（机械硬盘或固态硬盘）中，CPU并不能直接访问硬盘中的数据，而是需要先将硬盘中的数据读入到内存中，然后才能被CPU访问。由于读写硬盘的速度比读写内存要慢很多（DDR4内存读写速度是机械硬盘500倍，是固态硬盘的200倍）。为了避免每次读写文件时，都需要对硬盘进行读写操作，Linux内核会以页大小（4KB）为单位，将文件划分为多数据块，当用户对文件中的某个数据块进行读写操作
ARM64的函数调用标准和栈布局奔跑吧Linux社区 linux
欢迎订阅奔跑吧linux社区微信公众号本文节选自《奔跑吧Linux内核》第二版卷1第1.6章函数调用标准（ProcedureCallStandard，PCS）用来描述父/子函数是如何编译、链接的，特别是父函数和子函数之间调用关系的约定，如栈的布局、参数的传递等。每个处理器架构都有不同的函数调用标准，本章重点介绍ARM64的函数调用标准。ARM公司有一份描述ARM64架构函数调用的标准和规范文档，这
深入理解 Linux epoll：高性能事件驱动的核心技术程序修炼之道 c++linux 音视频计算机网络
介绍在高并发网络编程中，有效地管理大量的客户端连接是至关重要的。传统的I/O多路复用技术如select和poll在连接数较少时表现良好，但在连接数增加时性能下降明显。而Epoll则是一种高效的I/O多路复用技术，被广泛应用于服务器编程中，特别是在大规模并发连接的场景下。Epoll概述Epoll是Linux内核提供的一种事件通知机制，用于处理大量的I/O事件。Epoll在管理大量连接时具有更高的效率
Linux内核0.11学习九阳道人 linux 学习内核
Linux内核0.11学习文章目录Linux内核0.11学习一、计算机开机的过程1、启动BIOS2、BIOS在内存中加载中断向量表和中断服务程序Linux内核最新已经版本已经到5.18了，代码量千万行的级别，一天看五百行也要看两万天，然而很多程序员能不能活到两万天都是个大问题，所以不可能看得完。Linux0.11内核虽然是三十多年前的产物，就像孙子兵法、黄帝内经等古书一样，不代表它们没有学习的价值
云原生 | 在 Kubernetes 中使用 Cilium 替代 Calico 网络插件实践指南! 全栈工程师修炼指南企业IT运维实践云原生 kubernetes 网络容器
[知识是人生的灯塔，只有不断学习，才能照亮前行的道路]0x00简述介绍什么是Cilium?Cilium是一款开源软件，它基于一种名为eBPF的新的Linux内核技术提供动力，用于透明地保护使用Docker和Kubernetes等Linux容器管理平台中部署的应用程序服务之间的网络连接，Cilium主要使用场景是在Kubernetes中，但Cilium的优势并不仅限于Kubernetes环境。在Ku
redis学习笔记——不仅仅是存取数据 Everyday都不同 returnSource expire/del incr/lpush 数据库分区 redis
最近项目中用到比较多redis，感觉之前对它一直局限于get/set数据的层面。其实作为一个强大的NoSql数据库产品，如果好好利用它，会带来很多意想不到的效果。（因为我搞java，所以就从jedis的角度来补充一点东西吧。PS：不一定全，只是个人理解，不喜勿喷） 1、关于JedisPool.returnSource(Jedis jeids) 这个方法是从red
SQL性能优化-持续更新中。。。。。。 atongyeye oracle sql
1 通过ROWID访问表--索引你可以采用基于ROWID的访问方式情况,提高访问表的效率, , ROWID包含了表中记录的物理位置信息..ORACLE采用索引(INDEX)实现了数据和存放数据的物理位置(ROWID)之间的联系. 通常索引提供了快速访问ROWID的方法,因此那些基于索引列的查询就可以得到性能上的提高. 2 共享SQL语句--相同的sql放入缓存 3 选择最有效率的表
[JAVA语言]JAVA虚拟机对底层硬件的操控还不完善 comsci JAVA虚拟机
如果我们用汇编语言编写一个直接读写CPU寄存器的代码段，然后利用这个代码段去控制被操作系统屏蔽的硬件资源，这对于JVM虚拟机显然是不合法的，对操作系统来讲，这样也是不合法的，但是如果是一个工程项目的确需要这样做，合同已经签了，我们又不能够这样做，怎么办呢？那么一个精通汇编语言的那种X客，是否在这个时候就会发生某种至关重要的作用呢？ &n
lvs- real 男人50 LVS
#!/bin/bash # # Script to start LVS DR real server. # description: LVS DR real server # #. /etc/rc.d/init.d/functions VIP=10.10.6.252 host='/bin/hostname' case "$1" in sta
生成公钥和私钥 oloz DSA 安全加密
package com.msserver.core.util; import java.security.KeyPair; import java.security.PrivateKey; import java.security.PublicKey; import java.security.SecureRandom; public class SecurityUtil {
UIView 中加入的cocos2d，背景透明 374016526 cocos2d glClearColor
要点是首先pixelFormat:kEAGLColorFormatRGBA8，必须有alpha层才能透明。然后view设置为透明glView.opaque = NO;[director setOpenGLView:glView];[self.viewController.view setBackgroundColor:[UIColor clearColor]];[self.viewControll
mysql常用命令香水浓 mysql
连接数据库 mysql -u troy -ptroy 备份表 mysqldump -u troy -ptroy mm_database mm_user_tbl > user.sql 恢复表（与恢复数据库命令相同） mysql -u troy -ptroy mm_database < user.sql 备份数据库 mysqldump -u troy -ptroy
我的架构经验系列文章 - 后端架构 - 系统层面 agevs JavaScript jquery css html5
系统层面：高可用性所谓高可用性也就是通过避免单独故障加上快速故障转移实现一旦某台物理服务器出现故障能实现故障快速恢复。一般来说，可以采用两种方式，如果可以做业务可以做负载均衡则通过负载均衡实现集群，然后针对每一台服务器进行监控，一旦发生故障则从集群中移除；如果业务只能有单点入口那么可以通过实现Standby机加上虚拟IP机制，实现Active机在出现故障之后虚拟IP转移到Standby的快速
利用ant进行远程tomcat部署 aijuans tomcat
在javaEE项目中，需要将工程部署到远程服务器上，如果部署的频率比较高，手动部署的方式就比较麻烦，可以利用Ant工具实现快捷的部署。这篇博文详细介绍了ant配置的步骤（http://www.cnblogs.com/GloriousOnion/archive/2012/12/18/2822817.html），但是在tomcat7以上不适用，需要修改配置，具体如下： 1.配置tomcat的用户角色
获取复利总收入 baalwolf 获取
public static void main(String args[]){ int money=200; int year=1; double rate=0.1; &
eclipse.ini解释 BigBird2012 eclipse
大多数java开发者使用的都是eclipse，今天感兴趣去eclipse官网搜了一下eclipse.ini的配置，供大家参考，我会把关键的部分给大家用中文解释一下。还是推荐有问题不会直接搜谷歌，看官方文档，这样我们会知道问题的真面目是什么，对问题也有一个全面清晰的认识。 Overview 1、Eclipse.ini的作用 Eclipse startup is controlled by th
AngularJS实现分页功能 bijian1013 JavaScript AngularJS 分页
对于大多数web应用来说显示项目列表是一种很常见的任务。通常情况下，我们的数据会比较多，无法很好地显示在单个页面中。在这种情况下，我们需要把数据以页的方式来展示，同时带有转到上一页和下一页的功能。既然在整个应用中这是一种很常见的需求，那么把这一功能抽象成一个通用的、可复用的分页（Paginator）服务是很有意义的。 &nbs
[Maven学习笔记三]Maven archetype bit1129 ArcheType
archetype的英文意思是原型，Maven archetype表示创建Maven模块的模版，比如创建web项目，创建Spring项目等等. mvn archetype提供了一种命令行交互式创建Maven项目或者模块的方式， mvn archetype 1.在LearnMaven-ch03目录下，执行命令mvn archetype:gener
【Java命令三】jps bit1129 Java命令
jps很简单，用于显示当前运行的Java进程，也可以连接到远程服务器去查看 [hadoop@hadoop bin]$ jps -help usage: jps [-help] jps [-q] [-mlvV] [<hostid>] Definitions: <hostid>: <hostname>[:
ZABBIX2.2 2.4 等各版本之间的兼容性 ronin47
zabbix更新很快，从2009年到现在已经更新多个版本，为了使用更多zabbix的新特性，随之而来的便是升级版本，zabbix版本兼容性是必须优先考虑的一点客户端AGENT兼容 zabbix1.x到zabbix2.x的所有agent都兼容zabbix server2.4：如果你升级zabbix server，客户端是可以不做任何改变，除非你想使用agent的一些新特性。 Zabbix代理（p
unity 3d还是cocos2dx哪个适合游戏？ brotherlamp unity自学 unity教程 unity视频 unity资料 unity
unity 3d还是cocos2dx哪个适合游戏？问：unity 3d还是cocos2dx哪个适合游戏？答：首先目前来看unity视频教程因为是3d引擎，目前对2d支持并不完善，unity 3d 目前做2d普遍两种思路，一种是正交相机，3d画面2d视角，另一种是通过一些插件，动态创建mesh来绘制图形单元目前用的较多的是2d toolkit，ex2d，smooth moves，sm2，
百度笔试题：一个已经排序好的很大的数组，现在给它划分成m段，每段长度不定，段长最长为k，然后段内打乱顺序，请设计一个算法对其进行重新排序 bylijinnan java 算法面试百度招聘
import java.util.Arrays; /** * 最早是在陈利人老师的微博看到这道题： * #面试题#An array with n elements which is K most sorted，就是每个element的初始位置和它最终的排序后的位置的距离不超过常数K * 设计一个排序算法。It should be faster than O(n*lgn)。
获取checkbox复选框的值 chiangfai checkbox
<title>CheckBox</title> <script type = "text/javascript"> doGetVal: function doGetVal() { //var fruitName = document.getElementById("apple").value;//根据
MySQLdb用户指南 chenchao051 mysqldb
原网页被墙，放这里备用。 MySQLdb User's Guide Contents Introduction Installation _mysql MySQL C API translation MySQL C API function mapping Some _mysql examples MySQLdb
HIVE 窗口及分析函数 daizj hive 窗口函数分析函数
窗口函数应用场景：（1）用于分区排序（2）动态Group By （3）Top N （4）累计计算（5）层次查询一、分析函数用于等级、百分点、n分片等。函数说明 RANK() &nbs
PHP ZipArchive 实现压缩解压Zip文件 dcj3sjt126com PHP zip
PHP ZipArchive 是PHP自带的扩展类，可以轻松实现ZIP文件的压缩和解压，使用前首先要确保PHP ZIP 扩展已经开启，具体开启方法就不说了，不同的平台开启PHP扩增的方法网上都有，如有疑问欢迎交流。这里整理一下常用的示例供参考。一、解压缩zip文件 01 02 03 04 05 06 07 08 09 10 11
精彩英语贺词 dcj3sjt126com 英语
I'm always here 我会一直在这里支持你 &nb
基于Java注解的Spring的IoC功能 e200702084 java spring bean IOC Office
java模拟post请求 geeksun java
一般API接收客户端（比如网页、APP或其他应用服务）的请求，但在测试时需要模拟来自外界的请求，经探索，使用HttpComponentshttpClient可模拟Post提交请求。此处用HttpComponents的httpclient来完成使命。 import org.apache.http.HttpEntity ; import org.apache.http.HttpRespon
Swift语法之 ---- ?和!区别 hongtoushizi ?swift !
转载自： http://blog.sina.com.cn/s/blog_71715bf80102ux3v.html Swift语言使用var定义变量，但和别的语言不同，Swift里不会自动给变量赋初始值，也就是说变量不会有默认值，所以要求使用变量之前必须要对其初始化。如果在使用变量之前不进行初始化就会报错： var stringValue : String //
centos7安装jdk1.7 jisonami jdk centos
安装JDK1.7 步骤1、解压tar包在当前目录 [root@localhost usr]#tar -xzvf jdk-7u75-linux-x64.tar.gz 步骤2：配置环境变量在etc/profile文件下添加 export JAVA_HOME=/usr/java/jdk1.7.0_75 export CLASSPATH=/usr/java/jdk1.7.0_75/lib
数据源架构模式之数据映射器 home198979 PHP 架构数据映射器 datamapper
前面分别介绍了数据源架构模式之表数据入口、数据源架构模式之行和数据入口数据源架构模式之活动记录，相较于这三种数据源架构模式，数据映射器显得更加“高大上”。一、概念数据映射器（Data Mapper）：在保持对象和数据库（以及映射器本身）彼此独立的情况下，在二者之间移动数据的一个映射器层。概念永远都是抽象的，简单的说，数据映射器就是一个负责将数据映射到对象的类数据。 &nb
在Python中使用MYSQL pda158 mysql python
缘由　　近期在折腾一个小东西须要抓取网上的页面。然后进行解析。将结果放到数据库中。　　了解到 Python在这方面有优势，便选用之。　　由于我有台 server上面安装有 mysql，自然使用之。在进行数据库的这个操作过程中遇到了不少问题，这里记录一下，大家共勉。　　 python中mysql的调用　　百度之后能够通过MySQLdb进行数据库操作。
单例模式 hxl1988_0311 java 单例设计模式单件
package com.sosop.designpattern.singleton; /* * 单件模式：保证一个类必须只有一个实例，并提供全局的访问点 * * 所以单例模式必须有私有的构造器，没有私有构造器根本不用谈单件 * * 必须考虑到并发情况下创建了多个实例对象 * */ /** * 虽然有锁，但是只在第一次创建对象的时候加锁，并发时不会存在效率
27种迹象显示你应该辞掉程序员的工作 vipshichg 工作
1、你仍然在等待老板在2010年答应的要提拔你的暗示。 2、你的上级近10年没有开发过任何代码。 3、老板假装懂你说的这些技术，但实际上他完全不知道你在说什么。 4、你干完的项目6个月后才部署到现场服务器上。 5、时不时的，老板在检查你刚刚完成的工作时，要求按新想法重新开发。 6、而最终这个软件只有12个用户。 7、时间全浪费在办公室政治中，而不是用在开发好的软件上。 8、部署前5分钟才开始测试。

kprobe实现原理解析

你可能感兴趣的:(Linux内核)