俞凡 DeepNoMind

eBPF深度探索: 高效DNS监控实现

eBPF可以灵活扩展Linux内核机制，本文通过实现一个DNS监控工具为例，介绍了怎样开发实际的eBPF应用。原文: A Deep Dive into eBPF: Writing an Efficient DNS Monitoring

eBPF^[1]是内核内置的虚拟机，在Linux内核内部提供了高层库、指令集以及执行环境，被用于诸多Linux内核子系统，特别是网络、跟踪、调试和安全领域。其功能即支持改变内核对数据包的处理，也允许对网络设备(如智能网卡)进行编程。

eBPF实现的用例。

已经有大量各种语言的关于eBPF的介绍文章^[2]，所以本文不会过多涉及eBPF的细节。尽管许多文章都提供了相当多的信息，但都没有回答最重要的问题: eBPF是如何处理数据包并监视从主机发送给用户的数据包的？本文将从头开始创建一个实际的应用程序，逐步丰富其功能，特别是监控DNS请求、响应及其过程，并提供所有这些过程的解释、评论以及源代码链接。因为想多举几个例子，而不仅仅只是单一问题的解决方案，因此有时候我们会稍微有点偏题。最终希望那些想要熟悉eBPF的人可以花更少的时间研究有用的材料，并更快的开始编程。

简介

假设主机可以发送合法的DNS请求，但发送这些请求的IP地址是未知的。在网络过滤器日志中，可以看到不断受到请求，但不清楚这是合法请求，还是信息已经泄露给了攻击者？如果发送数据的服务器所在的域是已知的，那就容易了。不幸的是，PTR已经过时，SecurityTrails显示这个IP要么什么都没有，要么有太多乱七八糟的东西。

我们可以执行*tcpdump*^[3]命令，但是谁愿意一直盯着显示器呢？如果有多个服务器又怎么办呢？ELK技术栈里有*packetbeat*^[4]，这是一个可以吃掉服务器上所有处理器处理能力的怪物。*Osquery*^[5]也是一个很好的工具，它非常了解网络连接，但不了解DNS查询，相关支持已经不再提供了。*Zeek*^[6]是一个我在寻找如何跟踪DNS查询时了解到的工具，看起来还不错，但有两点让人感到困惑: 它不仅仅监视DNS，这意味着资源还将花在我不需要的工作上(也许尽管可以在设置中选择协议)，它也不知道是哪个进程发送了请求。

我们将用Python并从最简单的部分开始编写代码，从而理解Python是如何与eBPF交互的。首先安装这些包:

#apt install python3-bpfcc bpfcc-tools libbpfcc linux-headers-$(uname -r)

这是在Ubuntu下的命令，但是如果想要深入内核，为其他发行版找到必要的包应该也不是问题。现在让我们开始吧:

#!/usr/bin/env python3
from bcc import BPF
FIRST_BPF = r"""
int first(void *ctx) {
  bpf_trace_printk("Hello world! execve() is calling\n");
  return 0;
}
"""
bpf = BPF(text=FIRST_BPF)
bpf.attach_kprobe(event=bpf.get_syscall_fnname("execve"), fn_name="first")
while True:
    try:
        (_, _, _, _, _, event_b) = bpf.trace_fields()
        events = event_b.decode('utf8')
        if 'Hello world' in events:
            print(events)
    except ValueError:
        continue
    except KeyboardInterrupt:
        break

注意: 在Ubuntu 20.04 LTS和18.04 LTS中，默认情况下允许无特权用户加载eBPF程序，但在最近的Ubuntu版本(21.10和22.04 LTS)中，出于安全考虑，默认禁用了这一功能。通过以下命令可以重启此能力:

$ sudo sysctl kernel.unprivileged_bpf_disabled=0

与所有hello-world示例一样，它没有做任何有用的事情，只是向我们介绍了基础知识。当主机上的任何程序调用execve()系统调用时，first()函数就会被执行。可以在另一个控制台上运行命令ls|cat|grep|clear或任何包含execve()的命令来触发，然后执行我们的代码。也可以在内核中发生的各种事件时调用eBPF程序，attach_kprobe()表示在调用特定内核函数时触发。但我们更习惯于处理系统调用，谁会知道对应函数的名字呢？因此，助手函数get_syscall_fnname()可以帮助我们将系统调用名转换为内核函数名。

eBPF中最简单的输出选项是函数bpf_trace_printk()，但这只是用于调试的输出。传递给这个函数的所有东西都可以通过 /sys/kernel/debug/tracing/trace_pipe 文件获得。为了避免在另一个控制台中读取这个文件，我们使用函数trace_fields()，它可以读取这个文件，并在程序中为我们提供其内容。

代码的其余部分比较明确，在一个能够被Ctrl-C中断的无限循环中，读取调试输出，如果出现"Hello world"字符串，就将其完整输出。

注意: bpf_trace_printk()可以实现类似printf()的格式化文本，但有重要限制: 不能超过3个参数，并且只有一个参数是%s。

现在我们已经大致了解了如何使用eBPF，接下来我们开始构建一个实际的应用程序，监视所有DNS请求和响应，并记录谁问了什么以及收到了什么响应。

开始

我们从eBPF开始，处理数据包最简单的方法是将它们附加到网络套接字上。在本例中，每个包都将触发我们的程序。稍后我们将详细说明这是如何完成的，但现在我们需要在所有数据包中捕获端口为53的UDP包。要做到这一点，必须自己拆解包结构，并在C中分离所有嵌套的协议。cursor_advance宏可以在包的范围内移动光标(指针)，返回其当前位置并移动到指定位置，从而帮助我们做到这一点:

#include 
#include 
#include 
int dns_matching(struct __sk_buff *skb) {
 u8 *cursor = 0;
// Checking the IP protocol::
 struct ethernet_t *ethernet = cursor_advance(cursor, sizeof(*ethernet));
if (ethernet->type == ETH_P_IP) {
 …

proto.h文件中描述的结构ethernet_t:

struct ethernet_t {
  unsigned long long  dst:48;
  unsigned long long  src:48;
  unsigned int        type:16;
} BPF_PACKET_HEADER;

以太帧格式本身非常简单，包含6个字节(48位)的目地地址，相同大小的源地址，然后是两个字节(16位)的负载类型。

负载类型由一个等于0x0800的常量ETH_P_IP编码，定义在文件```if_ether.h```^[7]中，确保下一层协议是IP(该代码以及其他可能的值都由IEEE^[8]描述)。

我们继续检查IP内部是否是端口为53的UDP:

// Checking the UDP protocol:
struct ip_t *ip = cursor_advance(cursor, sizeof(*ip));
if (ip->nextp == IPPROTO_UDP) {
    // Checking port 53:
    struct udp_t *udp = cursor_advance(cursor, sizeof(*udp));
    if (udp->dport == 53) {
        // Request
        return -1;
    }
    if (udp->sport == 53) {
        // Respose
        return -1;
    }
}

ip_t和udp_t仍然定义在proto.h中，但IPPROTO_UDP来自于```in.h```^[9]。一般来说，这个例子并不完全正确。IP结构已经有点复杂了，它有可选字段，因此头部长度有可能不一样。正确做法是首先从头部获取其长度值，然后执行偏移，但我们才刚刚开始，不需要搞得太复杂。

这就很简单的找到了DNS包，接下来需要分析它的结构。为了简单起见，我们把包传递给用户空间(为此返回-1，而返回码0意味着不需要复制包)。

回到Python，我们首先仍然将程序附加到套接字上:

#!/usr/bin/env python3
import dnslib
import sys
from bcc import BPF
...
bpf = BPF(text=BPF_PROGRAM)
function_dns_matching = bpf.load_func("dns_matching", BPF.SOCKET_FILTER)
BPF.attach_raw_socket(function_dns_matching, '')

与上一个例子不同，现在程序不是在调用任何函数时被调用，而是被每个包调用。attach_raw_socket中的空参数意味着"所有网络接口"，如果我们需要监控特定网络接口，那么就填入对应的名字。

将socket设置为阻塞模式:

import fcntl
import os
socket_fd = function_dns_matching.sock
fl = fcntl.fcntl(socket_fd, fcntl.F_GETFL)
fcntl.fcntl(socket_fd, fcntl.F_SETFL, fl & ~os.O_NONBLOCK)

剩下的就很简单了，使用类似的无限循环，从套接字读取数据，去掉所有头域，直接获得DNS包并解码。

完整代码如下:

#!/usr/bin/env python3

import dnslib
import fcntl
import os
import sys

from bcc import BPF

BPF_APP = r'''
#include 
#include 
#include 
int dns_matching(struct __sk_buff *skb) {
    u8 *cursor = 0;
     // Checking the IP protocol:
    struct ethernet_t *ethernet = cursor_advance(cursor, sizeof(*ethernet));
    if (ethernet->type == ETH_P_IP) {
         // Checking the UDP protocol:
        struct ip_t *ip = cursor_advance(cursor, sizeof(*ip));
        if (ip->nextp == IPPROTO_UDP) {
             // Check the port 53:
            struct udp_t *udp = cursor_advance(cursor, sizeof(*udp));
            if (udp->dport == 53 || udp->sport == 53) {
                return -1;
            }
        }
    }
    return 0;
}
'''


bpf = BPF(text=BPF_APP)
function_dns_matching = bpf.load_func("dns_matching", BPF.SOCKET_FILTER)
BPF.attach_raw_socket(function_dns_matching, '')

socket_fd = function_dns_matching.sock
fl = fcntl.fcntl(socket_fd, fcntl.F_GETFL)
fcntl.fcntl(socket_fd, fcntl.F_SETFL, fl & ~os.O_NONBLOCK)

while True:
    try:
        packet_str = os.read(socket_fd, 2048)
    except KeyboardInterrupt:
        sys.exit(0)

    packet_bytearray = bytearray(packet_str)

    ETH_HLEN = 14
    UDP_HLEN = 8

    # IP header length
    ip_header_length = packet_bytearray[ETH_HLEN]
    ip_header_length = ip_header_length & 0x0F
    ip_header_length = ip_header_length << 2

    # Starting the DNS packet
    payload_offset = ETH_HLEN + ip_header_length + UDP_HLEN

    payload = packet_bytearray[payload_offset:]

    dnsrec = dnslib.DNSRecord.parse(payload)

    # If it’s the response:
    if dnsrec.rr:
        print(f'Resp: {dnsrec.rr[0].rname} {dnslib.QTYPE.get(dnsrec.rr[0].rtype)} {", ".join([repr(dnsrec.rr[i].rdata) for i in range(0, len(dnsrec.rr))])}')
    # If it’s the request:
    else:
        print(f'Request: {dnsrec.questions[0].qname} {dnslib.QTYPE.get(dnsrec.questions[0].qtype)}')

该示例展示了哪些DNS请求/响应会通过我们的网络接口，但通过这种方式，我们还是不知道是什么进程在处理。也就是说，只有有限的信息，由于缺乏信息，我没有选择Zeek。

从数据包到进程

要获取关于eBPF中的进程信息，可以使用以下函数: bpf_get_current_pid_tgid()、bpf_get_current_uid_gid()、bpf_get_current_comm(char *buf, int size_of_buf)。当程序被绑定到对某个内核函数调用时(如第一个示例所示)，就可以使用它们。UID/GID应该比较明确，但对于那些以前没有接触过内核操作细节的人来说，还是需要解释一下。在内核中被视为PID的东西在用户空间中显示为进程的thread ID。内核认为用户空间中的thread group ID是PID。类似的，bpf_get_current_comm()返回的不是通常的进程名(可以通过ps命令查看)，而是线程名。

好吧，我们总归会拿到进程数据，那怎么将数据传递到用户空间？Table就是用于此目的，通过BPF_PERF_OUTPUT(event)创建，通过方法event.perf_submit(ctx, data, data_size)传递，并通过b.perf_buffer_poll()轮询接收。在此之后，只要数据可用，就会调用callback()函数，即b["event"].open_perf_buffer(callback)。

下面将详细介绍这一机制，但现在，我们继续从理论上进行分析。我们既可以传输数据，也可以传输数据包本身。但要做到这一点，必须为传输的数据选择一个特定长度的变量。怎么选？直接回答是512字节，但并不正确。这一长度并没有考虑EDNS，而且我们还想正确跟踪基于TCP的DNS报文。因此我们不得不分配大量的预留空间，而更大的包将会被丢弃，大多数情况下，我们将分配比所需更多的内存。我不喜欢这种方法，幸运的是，还有另一个方法: perf_submit_skb()。除了数据外，它还从缓冲区传输指定字节的数据包。但需要注意，该方法仅适用于网络程序eBPF: 套接字，XDP。也就是说，我们无法获得有关进程的信息。

幸运的是，可以使用多个eBPF程序并互相交换数据！这也可以通过Table来实现。声明如下:

BPF_TABLE_PUBLIC("hash", key, val, name, max_elements);

这是为了使其对其他eBPF程序可用。在另一个程序中，通过如下代码访问:

BPF_TABLE("extern", key, val, name, max_elements);

因此，即使5元组(协议、源地址、源端口、目的地址和目的端口)都一样，也不会丢失数据包，键将是以下结构:

struct port_key {
     u8 proto;
     u32 saddr;
     u32 daddr;
     u16 sport;
     u16 dport;
 };

值是我们想知道的关于这个进程的所有信息:

struct port_val {
     u32 ifindex;
     u32 pid;
     u32 tgid;
     u32 uid;
     u32 gid;
     char comm[64];
 };

ifindex是网络设备，我们将在套接字上运行的另一个程序中填充这个值。在这里，我们用它来将整个结构转移到未来的用户空间。

总结: 当调用内核函数发送数据包时，存储涉及到的进程信息。当数据包出现在网络接口上时(不管是传出的还是传入)，检查是否在目的地之间通过这样或那样的协议传输包的任何信息。如果有，就将其与包一起传递给Python，在那里完成其余工作。

好了，我们已经讨论程序的基本逻辑，接下来开始编程吧！

我的名字是进程

我们从获取相关进程的信息开始。```udp_sendmsg()```^[10]和```tcp_sendmsg()```^[11]函数用于发送数据包，两者都将```sock```^[12]结构作为第一个参数。在eBPF中有两种方法可以访问所研究函数的实参: 将其指定为函数的形参，或者使用宏PT_REGS_PARMx，其中x是实参号。下面将展示这两个选项，这是第一个程序，C_BPF_KPROBE:

// The structure that will be used as the key for 
// eBPF table 'proc_ports':
struct port_key {
    u8 proto;
    u32 saddr;
    u32 daddr;
    u16 sport;
    u16 dport;
};
// The structure that will be stored in the eBPF table 'proc_ports' 
// contains information about the process:
struct port_val {
    u32 ifindex;
    u32 pid;
    u32 tgid;
    u32 uid;
    u32 gid;
    char comm[64];
};
// Public (accessible from other eBPF programs) eBPF table in which 
// information about the process is written. 
// It's read when a packet appears on the socket:
BPF_TABLE_PUBLIC("hash", struct port_key, struct port_val, proc_ports, 20480);
// These are two ways to get access to the function arguments:
//int trace_udp_sendmsg(struct pt_regs *ctx) {
// struct sock *sk = (struct sock *)PT_REGS_PARM1(ctx);
int trace_udp_sendmsg(struct pt_regs *ctx, struct sock *sk) {
    u16 sport = sk->sk_num;
    u16 dport = sk->sk_dport;
  
    // Processing packets only on port 53.
    // 13568 = ntohs(53);
    if (sport == 13568 || dport == 13568) {
        // Preparing the data:
        u32 saddr = sk->sk_rcv_saddr;
        u32 daddr = sk->sk_daddr;
        u64 pid_tgid = bpf_get_current_pid_tgid();
        u64 uid_gid = bpf_get_current_uid_gid();
        // Forming the key structure.
        // These strange transformations will be explained below.
        struct port_key key = {.proto = 17};
        key.saddr = htonl(saddr);
        key.daddr = htonl(daddr);
        key.sport = sport;
        key.dport = htons(dport);
        // Forming a structure with the process properties:
        struct port_val val = {};
        val.pid = pid_tgid >> 32;
        val.tgid = (u32)pid_tgid;
        val.uid = (u32)uid_gid;
        val.gid = uid_gid >> 32;
        bpf_get_current_comm(val.comm, 64);
        //Writing the value into the eBPF table:
        proc_ports.update(&key, &val);
    }
    return 0;
}

使用tcp_sendmsg也完全一样，唯一的区别是，在结构port_key中，字段proto将等于6，这两个值(17和6)分别是UDP和TCP的协议号，可以在/etc/protocols文件中查看这些值。

两个bpf_get_current_*函数都返回64比特，因此我们分别获取高低32比特来提取数据。此外，对于PID/TGID，我们可以立即以常见的形式获取(例如，对于PID，写入字段的高32位，其中包含内核认为是TGID的内容)。

我们接下来看看关键数据结构的转换。在下一节中，我们将在程序中创建一个类似的结构。但我们不是从原子结构sock中获取数据，而是从eBPF的```__sk_buff```^[13]中，数据的存储形式为:

__u32 remote_ip4; /* Stored in network byte order */
__u32 local_ip4; /* Stored in network byte order */
__u32 remote_port; /* Stored in network byte order */
__u32 local_port; /* stored in host byte order */

提取到用户空间

我们的第二个程序BPF_SOCK_TEXT将"挂起(hang)"在套接字上，为每个包检查对应进程的信息，并将其和包本身一起传输到用户空间:

// The structure that will be used as the key for
// eBPF table 'proc_ports':
struct port_key {
    u8 proto;
    u32 saddr;
    u32 daddr;
    u16 sport;
    u16 dport;
};
// The structure that will be stored in the eBPF table 'proc_ports',
// Contains information about the process:
struct port_val {
    u32 ifindex;
    u32 pid;
    u32 tgid;
    u32 uid;
    u32 gid;
    char comm[64];
};
// eBPF table from which information about the process is extracted.
// Filled when calling kernel functions udp_sendmsg()/tcp_sendmsg():
BPF_TABLE("extern", struct port_key, struct port_val, proc_ports, 20480);
// Table for transferring data to the user space:
BPF_PERF_OUTPUT(dns_events);
// Look for DNS packets among the data passing through the socket and 
// check if there is any information about the process:
int dns_matching(struct __sk_buff *skb) {
    u8 *cursor = 0;
// Checking the IP protocol:
struct ethernet_t *ethernet = cursor_advance(cursor, sizeof(*ethernet));
     if (ethernet->type == ETH_P_IP) {
        struct ip_t *ip = cursor_advance(cursor, sizeof(*ip));
        u8 proto;
        u16 sport;
        u16 dport;
        // Checking the transport layer protocol:
        if (ip->nextp == IPPROTO_UDP) {
            struct udp_t *udp = cursor_advance(cursor, sizeof(*udp));
            proto = 17;
            // Getting the data about the ports:
            sport = udp->sport;
            dport = udp->dport;
        } else if (ip->nextp == IPPROTO_TCP) {
            struct tcp_t *tcp = cursor_advance(cursor, sizeof(*tcp));
            // We don't need packets where no data is transmitted:
            if (!tcp->flag_psh) {
                return 0;
            }
            proto = 6;
            // Getting the data about the ports:
            sport = tcp->src_port;
            dport = tcp->dst_port;
        } else {
            return 0;
        }
        // If it's a DNS query:
        if (dport == 53 || sport == 53) {
            // Form a key structure:
            struct port_key key = {};
            key.proto = proto;
            if (skb->ingress_ifindex == 0) {
                key.saddr = ip->src;
                key.daddr = ip->dst;
                key.sport = sport;
                key.dport = dport;
            } else {
                key.saddr = ip->dst;
                key.daddr = ip->src;
                key.sport = dport;
                key.dport = sport;
            }
            // By the key, look for a value in the eBPF table:
            struct port_val *p_val;
            p_val = proc_ports.lookup(&key);
            // If no value is found, then we have no information about the 
            // process and there is no point in continuing:
            if (!p_val) {
                return 0;
            }
            // Network device index:
            p_val->ifindex = skb->ifindex;
            // Transmit the structure with the process information along with 
            // skb->len bytes sent to the socket:
            dns_events.perf_submit_skb(skb, skb->len, p_val,
                                       sizeof(struct port_val));
            return 0;
        } //dport == 53 || sport == 53
    } //ethernet->type == ETH_P_IP
return 0;
}

该程序的启动方式与第一个示例相同。我们在数据包中移动指针，从不同级别的协议中收集信息。当前仍然不考虑IP头的实际长度，但还是添加了一些新的东西，对于TCP包，我们将检查其标志，过滤掉不携带数据的包(SYN、ACK等)。

但我们必须恢复键，从而从proc_ports表中获取数据。同时，必须区分流量的方向，毕竟，当我们在表中输入数据时，意味着我们是源。但是对于传入的数据包，源将是远程服务器。为了理解数据包的移动方向，我将ingress_ifindex标识为0用于标识输出流量。

提供服务

我们需要通过Python做三件事: 将程序加载到内核中，从内核中获取数据，并对其进行处理。

前两个任务很简单。此外，我们已经在第一个例子中考虑了使用eBPF的两种方法:

# BPF initialization:
bpf_kprobe = BPF(text=C_BPF_KPROBE)
bpf_sock = BPF(text=BPF_SOCK_TEXT)
# Send UDP:
bpf_kprobe.attach_kprobe(event="udp_sendmsg", fn_name="trace_udp_sendmsg")
# Send TCP:
bpf_kprobe.attach_kprobe(event="tcp_sendmsg", fn_name="trace_tcp_sendmsg")
# Socket:
function_dns_matching = bpf_sock.load_func("dns_matching", BPF.SOCKET_FILTER)
BPF.attach_raw_socket(function_dns_matching, '')

获取数据的代码甚至更短:

bpf_sock["dns_events"].open_perf_buffer(print_dns)
while True:
    try:
        bpf_sock.perf_buffer_poll()
    except KeyboardInterrupt:
        exit()

但数据处理将更加繁琐。尽管有现成模块，我们还是决定自己解析协议头。首先，我想自己弄清楚这是如何发生的(最后，尽管在当前情况下正确处理IP包头的长度没有意义，因为头域有额外选项的包将在eBPF中被丢弃)，其次是减少对模块的依赖。然而，对于直接解析DNS，我仍然（到目前为止）使用现成模块，DNS结构比IP/TCP稍微复杂一些，需要另一个模块(ctypes)来处理C数据类型。

def print_dns(cpu, data, size):
    import ctypes as ct
    class SkbEvent(ct.Structure):
        _fields_ = [
            ("ifindex", ct.c_uint32),
            ("pid", ct.c_uint32),
            ("tgid", ct.c_uint32),
            ("uid", ct.c_uint32),
            ("gid", ct.c_uint32),
            ("comm", ct.c_char * 64),
            ("raw", ct.c_ubyte * (size - ct.sizeof(ct.c_uint32 * 5) - ct.sizeof(ct.c_char * 64)))
        ]
    # We get our 'port_val' structure and also the packet itself in the 'raw' field:
    sk = ct.cast(data, ct.POINTER(SkbEvent)).contents
    # Protocols:
    NET_PROTO = {6: "TCP", 17: "UDP"}
    # eBPF operates on thread names.
    # Sometimes they coincide with process names, but often not.
    # So we try to get the process name by its PID:
    try:
        with open(f'/proc/{sk.pid}/comm', 'r') as proc_comm:
            proc_name = proc_comm.read().rstrip()
    except:
        proc_name = sk.comm.decode()
    # Get the name of the network interface by index:
    ifname = if_indextoname(sk.ifindex)
    # The length of the Ethernet frame header is 14 bytes:
    ip_packet = bytes(sk.raw[14:])
    # The length of the IP packet header is not fixed due to the arbitrary
    # number of parameters.
    # Of all the possible IP header we are only interested in 20 bytes:
    (length, _, _, _, _, proto, _, saddr, daddr) = unpack('!BBHLBBHLL', ip_packet[:20])
    # The direct length is written in the second half of the first byte (0b00001111 = 15):
    # len_iph = length & 15
    # Length is written in 32-bit words, convert it to bytes:
    # len_iph = len_iph * 4
    # Convert addresses from numbers into IPs, assembling it into octets:
    saddr = ".".join(map(str, [saddr >> 24 & 0xff, saddr >> 16 & 0xff, saddr >> 8 & 0xff, saddr & 0xff]))
    daddr = ".".join(map(map(str, [daddr >> 24 & 0xff, daddr >> 16 & 0xff, daddr >> 8 & 0xff, daddr & 0xff]))
    # If the transport layer protocol is UDP:
    if proto == 17:
        udp_packet = ip_packet[len_iph:]
        (sport, dport) = unpack('!HH', udp_packet[:4])
        # UDP datagram header length is 8 bytes:
        dns_packet = udp_packet[8:]
    # If the transport layer protocol is TCP:
    elif proto == 6:
        tcp_packet = ip_packet[len_iph:]
        # TCP packet header length is also not fixed due to the optional
        # options. Of the entire TCP header, we are only interested in the data up to the 13th
        # byte (header length):
        (sport, dport, _, length) = unpack('!HHQB', tcp_packet[:13])
        # The direct length is written in the first half (4 bits):
        len_tcph = length >> 4
        # Length is written in 32-bit words, converted to bytes:
        len_tcph = len_tcph * 4
        # That's the tricky part.
        # I don't know where I went wrong or why I need a 2 byte offset,
        # but it's necessary because the DNS packet doesn't start until after it:
        dns_packet = tcp_packet[len_tcph + 2:]
    # other protocols are not handled:
    else:
        return
    # DNS data decoding:
    dns_data = dnslib.DNSRecord.parse(dns_packet)
    # Resource record types:
    DNS_QTYPE = {1: "A", 28: "AAAA"}
    # Query:
    If dns_data.header.qr == 0:
        # We are only interested in A (1) and AAAA (28) records:
        for q in dns_data.questions:
            If q.qtype == 1 or q.qtype == 28:
                print(f'COMM={proc_name} PID={sk.pid} TGID={sk.tgid} DEV={ifname} PROTO={NET_PROTO[proto]} SRC={saddr} DST={daddr} SPT={sport} DPT={dport} UID={sk.uid} GID={sk.gid} DNS_QR=0 DNS_NAME={q.qname} DNS_TYPE={DNS_QTYPE[q.qtype]}')
    # Response:
    elif dns_data.header.qr == 1:
        # We are only interested in A (1) and AAAA (28) records:
        For rr in dns_data.rr:
            If rr.rtype == 1 or rr.rtype == 28:
                print(f'COMM={proc_name} PID={sk.pid} TGID={sk.tgid} DEV={ifname} PROTO={NET_PROTO[proto]} SRC={saddr} DST={daddr} SPT={sport} DPT={dport} UID={sk.uid} GID={sk.gid} DNS_QR=1 DNS_NAME={rr.rname} DNS_TYPE={DNS_QTYPE[rr.rtype]} DNS_DATA={rr.rdata}')
    else:
        print('Invalid DNS query type.')

最后

启动应用程序Python代码，在另一个控制台中用```dig```^[14]工具发起请求。

# dig @1.1.1.1 google.com +tcp

如果正确执行，程序输出应该是这样的:

# python3 final_code_eBPF_dns.py
The program is running. Press Ctrl-C to abort.
COMM=dig PID=10738 TGID=10739 DEV=ens18 PROTO=TCP SRC=192.168.44.3 DST=1.1.1.1 SPT=57915 DPT=53 UID=0 GID=0 DNS_QR=0 DNS_NAME=google.com. DNS_TYPE=A
COMM=dig PID=10738 TGID=10739 DEV=ens18 PROTO=TCP SRC=1.1.1.1 DST=192.168.44.3 SPT=53 DPT=57915 UID=0 GID=0 DNS_QR=1 DNS_NAME=google.com. DNS_TYPE=A DNS_DATA=142.251.12.101
COMM=dig PID=10738 TGID=10739 DEV=ens18 PROTO=TCP SRC=1.1.1.1 DST=192.168.44.3 SPT=53 DPT=57915 UID=0 GID=0 DNS_QR=1 DNS_NAME=google.com. DNS_TYPE=A DNS_DATA=142.251.12.113
COMM=dig PID=10738 TGID=10739 DEV=ens18 PROTO=TCP SRC=1.1.1.1 DST=192.168.44.3 SPT=53 DPT=57915 UID=0 GID=0 DNS_QR=1 DNS_NAME=google.com. DNS_TYPE=A DNS_DATA=142.251.12.102
COMM=dig PID=10738 TGID=10739 DEV=ens18 PROTO=TCP SRC=1.1.1.1 DST=192.168.44.3 SPT=53 DPT=57915 UID=0 GID=0 DNS_QR=1 DNS_NAME=google.com. DNS_TYPE=A DNS_DATA=142.251.12.139
COMM=dig PID=10738 TGID=10739 DEV=ens18 PROTO=TCP SRC=1.1.1.1 DST=192.168.44.3 SPT=53 DPT=57915 UID=0 GID=0 DNS_QR=1 DNS_NAME=google.com. DNS_TYPE=A DNS_DATA=142.251.12.100
COMM=dig PID=10738 TGID=10739 DEV=ens18 PROTO=TCP SRC=1.1.1.1 DST=192.168.44.3 SPT=53 DPT=57915 UID=0 GID=0 DNS_QR=1 DNS_NAME=google.com. DNS_TYPE=A DNS_DATA=142.251.12.138

到此为止，我们已经创建了一个有用的应用程序，可以显示系统中所有的DNS查询。希望上面的解释足够详细，这样如果你对编写eBPF程序感兴趣，可以更容易开始。这段代码已经帮助我更好的了解服务器上发生的事情，以下链接可以获取完整代码。

完整代码^[15]

结论

这段代码还可以做得更好吗？当然可以！首先，应该增加对IPv6的支持。其次，不要再依赖IP头的固定长度，而是要对其进行解析。我拒绝使用Python库来处理数据包，不是没有原因的，在C语言中，仍然需要手动操作。第三，用C语言重写代码也很好，可以完全放弃Python，当然还要增加几行JSON输出的代码，这样在以后开发UI仪表盘时会更方便。这将导致第四点，对DNS数据包的手动分析。最后，最诱人的一点是停止查看端口(因为也许DNS数据包并不总是通过53端口)，并尝试分析每个数据包，在其中寻找那些符合DNS格式的数据包，这将使我们即使在非标准的端口上也能检测到数据包。

你好，我是俞凡，在Motorola做过研发，现在在Mavenir做技术工作，对通信、网络、后端架构、云原生、DevOps、CICD、区块链、AI等技术始终保持着浓厚的兴趣，平时喜欢阅读、思考，相信持续学习、终身成长，欢迎一起交流学习。
微信公众号：DeepNoMind

参考资料

[1]

eBPF: https://docs.kernel.org/bpf/classic_vs_extended.html

[2]

Awesome eBPF: https://github.com/zoidbergwill/awesome-ebpf

[3]

tcpdump: https://www.tcpdump.org

[4]

packetbeat: https://www.elastic.co/beats/packetbeat

[5]

Osquery: https://osquery.io

[6]

Zeek: https://zeek.org

[7]

if_ether.h: https://kernel.googlesource.com/pub/scm/linux/kernel/git/nico/archive/+/d9cc76127bcc137e3214b9166c439e02d2060cda/include/linux/if_ether.h#32

[8]

IEEE: https://standards-oui.ieee.org/ethertype/eth.txt

[9]

in.h: https://github.com/torvalds/linux/blob/master/include/uapi/linux/in.h#L43

[10]

udp_sendmsg(): https://github.com/torvalds/linux/blob/master/net/ipv4/udp.c#L1045

[11]

tcp_sendmsg(): https://github.com/torvalds/linux/blob/master/net/ipv4/tcp.c#L1478

[12]

sock: https://github.com/torvalds/linux/blob/master/include/net/sock.h#L352

[13]

__sk_buff: https://github.com/iovisor/bcc/blob/master/src/cc/compat/linux/virtual_bpf.h#L5746

[14]

dig: https://linux.die.net/man/1/dig

[15]

final_code_eBPF_dns.py: https://gist.github.com/oghie/b4e3accf1f87afcb939f884723e2b462

- END -

本文由 mdnice 多平台发布

你可能感兴趣的:(程序人生)

程序人生：技术人如何实现职业阶梯的跨越式发展 AI天才研究院 AI大模型企业级应用开发实战 Agentic AI 实战 AI人工智能与大数据程序人生职场和发展 ai
程序人生：技术人如何实现职业阶梯的跨越式发展关键词：职业发展、技术领导力、T型人才、职业规划、跨领域能力、持续学习、技术管理摘要：本文针对技术从业者的职业发展痛点，构建了系统化的职业阶梯跨越模型。通过解析技术人才成长的核心阶段与能力模型，结合数学量化评估体系和实战案例，提供从技术深耕到领导力跃迁的完整路径。内容涵盖能力矩阵构建、项目实战策略、跨领域知识融合、个人品牌经营等关键模块，帮助技术人突破职
程序人生职业生涯学习成长，学历提升是秘诀？ AI天才研究院 AI大模型企业级应用开发实战 Agentic AI 实战 AI人工智能与大数据程序人生学习职场和发展 ai
程序人生职业生涯学习成长，学历提升是秘诀？关键词：程序员职业发展、学历提升、持续学习、技术能力、职业规划、终身学习、技能提升摘要：本文深入探讨程序员职业生涯中的学习成长路径，分析学历提升在职业发展中的实际作用。通过对比不同发展阶段的技术能力需求与学历要求，揭示程序员职业成长的核心要素。文章将提供系统化的学习框架、实用的技能提升策略，以及平衡学历教育与实战经验的方法论，帮助程序员在快速变化的技术行业
【Java实现AI抽奖解签系统：24签个性化运势解读】王大师王文峰 java 开发语言
本人详解作者：王文峰，参加过CSDN2020年度博客之星，《Java王大师王天师》公众号：JAVA开发王大师，专注于天道酬勤的Java开发问题中国国学、传统文化和代码爱好者的程序人生，期待你的关注和支持！本人外号：神秘小峯山峯转载说明：务必注明来源（注明：作者：王文峰哦）【Java实现AI抽奖解签系统：24签个性化运势解读】学习教程（传送门）Java实现AI抽奖解签系统：24签个性化运势解读系统设
Java时间日期处理全攻略：多种写法、计算与获取方法王大师王文峰 java 开发语言
本人详解作者：王文峰，参加过CSDN2020年度博客之星，《Java王大师王天师》公众号：JAVA开发王大师，专注于天道酬勤的Java开发问题中国国学、传统文化和代码爱好者的程序人生，期待你的关注和支持！本人外号：神秘小峯山峯转载说明：务必注明来源（注明：作者：王文峰哦）Java时间日期处理全攻略：多种写法、计算与获取方法学习教程（传送门）Java时间日期处理全攻略：多种写法、计算与获取方法**一
C#初学者指南：从零开始掌握基础语法王大师王文峰 c#开发语言
本人详解作者：王文峰，参加过CSDN2020年度博客之星，《Java王大师王天师》公众号：JAVA开发王大师，专注于天道酬勤的Java开发问题中国国学、传统文化和代码爱好者的程序人生，期待你的关注和支持！本人外号：神秘小峯山峯转载说明：务必注明来源（注明：作者：王文峰哦）C#初学者指南：从零开始掌握基础语法学习教程（传送门）C#初学者指南：从零开始掌握基础语法环境搭建：准备你的第一个C#项目C#基
直击2025 C#架构师面试：分布式库存/大模型集成/热更新配置等企业级场景深度解析（含答案+性能优化技巧）王大师王文峰 c#面试分布式
本人详解作者：王文峰，参加过CSDN2020年度博客之星，《Java王大师王天师》公众号：JAVA开发王大师，专注于天道酬勤的Java开发问题中国国学、传统文化和代码爱好者的程序人生，期待你的关注和支持！本人外号：神秘小峯山峯转载说明：务必注明来源（注明：作者：王文峰哦）直击2025C#架构师面试：分布式库存/大模型集成/热更新配置等企业级场景深度解析（含答案+性能优化技巧）学习教程（传送门）20
服务+货物混合合同订单的技术实现与结算逻辑（Java版）王大师王文峰 java 开发语言
本人详解作者：王文峰，参加过CSDN2020年度博客之星，《Java王大师王天师》公众号：JAVA开发王大师，专注于天道酬勤的Java开发问题中国国学、传统文化和代码爱好者的程序人生，期待你的关注和支持！本人外号：神秘小峯山峯转载说明：务必注明来源（注明：作者：王文峰哦）服务+货物混合合同订单的技术实现与结算逻辑（Java版）学习教程（传送门）服务+货物混合合同订单的技术实现与结算逻辑（Java版
程序人生如何在技术会议中收获学习与成长 AI天才研究院计算 AI大模型企业级应用开发实战 AI人工智能与大数据程序人生学习职场和发展 ai
程序人生：如何在技术会议中收获学习与成长关键词：技术会议、开发者成长、参会策略、知识获取、人脉拓展、职业发展、技术洞察摘要：技术会议是程序员提升技术视野、获取前沿知识、拓展职业网络的重要平台。本文从参会前的战略规划、参会中的高效吸收、会后的持续转化三个维度，系统解析如何通过科学的参会策略实现能力跃升。结合具体案例、工具方法和实战经验，阐述技术会议在职业发展中的杠杆作用，帮助开发者将会议价值最大化，
程序人生：腾讯面试背后的职业生涯学习与成长秘籍 AI天才研究院程序人生面试学习 ai
程序人生：腾讯面试背后的职业生涯学习与成长秘籍关键词：腾讯面试、技术深度、工程能力、系统思维、职业成长、软技能、刻意练习摘要：本文以腾讯面试为切入点，拆解顶级互联网公司对技术人才的核心考察逻辑，结合真实面试案例与程序员职业生涯发展阶段，总结“技术深度-工程能力-系统思维-软技能”四维成长模型。通过生活化的比喻、具体的面试场景还原与可落地的成长方法论，帮助开发者从“应对面试”升级为“终身成长”，找到
程序人生职业生涯，学习成长为薪酬谈判添砖加瓦 ChatGPT AI大模型应用入门实战与进阶程序人生学习微信小程序 ai
程序人生职业生涯：学习成长为薪酬谈判添砖加瓦关键词：程序员职业生涯、技术能力体系、薪酬谈判策略、职业成长模型、市场价值评估、学习路径规划、胜任力模型摘要：本文针对程序员群体，构建"学习成长-能力提升-薪酬谈判"的完整逻辑链条。通过解析技术人员职业发展的三阶段模型，建立包含硬技能/软技能/项目经验的三维能力评估体系，提供可量化的学习效果评估方法与薪酬谈判实战策略。结合Python代码实现能力自评工具
当 AI 能写代码修 bug，高考填报计算机专业是“火坑”还是“新机遇” ｜深度对话 6 位专家 CSDN 程序人生人工智能 bug 高考
作者|梦依丹出品丨CSDN程序人生一年一度的高考如期而至，今年，将有1335万名考生踏入考场，如果说考试是考生的战场，那么让无数家庭真正反复权衡、难以抉择的，其实是考后的另一道大题——「填什么专业」。从“高考志愿填报导师”张雪峰推出的17999元的高考志愿填报服务不到3分钟便被抢购一空可见有多火，而计算机和人工智能更是他经常推荐的专业。今年，在AI浪潮的席卷之下，这道选择题更添了几分迷思与变数：当
哈工大计算机系统大作业——程序人生-Hello’s P2P m0_72541769 课程设计
计算机系统大作业题目程序人生-Hello’sP2P专业信息安全学号2022112864班级2203201学生xxx指导教师史先俊计算机科学与技术学院2024年5月摘要本论文旨在详细探讨计算机系统中程序从源码到可执行文件的整个转换过程，具体分析了C语言程序`Hello.c`的编译、链接、运行等各个阶段。通过使用GCC编译器以及Ubuntu环境下的一系列工具，本文对预处理、编译、汇编、链接、加载和运行
哈工大计统大作业-hello的一生 YX030212 课程设计 p2p 网络
计算机系统大作业题目程序人生-Hello’sP2P专业人工智能学号2021113560班级WL026学生陈禹西指导教师吴锐计算机科学与技术学院2023年5月摘要本文以一个简单的hello.c程序开始，介绍了一个程序在Linux下运行的完整生命周期，包括预处理、编译、汇编、链接、进程管理、存储管理、I/O管理这几部分，一步步详细介绍了程序从被键盘输入、保存到磁盘，直到最后程序运行结束，程序变为僵尸进
2025年春哈工大计算机系统（CSAPP）课程大作业：程序人生 The_Skynet CSAPP 期末大作业
通过这个大作业稍微复习了一下课程知识，这只是按课程要求在这里发布的。我把文件的链接贴在这里了：https://github.com/Trappist-1st/HIT-CSAPP-big_homework
《深入理解计算机系统》期末大作业：程序人生-Hello’s P2P Reisen_Inaba
摘要输出Hello,world的程序，是所有人编程学习的第一步，也是最简单的程序。本文将以程序hello.c为例，分析一个具有一般性的程序在Linux环境下，从预处理到编译、汇编、链接等的完整过程。综合《计算机系统基础》科目所学，考察程序的生命周期，并分析程序作为进程，与内存及外部IO设备的交互过程。关键词：系统，周期，程序生成，进程，交互目录第1章概述......................
解锁程序人生学习成长密码，从目标设定开始 AI天才研究院 ChatGPT AI大模型应用入门实战与进阶程序人生学习微信小程序 ai
解锁程序人生学习成长密码，从目标设定开始关键词：程序员成长、目标设定、学习路径、技能提升、职业规划、刻意练习、反馈机制摘要：本文深入探讨程序员如何通过科学的目标设定方法实现职业成长。文章从目标设定的重要性出发，详细介绍了SMART原则、OKR方法等技术，并结合程序员职业特点，提供了可操作的学习路径规划、技能提升策略和反馈机制建立方法。通过实际案例和工具推荐，帮助程序员构建系统化的成长体系，实现从初
Stable Diffusion 2025新手全套安装教程零基础小白一键解锁AI绘图神器，轻松玩转AI绘画 AI设计酷卡 stable diffusion 人工智能 AI作画 AIGC
我们今天不谈编程，也不谈程序人生，就来唠一唠AI绘图~~StableDiffusion是什么♥️StableDiffusion，简称SD,是一种基于深度学习的图像处理技术!它属于称之为扩散模型diffusionmodel的深度学习AI，是生成模型的一种!这意味着SD的核心作用就是生成类似于其训练数据的新数据,对于SD来说，这个数据就是(图像)图片简单的说StableDiffusion就是一种使用A
程序人生：远程工作环境下的技术成长与职业发展 AI天才研究院 ChatGPT AI大模型企业级应用开发实战程序人生远程工作网络 ai
程序人生：远程工作环境下的技术成长与职业发展关键词：远程工作、技术成长、职业发展、程序员、协作工具、时间管理、自我驱动摘要：本文深入探讨了在远程工作环境下程序员如何实现技术成长与职业发展的策略和方法。文章从远程工作的特点出发，分析了技术成长的挑战与机遇，提出了系统化的解决方案，包括高效学习路径、技术栈规划、远程协作技巧、职业发展策略等核心内容。通过实际案例、工具推荐和具体实施步骤，为程序员在远程工
程序人生进阶指南：掌握这5种跨学科思维让你脱颖而出程序人生职场和发展 ai
程序人生进阶指南：掌握这5种跨学科思维让你脱颖而出关键词：程序员成长、跨学科思维、系统思维、设计思维、经济学思维、心理学思维、数学思维摘要：本文探讨了程序员如何通过培养5种关键跨学科思维（系统思维、设计思维、经济学思维、心理学思维和数学思维）实现职业突破。文章详细解析了每种思维的核心概念、应用场景和在编程中的具体实践方法，帮助技术人员拓宽视野、提升问题解决能力，最终在职业生涯中脱颖而出。1.背景介
程序人生--2005年(30) chilavert318 程序人生涉世之初软件生涯经历
82搬家年底我又一次的搬家了，工作5年了我搬过2次家，一次是藩后街，另一次是丝茅冲。而这次的意义不同，因为这个家是指真正意义上的家！很有归宿感和成就感！在公司单身宿舍生活了3年，其实这里条件真的还不错。有热水、有空调、有电视、可以上网，理想上的职业宿舍，他都具备了。可是总觉得他还缺少些什么，后来细细想想他总归不是属于自己的东西，他只是我生活旅途的一个小站，条件再好我也会离开这里的。搬家工作是在年底
学习型组织，让程序人生职业生涯学习成长不再迷茫 AI大模型应用之禅程序人生学习职场和发展 ai
学习型组织，让程序人生职业生涯学习成长不再迷茫关键词：学习型组织、程序员成长、职业发展、团队学习、个人-组织共进化摘要：本文从程序员职业发展的典型迷茫出发，结合"学习型组织"这一管理科学经典理论，用程序员熟悉的技术思维拆解其核心逻辑。通过"技术团队如何从’代码作坊’升级为’学习引擎’"的实战案例，讲解学习型组织的五大核心要素（自我超越、心智模式、共同愿景、团队学习、系统思考）如何具体落地，帮助程序
程序人生：自我驱动下的职业生涯学习与成长之路 AI天才研究院计算 AI大模型应用入门实战与进阶程序人生学习职场和发展 ai
程序人生：自我驱动下的职业生涯学习与成长之路关键词：程序人生、自我驱动、职业生涯、学习成长、技术发展摘要：本文聚焦于程序员在职业生涯中的学习与成长，强调自我驱动的重要性。通过对程序人生的多维度剖析，阐述了程序员职业生涯的不同阶段特点、学习的核心概念与方法、关键算法原理及实际操作步骤、数学模型在编程中的应用、项目实战案例、实际应用场景等内容。同时推荐了相关的工具和资源，分析了未来发展趋势与挑战，并对
【提升开发效率的秘密武器：IntelliJ IDEA 插件完全使用指南】依赖冲突检测，保存时自动优化代码，编译时智能错误修复王大师王文峰编程利器IDEA intellij-idea java ide
本人详解作者：王文峰，参加过CSDN2020年度博客之星，《Java王大师王天师》公众号：JAVA开发王大师，专注于天道酬勤的Java开发问题中国国学、传统文化和代码爱好者的程序人生，期待你的关注和支持！本人外号：神秘小峯山峯转载说明：务必注明来源（注明：作者：王文峰哦）【提升开发效率的秘密武器：IntelliJIDEA插件完全使用指南】依赖冲突检测，保存时自动优化代码，编译时智能错误修复学习教程
【Python绘制创意爱心代码】多种技术手段实现动态、立体、交互式爱心效果，展示Python在创意编程中的技术魅力。所有代码可直接运行，需Python 3.6+环境。王大师王文峰 python 开发语言
本人详解作者：王文峰，参加过CSDN2020年度博客之星，《Java王大师王天师》公众号：JAVA开发王大师，专注于天道酬勤的Java开发问题中国国学、传统文化和代码爱好者的程序人生，期待你的关注和支持！本人外号：神秘小峯山峯转载说明：务必注明来源（注明：作者：王文峰哦）【Python绘制创意爱心代码】多种技术手段实现动态、立体、交互式爱心效果，展示Python在创意编程中的技术魅力。所有代码可直
React中useEffect和useLayoutEffect的区别 CreatorRay 前端面试 react react.js 前端面试
在最近一次面试中被问到，我印象中好像从来没用过useLayoutEffect，就没答上来。但是看名字应该是跟布局相关的，而且跟useEffect会有类似的作用。在React中，useEffect和useLayoutEffect都是用于处理副作用的Hooks，但它们的执行时机和对渲染流程的影响有显著区别。以下是两者的核心差异及使用场景：公众号：Code程序人生，个人网站：https://creato
【程序人生】中年技术女性，什么是生活的重点？ JosieBook 程序人生生活职场和发展
文章目录⭐前言⭐一、明确“成功”的定义：先破后立警惕社会规训：价值观排序工具：⭐二、怎职业发展：聚焦长板，打造不可替代性30岁职场破局策略：职场可见度提升：⭐三、人际关系：构建支持系统关系断舍离：亲密关系选择：⭐四、身心健康：可持续成功的根基身体管理：情绪调节：⭐五、财务安全：抵御风险的核心防线30岁财务健康标准：投资优先级：⭐六、财务安长期主义：制定“3年跃迁计划”目标锚定法：复盘与迭代：⭐关键
JAVA从万级QPS到亿级吞吐，如何用非阻塞模型突破传统架构的性能瓶颈王大师王文峰 java 架构开发语言
本人详解作者：王文峰，参加过CSDN2020年度博客之星，《Java王大师王天师》公众号：JAVA开发王大师，专注于天道酬勤的Java开发问题中国国学、传统文化和代码爱好者的程序人生，期待你的关注和支持！本人外号：神秘小峯山峯转载说明：务必注明来源（注明：作者：王文峰哦）JAVA从万级QPS到亿级吞吐，如何用非阻塞模型突破传统架构的性能瓶颈学习教程（传送门）引言：当线程池成为瓶颈——某视频平台春节
【C#】VS2019怎么能无论是Debug还是Release模式，生成路径都在Release文件夹下？ JosieBook #C#语言 vs
文章目录⭐问题⭐解决标题详情作者JosieBook头衔CSDN博客专家资格、阿里云社区专家博主、软件设计工程师博客内容开源、框架、软件工程、全栈（,NET/Java/Python/C++）、数据库、操作系统、大数据、人工智能、工控、网络、程序人生口号Tobeyourself，todowhatyouwant.联系方式q:1967473153欢迎三连点赞、✍评论、⭐收藏⭐问题正常情况下，是这样：怎么让
深挖JVM隐藏优化点与百万QPS系统调优【突破认知：JVM内存管理的9大反直觉真相】通过三个违背‘常识‘的调优策略，将GC停顿时间从1.2秒降至80ms，节省40%服务器成本王大师王文峰 jvm 服务器运维
本人详解作者：王文峰，参加过CSDN2020年度博客之星，《Java王大师王天师》公众号：JAVA开发王大师，专注于天道酬勤的Java开发问题中国国学、传统文化和代码爱好者的程序人生，期待你的关注和支持！本人外号：神秘小峯山峯转载说明：务必注明来源（注明：作者：王文峰哦）深挖JVM隐藏优化点与百万QPS系统调优【突破认知：JVM内存管理的9大反直觉真相】通过三个违背'常识'的调优策略，将GC停顿时
Vue 技术博客：从零开始构建一个 Vue Markdown 编辑器王大师王文峰 Java基础到框架 vue.js 编辑器前端
本人详解作者：王文峰，参加过CSDN2020年度博客之星，《Java王大师王天师》公众号：JAVA开发王大师，专注于天道酬勤的Java开发问题中国国学、传统文化和代码爱好者的程序人生，期待你的关注和支持！本人外号：神秘小峯山峯转载说明：务必注明来源（注明：作者：王文峰哦）学习教程（传送门）Vue技术博客：从零开始构建一个VueMarkdown编辑器前言环境准备实现步骤1.引入组件与库2.模板设计3
jdk tomcat 环境变量配置 Array_06 java jdk tomcat
Win7 下如何配置java环境变量 1。准备jdk包，win7系统，tomcat安装包（均上网下载即可） 2。进行对jdk的安装，尽量为默认路径（但要记住啊！！以防以后配置用。。。） 3。分别配置高级环境变量。电脑-->右击属性-->高级环境变量-->环境变量。分别配置 : path &nbs
Spring调SDK包报java.lang.NoSuchFieldError错误 bijian1013 java spring
在工作中调另一个系统的SDK包，出现如下java.lang.NoSuchFieldError错误。 org.springframework.web.util.NestedServletException: Handler processing failed; nested exception is java.l
LeetCode[位运算] - #136 数组中的单一数 Cwind java 题解位运算 LeetCode Algorithm
原题链接：#136 Single Number 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现两次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：题目限定了线性的时间复杂度，同时不使用额外的空间，即要求只遍历数组一遍得出结果。由于异或运算 n XOR n = 0, n XOR 0 = n，故将数组中的每个元素进
qq登陆界面开发 15700786134 qq
今天我们来开发一个qq登陆界面，首先写一个界面程序，一个界面首先是一个Frame对象，即是一个窗体。然后在这个窗体上放置其他组件。代码如下： public class First { public void initul(){ jf=ne
Linux的程序包管理器RPM 被触发 linux
在早期我们使用源代码的方式来安装软件时，都需要先把源程序代码编译成可执行的二进制安装程序，然后进行安装。这就意味着每次安装软件都需要经过预处理-->编译-->汇编-->链接-->生成安装文件--> 安装，这个复杂而艰辛的过程。为简化安装步骤，便于广大用户的安装部署程序，程序提供商就在特定的系统上面编译好相关程序的安装文件并进行打包，提供给大家下载，我们只需要根据自己的
socket通信遇到EOFException 肆无忌惮_ EOFException
java.io.EOFException at java.io.ObjectInputStream$PeekInputStream.readFully(ObjectInputStream.java:2281) at java.io.ObjectInputStream$BlockDataInputStream.readShort(ObjectInputStream.java:
基于spring的web项目定时操作知了ing java Web
废话不多说，直接上代码，很简单配置一下项目启动就行 1，web.xml <?xml version="1.0" encoding="UTF-8"?> <web-app xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="h
树形结构的数据库表Schema设计矮蛋蛋 schema
原文地址： http://blog.csdn.net/MONKEY_D_MENG/article/details/6647488 程序设计过程中，我们常常用树形结构来表征某些数据的关联关系，如企业上下级部门、栏目结构、商品分类等等，通常而言，这些树状结构需要借助于数据库完成持久化。然而目前的各种基于关系的数据库，都是以二维表的形式记录存储数据信息，
maven将jar包和源码一起打包到本地仓库 alleni123 maven
http://stackoverflow.com/questions/4031987/how-to-upload-sources-to-local-maven-repository <project> ... <build> <plugins> <plugin> <groupI
java IO操作与 File 获取文件或文件夹的大小，可读，等属性！！！百合不是茶
类 File File是指文件和目录路径名的抽象表示形式。 1，何为文件：标准文件（txt doc mp3...）目录文件（文件夹）虚拟内存文件 2，File类中有可以创建文件的 createNewFile（）方法,在创建新文件的时候需要try{} catch(）{}因为可能会抛出异常；也有可以判断文件是否是一个标准文件的方法isFile();这些防抖都
Spring注入有继承关系的类（2） bijian1013 java spring
被注入类的父类有相应的属性，Spring可以直接注入相应的属性，如下所例：1.AClass类 package com.bijian.spring.test4; public class AClass { private String a; private String b; public String getA() { retu
30岁转型期你能否成为成功人士 bijian1013 成长励志
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
【Velocity四】Velocity与Java互操作 bit1129 velocity
Velocity出现的目的用于简化基于MVC的web应用开发，用于替代JSP标签技术，那么Velocity如何访问Java代码.本篇继续以Velocity三http://bit1129.iteye.com/blog/2106142中的例子为基础， POJO package com.tom.servlets; public
【Hive十一】Hive数据倾斜优化 bit1129 hive
什么是Hive数据倾斜问题操作：join,group by,count distinct 现象：任务进度长时间维持在99%（或100%），查看任务监控页面，发现只有少量（1个或几个）reduce子任务未完成；查看未完成的子任务，可以看到本地读写数据量积累非常大，通常超过10GB可以认定为发生数据倾斜。原因：key分布不均匀倾斜度衡量：平均记录数超过50w且
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua csrf
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-3.求子数组的最大和 bylijinnan java
package beautyOfCoding; public class MaxSubArraySum { /** * 3.求子数组的最大和题目描述：输入一个整形数组，数组里有正数也有负数。数组中连续的一个或多个整数组成一个子数组，每个子数组都有一个和。求所有子数组的和的最大值。要求时间复杂度为O(n)。例如输入的数组为1, -2, 3, 10, -4,
Netty源码学习-FileRegion bylijinnan java netty
今天看org.jboss.netty.example.http.file.HttpStaticFileServerHandler.java 可以直接往channel里面写入一个FileRegion对象，而不需要相应的encoder： //pipeline（没有诸如“FileRegionEncoder”的handler）： public ChannelPipeline ge
使用ZeroClipboard解决跨浏览器复制到剪贴板的问题 cngolon 跨浏览器复制到粘贴板 Zero Clipboard
Zero Clipboard的实现原理 Zero Clipboard 利用透明的Flash让其漂浮在复制按钮之上，这样其实点击的不是按钮而是 Flash ，这样将需要的内容传入Flash，再通过Flash的复制功能把传入的内容复制到剪贴板。 Zero Clipboard的安装方法首先需要下载 Zero Clipboard的压缩包，解压后把文件夹中两个文件：ZeroClipboard.js
单例模式 cuishikuan 单例模式
第一种（懒汉，线程不安全）： public class Singleton { 2 private static Singleton instance; 3 pri
spring+websocket的使用 dalan_123
一、spring配置文件 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3.or
细节问题：ZEROFILL的用法范围。 dcj3sjt126com mysql
1、zerofill把月份中的一位数字比如1，2，3等加前导0 mysql> CREATE TABLE t1 (year YEAR(4), month INT(2) UNSIGNED ZEROFILL, -> day
Android开发10——Activity的跳转与传值 dcj3sjt126com Android开发
Activity跳转与传值，主要是通过Intent类，Intent的作用是激活组件和附带数据。一、Activity跳转方法一Intent intent = new Intent(A.this, B.class); startActivity(intent) 方法二Intent intent = new Intent();intent.setCla
jdbc 得到表结构、主键 eksliang jdbc 得到表结构、主键
转自博客：http://blog.csdn.net/ocean1010/article/details/7266042 假设有个con DatabaseMetaData dbmd = con.getMetaData(); rs = dbmd.getColumns(con.getCatalog(), schema, tableName, null); rs.getSt
Android 应用程序开关GPS gqdy365 android
要在应用程序中操作GPS开关需要权限： <uses-permission android:name="android.permission.WRITE_SECURE_SETTINGS" /> 但在配置文件中添加此权限之后会报错，无法再eclipse里面正常编译，怎么办？ 1、方法一：将项目放到Android源码中编译； 2、方法二：网上有人说cl
Windows上调试MapReduce zhiquanliu mapreduce
1.下载hadoop2x-eclipse-plugin https://github.com/winghc/hadoop2x-eclipse-plugin.git 把 hadoop2.6.0-eclipse-plugin.jar 放到eclipse plugin 目录中。 2.下载 hadoop2.6_x64_.zip http://dl.iteye.com/topics/download/d2b
如何看待一些知名博客推广软文的行为？ justjavac 博客
本文来自我在知乎上的一个回答：http://www.zhihu.com/question/23431810/answer/24588621 互联网上的两种典型心态：当初求种像条狗，如今撸完嫌人丑当初搜贴像条犬，如今读完嫌人软你为啥感觉不舒服呢？难道非得要作者把自己的劳动成果免费给你用，你才舒服？就如同 Google 关闭了 Gooled Reader，那是
sql优化总结 macroli sql
为了是自己对sql优化有更好的原则性，在这里做一下总结，个人原则如有不对请多多指教。谢谢！要知道一个简单的sql语句执行效率，就要有查看方式，一遍更好的进行优化。一、简单的统计语句执行时间 declare @d datetime ---定义一个datetime的变量set @d=getdate() ---获取查询语句开始前的时间select user_id
Linux Oracle中常遇到的一些问题及命令总结超声波 oracle linux
1.linux更改主机名 (1)#hostname oracledb　　　　临时修改主机名 (2) vi /etc/sysconfig/network 　　修改hostname (3) vi /etc/hosts　　　　　　　　修改IP对应的主机名 2.linux重启oracle实例及监听的各种方法（注意操作的顺序应该是先监听，后数据库实例） &nbs
hive函数大全及使用示例 superlxw1234 hadoop hive函数
具体说明及示例参见附件文档。文档目录：目录一、关系运算： 4 1. 等值比较: = 4 2. 不等值比较: <> 4 3. 小于比较: < 4 4. 小于等于比较: <= 4 5. 大于比较: > 5 6. 大于等于比较: >= 5 7. 空值判断: IS NULL 5
Spring 4.2新特性-使用@Order调整配置类加载顺序 wiselyman spring 4
4.1 @Order Spring 4.2 利用@Order控制配置类的加载顺序 4.2 演示两个演示bean package com.wisely.spring4_2.order; public class Demo1Service { } package com.wisely.spring4_2.order; public class