VicRestart

Linux内核之内存管理分段机制原理与实现(从无到有的过程)

1. 分段机制概述

对于分段机制，要从Intel的微处理器的8086开始说起，刚开始内存空间比较小，内存寻址采用的是直接访问物理地址的方式。由于技术的发展，计算机做的事情越来越多，程序也越来越大，为了更大的内存空间，把地址总线扩展到20位。但是，对于内存设计，一个很尴尬的问题产生了，之前的设计CPU的ALU宽度只有16位，也就是说，ALU不能访问20位的地址空间，那时就设计了段机制来处理这种情况。为了坚持这种兼容性，386依然运用段机制，直至现在的64位处理器已经看不到段机制的身影。

1.1 分段机制产生的原因

为了保持兼容，分段机制的被引入，我们来实际的理解分段机制解决了什么实质性的问题呢？在分段机制还没有出现的时候，程序运行是需要从内存分配出足够多的连续内存，然后整个程序装载进去。例如：

某个程序大小是100M，然后我们就需要有连续的100M内存空间才能把这个程序装载到内存里面。如果无法找到连续的100M内存空间，就无法把这个程序装载进内存空间，程序就无法得到运行。

假设我们的内存可以提供连续的区域来使得程序运行，那么我们来看一下还会存在有什么问题呢？

地址空间不隔离(安全性)：

如果现在有两个程序A和B在运行，程序A在内存的地址假设为0x0->0x100，而程序B在内存中的地址假设为0x100->0x199。那么假设程序员A本来想存在属于A的地址0x50，而不小心访问到属于B的地址0x150，那么不好的事情就将发生了，A和B程序都异常了。对于程序员B来说，是飞来横祸，同时也很难定位到问题，这种情况会导致程序能访问所有的内存空间，恶意修改数据可能造成安全问题。

程序运行时地址不确定(动态链接)：

程序每次要运行的时候，都是需要装载到内存中的。假设你在程序中写死了要操作某个地址的内存，例如你写的地址是0x150。这时问题就来了，你能够保证你操作的地址0x150真的就是你原来想操作的那个位置吗？很可能程序第一次装载进内存的位置是0x100->0x199，而程序第二次运行的时候，这个程序装载进内存的位置变成了0x0->0x100，而你操作的0x150地址压根就不是属于这个程序所占有的内存。

内存使用率低下(内存共享)：

现在假设我们写了3个程序，其中程序A大小为10M，程序B为70M，程序C的大小为30M。而你的计算机的内存总共有100M，这三个程序加起来有110M，显然这三个程序是无法同时存在于内存中的，并且最多只能够同时运行两个程序。比如现在是这个样子：程序A占有的内存空间是0x00000000~0x00000009，程序B占有的内存空间是0x00000010~0x00000079。

假设这个时候程序C要运行该怎么做？我们可以把其中的一个程序换出到磁盘上，然后再把程序C装载到内存中。

假设是把程序A换出，那么程序C还是无法装载进内存中，因为内存中空闲的连续区域有两块，一块是原来程序A占有的那10M，还有就是从0x00000080~0x00000099这20M，所以，30M的程序C无法装载进内存中。

那么，唯一的办法就是把程序B换出，保留程序A，但是，最后的结果会有60M的内存无法利用起来。

为了解决这一些问题，分段的概念应运而生。在计算机科学领域，任何的问题都可以通过增加一个间接的中间层来解决问题，那么为了实现分段的这个技术，就需要引入虚拟地址空间的概念。

我们来了解下，虚拟地址空间和物理地址空间的概念，简单的说来，对于可以寻址的一片空间，如果这个空间是虚拟的，我们就叫做虚拟的地址空间；如果这个空间是真实存在的，我们就叫做物理地址空间。虚拟地址空间是虚拟的，所有就决定了他可以是任意的大，而物理地址空间必须是真实存在的，是由实际的硬件决定的。

1.2 硬件分段机制

分段是一种隔离不同的代码、数据、栈模块的机制，能够保证不同进程或任务不会互相干扰。我们可以为一个进程分配属于它的段集合，CPU 的硬件机制会保证其代码不会越权访问段，也不会访问到段外的地址。

分段机制就是把虚拟地址空间中的虚拟内存组织成一些长度可变的的段的内存单元，80386虚拟地址空间中的逻辑地址由一个段部分和一个段内偏移部分构成，段是虚拟地址空间到线性地址转换的基础。每个段都有3个参数定义：

段基地址：指定段在线性地址空间中的开始地址，基地址是线性地址对应于段中偏移0处
段限长：是虚拟地址空间中段内最大可用偏移地址，定义了段的长度
段属性：指定段的特性，如该段是否可读，可写或可执行，段的特权级等

当需要访问处理器地址空间的某个字节时，段选择符指定了该字节所在的段，偏移量指定了该字节在段中相对于段基址的位置，处理器把逻辑地址转化成一个线性地址的过程如下：

1.使用段选择符中的偏移值（在GDT（全局描述符表）或 LDT（局部描述符表）中定位相应的段描述符
2.利用段描述符校验段的访问权限和范围，以确保该段是可以访问的并且偏移量位于段界限内
3.利用段描述符中取得的段基地址加上偏移量，形成一个线性地址

1.2.1 段选择符

段选择符（或称段选择子）是段的一个十六位标志符，如下图所示。段选择符并不直接指向段，而是指向段描述符表中定义段的段描述符。

段选择符包括 3 个字段的内容：

请求特权级RPL（[0:1]）
表指引标志TI（[2]）TI = 0 ，表示描述符在GDT中，TI = 1，表示描述符在LDT中
索引值，给出了描述符在GDT或LDT表中的索引项号

下面是一些段选择符的示例：

1.2.2 段描述符

段描述符表是段描述符的一个数组，如下图所示。描述符表的长度可变，最多可以包含8192个 8 byte 描述符。有两个描述符表：全局描述符表GDT （Global descriptor table）; 局部描述符表 LDT （Local descriptor table），由段选择符的bit[2]会选择到对应的GDT表还是LDT表去拿到对应的段基址。

而对于段描述符，每个段描述符长度是 8 字节，含有三个主要字段：段基地址、段限长和段属性。段描述符通常由编译器。链接器、加载器或者操作系统来创建，绝不可能由应用程序来创建。

段描述符通用格式如下：

了解了这个过程，我们来总体的梳理下，如果使用分段机制，那么怎么使虚拟地址空间转到对应的物理地址空间呢？转换过程如下图所示：

1.取出虚拟地址空间中的段选择符，根据TI位判断段描述符是存储在GDT还是LDT中

2.段选择符中的index*8，也就是左移3位，就是段描述符在GDT中的位置，在加上GDT的基地址，就是段描述符的地址，从而去除段描述符

3.段描述符中保存了该段的基地址，加上虚拟地址中的偏移量就是对应到的物理地址空间。

2. Linux中分段的实现原理

上一节讨论了80x86如何从硬件上提供分段机制的支持，而本节讨论下linux如何使用分段机制。最开始的时候，操作系统不支持分段，内存的换入换出都是以整个进程的内存空间为单位，导致系统非常的耗时，同时利用率也不高，当内存不足时，很容易导致内存交换失败。后来有了分段技术，把内存空间分成多个模块：代码段、数据段，或者是一个大的数据块。段成了内存交换的单位，在一定程度上增加了内存利用率。那时候还没有分页技术，虚拟地址（线性地址）是直接映射到物理空间的。

引入分页机制后，目前linux很少使用分段，分段和分页在某些方面是冗余的，因为他们都可以把物理地址空间分割成不同部分：分段给每个进程分配不同的逻辑地址空间，而分页可以把相同的逻辑地址空间映射到不同的物理地址上。因此，Linux优先采用了分页（分页操作系统），基于以下原因：

内存管理更简单：所有进程使用相同段寄存器值，也就是相同的线性地址集

出于兼容大部分硬件架构的考虑，RISC架构对分段支持的不是很好

所以自从x86-64起，除了在“传统模式”下，分段机制已被认为是过时的且不再被支持。虽然在x86-64的本机模式下仍然有分段机制的某些痕迹，但大多只是为了兼容，且它们不再具起到同样的作用，也不再提供真正的分段。

那么linux内核是怎么支持分段机制呢？我们来看上节的分段机制的原理图如下：

比如，我们将虚拟地址空间分成4个段，用0-3来编号，每个段在段表中有一个项，在物理空间中，段的排列如下图所示:

如果要访问段2中偏移量为600的虚拟地址，我们可以计算出物理地址为段基地址+偏量=2000+600=2600

3. Linux分段机制的软件实现

Linux对段机制的应用效果是等价于几乎绕过了段基址。在Linux中仅有4个段，用户代码段、数据段和内核代码段、数据段。

这些段相应的选择器分别由以下宏定义：_USER_CS, __USER_DS, __KERNEL_CS, 和__KERNEL_DS。举例来说，如果要定位内核代码段，内核只需要加载__KERNEK_CS宏的值到cs寄存器中。

接下来我们看一下linux代码吧，进入保护模式的函数go_to_protected_mode:

void go_to_protected_mode(void)
    {
        /* Hook before leaving real mode, also disables interrupts */
        realmode_switch_hook();

        /* Enable the A20 gate */
        if (enable_a20()) {
            puts("A20 gate not responding, unable to boot...\n");
            die();
        }

        /* Reset coprocessor (IGNNE#) */
        reset_coprocessor();

        /* Mask all interrupts in the PIC */
        mask_all_interrupts();

        /* Actual transition to protected mode... */
        setup_idt();
        setup_gdt();
        protected_mode_jump(boot_params.hdr.code32_start,
                 (u32)&boot_params + (ds() << 4));
    }

里面的函数略带一下吧，realmode_switch_hook()根据注释和函数命名可以知道这是在实模式切换前的钩子函数调用的地方；enable_a20()这个太熟悉了，就开启A20；reset_coprocessor()是把协处理器重置一下mask_all_interrupts()则是把中断关了，避免切换过程中出现状况。其中setup_idt()和setup_gdt()是本节的重点，函数名字告诉我们这是设置idt和gdt的，看一下两者具体代码吧：

static void setup_idt(void)
{
	static const struct gdt_ptr null_idt = {0, 0};
    asm volatile("lidtl %0" : : "m" (null_idt));
}

根据setup_idt()的实现，可以明显看到这没做什么，纯粹置一下idt为空的描述符表。

static void setup_gdt(void)
    {
        /* There are machines which are known to not boot with the GDT
         being 8-byte unaligned. Intel recommends 16 byte alignment. */
        static const u64 boot_gdt[] __attribute__((aligned(16))) = {
            /* CS: code, read/execute, 4 GB, base 0 */
            [GDT_ENTRY_BOOT_CS] = GDT_ENTRY(0xc09b, 0, 0xfffff),
            /* DS: data, read/write, 4 GB, base 0 */
            [GDT_ENTRY_BOOT_DS] = GDT_ENTRY(0xc093, 0, 0xfffff),
            /* TSS: 32-bit tss, 104 bytes, base 4096 */
            /* We only have a TSS here to keep Intel VT happy;
             we don't actually use it for anything. */
            [GDT_ENTRY_BOOT_TSS] = GDT_ENTRY(0x0089, 4096, 103),
        };
        /* Xen HVM incorrectly stores a pointer to the gdt_ptr, instead
         of the gdt_ptr contents. Thus, make it static so it will
         stay in memory, at least long enough that we switch to the
         proper kernel GDT. */
        static struct gdt_ptr gdt;

        gdt.len = sizeof(boot_gdt)-1;
        gdt.ptr = (u32)&boot_gdt + (ds() << 4);

        asm volatile("lgdtl %0" : : "m" (gdt));
    }

首先，我们看看之前的GDT entry的结构图如下：

GDT_ENTRY的定义如下：

/* Constructor for a conventional segment GDT (or LDT) entry */
    /* This is a macro so it can be used in initializers */
    #define GDT_ENTRY(flags, base, limit)            \
        ((((base) & 0xff000000ULL) << (56-24)) |    \
         (((flags) & 0x0000f0ffULL) << 40) |        \
         (((limit) & 0x000f0000ULL) << (48-16)) |    \
         (((base) & 0x00ffffffULL) << 16) |        \
         (((limit) & 0x0000ffffULL)))

可以清楚得看到，base, limit和flag通过位移和或组成了GDT_ENTRY。其中flags代表了40-47位的access byte和52-55位的flags。

CS和DS的flags为0xc0，所以G=1，意味着4K为一个页面，B/D为1，1-32位段；

CS的Access Byte=0x9b，意味着P=1（合法的Entry Pr必须为1），DPL=0，S=1，这里该段只能在Ring 0下访问，该段是代码段

DS的Access Byte=0x93，意味着P=1（合法的Entry Pr必须为1），DPL=0，S=1，这里该段只能在Ring 0下访问，该段是数据段

linux中逻辑地址等于线性地址。为什么这么说呢？因为Linux所有的段（用户代码段、用户数据段、内核代码段、内核数据段）的线性地址都是从 0x00000000 开始，长度4G，这样线性地址=逻辑地址+ 0x00000000，也就是说逻辑地址等于线性地址了。通过分析，我们发现，所有的段的起始地址都是一样的，都是 0。这算哪门子分段嘛！所以，在 Linux 操作系统中，并没有使用到全部的分段功能。那分段是不是完全没有用处呢？分段可以做权限审核，例如用户态 DPL 是 3，内核态 DPL 是 0。当用户态试图访问内核态的时候，会因为权限不足而报错。

还是以 mov 0x80495b0, %eax 中的地址为例分析一下转换过程：

1.首先段选择符中的TI为0，表明段描述符在GDT表中，使用段选择符中的偏移值定位到相应的段描述符，找到15这个位置
2.从15号位置的段描述符，找到对应的访问权限，访问基地址(0)和访问范围(0xffff)
3.利用段描述符中去得到的段基址0x0000000，加上逻辑地址偏移0x80495b0，形成线性地址0x80495b0。

所以Linux没有采用严格的分段机制，已经慢慢的弱化分段机制，而使用分页机制来替换分段机制。

4. 分段机制的优缺点

现在大致了解了分段的基本原理，系统运行时，地址空间中不同段被重定位到物理内存中，与之前的整个物理地址空间中只有一个基地址＋偏移量的方式相比，大量的节省了物理内存。同时分段管理就是将一个程序按照逻辑单元分成多个程序段，每一个段使用自己单独的虚拟地址空间。例如，对于编译器来说，我们可以给其5个段，占用5个虚拟地址空间，如下图所示

如此，一个段占用一个虚拟地址空间，不会发生空间增长时碰撞到另一个段的问题，从而避免因空间不够而造成编译失败的情况。如果某个数据结构对空间的需求超过整个虚拟之地所能够提供的空间，则编译仍将失败，开编提到的问题１好像得到了完美解决。

正是因为这种映射，使得程序无需关注物理地址是多少，只要虚拟地址没有改变，那么程序就不会操作地址不当，问题２也好像可以很好的解决。

但是问题３，是换入换出的问题，这个问题的关键是能不能在换出一个完整程序之后，把另外一个程序换进来，而这种分段机制，就存在一个很严重的问题。

物理内存很快充满了许多空闲空间的小洞,因而很难分配给新的段,或扩大已有的段。这种问题被称为外部碎片(external fragmentation)。该问题的一种解决方案是紧凑(compact)物理内存,重新安排原有的段。

分段机制采用的是分段，这就导致一个问题，已分配的段有大有小，未使用的段也有大有小，将要分配的段也有大有小，各方需求不一定，理想的情况，但系统中的程序比较少，内存没有完全使用的情况下会如紧凑型分配。但是在程序运行过程中，有些程序运行完后，要释放新已分配的内存空间，当使用一段时间后，可能会出现非紧凑的情况，在这个例子中，一个进程需要分配一个20K的段，当前有24K的空闲，却不连续，因此操作系统无法满足这20K的请求。这也就是外部碎片，其特征如下：

外部碎片是指还没有被分配出去(不属于任何进程)，但是由于太小了，无法分配给申请内存空间的新进程的内存空闲区域。

虽然这些存储块的总和可以满足当前申请的长度的要求，但是由于他们的地址不连续或者其他原因，使得系统无法满足当前的申请。

5. 分段机制的改进之路

紧凑物理内存，重新安排原有的段，例如，操作系统先终止运行的进程，将他们的数据复制到连续的内存区域中去，改变他们的段寄存器中的值，指向新的物理地址，从而得到足够大的连续空闲空间。这样做，大大提高了成本，系统开销也很大，会占用大量的处理器时间。

软件优化的算法，一种更简单的做法是利用空闲列表管理算法，保留大的内存块用于分配。相关的算法很多，例如传统的最优匹配(从空闲链表中找到最接近需要分配空间的空闲块返回)、最坏匹配、首次匹配以及伙伴算法等。但遗憾的是，无论算法多么精妙，都无法完全的消除外部碎片。

无论如何，分段机制解决了上面两个问题，算是一个很大的进步。但是对于内存效率问题仍然无能为力，同时也产生了内存的外部碎片。为了解决分段机制存在的问题，更为合理的分页机制就应运而生，后面的章节我们会接着讨论。

6. 总结

分段机制解决了一些问题，帮助我们实现了更高效的虚拟内存。不只是动态重定位，通过避免地址空间的逻辑段之间的大量潜在的内存浪费，分段机制更好的支持了虚拟地址空间。分段机制有好处，也有它的局限性，我们就需要更好的解决方案，以后章节会慢慢总结。

浅谈智能座舱的“一芯多屏” SAUTOMOTIVE 物联网 iot 自动驾驶
本文由边旭东，张亦弛，谢卉瑜联合创作摘要随着汽车智能化、网联化水平提高，汽车座舱逐渐向以人机交互为核心、多屏联动的智能座舱发展。在芯片研发制造、虚拟化技术大力发展下，在一颗性能强大芯片上运行多个车载操作系统，同时驱动多个显示屏的“一芯多屏”智能座舱方案成为智能座舱的发展趋势。1前言随着汽车产业智能网联化进程的不断发展，消费者对于汽车的认识逐步从“代步的交通工具”向连接家和办公室的“第三空间”转变，
Python学习第七天 Leo来编程 Python学习学习
模块模块是一个包含Python代码的文件，通常以.py为扩展名。模块中内容有函数、类、变量/常量、测试代码。模块的作用：划分代码结构、提高代码的复用率。命名规范使用小写字母：模块名应全部使用小写字母。避免使用大写字母，因为不同操作系统对文件名的大小写敏感度不同。使用下划线分隔单词：如果模块名由多个单词组成，使用下划线_分隔单词。这种风格称为file_util避免使用关键字和内置模块名不要使用Pyt
io学习-----＞文件io \＆会飞的鱼_ 服务器运维
思维导图：一.文件io的概念文件IO：指程序和文件系统之间的数据交互特点：1.不存在缓冲区，访问速度慢2.不可以移植，依赖于操作系统3.可以访问不同的文件类型(软连接，块设备等)4.文件IO属于系统调用5.文件IO在操作文件时使用文件描述符二.什么是描述符当操作一个文件的时候，则需要创建并打开一个文件，系统就会给文件分配一个编号，这个编号就是文件描述符文件描述符本质就是数组的下表，标准IO是对文件
鸿蒙全栈开发 D1 GH小杨 harmonyos 华为 typescript
鸿蒙全栈开发第一天第一部分：鸿蒙操作系统基础1.1鸿蒙发展史（深度解析）2012-01-012013-01-012014-01-012015-01-012016-01-012017-01-012018-01-012019-01-012020-01-012021-01-012022-01-012023-01-012024-01-01分布式技术预研微内核验证HarmonyOS1.0OpenHarmon
如何建立需求变更的规范化流程需求管理
在项目开发过程中，需求变更是不可避免的现象，流程透明、沟通机制、风险控制成为建立规范化流程的三大关键。流程透明确保变更原因、内容、审批和反馈都能被全员了解和跟踪，从而降低因信息不对称产生的误解和风险；同时，合理的沟通机制和严格的风险控制是保障变更顺利实施的重要环节，其中风险控制通过细致的数据分析和及时预警发挥了决定性作用。一、需求变更的重要性与背景需求变更是软件开发与项目管理中常见的问题。随着技术
yarn如何用node替换
Yarn是一个流行的JavaScript包管理工具，它为npm提供了更快、更可靠的体验。尽管Yarn有其优势，但在许多情况下，我们可能想使用Node.js的本地包管理机制来替代Yarn。一、基本概念在开始之前，我们要明确一些基本个念：Node.js：一个高效的JavaScript运行环境，为构建服务器端应用程序提供支持。Yarn：一个Facebook开发的JavaScript包管理工具，用于处理项
ubantu 修改android12 系统镜像云服务器linuxubuntu
整个过程涉及多个步骤，以下是我们将要遵循的流程：步骤描述1准备工作2获取Android12系统镜像3挂载系统镜像4修改文件5卸载系统镜像6制作新的系统镜像1.准备工作确保你已经安装了Ubuntu操作系统，并且你的Ubuntu系统上已经安装了一些必需的工具。在终端中运行以下命令以安装所需的软件包：sudoaptupdatesudoaptinstall\gparted\squashfs-tools\g
认证支持全面碾压？Apipost的OAuth2.0与ASAP实战演示，Apifox用户看完扎心了
认证缺失的隐秘危机，你可能正在裸奔调试当开发者沉浸在接口调试的逻辑快感中时，往往容易忽视一个致命环节——认证机制。试想：你的API请求未携带合法令牌，就像用密码"123456"登录银行账户；你的OAuth2.0流程配置错误，相当于把用户隐私直接暴露在公网。更讽刺的是，80%的开发者认为认证是运维的职责，却在实际调试中反复踩坑：授权头缺失、令牌过期、回调地址配置错误...这些看似基础的问题，轻则导致
c++ 继承闪电麦坤95 c++开发语言计算机外设 c语言前端
目录什么是继承？基本语法继承的类型公有继承（publicinheritance）：保护继承（protectedinheritance）：私有继承（privateinheritance）：继承中的构造函数和析构函数多重继承虚函数与多态什么是继承？继承是C++中一种机制，允许一个类（称为派生类或子类）从另一个类（称为基类或父类）继承属性和方法。通过继承，子类可以重用父类的代码，扩展或修改其功能，从而提
Python小项目：利用tkinter开发测手速小游戏
PythonTkinter手速测试器开发全解析本文将通过工业级代码规范重构基础测速程序，融入防作弊机制与性能优化方案，打造专业级手速测试工具。以下为经过真实项目验证的增强版实现方案：一、基础代码缺陷分析原始版本存在三大核心问题：无随机触发机制（用户可预判操作时机）缺少多轮测试统计功能未防止连续点击作弊二、增强版方案设计系统架构流程图：stateDiagram-v2[*]-->待机状态待机状态-->
碳实践｜CBAM下的企业应对与未来趋势分析区块链
引言随着全球气候变化的严峻形势日益加剧，各国政府纷纷出台了一系列环境政策以应对这一全球性挑战。其中，碳边境调节机制（CBAM）作为一项重要的国际环境政策，正逐渐成为全球贸易体系中的新常态。CBAM旨在对进口商品中隐含的碳排放进行征税，以激励企业减少温室气体排放，促进全球低碳经济转型。在此背景下，企业如何成功应对CBAM，不仅关系到其自身的生存与发展，更对整个行业的绿色转型具有重要意义。本文将以CB
23种设计模式之《访问者模式（Visitor）》在c#中的应用及理解 yuanpan 设计模式访问者模式 c#开发语言
程序设计中的主要设计模式通常分为三大类，共23种：1.创建型模式（CreationalPatterns）单例模式（Singleton）：确保一个类只有一个实例，并提供全局访问点。工厂方法模式（FactoryMethod）：定义创建对象的接口，由子类决定实例化哪个类。抽象工厂模式（AbstractFactory）：提供一个创建一系列相关或依赖对象的接口，而无需指定具体类。建造者模式（Builder）
软考计算机网络,软考-计算机网络总复习 Vicey Wang 软考计算机网络
计算机网络复习知识点1、计算机网络的定义描述计算机网络，是指将地理位置不同的具有独立功能的多台计算机及其外部设备，通过通信线路连接起来，在网络操作系统，网络管理软件及网络通信协议的管理和协调下，实现资源共享和信息传递的计算机系统2、OSI参考模型的分层(7层各自的功能)(1)物理层(PhysicalLayer)物理层是OSI参考模型的最低层，它利用传输介质为数据链路层提供物理连接。它主要关心的是通
Redis 各数据类型使用场景详解何怀逸 Redis redis 数据库缓存
1.字符串（String）场景1：计数器（如文章阅读量）问题：高并发下对同一数值进行增减操作时，需保证原子性，避免竞态条件导致数据不一致。频繁读写可能成为性能瓶颈。解决方案：INCR/DECR命令：Redis的原子操作确保增减操作的线程安全，无需额外锁机制。内存存储：数据直接存储在内存中，读写速度极快（微秒级响应）。场景2：分布式锁问题：多节点服务竞争同一资源时，需确保同一时间只有一个客户端持有锁
大模型入门 24k小善 AI编程 AI写作 prompt
大模型技术演进的核心脉络当前大模型技术已进入"参数规模+架构创新"双轮驱动阶段。2025年的最新趋势显示，万亿级参数模型在稀疏激活（如Mixture-of-Experts）与动态路由技术加持下，推理成本较传统密集模型降低57%。Transformer架构的持续演进体现在位置编码改进（如RoPE旋转位置编码）、注意力机制优化（FlashAttention算法提升30%训练速度）以及层级结构创新（深度
flink重启策略 24k小善 flink 大数据 java
一、重启策略核心意义Flink重启策略（RestartStrategy）是容错机制的核心组件，用于定义作业在发生故障时如何恢复执行。其核心目标为：最小化停机时间：快速恢复数据处理，降低业务影响。平衡资源消耗：避免无限重启导致集群资源耗尽。状态一致性保障：与Checkpoint机制协同，确保Exactly-Once语义。二、四大重启策略详解1.固定延迟重启（FixedDelayRestart）机制：
在 Docker 中，无法直接将外部多个端口映射到容器内部的同一个端口梦醒贰零壹柒运维 docker 容器运维
Docker的端口映射是一对一的，即一个外部端口只能映射到容器内部的一个端口。1.为什么不能多对一映射？端口冲突：如果外部多个端口映射到容器内部的同一个端口，Docker无法区分外部请求应该转发到哪个内部端口，会导致端口冲突。设计限制：Docker的端口映射机制是基于一对一的设计，不支持多对一的映射。2.替代方案虽然Docker不支持多对一映射，但可以通过以下方式实现类似的功能：(1)使用反向代理
T31ZC 君正SOC芯片应用于智能家居、工业控制等满足各种嵌入式应用的需求提供样品测试+软硬件资料 li15817260414 君正智能家居嵌入式硬件音视频
君正（Ingenic）T31ZC是一款基于MIPS架构的低功耗系统级芯片（SoC），集成了512Mbit的DDR2内存，主要用于嵌入式系统和物联网设备。以下是其详细的技术资料：1.处理器（CPU）：架构：MIPS架构内存：集成512Mbit（64MB）DDR2内存操作系统：运行Linux操作系统2.内存分布：T31ZC的64MB物理内存被划分为两部分：4.内存优化方向：在内存资源紧张的情况下，可以
到底什么是工业操作系统？（1）DOS年代 Wnq10072 linux microsoft 其他经验分享
在微软推出Windows操作系统之前，DOS（磁盘操作系统）是个人计算机的主要操作系统。以下是Windows出现之前的关键DOS系统及其发展历程：1.CP/M（ControlProgram/Monitor）由DigitalResearch公司于1976年推出，CP/M是早期个人计算机（如Altair8800）的主流操作系统。它基于命令行界面，支持8080芯片，并成为后续DOS系统的设计参考。IBM
芯片为什么需要初始引导程序？——ROM的作用、机制与实现嵌入式Jerry 嵌入式硬件嵌入式硬件服务器 linux 人工智能运维
1.前言当一个CPU上电时，它该如何确定自己需要执行什么代码？我们所知道的操作系统实际上就是一段进阶的代码，它必须从一个已经处于可执行状态的代码开始。这就是初始引导程序的作用，它确保CPU能够正确从对应的存储设备加载后续进程。在不同系统中，初始引导程序的定位方式和优先级结构不同，但基本原理是相通的。本文将以ROM为核心，详细解释初始引导程序在各种芯片中的作用和实现方式。2.什么是ROM？为什么芯片
MySQL 与 Redis 的数据一致性问题 m0_74824823 面试学习路线阿里巴巴 mysql redis 数据库
读数据的逻辑基本一致问题1:一致性有哪些?MySQL与Redis的数据一致性方案有哪些?先写MySQL还是先写Redis?缓存数据是更新还是清除?强一致还是最终一致?问题:如果mysql写成功了,但是Redis写(删除)失败了怎么办?重试机制的幂等问题如何解决?方案1:先更新MySQL再清除Redis方案2:双删策略方案3:监听MySQL的binlog日志删除问题:热key失效问题思路1:让热ke
2020年“磐云杯”网络空间安全技能竞赛全国拉赛 Beluga 中职网络空间安全赛题安全 linux 网络网络空间安全中科磐云
2020年“磐云杯”网络空间安全技能竞赛全国拉赛一、竞赛阶段竞赛阶段任务阶段竞赛任务竞赛时间分值第一阶段单兵模式系统渗透测试任务1Wireshark数据包分析100分钟100任务2系统漏洞扫描与利用100任务3服务漏洞扫描于测试100任务4Web渗透测试100任务5Windows操作系统渗透测试100任务6Linux操作系统渗透测试100任务7主机存活扫描渗透测试100备战阶段攻防对抗准备工作20
spring-ioc-bean 周周写不完的代码 spring java 后端
本文重点在于充分应用Spring提供的IoC特性，介绍如何创建一个好用的Bean。基础篇不涉及后置处理器、BeanDefinition以及Spring加载原理相关的知识。引入ioc的起源**接口与实现类的需求变更**：最初的静态工厂模式。**反射机制**：延迟加载，避免编译时依赖。**外部化配置**：将Bean的全限定名存储在配置文件中。**缓存机制**：存储已创建的Bean对象。入门使用Spri
网络空间安全（13）上传验证绕过 IT 青年网安知识库网络空间安全
前言上传验证绕过是一种网络安全攻击手段，攻击者利用目标系统或应用程序在文件上传过程中存在的漏洞，绕过文件上传的验证机制，上传恶意文件，从而实现对目标系统的攻击。一、常见类型客户端验证绕过定义：客户端验证通常通过JavaScript在浏览器中执行，用于检查文件类型、大小等。客户端验证绕过是指攻击者通过禁用JavaScript或修改前端代码，绕过这些验证。绕过方法：禁用JavaScript：直接在浏览
【Linux】【网络】UDP打洞--＞不同子网下的客户端和服务器通信（成功版）钟离墨笺 Linux 网络服务器 linux
【Linux】【网络】UDP打洞–＞不同子网下的客户端和服务器通信（成功版）根据上个文章的分析问题可能出现在代码逻辑上面我这里重新查找资料怀疑：1NAT映射可能需要多次数据包的发送才能建立。2NAT映射保存时间太短，并且NAT可能会在短时间内改变这些映射，需要一直保持映射。有些NAT设备会因为短时间内没有数据而回收端口映射，导致服务器提供的IP:Port失效。保活机制：双方定期发送保活包以防NAT
Spring 集成事务管理详解：银行转账示例阿绵后端 spring java 后端事务管理
1.前言在JavaEE开发中，数据库事务是保证数据一致性的重要机制。Spring提供了强大的事务管理功能，允许开发者通过声明式事务（基于注解）或编程式事务（手动管理）来控制事务。本文介绍如何在原始Spring框架（非SpringBoot）中集成事务管理，包括配置步骤和代码示例本代码示例版本要求：Java17+Spring6+2.事务管理的基本概念2.1什么是事务？事务（Transaction）是一
Python 爬虫实战：爬取学术论文数据西攻城狮北 python 爬虫实战案例
一、项目概述二、环境准备1.Python和PyCharm安装2.安装必要Python库三、爬虫实战1.分析目标网站2.编写爬虫代码（1）使用Requests和BeautifulSoup获取页面数据（2）使用Pandas存储数据（3）使用Scrapy框架构建高效爬虫3.爬取API数据四、数据处理与分析1.数据清洗2.数据可视化五、注意事项1.遵守法律和道德规范2.处理验证码3.应对反爬虫机制六、总结
Android广播机制简析漆黑迷夜 Android应用开发
1.广播机制简介Android中的广播主要是用来在不同的组件间传递消息用的。app能够接收来自Android系统或者其他app所发送的广播。也能像其发送系统提供的或者自定义的广播。例如，Android系统启动时就会发送一个开机广播，如果想要在开机是处理一些逻辑，可以监听该广播。应用场景如下：同一个app内部的同一个组件内的消息通信（单个或多个线程）;同一个app内部的不同组件之间的消息通信（单个或
OpenCV计算摄影学（15）无缝克隆（Seamless Cloning）调整图像颜色的函数colorChange() 村北头的码农 OpenCV opencv 人工智能计算机视觉
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述cv::colorChange是OpenCV中用于调整图像颜色的函数。它允许你通过乘以不同的系数来独立地改变输入图像中红色、绿色和蓝色通道的强度，从而实现对图像色彩的调整。这个功能对于需要精细控制图像色调的应用非常有用。函数原型voidcv::colorChang
c语言基础系列8-条件编译 aiweker AI工程化 C语言 c语言
条件编译在C语言中，条件编译是一种预处理器功能，它允许根据条件来选择性地包含或排除代码片段。条件编译通常使用#if、#ifdef、#ifndef、#elif、#else和#endif等预处理指令来实现。条件编译允许程序员在编译时根据不同的条件编译不同的代码，例如根据不同的操作系统或编译器进行条件编译。下面是一个条件编译的使用例子：#include#defineDEBUG1intmain(){#if
ASM系列五利用TreeApi 解析生成Class lijingyao8206 ASM 字节码动态生成 ClassNode TreeAPI
前面CoreApi的介绍部分基本涵盖了ASMCore包下面的主要API及功能，其中还有一部分关于MetaData的解析和生成就不再赘述。这篇开始介绍ASM另一部分主要的Api。TreeApi。这一部分源码是关联的asm-tree-5.0.4的版本。在介绍前，先要知道一点， Tree工程的接口基本可以完
链表树——复合数据结构应用实例 bardo 数据结构树型结构表结构设计链表菜单排序
我们清楚：数据库设计中，表结构设计的好坏，直接影响程序的复杂度。所以，本文就无限级分类（目录）树与链表的复合在表设计中的应用进行探讨。当然，什么是树，什么是链表，这里不作介绍。有兴趣可以去看相关的教材。需求简介：经常遇到这样的需求，我们希望能将保存在数据库中的树结构能够按确定的顺序读出来。比如，多级菜单、组织结构、商品分类。更具体的，我们希望某个二级菜单在这一级别中就是第一个。虽然它是最后
为啥要用位运算代替取模呢 chenchao051 位运算哈希汇编
在hash中查找key的时候，经常会发现用&取代%，先看两段代码吧， JDK6中的HashMap中的indexFor方法： /** * Returns index for hash code h. */ static int indexFor(int h, int length) {
最近的情况麦田的设计者生活感悟计划软考想
今天是2015年4月27号整理一下最近的思绪以及要完成的任务 1、最近在驾校科目二练车，每周四天，练三周。其实做什么都要用心，追求合理的途径解决。为
PHP去掉字符串中最后一个字符的方法 IT独行者 PHP 字符串
今天在PHP项目开发中遇到一个需求，去掉字符串中的最后一个字符原字符串1,2,3,4,5,6, 去掉最后一个字符","，最终结果为1,2,3,4,5,6 代码如下： $str = "1,2,3,4,5,6,"; $newstr = substr($str,0,strlen($str)-1); echo $newstr;
hadoop在linux上单机安装过程 _wy_ linux hadoop
1、安装JDK jdk版本最好是1.6以上，可以使用执行命令java -version查看当前JAVA版本号，如果报命令不存在或版本比较低，则需要安装一个高版本的JDK，并在/etc/profile的文件末尾，根据本机JDK实际的安装位置加上以下几行： export JAVA_HOME=/usr/java/jdk1.7.0_25
JAVA进阶----分布式事务的一种简单处理方法无量多系统交互分布式事务
每个方法都是原子操作：提供第三方服务的系统，要同时提供执行方法和对应的回滚方法 A系统调用B,C,D系统完成分布式事务 =========执行开始======== A.aa(); try { B.bb(); } catch(Exception e) { A.rollbackAa(); } try { C.cc(); } catch(Excep
安墨移动广告：移动DSP厚积薄发引领未来广告业发展命脉矮蛋蛋 hadoop 互联网
　　“谁掌握了强大的DSP技术，谁将引领未来的广告行业发展命脉。”2014年，移动广告行业的热点非移动DSP莫属。各个圈子都在纷纷谈论，认为移动DSP是行业突破点，一时间许多移动广告联盟风起云涌，竞相推出专属移动DSP产品。　　到底什么是移动DSP呢? 　　DSP(Demand-SidePlatform)，就是需求方平台，为解决广告主投放的各种需求，真正实现人群定位的精准广
myelipse设置 alafqq IP
在一个项目的完整的生命周期中，其维护费用，往往是其开发费用的数倍。因此项目的可维护性、可复用性是衡量一个项目好坏的关键。而注释则是可维护性中必不可少的一环。注释模板导入步骤安装方法：打开eclipse/myeclipse 选择 window-->Preferences-->JAVA-->Code-->Code
java数组百合不是茶 java数组
java数组的声明创建初始化； java支持C语言数组中的每个数都有唯一的一个下标一维数组的定义声明： int[] a = new int[3];声明数组中有三个数int[3] int[] a 中有三个数，下标从0开始，可以同过for来遍历数组中的数
javascript读取表单数据 bijian1013 JavaScript
利用javascript读取表单数据，可以利用以下三种方法获取： 1、通过表单ID属性：var a = document.getElementByIdx_x_x("id"); 2、通过表单名称属性：var b = document.getElementsByName("name"); 3、直接通过表单名字获取：var c = form.content.
探索JUnit4扩展：使用Theory bijian1013 java JUnit Theory
理论机制（Theory）一.为什么要引用理论机制（Theory）当今软件开发中，测试驱动开发（TDD — Test-driven development）越发流行。为什么 TDD 会如此流行呢？因为它确实拥有很多优点，它允许开发人员通过简单的例子来指定和表明他们代码的行为意图。 TDD 的优点： &nb
[Spring Data Mongo一]Spring Mongo Template操作MongoDB bit1129 template
什么是Spring Data Mongo Spring Data MongoDB项目对访问MongoDB的Java客户端API进行了封装，这种封装类似于Spring封装Hibernate和JDBC而提供的HibernateTemplate和JDBCTemplate，主要能力包括 1. 封装客户端跟MongoDB的链接管理 2. 文档-对象映射，通过注解:@Document(collectio
【Kafka八】Zookeeper上关于Kafka的配置信息 bit1129 zookeeper
问题： 1. Kafka的哪些信息记录在Zookeeper中 2. Consumer Group消费的每个Partition的Offset信息存放在什么位置 3. Topic的每个Partition存放在哪个Broker上的信息存放在哪里 4. Producer跟Zookeeper究竟有没有关系？没有关系！！！ //consumers、config、brokers、cont
java OOM内存异常的四种类型及异常与解决方案 ronin47 java OOM 内存异常
　OOM异常的四种类型：　　　　　一：　StackOverflowError ：通常因为递归函数引起（死递归，递归太深）。-Xss 128k 一般够用。　二：　out Of memory: PermGen Space：通常是动态类大多，比如web 服务器自动更新部署时引起。-Xmx
java-实现链表反转-递归和非递归实现 bylijinnan java
20120422更新：对链表中部分节点进行反转操作，这些节点相隔k个： 0->1->2->3->4->5->6->7->8->9 k=2 8->1->6->3->4->5->2->7->0->9 注意1 3 5 7 9 位置是不变的。解法：将链表拆成两部分： a.0-&
Netty源码学习-DelimiterBasedFrameDecoder bylijinnan java netty
看DelimiterBasedFrameDecoder的API，有举例：接收到的ChannelBuffer如下： +--------------+ | ABC\nDEF\r\n | +--------------+ 经过DelimiterBasedFrameDecoder(Delimiters.lineDelimiter())之后，得到： +-----+----
linux的一些命令 -查看cc攻击-网口ip统计等 hotsunshine linux
Linux判断CC攻击命令详解 2011年12月23日 ⁄ 安全 ⁄ 暂无评论查看所有80端口的连接数 netstat -nat|grep -i '80'|wc -l 对连接的IP按连接数量进行排序 netstat -ntu | awk '{print $5}' | cut -d: -f1 | sort | uniq -c | sort -n 查看TCP连接状态 n
Spring获取SessionFactory ctrain sessionFactory
String sql = "select sysdate from dual"; WebApplicationContext wac = ContextLoader.getCurrentWebApplicationContext(); String[] names = wac.getBeanDefinitionNames(); for(int i=0; i&
Hive几种导出数据方式 daizj hive 数据导出
Hive几种导出数据方式 1.拷贝文件如果数据文件恰好是用户需要的格式，那么只需要拷贝文件或文件夹就可以。 hadoop fs –cp source_path target_path 2.导出到本地文件系统 --不能使用insert into local directory来导出数据，会报错 --只能使用
编程之美 dcj3sjt126com 编程 PHP 重构
我个人的 PHP 编程经验中，递归调用常常与静态变量使用。静态变量的含义可以参考 PHP 手册。希望下面的代码，会更有利于对递归以及静态变量的理解 header("Content-type: text/plain"); function static_function () { static $i = 0; if ($i++ < 1
Android保存用户名和密码 dcj3sjt126com android
转自：http://www.2cto.com/kf/201401/272336.html 我们不管在开发一个项目或者使用别人的项目，都有用户登录功能，为了让用户的体验效果更好，我们通常会做一个功能，叫做保存用户，这样做的目地就是为了让用户下一次再使用该程序不会重新输入用户名和密码，这里我使用3种方式来存储用户名和密码 1、通过普通的txt文本存储 2、通过properties属性文件进行存
Oracle 复习笔记之同义词 eksliang Oracle 同义词 Oracle synonym
转载请出自出处：http://eksliang.iteye.com/blog/2098861 1.什么是同义词同义词是现有模式对象的一个别名。概念性的东西，什么是模式呢？创建一个用户，就相应的创建了一个模式。模式是指数据库对象，是对用户所创建的数据对象的总称。模式对象包括表、视图、索引、同义词、序列、过
Ajax案例 gongmeitao Ajax jsp
数据库采用Sql Server2005 项目名称为:Ajax_Demo 1.com.demo.conn包 package com.demo.conn; import java.sql.Connection;import java.sql.DriverManager;import java.sql.SQLException; //获取数据库连接的类public class DBConnec
ASP.NET中Request.RawUrl、Request.Url的区别 hvt .net Web C#asp.net hovertree
如果访问的地址是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree%3C&n=myslider#zonemenu那么Request.Url.ToString() 的值是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree<&
SVG 教程（七）SVG 实例，SVG 参考手册天梯梦 svg
SVG 实例在线实例下面的例子是把SVG代码直接嵌入到HTML代码中。谷歌Chrome，火狐，Internet Explorer9，和Safari都支持。注意：下面的例子将不会在Opera运行，即使Opera支持SVG - 它也不支持SVG在HTML代码中直接使用。 SVG 实例 SVG基本形状一个圆矩形不透明矩形一个矩形不透明2 一个带圆角矩
事务管理 luyulong java spring 编程事务
事物管理 spring事物的好处为不同的事物API提供了一致的编程模型支持声明式事务管理提供比大多数事务API更简单更易于使用的编程式事务管理API 整合spring的各种数据访问抽象 TransactionDefinition 定义了事务策略 int getIsolationLevel()得到当前事务的隔离级别 READ_COMMITTED
基础数据结构和算法十一：Red-black binary search tree sunwinner Algorithm Red-black
The insertion algorithm for 2-3 trees just described is not difficult to understand; now, we will see that it is also not difficult to implement. We will consider a simple representation known
centos同步时间 stunizhengjia linux 集群同步时间
做了集群，时间的同步就显得非常必要了。以下是查到的如何做时间同步。在CentOS 5不再区分客户端和服务器，只要配置了NTP，它就会提供NTP服务。 1)确认已经ntp程序包： # yum install ntp 2)配置时间源（默认就行，不需要修改） # vi /etc/ntp.conf server pool.ntp.o
ITeye 9月技术图书有奖试读获奖名单公布 ITeye管理员 ITeye
ITeye携手博文视点举办的9月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 9月试读活动回顾：http://webmaster.iteye.com/blog/2118112本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《NFC：Arduino、Andro