内核工匠

CMA技术原理分析

前言

本文介绍CMA(Contiguous Memory Allocator)技术原理，从源码分析CMA的初始化和分配流程，同时讲解涉及到的页面迁移、LRU(Least Rencntly Used)缓存、PCP(per cpu page)缓存等知识。

一、CMA概述

CMA是什么？为什么需要CMA？

Linux伙伴系统(Buddy)使用 Page 粒度来管理内存，每个页面大小为4K。伙伴系统按照空闲内存块的长度，把内存挂载到不同长度的 free_list链表中。free_list 的单位是以 (2^order个Page) 来递增的，即 1 page、2 page、… 2^n，通常情况下最大 order 为10 对应的空闲内存大小为 4M bytes。我们使用伙伴系统来申请连续的物理页面最大的页面最大小4M bytes，且系统内存碎片化严重的时候，也很难分配到高order的页面。

嵌入式系统上一些外设设备，如GPU、Camera，HDMI等都需要预留大量连续内存才能正常工作，且很多情况下仅4M连续内存是不足以满足设备的需求的，当然我们也可以使用memblock预留内存的方法来保留更大的连续内存，但这部分内存只能被设备所使用而Buddy使用不到，会导致内存浪费。CMA由此而生，我们即要能分配连续的大的内存空间给设备使用，平时设备不用时又要把内存给系统用，最大化利用内存。

CMA连续内存分配器，主要是为了可用于分配连续的大块内存。系统初始化的时候会通过保留一片物理内存区域，平时设备驱动不用时，内存管理系统将该区域用于分配和管理可移动类型页面，提供给APP或者内核movable页面使用。设备驱动使用时，此时已经分配的页面则进行迁移走，该区域用于连续内存分配。

在后续的章节中，我们主要通过阅读源码的方式，来介绍CMA的初始化、分配和页面迁移流程等。

注：后续文中所贴源码为kernel5.4版本，代码截图会省略次要代码，只保留关键代码。

二、CMA主要数据结构和API

2.1 struct cma

使用struct cma来描述一个CMA区域：

base_pfn：CMA区域物理地址的起始page frame number(页帧号)

count: CMA区域的页面数量

bitmap：描述cma区域页面的分配情况，1表示已分配，0为空闲。

order_per_bit：表示bitmap中一个bit所代表的页面数量（2^order_per_bit）。

2.2 cma_init_reserved_mem

从保留内存块里面获取一块地址为base、大小为size的内存，用来创建和初始化struct cma。

2.3 cma_init_reserved_areas

为了提升内存利用率，该函数用来将这CMA内存标记后归还给 buddy 系统，供 buddy作为可移动页面内存申请。

2.4 cma_alloc

用来从指定的CMA 区域上分配count个连续的页面，按照align对齐。

2.5 cma_release

用来释放已经分配count个连续的页面。

三、CMA主要流程分析

3.1 CMA初始化流程

3.1.1 系统初始化：

系统初始化过程需要先创建CMA区域，创建方法有：dts的reserved memory或者通过命令行参数。这里我们看经常使用的通过dts的reserved memory方式，物理内存的描述放置在dts中配置，比如：

linux,cma 为CMA 区域名称。

compatible须为“shared-dma-pool”。

resuable 表示 cma 内存可被 buddy 系统使用。

size 表示cma区域的大小，单位为字节

alignment指定 CMA 区域的地址对齐大小。

linux,cma-default 属性表示当前 cma 内存将会作为默认的cma pool 用于cma 内存的申请。

在系统启动过程中，内核对上面描述的dtb文件进行解析，从而完成内存信息注册，调用流程为：

setup_arch

arm64_memblock_init

early_init_fdt_scan_reserved_mem

__reserved_mem_init_node

__reserved_mem_init_node会遍历__reservedmem_of_table section中的内容，检查到dts中有compatible匹配（CMA这里为“shared-dma-pool”）就进一步执行对应的initfn。通过RESERVEDMEM_OF_DECLARE定义的都会被链接到__reservedmem_of_table这个section段中，最终会调到使用RESERVEDMEM_OF_DECLARE定义的函数，如下rmem_cma_setup：

3.1.2 rmem_cma_setup

@1 cma_init_reserved_mem 从保留内存块里面获取一块地址为base、大小为size的内存，这里用dtb中解析出来的地址信息来初始化CMA，用来创建和初始化struct cma，代码很简单：

@2 如果dts指定了linux,cma-default，则将dma_contiguous_set_default指向这个CMA区域，使用dma_alloc_contiguous从CMA分配内存时，默认会从该区域分。

执行到此， CMA和其它的保留内存是一样的，都是放在 memblock.reserved 中，这部分保留内存一样没能被 Buddy 系统用到。前面讲过为了提升内存利用率，还需要将CMA这部分内存标记后归还给 Buddy系统，供 Buddy作为可移动页面提供给APP或内核内存申请，由cma_init_reserved_areas来实现。

3.1.3 cma_init_reserved_areas

在内核初始化的后期会调用core_initcall描述的初始化函数：

cma_init_reserved_areas，它直接调用cma_activate_area来实现。cma_activate_area根据cma大小分配bitmap，然后循环调用init_cma_reserved_pageblock来操作CMA区域中所有的页面，看下源码：

@1 CMA区域由一个bitmap来管理各个page的状态，cma_bitmap_maxno计算Bitmap需要多少内存，i变量表示该CMA eara有多少个pageblock（4M）。

@2 遍历该CM区域中的所有的pageblock

@3 确保CMA区域中的所有page都是在一个zone内

@4 最终调用init_cma_reserved_pageblock，以pageblock为单位进行处理，设置migrate type为MIGRATE_CMA，将页面添加到伙伴系统中并更新zone管理的页面总数。如下：

@1 将页面已经设置的reserved标志位清除掉。

@2 将migratetype设置为MIGRATE_CMA

@3 循环调用__free_pages函数，将CMA区域中所有的页面都释放到buddy系统中。

@4 更新伙伴系统管理的内存数量。

执行到此，后续这部分CMA内存就可以为buddy所申请。在伙伴系统中migratetype为movable并且分配flag带CMA，可以从CMA分配内存：

3.2CMA分配流程

在阅读cma分配流程代码前，我们先看下它的函数调用流程，后面将通过源码对流程及各个函数进行分析。

3.2.1 cma_alloc

@1 bitmap的计算，主要是获取bimap最大的可用bit数(bitmap_maxno)，此次分配需要多大的bitmap(bitmap_count)等。

@2 根据上面计算得到的bitmap信息，从bitmap中找到一块空闲的位置。

@3 一些特别情况（在后面会讲到）经常会导致CMA分配失败，当分配返回EBUSY时，需要msleep(100)再retry，默认会retry 5次。

@4 将要分配的页面的对应bitmap先置位为1，表示已经分配了。

@5 使用alloc_config_range来进行内存分配，在后面节详细分析。

@6 分配失败则清除掉bitmap。

3.2.2 内核中的“批处理”：LRU缓存和PCP缓存

在分析alloc_config_range之前，先插讲两个知识点LRU缓存和PCP缓存，在阅读内核源码中，我们会发现内核很喜欢使用一些“批处理”的方法来提升效率，减少一些拿锁开销。

1.LRU 缓存

经典的LRU（Least Rencntly Used）链表算法如下图：

注：详细的LRU算法介绍可以参考内核工匠之前的文章：kswapd介绍

新分配的页面不断地加入ACTIVE LRU链表中，同时ACTIVE LRU链表也不断地取出将页面放入 INACTIVE LRU链表。链表中的锁（pgdat->lru_lock）竞争力度是非常强烈的，如果页面转移是一个一个进行的，那对锁的竞争将会十分严重。

为了改善这种情况，内核加入了一个 PER-CPU的 LRU缓存（用 struct pagevec 表示），页面要加入LRU链表会先放入当前 CPU 的LRU缓存中，直到LRU缓已经满了（一般为15个页面），再获取lru_lock，一次性将这些页面批量放入LRU链表。

2.PCP(PER-CPU PAGES)缓存

由于内存页面属于公共资源，系统中频繁分配释放页面，会因为获得释放锁（zone->lock），CPU之间的同步操作产生大量消耗。同样为了改善这种情况，内核加入了per cpu page 缓存（struct per_cpu_pages表示），每个CPU都从Buddy批发申请少量的页面存放在本地。当系统需要申请内存时，优先从PCP缓存拿，用完了再从buddy批发。释放时也优先放回该PCP缓存，缓存满了再放回buddy系统。

内核之前只支持order=0的PCP，社区最新已经有补丁可以支持order>0的per-cpu。

3.2.3 alloc_config_range函数：

继续看cma_alloc流程的alloc_config_range要干哪些事情：

简而言之，目的就是想从一块“脏的”连续内存块（已经被各种类型的内存使用），得到一块干净的连续内存块，要么是回收掉，要么是迁移走，最后将这块干净的连续内存返回给调用者使用，如下图：

走读下代码：

@1 start_isolate_page_range：将目标内存块的pageblock 的迁移类型由MIGRATE_CMA 变更为 MIGRATE_ISOLATE。因为buddy系统不会从 MIGRATE_ISOLATE 迁移类型的pageblock 分配页面，可以防止在cma分配过程中，这些页面又被人从Buddy分走。

@2 drain_all_pages：回收per-cpu pages，前面已经有介绍过PCP，回收过程需要先将放在PCP缓存页面归还给Buddy。

@3 __alloc_contig_migrate_range：将目标内存块已使用的页面进行迁移处理，迁移过程就是将页面内容复制到其他内存区域，并更新对该页面的引用。

@3.1 lru_cache_disable: 因为在LRU缓存的页面是无法迁移的，需要先将pagevec页面刷到LRU，即将准备添加到LRU链表上，却还未加入LRU的页面(还待在LRU缓存)添加到LRU上，并关闭LRU缓存功能。

@3.2 isolate_migratepages_range 隔离要分配区域已经被Buddy使用的page，存放到cc的链表中，返回的是最后扫描并处理的页框号。这里隔离主要是防止后续迁移过程，page被释放或者被LRU回收路径使用。

@3.3 reclaim_clean_pages_from_list：对于干净的文件页，直接回收即可。

@3.4 migrate_pages：该函数是页面迁移在内核态的主要接口，内核中涉及到页面迁移的功能大都会调到，它把可移动的物理页迁移到一个新分配的页面。

在下一节详细介绍它。

@3.5 lru_cache_enable迁移过程完成，重新使能LRU PAGEVEC

@4.undo_isolate_page_range: @1的逆过程pageblock的迁移类型从 MIGRATE_ISOLATE 恢复为 MIGRATE_CMA。

最后将这些页面返回给调用者。

3.3 CMA释放流程

cma_release释放CMA内存的代码很简单，就是把页面从新free给Buddy和清楚到cma的bitmap分配标识，这里直接贴一下代码：

四、页面迁移

系统要使用CMA区域的内存，内存上的页面必须是可迁移的，这样子当设备要使用CMA时页面才能迁移走，那么哪些页面可以迁移呢？有两种类型：

1. LRU上的页面，LRU链表上的页面为用户进程地址空间映射的页面，如匿名页和文件页，都是从buddy分配器migrate type为movable的pageblock上分来的。

2. 非LRU上，但是是movable页面。非LRU的页面通常是为kernel space分配的page，要实现迁移需要驱动实现page->mapping->a_ops中的相关方法。比如我们常见的zsmalloc内存分配器的页面就支持迁移。

migrate_pages()是页面迁移在内核态的主要接口，内核中涉及到页面迁移的功能大都会调到它。如下图，migrate_pages()无非是要分配一个新的页面，断开旧页面的映射关系，重新简历映射到新的页面，并且要拷贝旧页面的内容到新页面、新页面的struct page属性要和旧页面设置得一样，最后释放旧的页面。下面来阅读下它的源码。

4.1 migrate_pages：

migrate_pages函数和参数：

from: 准备迁移页面的链表

get_new_page：申请新页面函数的指针

putnew_page：释放新页面函数的指针

private：传给get_new_page的参数，CMA这里没有使用到传NULL

mode：迁移模式，CMA的迁移模式会设置为MIGRATE_SYNC。共有下面几种：

reason：迁移原因，记录是什么功能触发了迁移的行为。因为内核许多路径都需要用migrate_pages来迁移比如还有内存规整、热插拔等。CMA传递的为MR_CONTIG_RANG，表示调用alloc_contig_range()分配连续内存。

再看migrate_pages代码，它遍历 from链表，对每个page调用unmap_and_move来实现迁移处理。

4.2 unmap_and_move

unmap_and_move函数的参数同migrate_pages一模一样，它调用get_new_page分配一个新页面，然后使用__unmap_and_move迁移页面到这个新分配的页面中，我们主要看下__unmap_and_move

4.3 __unmap_and_move：

@1尝试获取old page的页面锁PG_locked，若页面已经被其它进程持有了锁，则这里会尝试获取锁失败，对于MIGRATE_ASYNC模式的为异步迁移拿不到锁就直接跳过此页面。CMA迁移模式为MIGRATE_SYNC，这里一定使用lock_page一定要等到锁。

@2处理正在回写的页面，根据迁移模式判断是否等待页面回写完成。MIGRATE_SYNC_LIGHT和MIGRATE_ASYNC不等待，cma迁移模式为MIGRATE_SYNC，会调用wait_on_page_writeback()函数等待页面回写完成。

@3 对于匿名页，为了防止迁移过程anon_vma数据结构被释放了，需要使用page_get_anon_vma增加anon_vma->refcount引用计数。

@4 获取new page的页面锁PG_locked，正常情况都能获取到。

@5 判断这个页面是否属于非LRU页面，

如果页面为非LRU页面，则通过调用move_to_new_page来处理，该函数会回调驱动的miratepage函数来进行页面迁移。

如果是LRU页面，继续执行@6

@6 通过page_mapped()判断是否有用户PTE映射了改页面。如果有则调用try_to_unmap()，通过反向映射机制解除old page所有相关的PTE。

@7 调用move_to_new_page，拷贝old page的内容和struct page属性数据到new page。对于LRU页面 move_to_new_page是通过调用migrate_page做了两件事：复制struct page的属性和页面内容。

@8对页表进行迁移：remove_migration_ptes通过反向映射机制建立new page到进程的映射关系。

@9 迁移完成释放old、new页面的PG_locked，当然对于匿名页我们也要put_anon_vma减少的anon_vma->refcount引用计数

@10 对于非LRU页面，调用put_page，释放old page引用计数(_refcount减1)

对于传统LRU putback_lru_page把newpage添加到LRU链表中。

4.4 move_to_new_page

在@5和@7中，非LRU和LRU页面都是通过move_to_new_page来复制页面，我们来看下他的实现：

对于非LRU页面，该函数会回调驱动的miratepage函数来进行页面迁移

比如在zsmalloc内存分配器会注册迁移回调函数，迁移流程这里会调用到zsmalloc的zs_page_migrate来迁移其申请的页面。zsmalloc内存分配器这里就不展开讲了，有兴趣的读者可以阅读zsmalloc的源码。

2.对于LRU页面，调用migrate_page做了两件事：复制struct page的属性和页面内容。

@7.1 struct page属性的复制：

migrate_page_move_mapping 要先检查page的refcount是否符合预期，符合后之后会复制页面的映射数据，比如page->index、page->mapping以及PG_swapbacked

这里顺带提一下refcount：refcount是struct page中重的引用计数，用来表示内核中引用改页面的次数。当refcount=0，表示该页面为空闲页面或即将要被释放的页面。当refcount的值>0，表示该页面已经被分配了且内核正在使用，暂时不会被释放。

内核中使用get_page、pin_user_pages、get_user_pages等函数来增加_refcount的引用计数，可以防止在进行某些操作过程（比如添加入LRU）页面被其它路径释放了，同时他也会导致refcount不符合预期，也就是在这里不能迁移。

@7.2 page页面内容的复制：

copy_highpage就很简单了，使用kmap映射两个页面，再将旧页面的内存复制到新的页面。

@7.3 migrate_page_states用来复制页面的flag，如PG_dirty，PG_XXX等标志位，也是属于struct page属性的复制。

4.5 小结：

整个迁移过程已经分析完，画出流程图如下，

五、总结

从上面章节分析，我们可以看到CMA的设计都是围绕这两点来做的：

1. 平时设备驱动不用时，CMA内存交给Buddy管理，这是在初始化流程cma_init_reserved_areas()或cma_release()来实现的。

2.设备驱动要使用时，通过cma_alloc来申请物理连续的CMA内存。对于已经在Buddy被APP或者内核movable分配走了的页面，要通过回收或迁移将这块内存清理“干净”，最后将这块物理连续“干净”的内存返回给设备驱动使用。核心实现在alloc_config_range()和migrate_pages()函数。

参考⽂献

1. 本⽂引⽤的和解读的代码都来⾃kernel-5.4https://git.kernel.org/pub/scm/linux/kernel/git/stable/linux.git/tree/?h=v5.4.234

2. 《奔跑吧Linux内核》

3. 宋宝华：论Linux的页迁移（Page Migration）完整版:

https://blog.csdn.net/21cnbao/article/details/108067917

长按关注内核工匠微信

Linux内核黑科技| 技术文章 | 精选教程

具身智能：从理论到实践的跨越
具身智能（EmbodiedAI）的概念起源与发展是一个跨越半个多世纪的学术探索历程，其核心思想在不同学科的交叉碰撞中逐渐成型。以下从理论源头、技术奠基、术语演进三个维度展开解析，揭示这一概念的学术脉络与产业价值：一、理论源头：从图灵的哲学构想到认知科学的具身化转向1.图灵的"感官机器"设想（1950年）在人工智能奠基性论文《计算机器与智能》中，图灵提出了两种智能发展路径：抽象计算路径：如国际象棋等
2023-05-09 论文小天才
2023年社会科学、人文艺术与文化国际会议（SSHAC2023)大会简介2023年社会科学、人文、艺术和文化国际会议（SSHAC2023）将在四川省成都市举行。会议旨在为从事“社会科学”和“人文艺术”研究的专家学者提供一个平台，分享科研成果和前沿技术，了解学术发展趋势，拓宽研究思路，加强学术研究和讨论，促进学术成果产业化合作。大会邀请了来自国内外高校和研究机构的专家、学者、企业家等相关人员。热忱欢
【Python】(三）面试题和Py基础题戏精亿点点菜面试职场和发展 python
1.技术面试题（1）解释Linux中的进程、线程和守护进程的概念，以及如何管理它们？答：进程（Process）：进程是操作系统中资源分配的基本单位，是正在运行的程序的实例。每个进程都有自己的内存空间、文件描述符和执行上下文。管理：①查看进程：使用ps、top、htop等命令查看当前运行的进程。②启动进程：通过命令行或脚本启动新进程。③终止进程：使用kill命令发送信号终止进程，例如kill-9PI
Haproxy七层代理陈小铃子学习运维 linux
一、负载均衡核心概念它本质上是一种反向代理技术，通过硬件或软件设备，将来自客户端的请求智能地分发到后端的多台服务器上。这样做的主要目的是：提高并发处理能力：避免单台服务器过载，提升整体服务的吞吐量。保证高可用性：当某台后端服务器发生故障时，负载均衡器可以将流量自动切换到健康的机器上，确保服务不中断。便于水平扩展：可以根据业务量增长，方便地增加后端服务器数量，实现弹性伸缩，且对用户透明。二、使用负载
开源模型应用落地-qwen模型小试-Qwen2.5-7B-Instruct-玩转ollama（一）开源技术探险家开源模型-实际应用落地 #深度学习自然语言处理语言模型
一、前言在AI大模型百花齐放的时代，很多人都对新兴技术充满了热情，都想尝试一下。然而，实际上要入门AI技术的门槛非常高。除了需要高端设备，还需要面临复杂的部署和安装过程，这让很多人望而却步。在这样的背景下，Ollama的出现为广大开发者和爱好者提供了一条便捷的道路，极大地降低了应用机器学习的门槛。Ollama的优势在于其极致的简化。通过这个平台，用户可以轻松下载、运行和管理各种机器学习模型，而无需
来宾亲子鉴定准确度高吗？来宾上户口亲子鉴定怎么做【附最新办理流程】中正DNA鉴定中心
来宾亲子鉴定准确度高吗？在广西来宾做亲子鉴定准确度非常高，只要选择正规有资质的鉴定机构，出具结果是有保障的，不管是个人隐私还是司法用途，虽然办理流程和报告用途有区别，检测实验流程一样，准确度非常精准。有关来宾上户口亲子鉴定怎么做也是咨询比较多的话题，下面第四点详细解答。一、亲子鉴定的方法亲子鉴定是目前最科学、准确的判断亲子关系的方法，依赖DNA分析技术，对比测序样本DNA后，实验室内精确辨识个体与
简化 Go 开发：使用强大的工具提高生产力 -睡到自然醒~ golang 开发语言后端 qt 笔记 spring
作为Go开发人员，应该都知道维持简洁高效开发工作流程的重要性。为了提高工作效率和代码质量，简化开发流程并自动执行重复性任务至关重要。在本文中，我们将探讨一些强大的工具和技术，它们将简化Go开发过程，助力您的编码之旅。Cookiecutter：使用一致的模板快速启动项目问题描述从头开始创建新的Go项目通常涉及设置标准项目结构和配置基本文件。此过程可能非常耗时且容易出错。Cookiecutter通过允
重磅！TDengine 入选 2024 中国物联网创新产品榜
在全球数字化浪潮和#AI技术驱动下，#物联网产业正经历新一轮革新升级。面对跨境合规、本地化需求多样、技术标准差异等挑战，如何以更高效、更智能的方式推动#物联网数据价值释放，成为行业共同关注的课题。近日，在2025中国物联网企业出海与创新发展峰会暨“2024物联之星”年度榜单颁奖典礼上，#TDengine凭借在#时序数据管理领域的持续突破，荣登“2024年度中国物联网行业创新产品榜”。作为物联网领域
ISO11898 与 SAE J1939 通信协议详细介绍芊言凝语汽车常见功能分享网络
ISO11898与SAEJ1939通信协议的详细介绍：ISO11898通信协议ISO11898是一系列国际标准，专门用于道路车辆的控制器局域网（CAN）的数据链路层和物理层6。它定义了CAN网络的基本操作，规定了网络设计、实施和测试的要求，为CAN网络的设计和实施提供了全面的指导。其核心技术特点包括高可靠性、实时性、支持多主控系统、高效的数据包结构以及灵活性等7。具体如下5：ISO11898-1：
2021-01-12 蹦哒吧小蹦儿
终于开始明白为什么很多人不愿从舒适圈里出来，并不是因为舒适圈有多舒服，只是因为舒适圈外挑战太多了——需要去适应这个社会，需要去学习很多新的东西，需要去接受挑战……本来拍照就可以完成的事，现在需要拍摄视频，而如何拍出好的视频，并且剪辑好看，这真是一门技术呀。需要学习太多东西。为了能更好的拍片，特意买了云台，但是为什么云台不听使唤？令人发愁，于是又开始新一轮的学习。汽车领域的平台开始了讲师课，可以有更
时序数据库主流产品概览时序数据说时序数据库数据库物联网 iotdb 大数据
时序数据库(TimeSeriesDatabase,TSDB)是专为处理时间序列数据优化的数据库系统，近年来随着物联网(IoT)、金融科技、工业互联网等领域的快速发展而备受关注。本文将介绍当前主流的时序数据库产品。一、时序数据库概述时序数据是带时间戳记录的数据点序列，具有以下特点：数据时间属性强数据通常为追加写入近期数据访问频率高于历史数据数据量通常非常庞大，需要高效的压缩技术时序数据库针对这些特点
PD分离技术分析老兵发新帖人工智能
PD分离中的“PD”指的是大语言模型（LLM）推理过程中的两个核心阶段：Prefill（预填充）和Decode（解码）。这两个阶段在计算特性和资源需求上存在显著差异，分离部署可优化整体性能。以下是详细解析：一、PD的具体含义Prefill（预填充阶段）任务：处理用户输入的整个提示（Prompt），为所有Token生成初始的键值缓存（KVCache）和隐藏状态（HiddenStates）。特性：计算
大模型微调技术的详细解析及对比老兵发新帖人工智能大数据
以下是四种主流大模型微调技术的详细解析及对比，结合技术原理、适用场景与性能表现进行说明：1.Full-tuning（全量微调）核心原理：加载预训练模型的所有参数，用特定任务数据（通常为指令-回答对）继续训练，更新全部权重。相当于对模型整体知识结构进行重构。操作流程：加载预训练模型；用任务数据集（如分类文本）和优化目标（如最小化误差）训练；所有参数参与梯度更新。优势：模型充分学习任务特征，效果通常最
大模型训练中的“训练阶段”（如Pre-training、SFT、RLHF等）与“微调技术” 老兵发新帖人工智能深度学习机器学习
大模型训练中的“训练阶段”（如Pre-training、SFT、RLHF等）与“微调技术”（如Full-tuning、Freeze-tuning、LoRA、QLoRA）是两类不同维度的概念，二者共同构成模型优化的完整流程。以下是二者的关系解析及技术对照：一、训练阶段的核心流程与目标预训练（Pre-training）目标：在无标注通用数据（如互联网文本）上训练模型，学习语言、视觉等通用特征。微调技术
合成孔径雷达干涉测量InSAR技术流程（星载/地基系统+DEM重建+DInSAR形变监测+时序分析）等 WangYan2022 遥感合成孔径雷达干涉测量 InSAR 形变信息提取地形三维重建
合成孔径雷达干涉测量（InterferometricSyntheticApertureRadar,InSAR）技术作为一种新兴的主动式微波遥感技术，凭借其可以穿过大气层，全天时、全天候获取监测目标的形变信息等特性，已在地表形变监测、DEM生成、滑坡、火山活动、冰川运动、人工建筑物形变信息提取等多种领域展开了成功应用。通过典型案例，熟练掌握InSAR数据处理（包括InSAR高程测量、DInSAR形变
时序数据库在数据库领域的应用前景数据库管理艺术数据库时序数据库 struts ai
时序数据库在数据库领域的应用前景关键词：时序数据库、时间序列数据、物联网、监控系统、金融分析、大数据、实时分析摘要：本文深入探讨了时序数据库在现代数据管理中的关键作用和应用前景。我们将从时序数据的基本特性出发，分析时序数据库的核心架构和设计原理，比较主流时序数据库产品的技术特点，并通过实际案例展示其在物联网、金融科技、运维监控等领域的应用价值。文章还将提供时序数据库选型指南，探讨未来技术发展趋势，
快手开源 Kwaipilot-AutoThink 思考模型，有效解决过度思考问题
新闻在专为防止数据泄露设计的挑战性基准测试LiveCodeBenchPro中，Kwaipilot-AutoThink位列所有开源模型榜首，甚至超越了Seed和o3-mini等强大的专有系统。介绍KAT(Kwaipilot-AutoThink)是一个开源大语言模型，通过学习何时生成显式思维链及何时直接作答，有效缓解过度思考问题。它的发展遵循简洁的两阶段训练流程：阶段核心思想关键技术成果1.预训练阶段
基于STM32的智能窗帘控制系统设计与实现
基于STM32的智能窗帘控制系统设计与实现引言随着物联网（IoT）技术的发展，智能家居逐渐融入日常生活。其中，智能窗帘控制系统是智能家居中较为基础和常见的应用，通过远程或自动控制窗帘的开闭，不仅提高了用户的生活便利性，还能帮助节约能源。例如，系统可以根据光线强度自动开关窗帘，从而优化室内光照。本文将详细讲解如何基于STM32设计并实现一个智能窗帘控制系统，从硬件设计到软件实现，全面覆盖整个开发过程
一文弄懂开源大型语言模型 (LLM) 应用程序开发平台--Dify Llama-Turbo AI大模型程序员 LLM 人工智能大模型 dify
Dify简介Dify是一个开源大型语言模型(LLM)应用程序开发平台，旨在弥合AI应用程序原型设计与生产部署之间的差距。本文为希望了解或扩展该平台的开发者和技术用户提供了Dify架构、组件和功能的技术概述。平台概述Dify提供端到端解决方案，通过可视化工具和API的组合，构建基于LLM的应用程序。其架构旨在支持AI应用程序开发的整个生命周期，包括模型集成、提示、知识管理、工作流编排和部署。主要特点
不正规不靠谱：假摩根士丹利内部群推荐绿色低碳减排平台骗局揭露!送一万体验资金做慈善全是假的! 易星辰分享普法
关于曝光网上摩根士丹利何晓斌宝丰能源节能减排在炒股群推荐智慧农业中粮仓平台骗局的文章，其内容主要揭示了近期频发的一种投资诈骗手段。以下是该骗局的主要特点和步骤：为什么明明跟老师对过视频，确认是本人，怎么还会被骗了?你有没有想过一个名人大咖怎么会有时间给你们一对一视频，其次我来给大家揭露一下，这个套路AI换脸骗局是一种利用人工智能技术，通过替换视频中的人脸来伪造身份或进行诈骗的行为。你的账户“余额”
什么是arm-arm体系架构版本(指令集版本)-arm内核版本众里寻佳千百度1995 嵌入式-linux
1、什么是arm？arm公司：是英国一家电子公司的名字，该公司成立于1990年11月，是苹果电脑，Acorn电脑集团和VLSITechnology的合资企业。Acorn曾在1985年推出世界上首个商用单芯片RISC（ReducedInstructionSetComputing）处理器。ARM主要出售芯片设计技术的授权。ARM处理器：英国Acorn有限公司设计的低功耗成本的第一款RISC微处理器。全
Python成第四个支持CUDA的编程语言
Python成第四个支持CUDA的编程语言3月19日NVIDIA的GTC2013图形技术大会将开幕，在此之前会有很多宣传造势内容，其中最重大也是最主要的就是NVIDIA老总黄仁勋的开幕词了，其他合作伙伴也会发布各自的演讲。ContinuumAnalytics联合NVIDIA宣布将会引入新的PythonCUDA编译器——NumbaPro，Python也成为继C、C++以及Fortan之后的第四个支持
每日早晚都读书1000/73-阅读“历史典籍”｜《罗马人的故事2-汉尼拔战记》盐野七生箸学习历史视角智慧使自己拥有“多元思维” 李廿
罗马人，智力不如希腊人，体力不如高卢人，技术不如埃特鲁利亚人，经济不如迦太基人，但为何却能一一打败对手，建立并维持庞大的罗马帝国？在这平庸年代，人人渴望英雄。日本女作家盐野七生，决然出走日本，远赴罗马，寻找英雄。定居罗马50多年，15年写就15册巨著《罗马人的故事》，还原一个意大利半岛的小国成为世界帝国，持续1300年的辉煌历程，再现一个英雄辈出的时代……《罗马人的故事2-汉尼拔战记》以女作家自己
消息队列MQ 不辉放弃 kafka 大数据开发数据库
消息队列（MessageQueue，简称MQ）是一种基于异步通信模式的中间件技术，核心作用是在分布式系统中实现消息的存储、传递和缓冲，解决不同组件/服务之间的通信耦合问题，提升系统的灵活性、可靠性和可扩展性。一、核心概念与本质消息队列的本质是一个“存储消息的容器”，但它并非简单的存储工具，而是通过一套规则（如消息路由、持久化、确认机制等）实现“生产者”和“消费者”的解耦通信：生产者（Produce
开源的大语言模型（LLM）应用开发平台Dify
概述Dify是一个开源的大语言模型（LLM）应用开发平台，结合了后端即服务（Backend-as-a-Service）和LLMOps的理念，旨在帮助开发者快速构建生产级的生成式AI应用。它通过直观的界面、强大的功能和灵活的部署方式，降低了AI应用开发的门槛，即使是非技术人员也能参与应用的定义和数据运营。本文档将指导您了解Dify的核心功能、安装部署、应用创建及常见使用场景。Dify简介Dify（D
如何区分Bug是前端问题还是后端问题？海姐软件测试缺陷管理 bug 前端
在软件测试中，精准定位Bug的归属（前端or后端）是高效协作的关键。以下是系统化的排查方法，结合技术细节和实战技巧：1.核心判断逻辑「数据vs展示」二分法：后端问题：数据本身错误（API返回错误数据/逻辑错误/数据库问题）前端问题：数据正确但展示异常（UI渲染错误/交互逻辑问题）2.四步定位法第一步：抓包分析（必做）工具：ChromeDevTools>Network/Fiddler/Charles
2025乐彩V8影视系统技术解析：双端原生架构与双H5免签封装实战双端原生+双H5免签封装+TV级性能优化，一套代码打通全终端生态 CH资源网ch-h点cn（测评师）架构性能优化
1.双端原生实现方案Android端：基于Kotlin+JetpackCompose架构，深度优化ExoPlayer内核，支持4KHDR硬解与DRM加密流iOS端：Swift+SwiftUI构建，集成AVFoundation定制播放器，实现画中画与杜比全景声支持TV专属优化：针对AndroidTV和AppleTV分别实现焦点引擎和遥控器键位映射452.双H5站免签封装方案系统创新性地实现双H5站点
第六届研究所操盘群老姜（姜新宁）算力3.0云端算个靠谱吗？别再被洗脑了赶紧止损！昌龙律法
这年头，你不理财，财不理你。理财方式有很多，不能投资的只有一种：骗人的。近期，我们接到多起网络投资理财被骗的案情，而每一宗案情都有相似之处，那就是：事主都是加入了某个理财投资微信群，然后通过群里的“投资理财专家”的“指点”，到某个投资平台进行投资理财，随后再用技术手段让所有的投资的钱有去无回。商小信第六届研究所操盘群老姜（姜新宁）算力3.0，第六届【研究所】圆梦反击战（分仓方案）数字经济算力大赛骗
bug复现不了开发人员不解决，遇到疑难bug该如何排查，这两个方法你需要知道。雨滴测试功能测试 bug 功能测试
在测试的时候，有时候经常会遇到一些难以复现的bug，比如有的线上bug在少部分用户哪里出现，但是自己复现却是没有问题的；亦或者是在测试环境上发现了一个偶现bug，然后再复现就很难以找到了；亦或者是出现一个技术问题，像环境部署，明明部署的是没有问题，按照正确的步骤来的，但是就是无法访问系统。那么，像这类问题它都属于恢复性问题，就是正常情况下，它都是没有问题的，但是在操作的过程中产生了某些微小变化导致
基于深度学习的语音识别：从音频信号到文本转录 Blossom.118 机器学习与人工智能深度学习语音识别音视频人工智能机器学习线性代数计算机视觉
前言语音识别（AutomaticSpeechRecognition,ASR）是人工智能领域中一个极具挑战性和应用前景的研究方向。它通过将语音信号转换为文本，为人们提供了更加自然和便捷的人机交互方式。近年来，深度学习技术在语音识别领域取得了显著进展，极大地提高了语音识别的准确率和鲁棒性。本文将详细介绍如何使用深度学习技术构建一个语音识别系统，从音频信号的预处理到模型的训练与部署。一、语音识别的基本概
rust的指针作为函数返回值是直接传递，还是先销毁后创建？ wudixiaotie 返回值
这是我自己想到的问题，结果去知呼提问，还没等别人回答，我自己就想到方法实验了。。 fn main() { let mut a = 34; println!("a's addr:{:p}", &a); let p = &mut a; println!("p's addr:{:p}", &a
java编程思想 -- 数据的初始化百合不是茶 java 数据的初始化
1.使用构造器确保数据初始化 /* *在ReckInitDemo类中创建Reck的对象 */ public class ReckInitDemo { public static void main(String[] args) { //创建Reck对象 new Reck(); } }
[航天与宇宙]为什么发射和回收航天器有档期 comsci
地球的大气层中有一个时空屏蔽层,这个层次会不定时的出现,如果该时空屏蔽层出现,那么将导致外层空间进入的任何物体被摧毁,而从地面发射到太空的飞船也将被摧毁... 所以,航天发射和飞船回收都需要等待这个时空屏蔽层消失之后,再进行 &
linux下批量替换文件内容商人shang linux 替换
1、网络上现成的资料　　格式: sed -i "s/查找字段/替换字段/g" `grep 查找字段 -rl 路径` 　　linux sed 批量替换多个文件中的字符串　　sed -i "s/oldstring/newstring/g" `grep oldstring -rl yourdir` 　　例如：替换/home下所有文件中的www.admi
网页在线天气预报 oloz 天气预报
网页在线调用天气预报 <%@ page language="java" contentType="text/html; charset=utf-8" pageEncoding="utf-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transit
SpringMVC和Struts2比较杨白白 springMVC
1. 入口 spring mvc的入口是servlet，而struts2是filter（这里要指出，filter和servlet是不同的。以前认为filter是servlet的一种特殊），这样就导致了二者的机制不同，这里就牵涉到servlet和filter的区别了。参见：http://blog.csdn.net/zs15932616453/article/details/8832343 2
refuse copy, lazy girl! 小桔子 copy
妹妹坐船头啊啊啊啊！都打算一点点琢磨呢。文字编辑也写了基本功能了。。今天查资料，结果查到了人家写得完完整整的。我清楚的认识到： 1.那是我自己觉得写不出的高度 2.如果直接拿来用，很快就能解决问题 3.然后就是抄咩~~ 4.肿么可以这样子，都不想写了今儿个，留着作参考吧！拒绝大抄特抄，慢慢一点点写！
apache与php整合 aichenglong php apache web
一 apache web服务器 1 apeche web服务器的安装 1)下载Apache web服务器 2)配置域名(如果需要使用要在DNS上注册) 3)测试安装访问http://localhost/验证是否安装成功 2 apache管理 1)service.msc进行图形化管理 2)命令管理，配
Maven常用内置变量 AILIKES maven
Built-in properties ${basedir} represents the directory containing pom.xml ${version} equivalent to ${project.version} (deprecated: ${pom.version}) Pom/Project properties Al
java的类和对象百合不是茶 JAVA面向对象类对象
java中的类： java是面向对象的语言，解决问题的核心就是将问题看成是一个类，使用类来解决 java使用 class 类名来创建类，在Java中类名要求和构造方法，Java的文件名是一样的创建一个A类： class A{ } java中的类：将某两个事物有联系的属性包装在一个类中，再通
JS控制页面输入框为只读 bijian1013 JavaScript
在WEB应用开发当中，增、删除、改、查功能必不可少，为了减少以后维护的工作量，我们一般都只做一份页面，通过传入的参数控制其是新增、修改或者查看。而修改时需将待修改的信息从后台取到并显示出来，实际上就是查看的过程，唯一的区别是修改时，页面上所有的信息能修改，而查看页面上的信息不能修改。因此完全可以将其合并，但通过前端JS将查看页面的所有信息控制为只读，在信息量非常大时，就比较麻烦。
AngularJS与服务器交互 bijian1013 JavaScript AngularJS $http
对于AJAX应用（使用XMLHttpRequests）来说，向服务器发起请求的传统方式是：获取一个XMLHttpRequest对象的引用、发起请求、读取响应、检查状态码，最后处理服务端的响应。整个过程示例如下： var xmlhttp = new XMLHttpRequest(); xmlhttp.onreadystatechange
[Maven学习笔记八]Maven常用插件应用 bit1129 maven
常用插件及其用法位于：http://maven.apache.org/plugins/ 1. Jetty server plugin 2. Dependency copy plugin 3. Surefire Test plugin 4. Uber jar plugin 1. Jetty Pl
【Hive六】Hive用户自定义函数(UDF) bit1129 自定义函数
1. 什么是Hive UDF Hive是基于Hadoop中的MapReduce，提供HQL查询的数据仓库。Hive是一个很开放的系统，很多内容都支持用户定制，包括：文件格式：Text File，Sequence File 内存中的数据格式： Java Integer/String, Hadoop IntWritable/Text 用户提供的 map/reduce 脚本：不管什么
杀掉nginx进程后丢失nginx.pid，如何重新启动nginx ronin47 nginx 重启 pid丢失
nginx进程被意外关闭，使用nginx -s reload重启时报如下错误：nginx: [error] open() “/var/run/nginx.pid” failed (2: No such file or directory)这是因为nginx进程被杀死后pid丢失了，下一次再开启nginx -s reload时无法启动解决办法：nginx -s reload 只是用来告诉运行中的ng
UI设计中我们为什么需要设计动效 brotherlamp UI ui教程 ui视频 ui资料 ui自学
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用你的产品。
Spring中JdbcDaoSupport的DataSource注入问题 bylijinnan java spring
参考以下两篇文章： http://www.mkyong.com/spring/spring-jdbctemplate-jdbcdaosupport-examples/ http://stackoverflow.com/questions/4762229/spring-ldap-invoking-setter-methods-in-beans-configuration Sprin
数据库连接池的工作原理 chicony 数据库连接池
随着信息技术的高速发展与广泛应用，数据库技术在信息技术领域中的位置越来越重要，尤其是网络应用和电子商务的迅速发展，都需要数据库技术支持动态Web站点的运行，而传统的开发模式是：首先在主程序（如Servlet、Beans）中建立数据库连接；然后进行SQL操作，对数据库中的对象进行查询、修改和删除等操作；最后断开数据库连接。使用这种开发模式，对
java 关键字 CrazyMizzz java
关键字是事先定义的，有特别意义的标识符，有时又叫保留字。对于保留字，用户只能按照系统规定的方式使用，不能自行定义。 Java中的关键字按功能主要可以分为以下几类：（1）访问修饰符 public,private,protected p
Hive中的排序语法 daizj 排序 hive order by DISTRIBUTE BY sort by
Hive中的排序语法 2014.06.22 ORDER BY hive中的ORDER BY语句和关系数据库中的sql语法相似。他会对查询结果做全局排序，这意味着所有的数据会传送到一个Reduce任务上，这样会导致在大数量的情况下，花费大量时间。与数据库中 ORDER BY 的区别在于在hive.mapred.mode = strict模式下，必须指定 limit 否则执行会报错。
单态设计模式 dcj3sjt126com 设计模式
单例模式（Singleton）用于为一个类生成一个唯一的对象。最常用的地方是数据库连接。使用单例模式生成一个对象后，该对象可以被其它众多对象所使用。 <?phpclass Example{ // 保存类实例在此属性中 private static&
svn locked dcj3sjt126com Lock
post-commit hook failed (exit code 1) with output: svn: E155004: Working copy 'D:\xx\xxx' locked svn: E200031: sqlite: attempt to write a readonly database svn: E200031: sqlite: attempt to write a
ARM寄存器学习 e200702084 数据结构 C++c C#F#
无论是学习哪一种处理器，首先需要明确的就是这种处理器的寄存器以及工作模式。 ARM有37个寄存器，其中31个通用寄存器，6个状态寄存器。 1、不分组寄存器（R0-R7）不分组也就是说说，在所有的处理器模式下指的都时同一物理寄存器。在异常中断造成处理器模式切换时，由于不同的处理器模式使用一个名字相同的物理寄存器，就是
常用编码资料 gengzg 编码
List<UserInfo> list=GetUserS.GetUserList(11); String json=JSON.toJSONString(list); HashMap<Object,Object> hs=new HashMap<Object, Object>(); for(int i=0;i<10;i++) {
进程 vs. 线程 hongtoushizi 线程 linux 进程
我们介绍了多进程和多线程，这是实现多任务最常用的两种方式。现在，我们来讨论一下这两种方式的优缺点。首先，要实现多任务，通常我们会设计Master-Worker模式，Master负责分配任务，Worker负责执行任务，因此，多任务环境下，通常是一个Master，多个Worker。如果用多进程实现Master-Worker，主进程就是Master，其他进程就是Worker。如果用多线程实现
Linux定时Job：crontab -e 与 /etc/crontab 的区别 Josh_Persistence linux crontab
一、linux中的crotab中的指定的时间只有5个部分：* * * * * 分别表示：分钟，小时，日，月，星期，具体说来：第一段代表分钟 0—59 第二段代表小时 0—23 第三段代表日期 1—31 第四段代表月份 1—12 第五段代表星期几，0代表星期日 0—6 如： */1 * * * * 每分钟执行一次。 *
KMP算法详解 hm4123660 数据结构 C++算法字符串 KMP
字符串模式匹配我们相信大家都有遇过，然而我们也习惯用简单匹配法（即Brute-Force算法)，其基本思路就是一个个逐一对比下去，这也是我们大家熟知的方法，然而这种算法的效率并不高，但利于理解。假设主串s="ababcabcacbab",模式串为t="
枚举类型的单例模式 zhb8015 单例模式
E.编写一个包含单个元素的枚举类型[极推荐]。代码如下： public enum MaYun {himself; //定义一个枚举的元素，就代表MaYun的一个实例private String anotherField;MaYun() {//MaYun诞生要做的事情//这个方法也可以去掉。将构造时候需要做的事情放在instance赋值的时候：/** himself = MaYun() {*
Kafka+Storm+HDFS ssydxa219 storm
cd /myhome/usr/stormbin/storm nimbus &bin/storm supervisor &bin/storm ui &Kafka+Storm+HDFS整合实践kafka_2.9.2-0.8.1.1.tgzapache-storm-0.9.2-incubating.tar.gzKafka安装配置我们使用3台机器搭建Kafk
Java获取本地服务器的IP 中华好儿孙 java Web 获取服务器ip地址
System.out.println("getRequestURL:"+request.getRequestURL()); System.out.println("getLocalAddr:"+request.getLocalAddr()); System.out.println("getLocalPort:&quo

CMA技术原理分析

你可能感兴趣的:(CMA技术原理分析)