妙BOOK言

SDM: Sharing-enabled Disaggregated Memory System with Cache Coherent Compute Express Link——论文阅读

PACT 2023 Paper CXL论文阅读汇总

问题

分离式内存作为一种有望解决数据中心中内存容量扩展和更好利用内存资源的方案，已经引起了极大的关注。然而，可以同时实现高性能和用户透明度的分离式内存系统仍然不可用。尽管一些现代互连技术现在具有硬件一致性协议，可以潜在地实现在多个计算节点之间以用户透明的方式共享数据，但是将这些技术朴素地应用于分离式内存系统会导致非常大的性能开销。

为了应对内存墙的三个层次：设备层（HBM[44]和HMC[42]）、模块层（NVM）、系统层（分布式存储器系统）

背景

分离式内存系统

分离式内存系统使用场景。分离式内存系统可以用作本地主内存的交换空间[5]、[21]、[36]、[37]，也可以用作扩展的主内存池[2]、[10]、[17]、[22]、[32]、[34]、[40]、[46]。我们假设分离式内存系统是为了主内存池的扩展而构建的，因为这对性能和系统可靠性很有吸引力。

分离式内存系统的概览。如图1所示，分为三个部分：内存节点、背板和计算节点。内存节点由几个内存模块组成，具有简单的硬件逻辑，将事务请求转换为模块兼容的命令，反之亦然。从内存节点中去除处理器和存储能够降低内存节点的成本，从而实现更大的内存容量。背板将一个节点的请求或响应重定向到另一个节点。计算节点由基本硬件组件组成，运行用户应用程序。

分离式内存系统通常需要进行第二级页表遍历，将节点级地址翻译为系统级地址。如图1所示，内存管理单元（MMU）首先将虚拟地址翻译为本地物理地址，成为内存请求地址。一旦发生最后一级缓存（LLC）缺失，系统代理根据请求地址将LLC的内存请求多路复用到本地内存或背板。在背板中，第二级页表遍历将本地物理地址翻译为全局物理地址。然后，在检查访问权限标志后访问内存节点数据。

CXL

CXL中计算节点的一致性状态存储在专用的一致性目录中，该目录是特定于实现的。目录区域由CXL主代理和一致性桥（COHB）组件访问，两者都位于系统代理中。CXL不考虑瞬态一致性状态，因为在CXL中，组件一次只允许对给定缓存行地址发出一个嗅探，该组件必须等待收到嗅探响应后，才能发出对该地址的下一个嗅探。

类型1设备适用于完全一致的外部缓存设备或加速器。其只在CXL.cache通道上传输与缓存一致性相关的消息，不包含CXL.mem，因此，设备附加内存对该设备私有。在实际应用中，一些专用领域的加速器（例如NPU），主动使用主机数据的加速器可以制造成类型1设备。

类型2适用于设备附加内存完全一致而且对主机可见。主机可见内存被称为主机管理的设备内存，主机管理的设备内存通过CXL.mem访问，通过CXL.cache通道上的一致性状态和嗅探的交互消息进行访问。类型2设备在主机方面充当直接的数据提供者，例如，通过类型2设备可以避免在GPU和主机之间进行高成本的复制操作（例如，cudaMalloc）。

类型3设备用于扩展内存池。类型3设备仅包括主机管理的设备内存，通过CXL.mem通道访问。类型3具有类似于逻辑卷的特性，即多逻辑设备，它将内存设备分成16个隔离的逻辑区域，跨越不同进程的安全和隔离区域。最近，内存制造商已经宣布了基于类型3的内存扩展产品[45]、[47]。

本文使用的CXL消息。如表I描所示，CXL定义的消息比表中的更多，我们只解释基线和提出的控制流所需的消息类型。第三列指示了每个消息类型的来源。表中提到的一致性状态是M（修改）、E（独占）、S（共享）和I（无效），与MESI协议相同。RdOwn和RdAny都是来自内存的读请求消息。对于Cmp-*和GO-*，“*”可以用一致性状态（即MESI）来重载，以指定缓存行的一致性状态。例如，在设备向主机发出RdOwn或RdAny后，设备将收到附带一致性状态的响应，这将是该设备中的一致性状态。根据CXL规范，不允许RdOwn接收GO-S（共享）的响应，而RdAny允许接收GO-I、GO-S、GO-E和GO-M。

CXL 3.0中引入了管理多个计算节点一致性的反向失效通道（即从设备到主机的BISnp和从主机到设备的BIRsp）。例如，与图2（b）中的INV-CF操作相比，计算节点H-2请求另一个计算节点H-1缓存的高速缓存行。在收到来自H-2的MemRd后，内存节点发出BISnpInv使H-1中的缓存数据失效。如果缓存的数据是脏的，H-1将数据连同MemWr消息转发到内存节点；如果数据是干净的，则直接向内存节点回复BIRspI消息。最后，内存节点向H-2发送Cmp-E和数据。

挑战和现有方法局限性

现有的分离式内存系统面临的关键问题：远程访问开销和用户透明度。

远程访问开销高

与访问本地内存相比，访问远程内存节点会产生较高的延迟，同时需要二级地址转换。

在使用传统的基于网络的事务（例如TCP）时，涉及多个软件层次的数据缓冲区复制 [23]。尽管已经提出了基于RDMA的分离式内存系统，以在最小化数据复制和涉及的软件层次的同时直接访问远程内存区域 [5], [10], [17], [21], [34], [46], [50], [53]，但使用RDMA仍需要在软件级别进行基于队列对的事务的附加复制操作 [20]。
二级地址转换也是导致高远程访问开销的一个关键因素。在分离式内存系统中，每个计算节点运行自己的操作系统，需要通过二级地址转换将来自每个计算节点的节点级物理地址转换为系统/全局物理地址。这种从节点到系统的地址映射需要存储在内存节点中，导致更多的远程访问。
通过缓存可以优化地址转换。第一个方案地址翻译缓存，以减少由两级地址翻译引起的远程访问次数（见背景-分离式内存系统）。第二个方案是数据缓存机制，在计算节点中缓存内存节点的数据。图4比较了两种情况的延迟图，我们假设本地物理地址已经被转换为全局物理地址，有一个主机节点（H），背板（B）和一个内存节点（MN）。图4（a）显示了仅使用地址翻译缓存的控制流，内存请求（例如，MemWr）发送到MN，因为H不缓存数据；B从MN请求权限标志以检查访问权限；如果B确认没有权限问题，将内存请求转发到MN。图4（b）显示了组合方案的时序图。H已经在其缓存中具有所请求的数据，但是内存请求仍需要检查数据访问权限。H向MN请求权限标志以检查访问权限；B将接收到的标志转发给H。性能提升就是两个请求回复之间的时间差。

缺乏用户透明度

实现用户应用对内存节点的透明访问对分离式内存系统至关重要。然而，基于RDMA的分离式内存系统要求用户通过修改其应用程序，使用RDMA动词的API（例如libibverbs [30]）来传输数据到/从远程内存区域。

多个计算节点之间的数据一致性

现有方法很少考虑多节点间数据一致性，或使用软件同步[2]、[22]、[40]在不同节点之间提供数据共享。但软件同步将产生显著的性能开销，如对传统多核和分布式系统的研究[12]，[19]所示。
例如使用基于失效的控制流（INV-CF）执行MESI一致性协议时，会产生额外的事务。如图2中阴影部分所示，fetch-clean会产生两个额外的事务，而fetch-dirty需要四个事务才能使数据无效。

将CXL技术应用于分离式内存系统带来的新挑战

CXL是一种缓存一致的事务级协议，使用自己的内存语法抽象I/O路径，与底层设备介质无关 [29]。借助其内存语法，CXL可以在对操作系统进行最小修改的情况下透明地扩展主内存池。

CXL 2.0仅支持单个计算节点（即主机）与多个CXL设备之间的一致性。尽管CXL 3.0支持多个计算节点之间的数据一致性，但计算节点需要在同一时间独占缓存数据，通过使其他计算节点中相同数据无效，从而影响展现出高数据局部性的应用程序的性能。
即使使用CXL数据共享，与其他缓存方案协调一致仍然具有挑战性，因为现代分离式内存系统采用地址转换缓存方案，该方案将访问权限检查与地址转换解耦 [32]，检查访问权限不可避免地需要远程访问。访问数据（无论是否缓存）必须在进行权限检查之后进行，从而由于串行化导致系统性能不佳。

分离式内存的相关工作

本文工作

我们提出了支持共享的分离式内存系统，即SDM，它允许多个计算节点在无需昂贵的无效操作的情况下访问共享数据。

SDM采用支持共享的控制流（SHA-CF），该控制流对请求主机之外的所有节点进行抽象，其中内存节点利用CXL.cache和CXL.mem消息类型，在不违反其自己的协议的情况下模拟对其他主机的嗅探事务。
内存节点的资源管理基元也是至关重要的，如分配、释放和地址转换。这些基元不应干扰CXL的正常读写事务通道（即CXL.mem和CXL.cache）。我们利用CXL.io通道进行设备控制，以管理内存节点资源。
提出了一种具有推测性访问的方案，以结合地址转换缓存和数据缓存。关键思想是通过推测性地重叠数据访问和权限检查，以增加请求处理吞吐量，一旦检测到违规，会断开会话连接。

基于一个内部仿真框架进行了设计评估，该框架使用详细的分析模型模拟了具有缓存一致性的多节点解聚内存系统。结果显示，SDM在计算密集型和内存密集型工作负载上分别比类似于采用CXL 3.0的优化基准系统提高了5.77倍和2.65倍。

SDM 架构

图5展示了SDM的体系结构概述。在高层次上，SDM由计算节点、背板和存储节点组成。

在计算节点中，系统代理通过在主机桥的I/O路径中引入CXL相关功能（包括一致性桥接器（COHB）和主机代理）而得到增强。主机代理充当计算节点与背板之间的接口。一旦主机代理接收到CXL消息（例如，RdOwn），它将消息重定向到CXL规范中定义的COHB。COHB读取并更新存储在本地内存中的一致性目录。一致性目录保存属于该计算节点的每个缓存行的一致性状态，一致性目录支持连续分配，它可以使用代数计算进行索引。计算目录索引的延迟相对于其他延迟（例如，互连）是可以忽略的。然而，在我们的评估中，没有考虑在缓存目录中查找，因此实际实现可能对一致性管理具有更长的路径。与中断处理器不同，CXL功能利用直接内存访问（DMA）引擎，以便直接与本地内存进行通信。最后，主机代理生成CXL消息，以根据COHB引用的状态响应传入的请求消息。

在背板上，CXL交换机将来自不同计算节点的CXL请求分发给内存节点。在仲裁请求之前，CXL交换机与地址转换单元（ATU i）进行通信，ATU i执行二级页表遍历，将本地物理地址转换为全局物理地址。

在内存节点中，还包括两个额外的特性：CXL解析器，从传入的CXL请求中获取源和请求类型信息；设备一致性代理（DCOH），该代理在CXL规范中定义，保存内存节点的一致性状态，并根据从CXL解析器提取的信息生成CXL.cache消息。内存节点还需要一个目录，即由DCOH逻辑管理的偏置表，该偏置表保存内存节点缓存其他节点的私有数据的缓存一致性状态。

在SDM中，必须详细考虑几个设计方面。第一，需要一个控制流来促进多主机分离式内存系统的数据共享，而不是采用高开销的控制流（即INV-CF），而且，该控制流不应与CXL规范相冲突。第二，必须有一组远程内存管理机制，用于页面分配、释放和页表遍历。这些管理机制不应干扰正常的内存事务通道（即CXL.mem和CXL.cache），以确保更高的系统性能。我们观察到这些机制可以通过巧妙地利用一个特殊的CXL通道来实现，而无需引入额外的旁路协议。第三，提出了一种预测的方法，将地址转换缓存方案和数据缓存方案和谐地结合起来。

SHA-CF：启用共享的控制流

【就是基于嗅探的MESI协议，利用CXL反向失效稍微优化一点】

我们提出了一致性控制流SHA-CF，该控制流在SDM中实现了多个计算节点之间的数据共享。SHA-CF的关键思想是将所有节点（除了请求节点）抽象为一个内存设备，并利用CXL.cache消息模拟在多个主机上的嗅探。图6显示了SHA-CF关键原语的三种场景：获取-独占（fetch-exclusive）、获取-共享（fetch-share）、修改之前使无效（invalidate-before-modify）。此图中的所有场景都假定有两个主机（H-1和H-2）和一个内存节点（MN），SHA-CF可以推广为支持多个计算和内存节点。我们的SHA-CF严格遵守CXL规范中定义的事务协议（即请求和响应消息是成对的），没有任何重新定义。

获取-独占原语，图6(a)，定义了当主机（H-1）获取其他主机未共享的数据时的控制流。H-1发送MemRd消息以从内存节点读取数据DATA-X。然后，内存节点广播RdOwn以检查其他主机中是否存在DATA-X。一旦内存节点从H-2接收到带有无效行的GO-I，内存节点发送Cmp-E和DATA-X，让H-1将一致性状态更新为E状态（独占）。

获取-共享原语，图6(b)，假设H-1最初持有DATA-X。H-2向内存节点发出对DATA-X的读取请求。然后，内存节点广播类似于获取-独占原语的RdAny。与获取-独占的情况不同，如果数据不是脏的，H-1会响应DATA-X并附带GO-S。如果DATA-X是脏的，将返回GO-M，以便将最新数据转发给H-2。如果内存节点收到GO-M和DATA-X，内存节点需要写回DATA-X。

修改之前使无效原语，图6(c)，两个主机共享DATA-X，DATA-X将被H-1修改。在更新DATA-X之前，H-1向内存节点发出MemInv以通知反向失效。内存节点广播CLFlush以使DATA-X失效。在失效其缓存行后，H-2向内存节点响应GO-I。在H-1收到作为MemInv响应的Cmp后，H-1修改DATA-X。使用CXL 3.0中的反向失效消息，可以用更少的事务来实现修改之前使无效的原语。

远程内存管理

【基于CXL.io执行内存管理，不影响CXL.cache和CXL.mem，其他没啥特别的】

我们解释了SDM中管理页面分配的机制。为了防止干扰正常内存事务，SDM利用了厂商定义的消息字段。提出的机制包含三个远程页面管理原语：ralloc、rfree、rwalk。图7展示了这三个原语的过程，示例中显示了一个主机（H），背板（B）和一个内存节点（MN）。

ralloc原语用于在内存节点中新分配一个物理页面。图7(a)，计算节点发送一个ralloc请求到背板，因为主机的内存管理单元触发了初始页面错误（例如，在内核中修改的do_page_fault()）。背板中的地址转换单元（ATU）分配一个页面并更新相应的权限标志，然后向计算节点发送完成信号Cmp。

rfree用于释放内存节点中已分配的页面。图7(b)，计算节点触发了远程页面的释放过程（例如，在内核中修改的deallocuvm()），并发送rfree消息。地址转换单元取消分配请求的页面，并取消相应权限标志的掩码。

rwalk用于将本地物理地址转换为全局物理地址。图7(c)，一个内存请求（例如，MemRd）发送到背板。背板通过反复访问内存节点中的页表，进行第二级页表遍历。在获取了权限标志之后，原始请求被重定向到内存节点。由于假定了地址翻译缓存，转换后的信息也可以传递到主机，进行地址翻译缓存。因此，提出的机制需要修改主机的内存管理单元以管理三个原语及其响应。如[32]中提到的，缓存的翻译一致性是基于失效的处理进行管理的。例如，由于作业迁移，从本地物理地址到全局物理地址的映射发生了变化。随后，ATU将通过发出携带本地物理地址的请求来使缓存的翻译失效。在我们的系统中，地址转换是通过CXL.io通道管理的，因此失效也可以通过相同的通道执行，通过在CXL.io的第15字节中定义一个专用消息来实现。

推测性访问

【就是乐观的执行仿存，若权限检查失败在回滚】

SDM中的推测访问用于和谐地结合地址转换缓存和数据缓存。推测访问的主要思想是在允许权限检查前进行访问，即，在检查权限标志之前对内存请求进行推测性处理。因此，计算节点无需等待来自内存节点的权限标志（如图4(b)）。

在权限标志到达计算节点后，CXL主代理硬件执行权限验证过程。例如，对于写请求，如果在相应的数据上允许该请求，则继续执行写请求；否则，使用“重放数据”将更新的数据回滚到原始状态。为了支持重放数据，推测访问需要在计算节点中的建立重放缓冲区。一旦需要回滚，则使用重放缓冲区中的旧数据条目将更新的数据恢复到旧状态。为了系统的安全操作，如果数据被恶意的非法访问，访问控制违规处理将隔离相应的会话，以防止来自该用户会话的进一步请求。

修改系统代理

为了在SDM中支持CXL事务，必须修改系统代理。图5(b)详细说明了计算节点中的系统代理。系统代理缓存位于系统代理中，用于缓存远程数据，系统代理缓存中的数据也可以被处理器核心的L1-L3缓存缓存。在系统代理缓存旁边，主机桥将内存请求多路复用到本地DIMM控制器或CXL主代理之间，主代理充当计算节点和背板之间的接口。一旦主代理接收到与一致性相关的消息，它将消息重定向到一致性桥（COHB），后者读取和更新存储在本地内存中的一致性目录。一致性目录是存储系统代理缓存中每行的一致性状态的重要特性。在不中断处理器的情况下，CXL主代理引入了一个直接内存访问（DMA）引擎，用于直接与本地内存通信。

实验

实验环境

使用Intel PIN tool构建了模拟器，一些参数如表2，具体细节没说，统计运行数据，根据公式计算访问时间和延迟。

数据集

PARSEC（计算密集型）[8]，11个工作负载：blackscholes、bodytrack、canneal、dedup、facesim、ferret、fluidanimate、raytrace、streamcluster、swaptions和x264。
Intel GAP（内存密集型）[7]，我们使用两个真实世界的图，twitter和web，其中应用了四个内核：bfs（广度优先搜索）、bc（介数中心性）、cc（连通分量）和sssp（单源最短路径），通过组合这些不同的图和内核来评估8个图的工作负载。

对比实验

对比：吞吐量、延迟、对计算节点数量的敏感性、对网络延迟的敏感性

总结

利用CXL优化分离式内存，利用CXL特性优化多处理器间的缓存一致性协议（MESI协议）。通过支持共享的控制流（SHA-CF）促进多主机间的共享，本质还是基于嗅探的MESI协议，利用CXL反向失效进行优化；利用CXL.io管理节点资源，不影响CXL.cache和CXL.mem传输；提出推测访问，就是乐观的执行仿存，若权限检查失败在回滚。

局限性：总体来看比较简单，利用CXL的特性来优化MESI协议；实验基于Intel PIN tool构建了模拟器，但没有具体细节，只对比了基础的基于嗅探的MESI协议，没有对比更好的缓存一致性算法。

KAIST数据集及使用草莓奶忻 SLAM基础 #SLAM数据集 ubuntu
文章目录KAIST复杂城市数据集KAIST数据集转换为rosbag1.将.gz.tar文件解压到其文件夹中2.克隆并构建此存储库3.使用路径和所需主题编辑配置文件4.为每种传感器类型创建一个rosbag文件5.将所有bag合并为一个参考KAIST复杂城市数据集KAIST-Urban-数据集-论文阅读数据集下载：ComplexUrbanDataset复杂城市数据集KAIST数据集转换为rosbag1
[论文阅读] 软件工程 | 需求工程中领域知识研究：系统映射与创新突破张较瘦_ 前沿技术论文阅读软件工程
需求工程中领域知识研究：系统映射与创新突破论文信息DomainKnowledgeinRequirementsEngineering:ASystematicMappingStudyarXiv:2506.20754DomainKnowledgeinRequirementsEngineering:ASystematicMappingStudyMarinaAraújo,JúliaAraújo,RomeuO
论文阅读：2025 arxiv Qwen3 Technical Report
https://arxiv.org/pdf/2505.09388https://www.doubao.com/chat/9918384373236738文章目录论文翻译Qwen3技术报告摘要1引言论文翻译Qwen3技术报告Qwen团队摘要在这项工作中，我们介绍了Qwen模型家族的最新版本Qwen3。Qwen3包含一系列大型语言模型（LLM），旨在提升性能、效率和多语言能力。Qwen3系列包括密集型
[论文阅读] 软件工程 | 探索软件生态系统中的开发者体验关键因素
探索软件生态系统中的开发者体验关键因素：从研究到实践引文格式@article{Zacarias2025,title={ExploringDeveloperExperienceFactorsinSoftwareEcosystems},author={Zacarias,RodrigoOliveiraandAntunes,L{\'e}oCarvalhoRamosandBarros,M{\'a}rciod
Fast Image Deconvolution using Hyper-Laplacian Priors论文阅读青铜锁00 #退化论文阅读论文阅读图像处理
FastImageDeconvolutionusingHyper-LaplacianPriors1.论文的研究目标与实际意义2.论文的创新方法2.1核心框架：交替最小化（AlternatingMinimization）2.2x子问题：频域FFT加速2.3w子问题：高效求解的核心创新2.3.1问题形式2.3.2查找表法（LUT）2.3.3解析解法（特定α\alphaα）2.3.4通用α\alphaα
[论文阅读] 人工智能 + 软件工程 | AI 与敏捷开发的破局之路：从挫败到成功的工作坊纪实张较瘦_ 前沿技术论文阅读人工智能软件工程
AI与敏捷开发的破局之路：从挫败到成功的工作坊纪实论文信息arXiv:2506.20159AIandAgileSoftwareDevelopment:FromFrustrationtoSuccess–XP2025WorkshopSummaryTomasHerda,VictoriaPichler,ZheyingZhang,PekkaAbrahamsson,GeirK.HanssenSubjects:
Diff-Retinex: Rethinking Low-light Image Enhancement with A Generative Diffusion Model 论文阅读钟屿论文阅读人工智能深度学习学习图像处理计算机视觉
Diff-Retinex：用生成式扩散模型重新思考低光照图像增强摘要本文中，我们重新思考了低光照图像增强任务，并提出了一种物理可解释的生成式扩散模型，称为Diff-Retinex。我们的目标是整合物理模型和生成网络的优点。此外，我们希望通过生成网络补充甚至推断低光照图像中缺失的信息。因此，Diff-Retinex将低光照图像增强问题表述为Retinex分解和条件图像生成。在Retinex分解中，我
【论文阅读】人工智能在直升机航空电子系统中的应用肥鼠路易论文阅读人工智能航空电子系统应用
人工智能在直升机航空电子系统中的应用论文摘要文章结构参考文献论文摘要论文摘要:在现代战争形势日趋信息化、智能化的背景下，将人工智能应用于武器装备已经是大势所趋。针对直升机飞行任务的特征，对其发展状况进行了描述，并对其作业能力进行了分析，探索了人工智能技术在直升机航电系统中的应用方向，为推进人工智能在直升机上的转化与应用奠定基础。通过对国外先进直升机智能技术的运用现状及对其作业能力的要求进行分析，探
[论文阅读] 人工智能+软件工程 | 用大语言模型架起软件需求形式化的桥梁张较瘦_ 前沿技术人工智能论文阅读软件工程
用大语言模型架起软件需求形式化的桥梁：一篇ACM调查草案的深度解读论文信息arXiv:2506.14627ACMSurveyDraftonFormalisingSoftwareRequirementswithLargeLanguageModelsArshadBeg,DiarmuidO’Donoghue,RosemaryMonahanComments:22pages.6summarytablesSu
Reti-Diff: Illumination Degradation Image Restoration with Retinex-based Latent Diffusion Model论文阅读青铜锁00 深度学习论文阅读 #退化论文阅读
Reti-Diff:IlluminationDegradationImageRestorationwithRetinex-basedLatentDiffusionModel1.研究目标与实际意义1.1研究目标1.2实际意义2.创新方法与模型设计2.1整体框架2.2RetinexPriorExtraction(RPE)模块2.2.1Retinex分解2.2.2先验压缩2.3Retinex-guide
SIMPL论文阅读 ZHANG8023ZHEN 论文阅读
论文链接：https://arxiv.org/pdf/2402.02519文章还没细看，但主要贡献点应该是SymmetricFusionTransformer和Bezier-basedMotionDecoder.对Bezier-basedMotionDecoder比较感兴趣，之后对这块细看一下
【论文阅读笔记】《CodeS: Towards Building Open-source Language Models for Text-to-SQL 》柠石榴 text2sql 论文论文阅读笔记语言模型
文章目录一、论文基本信息1.文章标题2.所属刊物/会议3.发表年份4.作者列表5.发表单位二、摘要三、解决问题四、创新点五、自己的见解和感想六、研究背景七、研究方法模型实验数据评估指标八、总结九、相关重要文献一、论文基本信息1.文章标题CodeS:TowardsBuildingOpen-sourceLanguageModelsforText-to-SQL2.所属刊物/会议未明确标注（会议缩写为“C
agentformer论文阅读 ZHANG8023ZHEN 论文阅读
参考了这篇博文：https://zhuanlan.zhihu.com/p/512764984主要有这几个部分a.map_encoderi.对地图进行CNNb.ContextEncoderi.timeencoder–将时间信息用transformer和positionemb进行融合，加入到特征中ii.agent-awareattention–self和selfattentionother和other
【论文阅读】DynamicControl ：一种新的controlnet多条件控制方法 prinTao pytorch Diffusion 论文阅读
背景现有方法要么处理条件效率低下，要么使用固定数量的条件，这并不能完全解决多个条件的复杂性及其潜在冲突。这强调了需要创新方法来有效管理多种条件，以实现更可靠和详细的图像合成。为了解决这个问题，我们提出了一个新的框架DynamicControl，它支持不同控制信号的动态组合，允许自适应选择不同数量和类型的条件。本文方法从一个双循环控制器开始，它通过利用预先训练的条件生成模型和判别模型为所有输入条件生
论文阅读：2018 arxiv CrowdHuman: A Benchmark for Detecting Human in a Crowd CSPhD-winston-杨帆论文阅读
https://www.doubao.com/chat/9226473480559618https://arxiv.org/pdf/1805.00123CrowdHuman:ABenchmarkforDetectingHumaninaCrowd文章目录论文翻译CrowdHuman：用于检测人群中人体的基准摘要1.引言2.相关工作2.1.人体检测数据集2.2.人体检测框架。论文翻译CrowdHuma
论文阅读：arxiv 2025 OThink-R1: Intrinsic Fast/Slow Thinking Mode Switching for Over-Reasoning Mitigation CSPhD-winston-杨帆论文阅读
总目录大模型安全相关研究：https://blog.csdn.net/WhiffeYF/article/details/142132328https://www.doubao.com/chat/8815924393371650https://arxiv.org/pdf/2506.02397#page=17.09OThink文章目录速览研究背景与问题核心思路与方法实验结果结论与意义速览这篇论文聚焦于
论文阅读：arxiv 2025 Not All Tokens Are What You Need In Thinking
总目录大模型安全相关研究：https://blog.csdn.net/WhiffeYF/article/details/142132328https://arxiv.org/pdf/2505.17827https://www.doubao.com/chat/8814790364572162文章目录速览研究背景提出的解决方案：条件token选择（CTS）实验结果核心贡献研究局限总结速览这篇论文主要探
[论文阅读]PIDNet: A Real-time Semantic Segmentation Network Inspired by PID Controllers 颜笑晏晏论文阅读
1.摘要双分支网络结构已显示出其对实时语义分割任务的效率性和有效性。然而，低级细节和高级语义的直接融合将导致细节特征容易被周围上下文信息淹没，即本文中的超调(overshoot)，这限制了现有两个分支模型的准确性的提高。在本文中，我们在卷积神经网络（CNN）和比例积分微分（PID）控制器之间架起了桥梁，并揭示了双分支网络只是一个比例积分（PI）控制器，当然也会存在类似的超调问题。为了解决这个问题，
[论文阅读] 人工智能+软件工程 | 用 LLM + 静态代码分析自动化提升代码质量张较瘦_ 前沿技术论文阅读人工智能软件工程
用LLM+静态代码分析自动化提升代码质量论文信息AugmentingLargeLanguageModelswithStaticCodeAnalysisforAutomatedCodeQualityImprovements@article{abtahi2025augmenting,title={AugmentingLargeLanguageModelswithStaticCodeAnalysisfo
经典论文阅读《A Framework for Unifying Reordering Transformations》《统一重排序变换的框架》好好学习啊天天向上自动性能优化
1）摘要我们提出了一个用于统一迭代重排序变换的框架，这些变换包括循环交换、循环分布、倾斜、分块、索引集拆分和语句重排序。该框架基于这样一种思想：变换可以表示为将原始迭代空间映射到新迭代空间的调度。框架旨在为变换提供一种统一的表示和推理方式。作为框架的一部分，我们提供了辅助构建和使用调度的算法，特别是用于检验调度合法性、对齐调度以及为调度生成优化代码的算法。2）优化编译器会对语句的迭代进行重新排序，
[论文阅读] 系统架构 | 零售 IT 中的微服务与实时处理：开源工具链与部署策略综述张较瘦_ 前沿技术论文阅读大数据零售
零售IT中的微服务与实时处理：开源工具链与部署策略综述论文信息MicroservicesandReal-TimeProcessinginRetailIT:AReviewofOpen-SourceToolchainsandDeploymentStrategiesAaditaaVashisht(DepartmentofInformationScienceandEngineering,RVCollege
[论文阅读]人工智能 | CoMemo：给大视觉语言模型装个“图像记忆” 张较瘦_ 前沿技术人工智能论文阅读语言模型
【论文速览】CoMemo：给大视觉语言模型装个“图像记忆”论文信息Liu,S.,Su,W.,Zhu,X.,Wang,W.,&Dai,J.(2025).CoMemo:LVLMsNeedImageContextwithImageMemory.arXivpreprintarXiv:2506.06279.一、研究背景：当LVLMs遇到“视觉健忘症”想象一下，你在阅读一本图文并茂的小说时，随着文字篇幅越来越
[论文阅读] 人工智能+软件工程 | 结对编程中的知识转移新图景张较瘦_ 前沿技术人工智能软件工程结对编程
当AI成为编程搭档：结对编程中的知识转移新图景论文信息论文标题：FromDeveloperPairstoAICopilots:AComparativeStudyonKnowledgeTransfer（从开发者结对到AI副驾驶：知识转移的对比研究）作者及机构：AlisaWelter等来自德国萨尔兰大学，ChristofTinnes同时隶属于西门子公司发表平台：arXiv预印本平台发表时间：2025年
【论文阅读笔记】HaDes幻觉检测benchmark zsq 论文分享论文阅读笔记 NLP 大语言模型幻觉
0论文信息题目：AToken-levelReference-freeHallucinationDetectionBenchmarkforFree-formTextGeneration作者：TianyuLiu,YizheZhang,ChrisBrockett,YiMao,ZhifangSui,WeizhuChen,BillDolan会议：ACL，2022链接：https://arxiv.org/ab
论文阅读：Enhancing Retrieval and Managing Retrieval: A Four-Module Synergy for Improved Quality and Ef clvsit RAG 论文阅读 LLM
检索增强生成（RAG）技术利用大型语言模型（LLM）的上下文学习能力，生成更准确、更相关的响应。RAG框架起源于简单的“检索-阅读”方法，现已发展成为高度灵活的模块化范式。其中一个关键组件——查询重写模块，通过生成搜索友好的查询来增强知识检索。这种方法能使输入问题与知识库更紧密地结合起来。作者的研究发现了将QueryRewriter模块增强为QueryRewriter+的机会，即通过生成多个查询来
论文阅读：HySCDG生成式数据处理流程
论文地址:TheChangeYouWantToDetect:SemanticChangeDetectionInEarthObservationWithHybridDataGenerationAbstract摘要内容介绍问题背景“Bi-temporalchangedetectionatscalebasedonVeryHighResolution(VHR)imagesiscrucialforEarth
[论文阅读] 人工智能 | 搜索增强LLMs的用户偏好与性能分析张较瘦_ 前沿技术人工智能论文阅读
【论文解读】SearchArena：搜索增强LLMs的用户偏好与性能分析论文信息作者:MihranMiroyan,Tsung-HanWu,LoganKing等标题:SearchArena:AnalyzingSearch-AugmentedLLMs来源:arXivpreprintarXiv:2506.05334v1,2025一、研究背景：当LLMs需要“上网查资料”时，我们如何评估它？想象你在问AI
[论文阅读] 人工智能 | 如何快速检测LLM生成的代码？这篇论文提出了一个巧妙的方法张较瘦_ 前沿技术人工智能论文阅读
如何快速检测LLM生成的代码？这篇论文提出了一个巧妙的方法论文引文格式@misc{ashkenazi2025zero,title={Zero-ShotDetectionofLLM-GeneratedCodeviaApproximatedTaskConditioning},author={MaorAshkenaziandOfirBrennerandTalFurmanShohetandEranTrei
[论文阅读] 人工智能+软件工程 | 理解GitGoodBench：评估AI代理在Git中表现的新基准张较瘦_ 前沿技术论文阅读人工智能软件工程
理解GitGoodBench：评估AI代理在Git中表现的新基准论文信息GitGoodBench:ANovelBenchmarkForEvaluatingAgenticPerformanceOnGitTobiasLindenbauer,EgorBogomolov,YaroslavZharovCiteas:arXiv:2505.22583[cs.SE]研究背景：当AI走进开发者的协作工具箱在软件开发
[论文阅读] 人工智能+软件工程（软件测试） | 当大语言模型遇上APP测试：SCENGEN如何让手机应用更靠谱张较瘦_ 前沿技术人工智能论文阅读软件工程
当大语言模型遇上APP测试：SCENGEN如何让手机应用更靠谱？一、论文基础信息论文标题：LLM-GuidedScenario-basedGUITesting（《大语言模型引导的基于场景的GUI测试》）作者及机构：ShengchengYu等（德国慕尼黑工业大学、南京大学、同济大学等）发表来源：IEEETransactionsonSoftwareEngineering（IEEE软件工程汇刊）发表时间
LeetCode[位运算] - #137 Single Number II Cwind java Algorithm LeetCode 题解位运算
原题链接：#137 Single Number II 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现三次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：与#136类似，都是考察位运算。不过出现两次的可以使用异或运算的特性 n XOR n = 0, n XOR 0 = n，即某一
《JavaScript语言精粹》笔记 aijuans JavaScript
0、JavaScript的简单数据类型包括数字、字符创、布尔值（true/false）、null和undefined值，其它值都是对象。 1、JavaScript只有一个数字类型，它在内部被表示为64位的浮点数。没有分离出整数，所以1和1.0的值相同。 2、NaN是一个数值，表示一个不能产生正常结果的运算结果。NaN不等于任何值，包括它本身。可以用函数isNaN(number)检测NaN,但是
你应该更新的Java知识之常用程序库 Kai_Ge java
在很多人眼中，Java 已经是一门垂垂老矣的语言，但并不妨碍 Java 世界依然在前进。如果你曾离开 Java，云游于其它世界，或是每日只在遗留代码中挣扎，或许是时候抬起头，看看老 Java 中的新东西。 Guava Guava[gwɑ:və]，一句话，只要你做Java项目，就应该用Guava（Github）。 guava 是 Google 出品的一套 Java 核心库，在我看来，它甚至应该
HttpClient 120153216 httpclient
/** * 可以传对象的请求转发，对象已流形式放入HTTP中 */ public static Object doPost(Map<String,Object> parmMap,String url) { Object object = null; HttpClient hc = new HttpClient(); String fullURL
Django model字段类型清单 2002wmj django
Django 通过 models 实现数据库的创建、修改、删除等操作，本文为模型中一般常用的类型的清单，便于查询和使用： AutoField：一个自动递增的整型字段，添加记录时它会自动增长。你通常不需要直接使用这个字段；如果你不指定主键的话，系统会自动添加一个主键字段到你的model。(参阅自动主键字段) BooleanField：布尔字段,管理工具里会自动将其描述为checkbox。 Cha
在SQLSERVER中查找消耗CPU最多的SQL 357029540 SQL Server
返回消耗CPU数目最多的10条语句 SELECT TOP 10 total_worker_time/execution_count AS avg_cpu_cost, plan_handle, execution_count, (SELECT SUBSTRING(text, statement_start_of
Myeclipse项目无法部署，Undefined exploded archive location 7454103 eclipse MyEclipse
做个备忘！错误信息为： Undefined exploded archive location 原因：在工程转移过程中，导致工程的配置文件出错；解决方法：
GMT时间格式转换 adminjun GMT 时间转换
普通的时间转换问题我这里就不再罗嗦了，我想大家应该都会那种低级的转换问题吧，现在我向大家总结一下如何转换GMT时间格式，这种格式的转换方法网上还不是很多，所以有必要总结一下，也算给有需要的朋友一个小小的帮助啦。 1、可以使用 SimpleDateFormat SimpleDateFormat EEE-三位星期 d-天 MMM-月 yyyy-四位年
Oracle数据库新装连接串问题 aijuans oracle数据库
割接新装了数据库，客户端登陆无问题，apache/cgi-bin程序有问题，sqlnet.log日志如下： Fatal NI connect error 12170. VERSION INFORMATION: TNS for Linux: Version 10.2.0.4.0 - Product
回顾java数组复制 ayaoxinchao java 数组
在写这篇文章之前，也看了一些别人写的，基本上都是大同小异。文章是对java数组复制基础知识的回顾，算是作为学习笔记，供以后自己翻阅。首先，简单想一下这个问题：为什么要复制数组？我的个人理解：在我们在利用一个数组时，在每一次使用，我们都希望它的值是初始值。这时我们就要对数组进行复制，以达到原始数组值的安全性。java数组复制大致分为3种方式：①for循环方式 ②clone方式 ③arrayCopy方
java web会话监听并使用spring注入 bewithme Java Web
在java web应用中，当你想在建立会话或移除会话时，让系统做某些事情，比如说，统计在线用户，每当有用户登录时，或退出时，那么可以用下面这个监听器来监听。 import java.util.ArrayList; import java.ut
NoSQL数据库之Redis数据库管理(Redis的常用命令及高级应用) bijian1013 redis 数据库 NoSQL
一 .Redis常用命令 Redis提供了丰富的命令对数据库和各种数据库类型进行操作，这些命令可以在Linux终端使用。 a.键值相关命令 b.服务器相关命令 1.键值相关命令 &
java枚举序列化问题 bingyingao java 枚举序列化
对象在网络中传输离不开序列化和反序列化。而如果序列化的对象中有枚举值就要特别注意一些发布兼容问题: 1.加一个枚举值新机器代码读分布式缓存中老对象，没有问题，不会抛异常。老机器代码读分布式缓存中新对像，反序列化会中断，所以在所有机器发布完成之前要避免出现新对象，或者提前让老机器拥有新增枚举的jar。 2.删一个枚举值新机器代码读分布式缓存中老对象，反序列
【Spark七十八】Spark Kyro序列化 bit1129 spark
当使用SparkContext的saveAsObjectFile方法将对象序列化到文件，以及通过objectFile方法将对象从文件反序列出来的时候，Spark默认使用Java的序列化以及反序列化机制，通常情况下，这种序列化机制是很低效的，Spark支持使用Kyro作为对象的序列化和反序列化机制，序列化的速度比java更快，但是使用Kyro时要注意，Kyro目前还是有些bug。 Spark
Hybridizing OO and Functional Design bookjovi erlang haskell
推荐博文： Tell Above, and Ask Below - Hybridizing OO and Functional Design 文章中把OO和FP讲的深入透彻，里面把smalltalk和haskell作为典型的两种编程范式代表语言，此点本人极为同意，smalltalk可以说是最能体现OO设计的面向对象语言，smalltalk的作者Alan kay也是OO的最早先驱，
Java-Collections Framework学习与总结-HashMap BrokenDreams Collections
开发中常常会用到这样一种数据结构，根据一个关键字，找到所需的信息。这个过程有点像查字典，拿到一个key，去字典表中查找对应的value。Java1.0版本提供了这样的类java.util.Dictionary(抽象类)，基本上支持字典表的操作。后来引入了Map接口，更好的描述的这种数据结构。 &nb
读《研磨设计模式》-代码笔记-职责链模式-Chain Of Responsibility bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 业务逻辑：项目经理只能处理500以下的费用申请，部门经理是1000，总经理不设限。简单起见，只同意“Tom”的申请 * bylijinnan */ abstract class Handler { /*
Android中启动外部程序 cherishLC android
1、启动外部程序引用自： http://blog.csdn.net/linxcool/article/details/7692374 //方法一 Intent intent=new Intent(); //包名包名+类名（全路径） intent.setClassName("com.linxcool", "com.linxcool.PlaneActi
summary_keep_rate coollyj SUM
BEGIN /*DECLARE minDate varchar(20) ; DECLARE maxDate varchar(20) ;*/ DECLARE stkDate varchar(20) ; DECLARE done int default -1; /* 游标中注册服务器地址 */ DE
hadoop hdfs 添加数据目录出错 daizj hadoop hdfs 扩容
由于原来配置的hadoop data目录快要用满了，故准备修改配置文件增加数据目录，以便扩容，但由于疏忽，把core-site.xml, hdfs-site.xml配置文件dfs.datanode.data.dir 配置项增加了配置目录，但未创建实际目录，重启datanode服务时，报如下错误： 2014-11-18 08:51:39,128 WARN org.apache.hadoop.h
grep 目录级联查找 dongwei_6688 grep
在Mac或者Linux下使用grep进行文件内容查找时，如果给定的目标搜索路径是当前目录，那么它默认只搜索当前目录下的文件，而不会搜索其下面子目录中的文件内容，如果想级联搜索下级目录，需要使用一个“-r”参数： grep -n -r "GET" . 上面的命令将会找出当前目录“.”及当前目录中所有下级目录
yii 修改模块使用的布局文件 dcj3sjt126com yii layouts
方法一：yii模块默认使用系统当前的主题布局文件，如果在主配置文件中配置了主题比如: 'theme'=>'mythm', 那么yii的模块就使用 protected/themes/mythm/views/layouts 下的布局文件；如果未配置主题，那么 yii的模块就使用 protected/views/layouts 下的布局文件，总之默认不是使用自身目录 pr
设计模式之单例模式 come_for_dream 设计模式单例模式懒汉式饿汉式双重检验锁失败无序写入
今天该来的面试还没来，这个店估计不会来电话了，安静下来写写博客也不错，没事翻了翻小易哥的博客甚至与大牛们之间的差距，基础知识不扎实建起来的楼再高也只能是危楼罢了，陈下心回归基础把以前学过的东西总结一下。 *********************************
8、数组豆豆咖啡二维数组数组一维数组
一、概念数组是同一种类型数据的集合。其实数组就是一个容器。二、好处可以自动给数组中的元素从0开始编号，方便操作这些元素三、格式 //一维数组 1,元素类型[] 变量名 = new 元素类型[元素的个数] int[] arr =
Decode Ways hcx2013 decode
A message containing letters from A-Z is being encoded to numbers using the following mapping: 'A' -> 1 'B' -> 2 ... 'Z' -> 26 Given an encoded message containing digits, det
Spring4.1新特性——异步调度和事件机制的异常处理 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
squid3(高命中率)缓存服务器配置 liyonghui160com
系统:centos 5.x 需要的软件:squid-3.0.STABLE25.tar.gz 1.下载squid wget http://www.squid-cache.org/Versions/v3/3.0/squid-3.0.STABLE25.tar.gz tar zxf squid-3.0.STABLE25.tar.gz &&
避免Java应用中NullPointerException的技巧和最佳实践 pda158 java
1) 从已知的String对象中调用equals()和equalsIgnoreCase()方法，而非未知对象。　　总是从已知的非空String对象中调用equals()方法。因为equals()方法是对称的，调用a.equals(b)和调用b.equals(a)是完全相同的，这也是为什么程序员对于对象a和b这么不上心。如果调用者是空指针，这种调用可能导致一个空指针异常 Object unk
如何在Swift语言中创建http请求 shoothao http swift
概述：本文通过实例从同步和异步两种方式上回答了”如何在Swift语言中创建http请求“的问题。如果你对Objective-C比较了解的话，对于如何创建http请求你一定驾轻就熟了，而新语言Swift与其相比只有语法上的区别。但是，对才接触到这个崭新平台的初学者来说，他们仍然想知道“如何在Swift语言中创建http请求？”。在这里,我将作出一些建议来回答上述问题。常见的
Spring事务的传播方式 uule spring事务
传播方式：新建事务 required required_new - 挂起当前非事务方式运行 supports &nbs