大白羊想学习

FuzzFactory：Domain-Specific Fuzzing with Waypoints

论文 FuzzFactory: Domain-Specific Fuzzing with Waypoints

作者：R. Padhye, C. Lemieux, K. Sen, L. Simon, and H. Vijayakumar
发表：Proc. ACM Program. Lang., Vol. 3, No. OOPSLA, Article 174. Publication date: October 2019.

一、引言

覆盖导向的模糊测试作为一种高效的方法，在分析二进制数据的程序中发现安全漏洞，如缓冲区溢出，已经得到了重视。最近，研究人员针对不同的领域特定的测试目标，对覆盖引导的模糊算法进行了各种专门化，如寻找性能瓶颈、生成有效的输入、处理幻数字节比较等。每一种解决方案都需要非平凡的实现工作，并产生不同的变量一个模糊的工具。我们观察到许多领域特定的解决方案遵循一种通用的解决方案模式。在本文中，我们提出了FuzzFactory，一个开发领域特定的模糊应用程序的框架，而不需要改变变异和搜索启发式。FuzzFactory允许用户在测试执行期间指定特定于域的动态反馈的集合，以及如何聚合这些反馈。FuzzFactory使用这些信息选择性地保存中间输入，称为航路点（waypoints），以增强覆盖率引导的模糊。这些航路点总是朝着特定领域的多维目标前进。我们使用FuzzFactory实例化了六个领域特定的fuzzing应用程序：三个先前工作的重新实现和三个新的解决方案，并根据Google的fuzzer测试套件中的基准测试评估了它们的有效性。我们还展示了如何组合多个域以使其性能优于其部分的总和。

二、问题提出

糊测试除了发现程序崩溃之外还有其他应用。例如，模糊测试可以用于定向测、基于性能的测试、差异测试、侧信道分析、发现算法复杂性漏洞、发现性能热点等等。在每种情况下，研究人员都修改了最初的模糊算法，以产生一个专门的解决方案。对此问题，研究人员调整了最初的CGF算法，以利用来自程序的特定于域的信息来提高代码覆盖率。

但是，对于每一个新的领域，研究人员都必须找到一种方法来调整模糊算法并产生新的AFL变种或其他模糊工具。每个这样的解决方案都需要不同的实现。此外，这些变体是独立的，不易组合。

三、FuzzFactory框架

基于这个问题，论文中提出了FuzzFactory，这是一个统一的框架：实现特定领域fuzzing程序的框架。

框架是基于以下观察：许多领域特定的模糊化问题最终是为了获得更大的覆盖率，除了那些只提高代码覆盖率的问题外，还可以选择性地保存新生成的输入以备后续的变异。我们称这些中间输入航路点（waypoints）。简单来说，我们不仅要保留能够使得覆盖率增大的种子信息，还要保留更多有用的点的信息，这些点能使得变异更容易触发新的覆盖率。这些点叫做航路点。

文中举了两个例子进行说明应当保留怎样的点作为航路点。
第一个例子进行下图的算法，对于这个算法，函数测试将两个16位整数a和b作为输入，第2、3、4行的比较条件还比较容易触发，但是想第5行的条件则非常困难，将这种情况称为硬比较。但是如右图，我们起初输入i1, i2、i3、i4分别满足2-4行，i5则未触发新的路径。此时如果是常用的方法，则会直接抛弃i5，对i4进行进一步的变异得到i8。然而我们可以看到，i5向i7变异使得其满足第5行条件的可能性要比i8变异得到i7的可能性大得多，因为i5中a、b匹配的位数要比之前任何时候都大，因此我们不应该简单地抛弃i5。在这种情况下，匹配的位数也应当作为一个标准来判断是否应当保存用例。

第二个例子是针对malloc动态分配调用来生成最大的内存分配值，这可以用于压力测试。同样是上面这个算法，从i8到i9并没有触发新的覆盖范围，然而却是是使得malloc的范围更大了，因此也却是应当被保留。

总的来说，对于特定领域的fuzz，用户指定除了覆盖率信息外，还需要指定从被测程序的执行中收集哪些自定义的反馈信息。这主要需要指定两个函数，（1）从程序执行过程中收集的特定类型的反馈，以及（2）如何使用此反馈来确定输入是否应被视为有趣并被保存。

这个框架的主要贡献是：提出了模糊算法和被测程序反馈选择之间的关注分离。

四、waypoints航路点

这里论文中给出了元组表示以及各元素的一些性质公式，为了方便理解，这里不对公式进行说明，尽可能直接阐述结论。

（1）反馈值的计算：waypoints问题中，我们将用户指定的这个特定类型反馈的值称为聚合值，而reducer函数则是用于计算聚合值的，当reducer函数满足某一条件时我们这个输入保存下来作为waypoints。例如在malloc问题中，reducer函数就是计算申请内存值的大小，即max（old,(new+old)）。关于reducer函数的性质有两个：
【性质一】幂等性与同一个输入进行多次结合或一次结合的结果相同。即max（old,(new+old)）=max(max(old,(new+old)),(new+old))
【性质二】交换性即先与哪一个输入进行结合都不影响结果。即max(max(old,new1+old),(new2+old+new1))=max(max(old,new2+old),(old+new2+new1))
当满足这两个性质是，可以确保通过reducer函数选出的waypoints对加速fuzz有帮助。但是，FuzzFactory不会静态验证这些性质，用户需自行确保所选的reducer函数满足性质1和2。

（2）航路点waypoints的判断：如果对输入的执行导致某一个反馈值发生更改，我们将保存输入这个输入。

（3）反馈值变化的单调性：反馈值的变化总是指向一个方向，这个方向意味着某种领域特定的进展。例如malloc，返回的分配内存的最大大小一定是不断增大的。

根据单调性可推：输入i被认为是一个航路点，需要某个反馈值取得进展，而不牺牲任何其他反馈值的进展。

（4）组成域：用户可以为被测程序自然地组成多个域（即将测试用例分词多个组）。在整体域内的waypoints应当与所有小域内waypoints的集合相同。

五、实现

算法如上图，这基于覆盖率引导的模糊测试，灰色部分即此模块对fuzz的扩展。扩展主要分为两个部分：
（1）在程序p对输入i′执行的过程中，该算法不仅收集覆盖率，而且还收集特定域的反馈映射dsf i1…dsf
（2）然后使用调is_waypoint（i′，S，D）中的那些映射来确定是否应将新输入i′添加到保存的输入集S中。

六、应用
-----这部分我基本保留了文章中的内容，毕竟实验结果还是要完整些好*------

论文中将这个框架分别运用到了6个独立的领域特定的模糊应用程序。

（1） slow：一个用于最大化执行路径长度的应用程序，基于SlowFuzz。这是FuzzFactory中要实现的最简单的域。
（2） perf：基于PerfFuzz，通过最大化基本块执行计数来发现热点的应用程序。。在FuzzFactory中，这自然是慢的。
（3） mem：一种新的应用程序，用于生成最大化动态内存分配的输入。
（4）有效性：有效性模糊算法的应用，它试图将输入生成偏向于满足程序特定有效性检查的输入。
（5） cmp：用于平滑硬比较的域。虽然之前的很多工作都是针对这个应用，但是我们的特定解决方案是新颖的。
（6） diff：一种用于测试程序中代码更改后增量模糊化的新应用程序。
在fuzzfactory框架下，上述六个域中的四个可以在30行C++代码中实现。当对输入执行测试程序时，需要检测收集特定于域的反馈值。此类检测在编译时执行。尽管我们的实现在LLVM IR级别执行检测。下表列出了这6个情况下使用的一些钩子、操作和实用程序函数，我们在特定于域的检测的抽象描述中使用这些函数。

当通过测试程序时遇到程序中的相应元素时，检测框架（例如LLVM）在编译时激活钩子。
以下是六个例子的详细情况：

（一）slow：最大化执行路径

模糊测试可以用来生成使被测程序的算法复杂度恶化的输入。其方法为：搜索使用一个适应度函数，该函数计算在执行单个测试输入期间执行的基本块数，我们将此度量称为执行路径长度，我们的目标是使基本块尽量多。因此，is_waypoint实现的功能应该是：如果输入的执行块比其他输入都要多，则应保存这个输入。

表3为框架基于这一问题进行的修改。利用hook定义entry_point和new_basic_block。dsf(0)表示测试输入的执行长度。在被测程序的入口点，插入一个将dsf（0）设置为0的语句。然后，在程序中的每个基本块上，插入一个语句，该语句递增存储在dsf（0）中的值。因此，在测试执行期间，dsf（0）的值在每次访问基本块时递增一。在测试输入执行结束时，dsf（0）的值将包含执行路径长度。由于该域的reducer函数定义为max，初始值为0（见表3的第一行）。

实验结果：上图显示了我们在基准程序上使用这个应用程序的实验结果。在24小时的模糊化之后，我们评估了基准（afl）和slow的最大执行路径长度（跨越生成的测试语料库）。该图绘制了12次重复中该指标的平均值和标准误差。对于libpng，域特定反馈允许生成路径长度大于基线长度2.5倍的输入。对于boringssl和libxml来说，增长并没有那么显著。但是，slow的最大执行路径长度实际上低于afl在其余三个基准上发现的最大执行路径长度。对这个结果的一个可能的解释是，从第一个输入开始，缓慢地尝试积极地最大化执行路径长度。另一方面，afl将时间花在最大化代码覆盖率上，并发现测试程序组件中不由种子输入执行的较长执行路径。这种差异在libarchive中最为明显。在我们考虑的所有基准中，libarchive是唯一一个在Google测试套件中提供的初始种子输入无效的基准。也就是说，libarchive的初始种子输入会导致测试程序在错误状态下提前退出。由于AFL 24小时只增加代码覆盖率，因此它能够最终生成有效存档（例如ZIP文件）的输入，其处理导致更长的执行路径。在libpng等基准测试中，提供的种子输入是有效的，并且已经覆盖了测试程序中有趣的代码路径；因此，slow能够有效地最大化路径长度。当初始种子输入已经提供了良好的代码覆盖率时，这种受SlowFuzz启发的方法似乎最有效。

（二） perf: 发现热点
perf是一个使用模糊测试生成具有病态性能的输入的工具，目的是生成能够多次执行同一个基本块的输入。reducer函数为max。

我们用值0初始化整个DSF映射。每次访问一个新的基本块k时，我们都会增加存储在dsf（k）中的值。这是在instrumentation hook函数new_basic_block中完成的，使用current_program_loc（）函数静态获取要检测的基本块的程序位置（请参阅表2）。在测试执行结束时，dsf（k）将包含执行基本块k的次数。由于reducer函数是max，如果新生成的输入增加了测试程序中任何基本块k的执行计数，则该输入将被视为航路点。

实验结果同样以AFL作为基准，另外还与perf进行比较。对于libpng和libjpeg-turbo，perf发现的热点比基线afl发现的热点执行2×和1.7×以上。对于libarchive，perf应用程序的性能要差得多。与前一节中报告的实验类似，这里的主要问题是libarchive提供的初始种子输入导致退出。AFL花费更多的时间来增加codecoverage而不是基本的块执行计数，它最终生成有效的存档文件（例如ZIP）。考虑到libarchive是一个执行解压的程序，生成有效的归档文件就足以发现执行解压的代码组件中的一个巨大热点。另一方面，perf只发现libarchive解析文件元数据的热点。我们的评估表明PerfFuzz算法也依赖于覆盖有趣代码路径的初始种子输入。在所有的基准测试中，perf的结果与专业的PerfFuzz工具相似或稍好一些。

（三）mem：加速内存分配
mem时候用于生成动态分配的最大内存量，可用于压力测试。
每当测试程序在程序位置k处使用malloc或calloc分配新内存时，我们将dsf (k)的值增加所分配的字节数。在测试执行结束时，dsf (k)的值包含在程序位置k处为所有这样的位置k分配的总字节数。reducer函数仍然是使用max

实验数据：基准libxml似乎没有执行任何与输入相关的动态内存分配。基准vorbis, libpng, libjpeg-turbo和boringssl,特定于域的模糊应用程序生成的输入分配1.5×ś120×更多的内存。对于libpng，我们的应用程序生成了输入PNG图像，其元数据根据测试驱动程序中硬编码的200万像素的验证规则指定了最大允许图像尺寸。尽管这些PNG文件本身的大小只有1KB左右，但它们的处理需要超过24MB的动态分配内存。

（四）valid：有效性模糊测试
大多数随机生成的输入都是无效的;也就是说，它们导致测试程序以错误状态提前退出。例如libpng上的传统CGF不太可能生成许多有效的PNG图像，即使一开始就使用有效的输入进行fuzzing。
在有效性问题中，我们有两种情况需要保存输入：第一、覆盖率增加，有效性不管；第二、新生成的输入有效

首先，我们修改了基准套件附带的测试驱动程序，以添加特定于程序的assume(expr)语句。assume的语义类似于我们更熟悉的断言:如果参数expr在运行时的计算结果为true，那么该语句就是一个no-op;否则，测试执行就会停止。图5演示了我们对libpng测试驱动程序所做的三种单行更改之一。我们没有因为PNG报头无效而提前退出，而是简单地用一个assume语句包装有效性检查。除了boringssl之外，我们能够在所有基准测试的测试驱动程序中进行如此小的更改。整个五基准的司机我们修改,我们添加了1ś3假设语句包装现有的有效性检查在测试驱动程序,改变1ś11行代码。其次，我们对测试程序进行测试，以在测试执行期间用有关代码覆盖率的信息填充DSF映射，这与传统的覆盖引导的fuzzing类似。在运行时，如果要假设的任何参数的计算结果为false，则整个DSF映射将重置为退出前的初始状态。因此，当且仅当测试输入有效时，DSF映射映射传统的代码覆盖率信息。无效的输入不会产生领域特定的反馈。此方案导致算法2的以下行为:如果新生成的输入导致新的累积代码覆盖率，或者如果输入有效并实现了更多的代码覆盖率(即，更改聚合的特定于域的反馈)比迄今为止看到的任何其他有效输入(即，在产生特定领域反馈的输入之间)。

实验结果表明，validityfuzzingenablesenhance在libpng(3%)和libjpeg-turbo(39%)的有效输入中。对于vorbis，有效性反馈似乎没有任何影响。对于libxml，有效性模糊算法在有效输入之间产生的分支覆盖率减少了30%。与其他处理二进制输入数据的基准测试不同，libxml期望有效的输入符合上下文无关的语法。对于这样一个领域，有效性模糊本身似乎是不够的。直观地说，使用字节级的变化来修改有效的XML文件并不一定有助于生成具有不同代码覆盖率的更有效的XML文件。在libarchive上，与往常一样，领域特有的模糊应用不是很有效。由于libarchive被播种了一个无效的输入，在最初几个小时的模糊处理过程中生成的大部分输入都会导致假设失败。当然，有效性模糊算法首先依赖于一些有效的输入，以使特定于域的反馈有用。
（五）cmp：平滑硬比较

其中反馈表示正在比较的两个操作数之间共有的位数V = N。使用max reduce函数;因此，如果新生成的输入最大化了被测程序中任何硬比较操作匹配的比特数，那么它将被保存为一个waypoint。cmp使用了bin_expr、switch、target_program_loc和comm_bits的定义。检测策略如下:首先，在入口点将DSF映射初始化为0，然后，执行诸如整数相等、字符串比较和switch情况语句等操作。插入的代码填充与它们的程序位置对应的DSF映射条目，并在它们的操作数之间观察到公共位的最大计数。

（六） diff: 增量模糊测试
代码更改后的增量fuzzing。为了在复杂软件的稳定版本中发现缺陷，让fuzzing工具运行数小时或数天是一种常见的做法。但是，如果开发人员对这样的软件进行了更改，目前还没有一种简单的方法可以让他们快速模糊地测试更改。一种方法是他们可以使用由软件前一版本上的长期fuzzing会话生成的测试集作为回归测试套件，但是这些输入可能不会执行受软件更改影响的代码路径。另一种方法是也可以用之前生成的输入语料库作为初始种子，然而，他们没有办法与模糊测试器沟通，让它关注影响软件变更的代码路径。为此，论文提出并实现了一个用于增量模糊的领域专用模糊应用程序。这个应用程序的目标是引导fuzzing快速发现访问刚刚修改的代码行的有趣的代码路径。我们将这组修改后的代码行称为diff。为了度量输入执行的路径的多样性，我们将关注基本块转换(BBTs)，而不是单独关注基本块。

以此为例，这个程序在第7行执行除法。在原始程序中，除数d总是输入a的倍数，因此第7行上的除法总是安全的。然而对程序的新更改(在第4行将2 * a切换为2 - a)使得除法可以为0。b显示了一些输入和它们通过这个程序的执行路径。执行路径表示为输入执行的BBTs序列。我们使用⟨x, y⟩代表过渡从基本块从行x的基本块的起始行y。我们用符号(闪电图标)表示一个受扩散影响的基本块的执行。
考虑b中的三个输入。Inputi1 (a=3,b=4)执行diff，但不执行第7行上的除法。Inputi2 (a=4,b=4)在第7行执行除法，但在第4行不执行diff。与输入i1和i2相比，输入i3 (a=4,b=3)并没有执行新的bbt，因此常规的覆盖引导fuzzing不会保存它。然而，输入i3是第一个在命中diff后执行到第7行的真正分支，之前的i2压根没执行到第4行，因此i3应当被增量模糊设置有趣，因为它会执行一个受差异变化影响的新代码路径。

表8正式定义了增量模糊域，并描述了工具。我们跟踪基本的块转换，而不是简单的基本块。为了更好地近似路径，DSF映射收集BBT执行块的集合。为了确保我们只跟踪差异后的bbt，该工具还在测试程序中定义了一个新的全局变量hits_diff。这个变量在测试入口点被设置为false。在每个基本块上，工具添加一个检查，以查看基本块是否在within_diff中(即在interest的代码更改中添加或修改了基本块)，并将hits_diff设置为true(如果是这样的话)。然后,该BBT的DSF⟨p c⟩只在hits_diff是真的时保存。
对于libpng和libjpeg-turbo，我们的过程产生的diff被起始语料库中的所有输入击中，而对于vorbis，种子语料库中的任何输入最初都没有击中diff，这导致了非常大的diff。正如对如此巨大差异的预期，diff和afl同样成功地在这些基准上发现了各种差异后行为。对于libarchive和boringssl，只有少数输入达到初始diff，diff不是很大。这些更紧密地反映了由我们的技术驱动的增量变化。对于这些基准，FuzzFactory领域特定的fuzzing应用程序diff在diff下游的覆盖率比afl高2.5-3倍。

七、bugs发现
由于在我们的实验中使用的基准测试套件包含了大量模糊化软件的旧的历史版本，所以我们希望在模糊化时只发现以前已知的错误（如果有的话）。令我们惊讶的是，在模糊libarchive 2017年1月快照时，我们发现cmp mem保存的输入在最新版本（2019年3月）中显示了两个先前未知的错误：内存泄漏和导致巨大内存分配的意外整数符号转换。

根据论文复现大模型方法以及出错处理技巧 Ai玩家hly 从0倒1 论文复现大模型复现 Ai大模型复现
复现一篇论文中的大模型搭建涉及以下几个关键步骤：理解论文的模型架构、数据集处理、超参数设置以及实验环境的搭建。这里给出一个基本的实现方法示例，假设我们选择复现一个图像分类任务中的经典模型，例如ResNet。实现步骤示例1.理解论文和模型架构选择一篇关于ResNet的论文作为示例，例如《DeepResidualLearningforImageRecognition》（Heetal.,2015）。2.
书籍-《优化基础：理论、工具及应用（论文版）》机器学习人工智能
书籍：OptimizationEssentials:Theory,Tools,andApplications作者：FaizHamid出版：Springer编辑：陈萍萍的公主@一点人工一点智能下载：书籍下载-《优化基础：理论、工具及应用（论文版）》01书籍介绍本书探讨了运筹学和数学优化领域的最新发展和令人兴奋的挑战。它以统一且精心编排的方式呈现了以下内容：(a)现实生活中出现的新颖优化问题，并突出每
【开题报告+论文+源码】基于SpringBoot+Vue的社区团购配送系统编程毕设 spring boot 后端 java
项目背景与意义随着社会的进步和收入的提高，消费者对购物体验有了更高的要求。他们希望获得更多样化的商品选择，更加便捷的购物方式，以及更加优质的售后服务。同时，越来越多的老年人开始关注健康饮食和食品质量。他们不再满足于传统的购物方式，而是希望通过更加方便的方式来获取更加安全和健康的食品。社区团购配送系统在满足用户日常生活需求的同时，也带来了许多便利和机遇。项目介绍本课程演示的是一款基于SpringBo
[0482]基于JAVA的养老服务监控智慧管理系统的设计与实现阿鑫学长【毕设工场】 java 人工智能大数据毕业设计课程设计
毕业设计（论文）开题报告表姓名学院专业班级题目基于JAVA的养老服务监控智慧管理系统的设计与实现指导老师（一）选题的背景和意义选题背景与意义：随着全球社会老龄化的不断加剧，养老服务的信息化、智能化转型已成为必然趋势。我国作为世界上老年人口最多的国家，面临着巨大的养老压力和挑战，如何高效、科学地管理和优化养老服务资源，保障老年群体的生活质量及健康安全，是当前社会亟待解决的重要课题。基于此现实背景，设
使用Deepseek书写一篇综述论文，如何提示？学术乙方小知识经验分享
使用DeepSeek撰写综述论文时，可以通过以下提示和步骤来高效完成任务：明确研究主题与范围在开始撰写之前，首先需要明确研究主题、文献综述的时间跨度、地理范畴和文献类型。这有助于聚焦研究方向，避免偏离主题。制定详细的提示词提示词的设计是高效利用DeepSeek的关键。可以参考以下模板：研究背景与现状：请帮我梳理XXX领域的研究背景与现状，包括国内外的主要研究成果和研究热点。文献筛选与阅读：请帮我筛
代码逐行解析 | 教你在C++中使用深度学习提取特征点 3Ｄ视觉工坊 3D视觉从入门到精通 c++深度学习开发语言人工智能
点击下方卡片，关注「3D视觉工坊」公众号选择星标，干货第一时间送达扫描下方二维码，加入3D视觉技术星球，星球内汇集了众多3D视觉实战问题，以及各个模块的学习资料：最新顶会论文、书籍、源码、视频（近20门系统课程[星球成员可免费学习]）等。想要入门3D视觉、做项目、搞科研，就加入我们吧。作者：泡椒味的口香糖|来源：3DCV添加微信：dddvision
2025年毕设ssm校园二手交易平台论文+源码锦程学长--毕设程序课程设计
本系统（程序+源码）带文档lw万字以上文末可获取一份本项目的java源码和数据库参考。系统程序文件列表开题报告内容选题背景关于校园二手交易平台的研究，现有成果多集中于社会综合型平台（如闲鱼、转转）的商业模式分析，或理论层面的共享经济模型探讨，而针对高校场景特殊性（如用户密度高、交易标的额小、社交属性强）的垂直型平台研究存在明显缺口。当前高校内二手交易多依赖社群、论坛等分散渠道，存在信息不对称、交易
vue3+springboot电影院售票选座管理系统 qq_3166678367 spring boot 后端 java
目录本系统(已开发完成)->成品实现截图开发技术本系统支持的技术栈源码获取详细视频演示：文章底部获取博主联系方式！！！！本课题重点核心代码部分展示论文提纲来自指导老师帅的肯定视频演示/源码获取本系统(已开发完成)->成品实现截图开发技术关键技术实现：在Java的开发过程中，可以使用HTML、CSS、JavaScript等前端技术来实现系统的用户界面设计和交互功能。后端可以使用Java语言编写业务逻
DeepSeek + 药物研发：解决药物研发周期长、成本高-降低80%、失败率高-减少40% Debroon 医疗大模型研发 +慢病逆转人工智能深度学习
DeepSeek+药物研发：解决药物研发周期长、成本高-降低80%、失败率高-减少40%论文大纲1.WHY——研究背景与现实问题1.1研究要解决的现实问题与提出背景1.2研究所要解决的问题类别1.3正反例对比关联：和前人的工作有什么关系？3.总结归纳3.1总结收获3.2探索思考4.WHAT——核心发现或论点5.HOW——研究过程、创新与关键数据6.HOWGOOD——理论贡献与实践意义解法拆解1.1
医图论文 CVPR‘24 | 适应医学图像中泛化异常检测的视觉-语言模型小白学视觉医学图像处理论文解读语言模型人工智能计算机视觉医学图像顶会医学图像处理 CVPR 论文解读
论文信息题目：AdaptingVisual-LanguageModelsforGeneralizableAnomalyDetectioninMedicalImages适应医学图像中泛化异常检测的视觉-语言模型作者：ChaoqinHuang，AofanJiang，JinghaoFeng，YaZhang，XinchaoWang，YanfengWang源码：https://github.com/Medi
A Survey of Large Language Models大模型综述论文章节总结 WhyteHighmore 论文语言模型人工智能自然语言处理论文笔记
ASurveyofLLM人大译ASurveyofLargeLanguageModels这篇论文全面回顾了大型语言模型(LLM)的最新进展，重点关注其发展背景、关键发现和主流技术。文章主要围绕LLM的四个主要方面展开：1引言自从1950年图灵测试被提出以来，人类一直在探索机器掌握语言智能的方法。语言本质上是一种受语法规则支配的复杂、精细的人类表达系统，这使得开发能够理解和掌握语言的强大人工智能(AI
论文笔记-Contrastive Learning for Unpaired Image-to-Image Translation kingsleyluoxin 计算机视觉论文笔记深度学习 python 计算机视觉机器学习人工智能深度学习
论文信息标题：ContrastiveLearningforUnpairedImage-to-ImageTranslation作者：TaesungPark,AlexeiA.Efros,RichardZhang,Jun-YanZhu机构：UniversityofCalifornia,Berkeley;AdobeResearch代码链接https://github.com/taesungp/contra
【论文精读】SCINet-基于降采样和交互学习的时序卷积模型打酱油的葫芦娃时序预测算法时序预测 SCINet TCN
《SCINet:TimeSeriesModelingandForecastingwithSampleConvolutionandInteraction》的作者团队来自香港中文大学，发表在NeurIPS2022会议上。动机该论文的出发点是观察到时间序列数据具有独特的属性：即使在将时间序列下采样成两个子序列后，时间关系（例如数据的趋势和季节性成分）也基本上得以保留。这个观察启发了作者去设计一种新型的神
【论文精读】PatchTST-基于分块及通道独立机制的Transformer模型打酱油的葫芦娃时序预测算法时序预测 PatchTST Transformer 预训练微调表征学习
《ATIMESERIESISWORTH64WORDS:LONG-TERMFORECASTINGWITHTRANSFORMERS》的作者团队来自PrincetonUniversity和IBMResearch，发表在ICLR2023会议上。动机Transformer模型因其自注意力机制在处理序列数据方面的优势，在自然语言处理（NLP）、计算机视觉（CV）、语音等多个领域取得了巨大成功。这种机制使得模型
【Hinton论文精读】The Forward-Forward Algorithm: Some Preliminary Investigations-202212 tyhj_sf 论文研读笔记 ML理论系列人工智能深度学习 FF算法
博文导航0引言1论文摘要2反向传播有什么问题呢？3Forward-Forward算法3.1使用逐层优化函数学习多层表示4Forward-Forward算法的实验4.1反向传播baseline4.2FF算法的一个简单的无监督的例子4.3FF算法的一个简单的监督例子4.4使用FF算法来模拟感知中自上而下的效应4.5作为教师使用空间环境的预测4.6CIFAR-10实验5睡眠6FF算法与其他对比性学习技术
【深度学习遥感分割|论文解读2】UNetFormer：一种类UNet的Transformer，用于高效的遥感城市场景图像语义分割 985小水博一枚呀论文解读深度学习 transformer 人工智能网络 cnn
【深度学习遥感分割|论文解读2】UNetFormer：一种类UNet的Transformer，用于高效的遥感城市场景图像语义分割【深度学习遥感分割|论文解读2】UNetFormer：一种类UNet的Transformer，用于高效的遥感城市场景图像语义分割文章目录【深度学习遥感分割|论文解读2】UNetFormer：一种类UNet的Transformer，用于高效的遥感城市场景图像语义分割2.Re
【Image captioning-RS】论文12 Prior Knowledge-Guided Transformer for Remote Sensing Image Captioning CV视界 Image captioning学习 transformer 深度学习人工智能
1.摘要遥感图像(RSI)字幕生成旨在为遥感图像生成有意义且语法正确的句子描述。然而,相比于自然图像字幕,RSI字幕生成面临着由于RSI特性而产生的额外挑战。第一个挑战源于这些图像中存在大量物体。随着物体数量的增加,确定描述的主要焦点变得越来越困难。此外,RSI中的物体通常外观相似,进一步复杂化了准确描述的生成。为克服这些挑战,我们提出了一种基于先验知识的transformer(PKG-Trans
springboot毕设电脑销售管理系统程序+论文真纯Django毕设程序 spring boot 课程设计后端
本系统（程序+源码）带文档lw万字以上文末可获取一份本项目的java源码和数据库参考。系统程序文件列表开题报告内容研究背景随着信息技术的飞速发展和普及，电脑已经成为现代生活和工作中不可或缺的重要工具。电脑销售行业也随之迎来了前所未有的发展机遇，但同时也面临着激烈的市场竞争和不断变化的客户需求。传统的销售管理模式已难以满足当前市场的快速响应和精细化管理要求。因此，开发一套高效、便捷、全面的电脑销售管
OctoTools：一个具有复杂推理可扩展工具的智体框架三谷秋水智能体大模型机器学习人工智能语言模型机器学习
25年2月来自斯坦福大学的论文“OctoTools:AnAgenticFrameworkwithExtensibleToolsforComplexReasoning”。解决复杂的推理任务可能涉及视觉理解、域知识检索、数值计算和多步骤推理。现有方法使用外部工具增强大语言模型(LLM)，但仅限于专业领域、有限的工具类型或需要额外的训练数据。本文的OctoTools，是一个无需训练、用户友好且易于扩展的
2025年毕设ssm校园二手电瓶车交易网站论文+源码 SSM毕设程序源码JAVA 课程设计
本系统（程序+源码）带文档lw万字以上文末可获取一份本项目的java源码和数据库参考。系统程序文件列表开题报告内容选题背景关于校园二手交易平台的现有研究，多以综合类商品交易或书籍循环为主，而专门针对电瓶车这类高价值、强监管的校园二手交易研究较少。当前高校内电瓶车交易存在信息不对称、交易流程不规范、车牌管理脱节等问题，缺乏系统化的解决方案。部分高校虽尝试通过论坛或社群进行交易，但存在用户身份难核实、
Python实现自动提取目标文档的大纲（13）写python的鑫哥 Python办公自动化 python 自动提取 Word 文档大纲编号
前言本文是该专栏的第13篇，后面会持续分享Python办公自动化干货知识，记得关注。大纲是一种用于组织和呈现内容结构的工具，它通过层次化的形式展示信息的框架和重点。其通常用于规划、整理和总结文档、报告、演讲、论文或其他任何形式的写作和表达。它可以帮助作者或演讲者清晰地梳理思路，确保内容的逻辑性和连贯性，同时也便于读者或听众快速了解整体结构和重点内容。而本文，笔者也重点来讲述通过Python，如何来
python基于django/flask体育馆管理系统Django-SpringBoot-php-Node.js-flask QQ_511008285 python django flask spring boot php node.js
目录技术栈介绍具体实现截图系统设计研究方法：设计步骤设计流程核心代码部分展示研究方法详细视频演示试验方案论文大纲源码获取/详细视频演示技术栈介绍Django-SpringBoot-php-Node.js-flask本课题的研究方法和研究步骤基本合理，难度适中，本选题是学生所学专业知识的延续，符合学生专业发展方向，对于提高学生的基本知识和技能以及钻研能力有益。该学生能够在预定时间内完成该课题的设计。
7招教你掌握用DeepSeek辅助论文写作的提示词技巧学境思源AcademicIdeas 学境思源 AI写作 ChatGPT 人工智能
随着人工智能技术的快速发展，大模型（如DeepSeek、ChatGPT等）已经成为论文写作的重要辅助工具。合理运用提示词（Prompt），不仅能极大提高写作效率，还能辅助生成高质量的学术内容。今天的内容将分享如何利用DeepSeek的提示词技巧，助力论文写作。1.明确写作目标，让AI理解你的需求在使用大模型时，清晰的写作目标至关重要。一个好的提示词应当包括：写作主题、内容范围、格式要求、风格倾向等
基于Spring Boot+vue技术的导游系统设计与实现除了菜一无所有！ spring boot vue.js 后端
论文下载【免费】基于SpringBoot+vue技术的导游系统设计与实现资源-CSDN文库摘要本研究背景主要聚焦于当前旅游业信息化、智能化的发展趋势。随着移动互联网的普及和人们出行方式的多样化，导游系统作为旅游服务的重要组成部分，亟需进行技术革新以提升用户体验和服务效率。本研究旨在利用SpringBoot后端框架与Vue前端框架，构建一个功能丰富、交互友好的导游系统。研究内容主要包括系统需求分析、
毕业论文需要进行几次AIGC检测？ kexiaoya2013 人工智能 AIGC 论文阅读论文笔记
每到毕业季，许多同学都会面临论文查重的困扰。尤其是今年Deepseek的爆火，学校对论文AIGC检测也越来越严格。那么，毕业论文AIGC检测究竟需要做几次呢？一、检测次数受哪些因素影响1、学校政策部分高校提供1-2次免费检测机会，有的则要求自己检测合格后才能提交。检测前，务必提前了解所在院校的检测规则。若学校未明确，建议至少自查2次（初稿+定稿）。2、AI率波动如果首次AI率检测结果超过或接近学校
EDAS：投稿经验-word版本-问题解决 weixin_41724971 学习总结 Latex写作经验总结 SCI科研写作方法总结 word
1.字体不对，字体未嵌入问题问题：word转PDF后，总是显示有字体格式不对（忘记截图了）。办法：1.EDAS投稿PDF格式问题-CSDN博客-PDF上修改+IEEE论文检测的字体未嵌入问题TimesNewRoman,Bold,TimesNewRoman,Italicisnotembedded解决方法_打开其他人的word显示文字未嵌入-CSDN博客（必须有会员，说实话我没弄出来。如有需要这俩结合
如何在论文中添加参考文献引用（以Word2016为例）韦_恩 windows日常使用总结 office word
相信很多同学在写论文时候的引用是手动自己加的吧？这样不是不行，就是万一某个引用变了就会导致牵一发动全身的问题，所以利用word中提供给你的方式就可以灵活动态添加引用，因为这个东西并不是天天用，所以很容易忘，今天来总结一下。目录1.自定义编号2.添加引用编号3.调整编号与内容之间的空隙4.在文中添加引用5.引用顺序变更后自动调整6.总结1.自定义编号定义新编号格式。在编号格式中加上文献引用的“[]”
注意力机制+多尺度卷积一只小小的土拨鼠解构前沿：文献精读深度学习 python 人工智能 YOLO 深度学习
多尺度卷积先提供丰富的特征信息，注意力机制再从中筛选出关键信息，这样结合起来，不仅可以进一步提高模型的识别精度和效率，显著提升模型性能，还可以增强模型的可解释性。MPARN:multi-scalepathattentionresidualnetworkforfaultdiagnosisofrotatingmachines方法：论文介绍了一种用于旋转机械故障诊断的多尺度卷积神经网络结构，称为多尺度路
最新计算机专业毕设论文选题大全基于BeautifulSoup的毕业设计详细题目100套优质毕设项目分享(源码+论文)✅ 会写代码的羊毕设选题课程设计 beautifulsoup 毕业设计毕业设计题目毕设题目 python 网络爬虫
文章目录前言最新毕设选题（建议收藏起来）基于BeautifulSoup的毕业设计选题毕设作品推荐前言2025全新毕业设计项目博主介绍：✌全网粉丝10W+,CSDN全栈领域优质创作者，博客之星、掘金/华为云/阿里云等平台优质作者。技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、大数据、机器学习等设计与开发。主要内容：免费
论文阅读：Deep Stacked Hierarchical Multi-patch Network for Image Deblurring 行走的歌文献阅读图像处理计算机视觉机器学习深度学习图像去雨图像处理
这是一篇去模糊的文章，后来发现直接套用不合适，无法获取到相应的特征，遂作罢，简单记录一下。2019CVPR：DMPHN这篇文章是2019CVPR的一篇去模糊方向的文章，师兄分享的时候看了一下，后来也发现这个网络结构在很多workshop以及文章中都见过。文章：ArXiv代码：Github在去模糊领域，目前的多尺度和尺度循环模型存在一些问题：1)由粗到细方案中的去卷积/上采样操作导致运行时间昂贵;2
Spring中@Value注解，需要注意的地方无量 spring bean @Value xml
Spring 3以后,支持@Value注解的方式获取properties文件中的配置值，简化了读取配置文件的复杂操作 1、在applicationContext.xml文件(或引用文件中)中配置properties文件 <bean id="appProperty" class="org.springframework.beans.fac
mongoDB 分片开窍的石头 mongodb
mongoDB的分片。要mongos查询数据时候先查询configsvr看数据在那台shard上，configsvr上边放的是metar信息，指的是那条数据在那个片上。由此可以看出mongo在做分片的时候咱们至少要有一个configsvr,和两个以上的shard（片）信息。第一步启动两台以上的mongo服务 &nb
OVER(PARTITION BY)函数用法 0624chenhong oracle
这篇写得很好，引自 http://www.cnblogs.com/lanzi/archive/2010/10/26/1861338.html OVER(PARTITION BY)函数用法 2010年10月26日 OVER(PARTITION BY)函数介绍开窗函数 &nb
Android开发中，ADB server didn't ACK 解决方法一炮送你回车库 Android开发
首先通知：凡是安装360、豌豆荚、腾讯管家的全部卸载，然后再尝试。一直没搞明白这个问题咋出现的，但今天看到一个方法，搞定了！原来是豌豆荚占用了 5037 端口导致。参见原文章：一个豌豆荚引发的血案——关于ADB server didn't ACK的问题简单来讲，首先将Windows任务进程中的豌豆荚干掉，如果还是不行，再继续按下列步骤排查。 &nb
canvas中的像素绘制问题换个号韩国红果果 JavaScript canvas
pixl的绘制，1.如果绘制点正处于相邻像素交叉线，绘制x像素的线宽，则从交叉线分别向前向后绘制x/2个像素，如果x/2是整数，则刚好填满x个像素，如果是小数，则先把整数格填满，再去绘制剩下的小数部分，绘制时，是将小数部分的颜色用来除以一个像素的宽度，颜色会变淡。所以要用整数坐标来画的话（即绘制点正处于相邻像素交叉线时），线宽必须是2的整数倍。否则会出现不饱满的像素。 2.如果绘制点为一个像素的
编码乱码问题灵静志远 java jvm jsp 编码
1、JVM中单个字符占用的字节长度跟编码方式有关，而默认编码方式又跟平台是一一对应的或说平台决定了默认字符编码方式；2、对于单个字符：ISO-8859-1单字节编码，GBK双字节编码，UTF-8三字节编码；因此中文平台(中文平台默认字符集编码GBK)下一个中文字符占2个字节，而英文平台(英文平台默认字符集编码Cp1252(类似于ISO-8859-1))。 3、getBytes()、getByte
java 求几个月后的日期 darkranger calendar getinstance
Date plandate = planDate.toDate(); SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd"); Calendar cal = Calendar.getInstance(); cal.setTime(plandate); // 取得三个月后时间 cal.add(Calendar.M
数据库设计的三大范式（通俗易懂） aijuans 数据库复习
关系数据库中的关系必须满足一定的要求。满足不同程度要求的为不同范式。数据库的设计范式是数据库设计所需要满足的规范。只有理解数据库的设计范式，才能设计出高效率、优雅的数据库，否则可能会设计出错误的数据库. 目前，主要有六种范式：第一范式、第二范式、第三范式、BC范式、第四范式和第五范式。满足最低要求的叫第一范式，简称1NF。在第一范式基础上进一步满足一些要求的为第二范式，简称2NF。其余依此类推。
想学工作流怎么入手 atongyeye jbpm
工作流在工作中变得越来越重要，很多朋友想学工作流却不知如何入手。很多朋友习惯性的这看一点，那了解一点，既不系统，也容易半途而废。好比学武功，最好的办法是有一本武功秘籍。研究明白，则犹如打通任督二脉。系统学习工作流，很重要的一本书《JBPM工作流开发指南》。本人苦苦学习两个月，基本上可以解决大部分流程问题。整理一下学习思路，有兴趣的朋友可以参考下。 1 首先要
Context和SQLiteOpenHelper创建数据库百合不是茶 android Context创建数据库
一直以为安卓数据库的创建就是使用SQLiteOpenHelper创建,但是最近在android的一本书上看到了Context也可以创建数据库,下面我们一起分析这两种方式创建数据库的方式和区别,重点在SQLiteOpenHelper 一:SQLiteOpenHelper创建数据库: 1,SQLi
浅谈group by和distinct bijian1013 oracle 数据库 group by distinct
group by和distinct只了去重意义一样，但是group by应用范围更广泛些，如分组汇总或者从聚合函数里筛选数据等。譬如：统计每id数并且只显示数大于3 select id ,count(id) from ta
vi opertion 征客丶 mac opration vi
进入 command mode （命令行模式）按 esc 键再按 shift + 冒号注：以下命令中带 $ 【在命令行模式下进行】，不带 $ 【在非命令行模式下进行】一、文件操作 1.1、强制退出不保存 $ q! 1.2、保存 $ w 1.3、保存并退出 $ wq 1.4、刷新或重新加载已打开的文件 $ e 二、光标移动 2.1、跳到指定行数字
【Spark十四】深入Spark RDD第三部分RDD基本API bit1129 spark
对于K/V类型的RDD,如下操作是什么含义？ val rdd = sc.parallelize(List(("A",3),("C",6),("A",1),("B",5)) rdd.reduceByKey(_+_).collect reduceByKey在这里的操作，是把
java类加载机制 BlueSkator java 虚拟机
java类加载机制 1.java类加载器的树状结构引导类加载器 ^ | 扩展类加载器 ^ | 系统类加载器 java使用代理模式来完成类加载，java的类加载器也有类似于继承的关系，引导类是最顶层的加载器，它是所有类的根加载器，它负责加载java核心库。当一个类加载器接到装载类到虚拟机的请求时，通常会代理给父类加载器，若已经是根加载器了，就自己完成加载。虚拟机区分一个Cla
动态添加文本框 BreakingBad 文本框
<script> var num=1; function AddInput() { var str=""; str+="<input
读《研磨设计模式》-代码笔记-单例模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ public class Singleton { } /* * 懒汉模式。注意，getInstance如果在多线程环境中调用，需要加上synchronized，否则存在线程不安全问题 */ class LazySingleton
iOS应用打包发布常见问题 chenhbc ios iOS发布 iOS上传 iOS打包
这个月公司安排我一个人做iOS客户端开发，由于急着用，我先发布一个版本，由于第一次发布iOS应用，期间出了不少问题，记录于此。 1、使用Application Loader 发布时报错：Communication error.please use diagnostic mode to check connectivity.you need to have outbound acc
工作流复杂拓扑结构处理新思路 comsci 设计模式工作算法企业应用 OO
我们走的设计路线和国外的产品不太一样，不一样在哪里呢？国外的流程的设计思路是通过事先定义一整套规则(类似XPDL)来约束和控制流程图的复杂度(我对国外的产品了解不够多，仅仅是在有限的了解程度上面提出这样的看法)，从而避免在流程引擎中处理这些复杂的图的问题，而我们却没有通过事先定义这样的复杂的规则来约束和降低用户自定义流程图的灵活性，这样一来，在引擎和流程流转控制这一个层面就会遇到很
oracle 11g新特性Flashback data archive daizj oracle
1. 什么是flashback data archive Flashback data archive是oracle 11g中引入的一个新特性。Flashback archive是一个新的数据库对象，用于存储一个或多表的历史数据。Flashback archive是一个逻辑对象，概念上类似于表空间。实际上flashback archive可以看作是存储一个或多个表的所有事务变化的逻辑空间。
多叉树:2-3-4树 dieslrae 树
平衡树多叉树,每个节点最多有4个子节点和3个数据项,2,3,4的含义是指一个节点可能含有的子节点的个数,效率比红黑树稍差.一般不允许出现重复关键字值.2-3-4树有以下特征: 1、有一个数据项的节点总是有2个子节点(称为2-节点) 2、有两个数据项的节点总是有3个子节点(称为3-节
C语言学习七动态分配 malloc的使用 dcj3sjt126com c language malloc
/* 2013年3月15日15:16:24 malloc 就memory(内存) allocate(分配)的缩写本程序没有实际含义，只是理解使用 */ # include <stdio.h> # include <malloc.h> int main(void) { int i = 5; //分配了4个字节静态分配 int * p
Objective-C编码规范[译] dcj3sjt126com 代码规范
原文链接 : The official raywenderlich.com Objective-C style guide 原文作者 : raywenderlich.com Team 译文出自 : raywenderlich.com Objective-C编码规范译者 : Sam Lau
0.性能优化-目录 frank1234 性能优化
从今天开始笔者陆续发表一些性能测试相关的文章，主要是对自己前段时间学习的总结，由于水平有限，性能测试领域很深，本人理解的也比较浅，欢迎各位大咖批评指正。主要内容包括：一、性能测试指标吞吐量、TPS、响应时间、负载、可扩展性、PV、思考时间 http://frank1234.iteye.com/blog/2180305 二、性能测试策略生产环境相同基准测试预热等 htt
Java父类取得子类传递的泛型参数Class类型 happyqing java 泛型父类子类 Class
import java.lang.reflect.ParameterizedType; import java.lang.reflect.Type; import org.junit.Test; abstract class BaseDao<T> { public void getType() { //Class<E> clazz =
跟我学SpringMVC目录汇总贴、PDF下载、源码下载 jinnianshilongnian springMVC
----广告-------------------------------------------------------------- 网站核心商详页开发掌握Java技术，掌握并发/异步工具使用，熟悉spring、ibatis框架；掌握数据库技术，表设计和索引优化，分库分表/读写分离；了解缓存技术，熟练使用如Redis/Memcached等主流技术；了解Ngin
the HTTP rewrite module requires the PCRE library 流浪鱼 rewrite
./configure: error: the HTTP rewrite module requires the PCRE library. 模块依赖性Nginx需要依赖下面3个包 1. gzip 模块需要 zlib 库 ( 下载: http://www.zlib.net/ ) 2. rewrite 模块需要 pcre 库 ( 下载: http://www.pcre.org/ ) 3. s
第12章 Ajax（中） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Optimize query with Query Stripping in Web Intelligence blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Optimize+query+with+Query+Stripping+in+Web+Intelligence and a very straightfoward video http://www.sdn.sap.com/irj/scn/events?rid=/library/uuid/40ec3a0c-936
Java开发者写SQL时常犯的10个错误 tomcat_oracle java sql
1、不用PreparedStatements 　　有意思的是，在JDBC出现了许多年后的今天，这个错误依然出现在博客、论坛和邮件列表中，即便要记住和理解它是一件很简单的事。开发者不使用PreparedStatements的原因可能有如下几个：　　他们对PreparedStatements不了解　　他们认为使用PreparedStatements太慢了　　他们认为写Prepar
世纪互联与结盟有感阿尔萨斯
10月10日，世纪互联与（Foxcon）签约成立合资公司，有感。全球电子制造业巨头（全球500强企业）与世纪互联共同看好IDC、云计算等业务在中国的增长空间，双方迅速果断出手，在资本层面上达成合作，此举体现了全球电子制造业巨头对世纪互联IDC业务的欣赏与信任，另一方面反映出世纪互联目前良好的运营状况与广阔的发展前景。众所周知，精于电子产品制造（世界第一），对于世纪互联而言，能够与结盟

FuzzFactory：Domain-Specific Fuzzing with Waypoints

论文 FuzzFactory: Domain-Specific Fuzzing with Waypoints

你可能感兴趣的:(论文)