nedwons

搬砖：安全编程: 防止缓冲区溢出

安全编程: 防止缓冲区溢出

https://blog.csdn.net/blpluto/article/details/5861791

个人分类： C++/C笔记

本文讨论 Linux/UNIX 系统中最常见的缺陷：缓冲区溢出。本文首先解释什么是缓冲区溢出，以及它们为何如此常见和如此危险。然后讨论广泛用于解决缓冲区溢出的新 Linux 和 UNIX 方法 ―― 以及为什么这些方法还不足够。随后将展示 C/C++ 程序中防止缓冲区溢出的各种方法，同时包括静态调整大小的方法（比如标准的 C 库和 OpenBSD/strlcpy 解决方案）和动态调整大小的解决方案，以及一些将为您提供帮助的工具。最后，本文以一些关于缓冲区溢出缺陷的未来发展形势的预测来结束全文的讨论。

1988 年 11 月，许多组织不得不因为“Morris 蠕虫”而切断 Internet 连接，“Morris 蠕虫”是 23 岁的程序员 Robert Tappan Morris 编写的用于攻击 VAX 和 Sun 机器的程序。据有关方面估计，这个程序大约使得整个 Internet 的 10% 崩溃。 2001 年 7 月，另一个名为“Code Red”的蠕虫病毒最终导致了全球运行微软的 IIS Web Server 的 300,000 多台计算机受到攻击。2003 年 1 月，“Slammer”（也称为“Sapphire”）蠕虫利用 Microsoft SQL Server 2000 中的一个缺陷，使得南韩和日本的部分 Internet 崩溃，中断了芬兰的电话服务，并且使得美国航空订票系统、信用卡网络和自动出纳机运行缓慢。所有这些攻击 ―― 以及其他许多攻击，都利用了一个称做为 缓冲区溢出 的程序缺陷。

1999 年 Bugtraq（一个讨论安全缺陷的邮件列表）进行的一次非正式调查发现，三分之二的参与者认为第一号的缺陷就是缓冲区溢出（要了解相关背景，请参阅本文后面参考资料部分列出的“Buffer Overflows: Attacks and Defenses for the Vulnerability of the Decade”一文）。从 1997 年到 2002 年 3 月，CERT/CC 发出的半数安全警报都基于缓冲区缺陷。

如果希望自己的程序是安全的，您需要知道什么是缓冲区溢出，如何防止它们，可以采用哪些最新的自动化工具来防止它们（以及为什么这些工具还不足够），还有如何在您自己的程序中防止它们。

什么是缓冲区溢出？

缓冲区以前可能被定义为“包含相同数据类型的实例的一个连续计算机内存块”。在 C 和 C++ 中，缓冲区通常是使用数组和诸如 malloc() 和 new 这样的内存分配例程来实现的。极其常见的缓冲区种类是简单的字符数组。溢出是指数据被添加到分配给该缓冲区的内存块之外。

如果攻击者能够导致缓冲区溢出，那么它就能控制程序中的其他值。虽然存在许多利用缓冲区溢出的方法，不过最常见的方法还是“stack-smashing”攻击。Elias Levy (又名为 Aleph One）的一篇经典文章“Smashing the Stack for Fun and Profit”解释了 stack-smashing 攻击，Elias Levy 是 Bugtraq 邮件列表（请参阅参考资料以获得相关链接）的前任主持人。

为了理解 stack-smashing 攻击（或其他任何缓冲区攻击）是如何进行的，您需要了解一些关于计算机在机器语言级实际如何工作的知识。在类 UNIX 系统上，每个进程都可以划分为三个主要区域：文本、数据和堆栈。 文本区域包括代码和只读数据，通常不能对它执行写入操作。 数据区域同时包括静态分配的内存（比如全局和静态数据）和动态分配的内存（通常称为堆）。 堆栈区域用于允许函数/方法调用；它用于记录函数完成之后的返回位置，存储函数中使用的本地变量，向函数传递参数，以及从函数返回值。每当调用一个函数，就会使用一个新的 堆栈帧来支持该调用。了解这些之后，让我们来考察一个简单的程序。

清单 1. 一个简单的程序

void function1(int a, int b, int c) {
   char buffer1[5];
   gets(buffer1); /* DON'T DO THIS */
}
void main() {
  function(1,2,3);
}

假设使用 gcc 来编译清单 1 中的简单程序，在 X86 上的 Linux 中运行，并且紧跟在对 gets() 的调用之后中止。此时的内存内容看起来像什么样子呢？答案是它看起来类似图 1，其中展示了从左边的低位地址到右边的高位地址排序的内存布局。

图 1. 堆栈视图

内存的底部							内存的顶部
	buffer1	sfp	ret	a	b	c
<--- 增长 ---	[ ]	[ ]	[ ]	[ ]	[ ]	[ ]	...
堆栈的顶部							堆栈的底部

许多计算机处理器，包括所有 x86 处理器，都支持从高位地址向低位地址“倒”增长堆栈。因此，每当一个函数调用另一个函数，更多的数据将被添加到左边（低位地址），直至系统的堆栈空间耗尽。在这个例子中，当 main() 调用 function1() 时，它将 c 的值压入堆栈，然后压入 b 的值，最后压入 a 的值。之后它压入 return (ret) 值，这个值在 function1() 完成时告诉 function1() 返回到 main() 中的何处。它还把所谓的“已保存的帧指针（saved frame pointer，sfp）”记录到堆栈上；这并不是必须保存的内容，此处我们不需要理解它。在任何情况下， function1() 在启动以后，它会为 buffer1() 预留空间，这在图 1 中显示为具有一个低地址位置。

现在假设攻击者发送了超过 buffer1() 所能处理的数据。接下来会发生什么情况呢？当然，C 和 C++ 程序员不会自动检查这个问题，因此除非程序员明确地阻止它，否则下一个值将进入内存中的“下一个”位置。那意味着攻击者能够改写 sfp （即已保存的帧指针），然后改写 ret （返回地址）。之后，当 function1() 完成时，它将“返回”―― 不过不是返回到 main() ，而是返回到攻击者想要运行的任何代码。

通常攻击者会使用它想要运行的恶意代码来使缓冲区溢出，然后攻击者会更改返回值以指向它们已发送的恶意代码。这意味着攻击者本质上能够在一个操作中完成整个攻击！Aleph On 的文章（请参阅参考资料）详细介绍了这样的攻击代码是如何创建的。例如，将一个 ASCII 0 字符压入缓冲区通常是很困难的，而该文介绍了攻击者一般如何能够解决这个问题。

除了 smashing-stack 和更改返回地址外，还存在利用缓冲区溢出缺陷的其他途径。与改写返回地址不同，攻击者可以 smashing-stack（使堆栈上的缓冲区溢出），然后改写局部变量以利用缓冲区溢出缺陷。缓冲区根本就不必在堆栈上 ―― 它可以是堆中动态分配的内存（也称为“malloc”或“new”区域），或者在某些静态分配的内存中（比如“global”或“static”内存）。基本上，如果攻击者能够溢出缓冲区的边界，麻烦或许就会找上你了。然而，最危险的缓冲区溢出攻击就是 stack-smashing 攻击，因为如果程序对攻击者很脆弱，攻击者获得整个机器的控制权就特别容易。

为什么缓冲区溢出如此常见？

在几乎所有计算机语言中，不管是新的语言还是旧的语言，使缓冲区溢出的任何尝试通常都会被该语言本身自动检测并阻止（比如通过引发一个异常或根据需要给缓冲区添加更多空间）。但是有两种语言不是这样：C 和 C++ 语言。C 和 C++ 语言通常只是让额外的数据乱写到其余内存的任何位置，而这种情况可能被利用从而导致恐怖的结果。更糟糕的是，用 C 和 C++ 编写正确的代码来始终如一地处理缓冲区溢出则更为困难；很容易就会意外地导致缓冲区溢出。除了 C 和 C++ 使用得非常广泛外，上述这些可能都是不相关的事实；例如，Red Hat Linux 7.1 中 86% 的代码行都是用 C 或 C ++ 编写的。因此，大量的代码对这个问题都是脆弱的，因为实现语言无法保护代码避免这个问题。

在 C 和 C++ 语言本身中，这个问题是不容易解决的。该问题基于 C 语言的根本设计决定（特别是 C 语言中指针和数组的处理方式）。由于 C++ 是最兼容的 C 语言超集，它也具有相同的问题。存在一些能防止这个问题的 C/C++ 兼容版本，但是它们存在极其严重的性能问题。而且一旦改变 C 语言来防止这个问题，它就不再是 C 语言了。许多语言（比如 Java 和 C#）在语法上类似 C，但它们实际上是不同的语言，将现有 C 或 C++ 程序改为使用那些语言是一项艰巨的任务。

然而，其他语言的用户也不应该沾沾自喜。有些语言存在允许缓冲区溢出发生的“转义”子句。Ada 一般会检测和防止缓冲区溢出（即针对这样的尝试引发一个异常），但是不同的程序可能会禁用这个特性。C# 一般会检测和防止缓冲区溢出，但是它允许程序员将某些例程定义为“不安全的”，而这样的代码可能会导致缓冲区溢出。因此如果您使用那些转义机制，就需要使用 C/C++ 程序所必须使用的相同种类的保护机制。许多语言都是用 C 语言来实现的（至少部分是用 C 语言来实现的），并且用任何语言编写的所有程序本质上都依赖用 C 或 C++ 编写的库。因此，所有程序都会继承那些问题，所以了解这些问题是很重要的。

回页首

导致缓冲区溢出的常见 C 和 C++ 错误

从根本上讲，在程序将数据读入或复制到缓冲区中的任何时候，它需要在复制之前检查是否有足够的空间。能够容易看出来的异常就不可能会发生 ―― 但是程序通常会随时间而变更，从而使得不可能成为可能。

遗憾的是，C 和 C++ 附带的大量危险函数（或普遍使用的库）甚至连这点（指检查空间）也无法做到。程序对这些函数的任何使用都是一个警告信号，因为除非慎重地使用它们，否则它们就会成为程序缺陷。您不需要记住这些函数的列表；我的真正目的是说明这个问题是多么普遍。这些函数包括 strcpy(3)、strcat(3)、sprintf(3) （及其同类 vsprintf(3) ）和 gets(3) 。 scanf() 函数集（ scanf(3)、fscanf(3)、sscanf(3)、vscanf(3)、vsscanf(3) 和 vfscanf(3) ）可能会导致问题，因为使用一个没有定义最大长度的格式是很容易的（当读取不受信任的输入时，使用格式“%s”总是一个错误）。

其他危险的函数包括 realpath(3)、getopt(3)、getpass(3)、streadd(3)、strecpy(3) 和 strtrns(3) 。从理论上讲， snprintf() 应该是相对安全的 ―― 在现代 GNU/Linux 系统中的确是这样。但是非常老的 UNIX 和 Linux 系统没有实现 snprintf() 所应该实现的保护机制。

Microsoft 的库中还有在相应平台上导致同类问题的其他函数（这些函数包括 wcscpy()、_tcscpy()、_mbscpy()、wcscat()、_tcscat()、_mbscat() 和 CopyMemory() ）。注意，如果使用 Microsoft 的 MultiByteToWideChar() 函数，还存在一个常见的危险错误 ―― 该函数需要一个最大尺寸作为字符数目，但是程序员经常将该尺寸以字节计（更普遍的需要），结果导致缓冲区溢出缺陷。

另一个问题是 C 和 C++ 对整数具有非常弱的类型检查，一般不会检测操作这些整数的问题。由于它们要求程序员手工做所有的问题检测工作，因此以某种可被利用的方式不正确地操作那些整数是很容易的。特别是，当您需要跟踪缓冲区长度或读取某个内容的长度时，通常就是这种情况。但是如果使用一个有符号的值来存储这个长度值会发生什么情况呢 ―― 攻击者会使它“成为负值”，然后把该数据解释为一个实际上很大的正值吗？当数字值在不同的尺寸之间转换时，攻击者会利用这个操作吗？数值溢出可被利用吗？有时处理整数的方式会导致程序缺陷。

回页首

防止缓冲区溢出的新技术

当然，要让程序员不犯常见错误是很难的，而让程序（以及程序员）改为使用另一种语言通常更为困难。那么为何不让底层系统自动保护程序避免这些问题呢？最起码，避免 stack-smashing 攻击是一件好事，因为 stack-smashing 攻击是特别容易做到的。

一般来说，更改底层系统以避免常见的安全问题是一个极好的想法，我们在本文后面也会遇到这个主题。事实证明存在许多可用的防御措施，而一些最受欢迎的措施可分组为以下类别：

基于探测方法（canary）的防御。这包括 StackGuard（由 Immunix 所使用）、ProPolice（由 OpenBSD 所使用）和 Microsoft 的 /GS 选项。
非执行的堆栈防御。这包括 Solar Designer 的 non-exec 补丁（由 OpenWall 所使用）和 exec shield（由 Red Hat/Fedora 所使用）。
其他方法。这包括 libsafe（由 Mandrake 所使用）和堆栈分割方法。

遗憾的是，迄今所见的所有方法都具有弱点，因此它们不是万能药，但是它们会提供一些帮助。

基于探测方法的防御

研究人员 Crispen Cowan 创建了一个称为 StackGuard 的有趣方法。Stackguard 修改 C 编译器（gcc），以便将一个“探测”值插入到返回地址的前面。“探测仪”就像煤矿中的探测仪：它在某个地方出故障时发出警告。在任何函数返回之前，它执行检查以确保探测值没有改变。如果攻击者改写返回地址（作为 stack-smashing 攻击的一部分），探测仪的值或许就会改变，系统内就会相应地中止。这是一种有用的方法，不过要注意这种方法无法防止缓冲区溢出改写其他值（攻击者仍然能够利用这些值来攻击系统）。人们也曾扩展这种方法来保护其他值（比如堆上的值）。Stackguard（以及其他防御措施）由 Immunix 所使用。

IBM 的 stack-smashing 保护程序（ssp，起初名为 ProPolice）是 StackGuard 的方法的一种变化形式。像 StackGuard 一样，ssp 使用一个修改过的编译器在函数调用中插入一个探测仪以检测堆栈溢出。然而，它给这种基本的思路添加了一些有趣的变化。它对存储局部变量的位置进行重新排序，并复制函数参数中的指针，以便它们也在任何数组之前。这样增强了ssp 的保护能力；它意味着缓冲区溢出不会修改指针值（否则能够控制指针的攻击者就能使用指针来控制程序保存数据的位置）。默认情况下，它不会检测所有函数，而只是检测确实需要保护的函数（主要是使用字符数组的函数）。从理论上讲，这样会稍微削弱保护能力，但是这种默认行为改进了性能，同时仍然能够防止大多数问题。考虑到实用的因素，它们以独立于体系结构的方式使用 gcc 来实现它们的方法，从而使其更易于运用。从 2003 年 5 月的发布版本开始，广受赞誉的 OpenBSD（它重点关注安全性）在他们的整个发行套件中使用了 ssp（也称为 ProPolice）。

Microsoft 基于 StackGuard 的成果，添加了一个编译器标记（/GS）来实现其 C 编译器中的探测仪。

非执行的堆栈防御

另一种方法首先使得在堆栈上执行代码变得不可能。遗憾的是，x86 处理器（最常见的处理器）的内存保护机制无法容易地支持这点；通常，如果一个内存页是可读的，它就是可执行的。一个名叫 Solar Designer 的开发人员想出了一种内核和处理器机制的聪明组合，为 Linux 内核创建了一个“非执行的堆栈补丁”；有了这个补丁，堆栈上的程序就不再能够像通常的那样在 x86 上运行。事实证明在有些情况下，可执行程序需要在堆栈上；这包括信号处理和跳板代码（trampoline）处理。trampoline 是有时由编译器（比如 GNAT Ada 编译器）生成的奇妙结构，用以支持像嵌套子例程之类的结构。Solar Designer 还解决了如何在防止攻击的同时使这些特殊情况不受影响的问题。

Linux 中实现这个目的的最初补丁在 1998 年被 Linus Torvalds 拒绝，这是因为一个有趣的原因。即使不能将代码放到堆栈上，攻击者也可以利用缓冲区溢出来使程序“返回”某个现有的子例程（比如 C 库中的某个子例程），从而进行攻击。简而言之，仅只是拥有非可执行的堆栈是不足够的。

一段时间之后，人们又想出了一种防止该问题的新思路：将所有可执行代码转移到一个称为“ASCII 保护（ASCII armor）”区域的内存区。要理解这是如何工作的，就必须知道攻击者通常不能使用一般的缓冲区溢出攻击来插入 ASCII NUL 字符（0)这个事实。这意味着攻击者会发现，要使一个程序返回包含 0 的地址是很困难的。由于这个事实，将所有可执行代码转移到包含 0 的地址就会使得攻击该程序困难多了。

具有这个属性的最大连续内存范围是从 0 到 0x01010100 的一组内存地址，因此它们就被命名为 ASCII 保护区域（还有具有此属性的其他地址，但它们是分散的）。与非可执行的堆栈相结合，这种方法就相当有价值了：非可执行的堆栈阻止攻击者发送可执行代码，而 ASCII 保护内存使得攻击者难于通过利用现有代码来绕过非可执行堆栈。这样将保护程序代码避免堆栈、缓冲区和函数指针溢出，而且全都不需重新编译。

然而，ASCII 保护内存并不适用于所有程序；大程序也许无法装入 ASCII 保护内存区域（因此这种保护是不完美的），而且有时攻击者能够将 0 插入目的地址。此外，有些实现不支持跳板代码，因此可能必须对需要这种保护的程序禁用该特性。Red Hat 的 Ingo Molnar 在他的“exec-shield”补丁中实现了这种思想，该补丁由 Fedora 核心（可从 Red Hat 获得它的免费版本）所使用。最新版本的 OpenWall GNU/Linux (OWL)使用了 Solar Designer 提供的这种方法的实现（请参阅参考资料以获得指向这些版本的链接）。

其他方法

还有其他许多方法。一种方法就是使标准库对攻击更具抵抗力。Lucent Technologies 开发了 Libsafe，这是多个标准 C 库函数的包装，也就是像 strcpy() 这样已知的对 stack-smashing 攻击很脆弱的函数。Libsafe 是在 LGPL 下授予许可证的开放源代码软件。那些函数的 libsafe 版本执行相关的检查，确保数组改写不会超出堆栈桢。然而，这种方法仅保护那些特定的函数，而不是从总体上防止堆栈溢出缺陷，并且它仅保护堆栈，而不保护堆栈中的局部变量。它们的最初实现使用了 LD_PRELOAD ，而这可能与其他程序产生冲突。Linux 的 Mandrake 发行套件（从 7.1 版开始）包括了 libsafe。

另一种方法称为“分割控制和数据堆栈”―― 基本的思路是将堆栈分割为两个堆栈，一个用于存储控制信息（比如“返回”地址），另一个用于控制其他所有数据。Xu et al. 在 gcc 中实现了这种方法，StackShield 在汇编程序中实现了这种方法。这样使得操纵返回地址困难多了，但它不会阻止改变调用函数的数据的缓冲区溢出攻击。

事实上还有其他方法，包括随机化可执行程序的位置；Crispen 的“PointGuard”将这种探测仪思想引申到了堆中，等等。如何保护当今的计算机现在已成了一项活跃的研究任务。

回页首

一般保护是不足够的

如此多不同的方法意味着什么呢？对用户来说，好的一面在于大量创新的方法正在试验之中；长期看来，这种“竞争”会更容易看出哪种方法最好。而且，这种多样性还使得攻击者躲避所有这些方法更加困难。然而，这种多样性也意味着开发人员需要避免编写会干扰其中任何一种方法的代码。这在实践上是很容易的；只要不编写对堆栈桢执行低级操作或对堆栈的布局作假设的代码就行了。即使不存在这些方法，这也是一个很好的建议。

操作系统供应商需要参与进来就相当明显了：至少挑选一种方法，并使用它。缓冲区溢出是第一号的问题，这些方法中最好的方法通常能够减轻发行套件中几乎半数已知缺陷的影响。可以证明，不管是基于探测仪的方法更好，还是基于非可执行堆栈的方法更好，它们都具有各自的优点。可以将它们结合起来使用，但是少数方法不支持这样使用，因为附加的性能损失使得这样做不值得。我并没有其他意思，至少就这些方法本身而言是这样；libsafe 和分割控制及数据堆栈的方法在它们所提供的保护方面都具有局限性。当然，最糟糕的解决办法就是根本不对这个第一号的缺陷提供保护。还没有实现一种方法的软件供应商需要立即计划这样做。从 2004 年开始，用户应该开始避免使用这样的操作系统，即它们至少没有对缓冲区溢出提供某种自动保护机制。

然而，没有哪种方法允许开发人员忽略缓冲区溢出。所有这些方法都能够被攻击者破坏。攻击者也许能够通过改变函数中其他数据的值来利用缓冲区溢出；没有哪种方法能够防止这点。如果能够插入某些难于创建的值（比如 NUL 字符），那么这其中的许多方法都能被攻击者绕开；随着多媒体和压缩数据变得更加普遍，攻击者绕开这些方法就更容易了。从根本上讲，所有这些方法都能减轻从程序接管攻击到拒绝服务攻击的缓冲区溢出攻击所带来的破坏。遗憾的是，随着计算机系统在更多关键场合的使用，即使拒绝服务通常也是不可接受的。因而，尽管发行套件应该至少包括一种适当的防御方法，并且开发人员应该使用（而不是反对）那些方法，但是开发人员仍然需要最初就编写无缺陷的软件。

回页首

C/C++ 解决方案

针对缓冲区溢出的一种简单解决办法就是转为使用能够防止缓冲区溢出的语言。毕竟，除了 C 和 C++ 外，几乎每种高级语言都具有有效防止缓冲区溢出的内置机制。但是许多开发人员因为种种原因还是选择使用 C 和 C++。那么您能做什么呢？

事实证明存在许多防止缓冲区溢出的不同技术，但它们都可划分为以下两种方法：静态分配的缓冲区和动态分配的缓冲区。首先，我们将讲述这两种方法分别是什么。然后，我们将讨论静态方法的两个例子（标准 C strncpy/strncat 和 OpenBSD 的 strlcpy/strlcat ），接着讨论动态方法的两个例子（SafeStr 和 C++ 的 std::string ）。

回页首

重要选择：静态和动态分配的缓冲区

缓冲区具有有限的空间。因此实际上存在处理缓冲区空间不足的两种可能方式。

“静态分配的缓冲区”方法：也就是当缓冲区用完时，您抱怨并拒绝为缓冲区增加任何空间。
“动态分配的缓冲区”方法：也就是当缓冲区用完时，动态地将缓冲区大小调整到更大的尺寸，直至用完所有内存。

静态方法具有一些缺点。事实上，静态方法有时可能会带来不同的缺陷。静态方法基本上就是丢弃“过多的”数据。如果程序无论如何还是使用了结果数据，那么攻击者会尝试填满缓冲区，以便在数据被截断时使用他希望的任何内容来填充缓冲区。如果使用静态方法，应该确保攻击者能够做的最糟糕的事情不会使得预先的假设无效，而且检查最终结果也是一个好主意。

动态方法具有许多优点：它们能够向上适用于更大的问题（而不是带来任意的限制），而且它们没有导致安全问题的字符数组截断问题。但它们也具有自身的问题：在接受任意大小的数据时，可能会遇到内存不足的情况 ―― 而这在输入时也许不会发生。任何内存分配都可能会失败，而编写真正很好地处理该问题的 C 或 C++ 程序是很困难的。甚至在内存真正用完之前，也可能导致计算机变得太忙而不可用。简而言之，动态方法通常使得攻击者发起拒绝服务攻击变得更加容易。因此仍然需要限制输入。此外，必须小心设计程序来处理任意位置的内存耗尽问题，而这不是一件容易的事情。

标准 C 库方法

最简单的方法之一是简单地使用那些设计用于防止缓冲区溢出的标准 C 库函数（即使在使用 C ++，这也是可行的），特别是 strncpy(3) 和 strncat(3) 。这些标准 C 库函数一般支持静态分配方法，也就是在数据无法装入缓冲区时丢弃它。这种方法的最大优点在于，您可以肯定这些函数在任何机器上都可用，并且任何 C/C++ 开发人员都会了解它们。许许多多的程序都是以这种方式编写的，并且确实可行。

遗憾的是，要正确地做到这点却是令人吃惊的困难。下面是其中的一些问题：

strncpy(3) 和 strncat(3) 都要求您给出 剩余的空间，而不是给出缓冲区的总大小。这之所以会成为问题是因为，虽然缓冲区的大小一经分配就不会变化，但是缓冲区中剩余的空间量会在每次添加或删除数据时发生变化。这意味着程序员必须始终跟踪或重新计算剩余的空间。这种跟踪或重新计算很容易出错，而任何错误都可能给缓冲区攻击打开方便之门。
在发生了溢出（和数据丢失）时，两个函数都不会给出简单的报告，因此如果要检测缓冲区溢出，程序员就必须做更多的工作。
如果源字符串至少和目标一样长，那么函数 strncpy(3) 还不会使用 NUL 来结束字符串；这可能会在以后导致严重破坏。因而，在运行 strncpy(3) 之后，您通常需要重新结束目标字符串。
函数 strncpy(3) 还可以用来仅把源字符串的 一部分复制到目标中。在执行这个操作时，要复制的字符的数目通常是基于源字符串的相关信息来计算的。这样的危险之处在于，如果忘了考虑可用的缓冲区空间，那么 即使在使用 strncpy(3) 时也可能会留下缓冲区攻击隐患。这个函数也不会复制 NUL 字符，这可能也是一个问题。
可以通过一种防止缓冲区溢出的方式使用 sprintf() ，但是意外地留下缓冲区溢出攻击隐患是非常容易的。 sprintf() 函数使用一个控制字符串来指定输出格式，该控制字符串通常包括“ %s ”（字符串输出）。如果指定字符串输出的精确指定符（比如 %.10s ），那么您就能够通过指定输出的最大长度来防止缓冲区溢出。甚至可以使用“ * ”作为精确指定符（比如“ %.*s ”），这样您就可以传入一个最大长度值，而不是在控制字符串中嵌入最大长度值。这样的问题在于，很容易就会不正确地使用 sprintf() 。一个“字段宽度”（比如“ %10s ”）仅指定了最小长度 ―― 而不是最大长度。“字段宽度”指定符会留下缓冲区溢出隐患，而字段宽度和精确宽度指定符看起来几乎完全相同 ―― 唯一的区别在于安全的版本具有一个点号。另一个问题在于，精确字段仅指定一个参数的最大长度，但是缓冲区需要针对组合起来的数据的最大尺寸调整大小。
scanf() 系列函数具有一个最大宽度值，至少 IEEE Standard 1003-2001 清楚地规定这些函数一定不能读取超过最大宽度的数据。遗憾的是，并非所有规范都清楚地规定了这一点，我们不清楚是否所有实现都正确地实现了这些限制（这在如今的 GNU/Linux 系统上就不能正确地工作）。如果您依赖它，那么在安装或初始化期间运行小测试来确保它能正确工作，这样做将是明智的。

strncpy(3) 还存在一个恼人的性能问题。从理论上讲， strncpy(3) 是 strcpy(3) 的安全替代者，但是 strncpy(3) 还会在源字符串结束时使用 NUL 来填充整个目标空间。这是很奇怪的，因为实际上并不存在这样做的很好理由，但是它从一开始就是这样，并且有些程序还依赖这个特性。这意味着从 strcpy(3) 切换到 strncpy(3) 会降低性能 ―― 这在如今的计算机上通常不是一个严重的问题，但它仍然是有害的。

那么可以使用标准 C 库的例程来防止缓冲区溢出吗？是的，不过并不容易。如果计划沿着这条路线走，您需要理解上述的所有要点。或者，您可以使用下面几节将要讲述的一种替代方法。

OpenBSD 的 strlcpy/strlcat

OpenBSD 开发人员开发了一种不同的静态方法，这种方法基于他们开发的新函数 strlcpy(3) 和 strlcat(3) 。这些函数执行字符串复制和拼接，不过更不容易出错。这些函数的原型如下：

size_t strlcpy (char *dst, const char *src, size_t size); 
size_t strlcat (char *dst, const char *src, size_t size);

strlcpy() 函数把以 NUL 结尾的字符串从“ src ”复制到“ dst ”（最多 size-1 个字符）。 strlcat() 函数把以 NUL 结尾的字符串 src 附加到 dst 的结尾（但是目标中的字符数目将不超过 size-1)。

初看起来，它们的原型和标准 C 库函数并没有多大区别。但是事实上，它们之间存在一些显著区别。这些函数都接受目标的总大小（而不是剩余空间）作为参数。这意味着您不必连续地重新计算空间大小，而这是一项易于出错的任务。此外，只要目标的大小至少为 1，两个函数都保证目标将以 NUL 结尾（您不能将任何内容放入零长度的缓冲区）。如果没有发生缓冲区溢出，返回值始终是组合字符串的长度；这使得检测缓冲区溢出真正变得容易了。

遗憾的是， strlcpy(3) 和 strlcat(3) 并不是在类 UNIX 系统的标准库中普遍可用。OpenBSD 和 Solaris 将它们内置在中，但是 GNU/Linux 系统却不是这样。这并不是一件那么困难的事情；因为当底层系统没有提供它们时，您甚至可以将一些小函数直接包括在自己的程序源代码中。

SafeStr

Messier 和 Viega 开发了“SafeStr”库，这是一种用于 C 的动态方法，它自动根据需要调整字符串的大小。使用 malloc() 实现所使用的相同技巧，Safestr 字符串很容易转换为常规的 C“ char * ”字符串：safestr 在传递指针“之前”的地址处存储重要信息。这种技术的优点在于，在现有程序中使用 SafeStr 将会很容易。SafeStr 还支持“只读”和“受信任”的字符串，这也可能是有用的。这种方法的一个问题在于它需要 XXL（这是一个给 C 添加异常处理和资源管理支持的库），因此您实际上要仅为了处理字符串而引入一个重要的库。Safestr 是在开放源代码的 BSD 风格的许可证下发布的。

C++ std::string

针对 C++ 用户的另一种解决方案是标准的 std::string 类，这是一种动态的方法（缓冲区根据需要而增长）。它几乎是不需要伤脑筋的，因为 C++ 语言直接支持该类，因此不需要做特殊的工作就可使用它，并且其他库也可能会使用它。就其本身而言， std::string 通常会防止缓冲区溢出，但是如果通过它提取一个普通 C 字符串（比如使用 data() 或 c_str() ），那么上面讨论的所有问题都会重新出现。还要记住 data() 并不总是返回以 NUL 结尾的字符串。

由于种种历史原因，许多 C++ 库和预先存在的程序都创建了它们自己的字符串类。这可能使得 std::string 更难于使用，并且在使用那些库或修改那些程序时效率很低，因为不同的字符串类型将不得不连续地来回转换。并非其他所有那些字符串类都会防止缓冲区溢出，并且如果它们对 C 不受保护的 char* 类型执行自动转换，那么缓冲区溢出缺陷很容易引入那些类中。

回页首

工具

有许多工具可以在缓冲区溢出缺陷导致问题之前帮助检测它们。例如，像我的 Flawfinder 和 Viega 的 RATS 这样的工具能够搜索源代码，识别出可能被不正确地使用的函数（基于它们的参数来归类）。这些工具的一个缺点在于，它们不是完美的 ―― 它们会遗漏一些缓冲区溢出缺陷，并且它们会识别出一些实际上不是问题的“问题”。但是使用它们仍然是值得的，因为与手工查找相比，它们将帮助您在短得多的时间内识别出代码中的潜在问题。

回页首

结束语

借助知识、谨慎和工具，C 和 C++ 中的缓冲区溢出缺陷是可以防止的。不过做起来并没有那么容易，特别是在 C 中。如果使用 C 和 C++ 来编写安全的程序，您需要真正理解缓冲区溢出和如何防止它们。

一种替代方法是使用另一种编程语言，因为如今的几乎其他所有语言都能防止缓冲区溢出。但是使用另一种语言并不会消除所有问题。许多语言依赖 C 库，并且许多语言还具有关闭该保护特性的机制（为速度而牺牲安全性）。但是即便如此，不管您使用哪种语言，开发人员都可能会犯其他许多错误，从而带来引入缺陷。

不管您做什么，开发没有错误的程序都是极其困难的，即使最仔细的复查通常也会遗漏其中一些错误。开发安全程序的最重要方法之一是 最小化特权。那意味着程序的各个部分应该具有它们需要的唯一特权，一点也不能多。这样，即使程序具有缺陷（谁能无过？），也可能会避免将该缺陷转化为安全事故。但是在实践中如何做到这点呢？下一篇文章将研究如何实际地最小化 Linux/UNIX 系统中的特权，以便您能防止自己不可避免的错误所带来安全隐患。

参考资料

您可以参阅本文在 developerWorks 全球站点上的英文原文.
阅读 developerWorks 上 David 的 安全编程 专栏系列中的所有文章连载。
David 的书 Secure Programming for Linux and Unix HOWTO 详细介绍了如何开发安全的软件。
“ The What, Why, and How of the 1988 Internet Worm”更详细地介绍了 1988 年的 Morris 蠕虫事件。
C. Ian Kyer、Warren J. Sheffer 和 Bruce Salvatore、Fasken Martineau DuMoulin LLP 所著的 New IT Concerns in the Age of Anti-Terrorism: How the Canadian Government has Reacted and How Business Should React 指出，Morris 蠕虫使得当时大约有 88,000 台计算机的 Internet 中的 10% 的计算机崩溃。
Steve Burnett and Stephen Paine 所著的 RSA Security's Official Guide to Cryptography （McGraw-Hill，2001 年）在第 11 章（“Doing it Wrong: The break-ins”）中指出，Morris 蠕虫使得大约 10% 的 Internet 崩溃，该书还对安全故障提出了其他有趣的评论。
CERT(R) Advisory CA-2001-19 "Code Red" Worm Exploiting Buffer Overflow In IIS Indexing Service DLL更详细地介绍了 Code Red 病毒。
“ Frontline: Cyber War!: The Warnings?”总结了各种攻击及其已知的影响，包括 Code Red 和 Slammer。
Aleph One (Elias Levy) 撰写的 Smashing The Stack For Fun And Profit一文（ Phrack Magazine，1996 年 11 月 8 日，第 49 期第 14 篇文章）阐述了 stack-smashing 攻击是如何进行的。在该文刊出之前许多年就已经在发生 stack-smashing 攻击，但是该文很好地描述了这些攻击。
David 的文章“ More than a Gigabuck: Estimating GNU/Linux's Size”研究了 Red Hat Linux 7.1 的源代码。结果发现这个发行套件包括 3 千多万个实际源代码行（source lines of code，SLOC），其中 86% 都是用 C 或者 C++ 编写的。该文还发现，如果采用美国的传统专有手段，开发这个 Linux 发行套件将需要 10 亿美元和 8,000 个人年的成本（以 2000 年的美元币值计）。
Crispin Cowan、Perry Wagle、Calton Pu、Steve Beattie 和 Jonathan Walpole 撰写的 Buffer Overflows: Attacks and Defenses for the Vulnerability of the Decade 一文讨论了防止 stack-smashing 攻击的 Stackguard 方法；该 Web 站点还包含 Cowan 用于防止攻击的其他方法的参考资料。该文包括 Bugtraq 1999 年非正式调查的摘要。
IBM 的 stack-smashing protector (ssp，又名为 ProPolice)Web 站点提供了关于 ssp 的更多信息。ssp 由 OpenBSD 所使用。
“ Linux kernel patch from the Openwall Project”讨论了 Solar Designer 的当前 Linux 内核补丁（包括非可执行的堆栈组件）。
“ Linux: Exec Shield Overflow Protection” 讨论了 Ingo Molnar 的 exec-shield 方法。
OpenWall GNU/Linux (OWL)使用了 Solar Designer 的非可执行堆栈补丁版本，而 Red Hat Fedora则使用了 exec shield ―― 两种选择都可以实现非可执行的堆栈（大多数时候）。
Libsafe 是一个用于保护某些标准 C 函数避免 stack-smashing 攻击的库。Libsafe 已整合到较新版本的 Mandrake Linux发行套件中。
Messier 和 Viega 编写的安全 C 字符串（Safe C String，SafeStr）库是一个有趣的库，它提供简单和安全的 C 字符串处理。
XXL 库是一个用于 C 的线程安全的异常处理和和资源管理库。它在 BSD 许可证下可用。
Flawfinder 项目主页提供 Flawfinder，这是一个在 GPL 下授予许可证的工具，用于查找 C 和 C++ 程序中的问题。
John Viega 的 粗略安全审核工具（或称为 RATS）是一个免费的开放源代码工具，用于审核代码和应用程序。
O'Reilly & Associates 正在以 安全编程技巧 为题，出版 Gene Spafford、Simson Garfinkel 和 Alan Schwartz 所著的 Practical UNIX & Internet Security, 3rd Edition中的系列文章摘选。
“ 自我管理数据缓冲区内存”（ developerWorks，2004 年 1 月）讲述了如何在 C 代码中仅当实际数据变得可用时才分配内存 ―― 在恰当地使用时，这种方法最大限度地降低了缓冲区溢出的可能。
在 developerWorks Linux 专区可以找到为 Linux 开发人员准备的更多参考资料。
在 Developer Bookstore 的 Linux 专区可以找到各种有关 Linux 的图书。

关于作者


		David A. Wheeler 是计算机安全方面的专家，他长期致力于改进大型和高风险软件系统的开发技术。Wheeler 先生是 Secure Programming for Linux and UNIX HOWTO 一书的作者，并且是一位 Common Criteria 的验证者。Wheeler 先生还编写过文章“ Why Open Source Software/Free Software? Look at the Numbers!” 和 Springer-Verlag 出版的图书 Ada95: The Lovelace Tutorial，他还是由 IEEE 出版的 Software Inspection: An Industry Best Practice一书的合著者和首席编辑。本文介绍了作者的看法，不一定代表 Institute for Defense Analyses 的立场。可以通过 dwheelerNOSPAM@dwheeler.com与 David 联系。

原文出处：http://www.ibm.com/developerworks/cn/linux/l-sp/part4/#resources

你可能感兴趣的:(c,c++)

清华DeepSeek：执手札利刃，破AI雾障，开深度进阶先河 2501_90771553 pdf
「清华北大-Deepseek使用手册」链接：https://pan.quark.cn/s/98782f7d61dc「清华大学Deepseek整理）1－6版本链接：https://pan.quark.cn/s/72194e32428a资源链接：https://pan.quark.cn/s/3d4088555ca0资源链接：https://pan.quark.cn/s/df8ce3ea6f4e「Dee
2024年最新PyTorch深度学习项目实战100例数据集_python 深度学习项目演练 2401_84585440 程序员深度学习 python pytorch
前言最近很多订阅了《PyTorch深度学习项目实战100例》的用户私信咨询有些数据集下载不了以及一些文章中没有给出数据集链接，为了解决这个问题，专门开设了本篇文章，提供数据集下载链接，打包100例的所有数据集。本专栏适用人群：深度学习初学者，刚刚接触PyTorch的用户群体，专栏将具体讲解如何快速搭建深度学习模型用自己的数据集实现深度学习小项目，快速让新手小白能够对基于深度学习方法有个基本的框架认
【全网超详细】常用的 Windows CMD（命令提示符）指令合集 Wit's blog c++python pyqt scrapy scikit-learn dash scipy
以下整理了一份【全网超详细】常用的WindowsCMD（命令提示符）指令合集，并对其功能、常见用法及示例进行了分类与说明。希望能帮助你在日常或专业环境下快速定位和使用所需命令，提高工作与学习效率。为方便查阅，本篇会按照文件管理类、系统信息与网络类、进程与服务类、磁盘与系统维护类等主题进行梳理，每条命令配有简单示例及常见参数介绍。一、文件管理类指令1.dir功能：列出指定目录下的文件与子目录信息。常
C++类和对象：匿名对象及连续构造拷贝编译器的优化有梦想的电信狗《C++语法精粹》——c++c语言开发语言 ide visualstudio 算法
匿名对象和连续构造和拷贝时编译器的优化github地址前言匿名对象：临时对象的妙用与优化1.定义2.核心特性解析2.1生命周期管理2.2创建方式对比2.3匿名对象的引用特性2.4匿名对象自动调用构造函数和析构函数。3.匿名对象核心特性总结1.本质特征2.典型应用场景3.与有名对象对比连续构造和拷贝时编译器的优化1️⃣何时会发生连续构造和拷贝？2️⃣编译器的优化技术：拷贝省略（CopyElision
C++ 关于基于范围的for循环(C++11) 语法详解 921正在学习 C/C++/数据结构笔记 c++开发语言
范围for的语法在C++98中如果要遍历一个数组voidTestFor(){intarray[]={1,2,3,4,5};for(inti=0;i
关于使用Java语言编写打地鼠游戏倾听一世，繁花盛开 Java语言打地鼠游戏开发语言 eclipse spring
用Java语言书写打地鼠游戏关于游戏的介绍《打地鼠游戏》Java代码的实现PlayMouse.javaStartGame.javaMusicPlay.javaMusicPlayTest.java游戏所需图片运行效果结言关于游戏的介绍打地鼠游戏是一款非常受欢迎的敏捷类游戏，它的基本规则简单易懂，同时又充满了挑战性和趣味性。在游戏中，玩家通常需要在一个方形区域内，面对多个地洞，这些地洞中会不定时地冒出
深入C语言：指针与数组的经典笔试题剖析 lili-felicity C语言编程启航算法
1.sizeof和strlen的对比1.1sizeofsizeof是C语言中的一个操作符，用于计算变量或数据类型所占内存空间的大小，单位是字节。它不关心内存中存储的具体数据内容，只关注内存空间的大小。#includeintmain(){inta=10;printf("%d\n",sizeof(a));//输出：4（int类型通常占4个字节）printf("%d\n",sizeofa);//输出：4
Lab17_ Blind SQL injection with out-of-band data exfiltration 远川_Horizon web安全 sql
文章目录前言：进入实验室构造payload前言：实验室标题为：带外数据泄露的SQL盲注简介：本实验包含一个SQL盲目注入漏洞。应用程序使用跟踪Cookie进行分析，并执行包含提交的Cookie值的SQL查询。SQL查询是异步执行的，对应用程序的响应没有影响。但是，您可以触发与外部域的带外交互。该数据库包含一个名为users的表，其中的列名为username和password。您需要利用SQL盲目注
Apache Kafka 在生产环境中的管理与优化：从理论到实践 Echo_Wish 运维探秘让你快速入坑运维 apache kafka 分布式
ApacheKafka在生产环境中的管理与优化：从理论到实践在当今这个数据驱动的时代，ApacheKafka已经成为企业流处理和实时数据管道的核心工具。作为一名运维工程师，确保Kafka在生产环境中的高效运行不仅是挑战，更是体现专业能力的绝佳舞台。那么，如何管理并优化Kafka集群，提升其在复杂生产环境下的表现呢？接下来，我将通过经验总结和代码示例，带你逐步了解生产环境下Kafka的管理与优化。一
PyTorch 学习路线 gorgor在码农 #python入门基础 python pytorch
学习PyTorch需要结合理论理解和实践编码，逐步掌握其核心功能和实际应用。以下是分阶段的学习路径和资源推荐，适合从入门到进阶：1.基础知识准备前提条件Python基础：熟悉Python语法（变量、函数、类、模块等）。数学基础：了解线性代数、微积分、概率论（深度学习的基础）。机器学习基础：理解神经网络、损失函数、优化器（如梯度下降）等概念。学习资源Python入门：Python官方教程机器学习基础
Manus：全球首款通用型 Agent 产品，智能体时代大幕开启 zhz5214 AI 人工智能 ai AI编程 AI写作
Manus，这款由Monica推出的前沿AI产品，凭借独特的创新设计与卓越性能，即将在智能领域引发一场技术变革。流客科技，作为科技领域持续探索创新的品牌，始终关注此类前沿技术突破，深信这样的创新产品将有力推动行业发展。Manus旨在应对复杂多变的任务场景。无论是深入的市场调研、高效精准的文件处理、精心规划的旅行安排，还是专业细致的数据分析，它都展现出强大实力。自主任务规划与执行：Manus能够将复
查看Linux服务器的相关配置信息听说唐僧不吃肉 Linux 服务器配置信息
一、总结1、查看cpu信息cat/etc/cpuinfo针对cpu数，来作出以下总结：#总核数=物理CPU个数X每颗物理CPU的核数#总逻辑CPU数=物理CPU个数X每颗物理CPU的核数X超线程数#1、查看物理CPU个数cat/proc/cpuinfo|grep"physicalid"|sort|uniq|wc
Mistral 发布 Mistral OCR，号称「世界上最好的 OCR 模型」自不量力的A同学 ocr
Mistral发布的MistralOCR号称“世界上最好的OCR模型”，以下是对它的详细介绍：产品概述MistralOCR是一种光学字符识别API，以图像和PDF作为输入，可从有序交错的文本和图像中提取内容，能理解文档的每个元素，包括媒体、文本、表格、公式等，可与RAG系统结合，处理多模式文档。核心优势顶尖的复杂文档理解能力：可精准识别科学论文、技术文献中的图表、公式（含LaTeX）、表格及混合排
js操作数组常用的方法 weixin_46541579 javascript 前端 vue.js
在前端开发中，操作数组是常见的操作。这里列举下在开发中常用的一些方法。正文开始concat拼接数组constarr1=[1,2,3];constarr2=['q','w','e']constarr3=arr1.concat(arr2);console.log('arr3',arr3);//打印结果[1,2,3,'q','w','e']join数组转成字符串//这里使用上面声明的arr3consti
python机试1：读取和输出数据大多_C python 华为od 开发语言
读取和输出数据在LeetCode和机试中也是很重要的基础。你需要掌握文件读取、输入处理、输出优化，才能应对不同类型的题目和考试环境。以下是详细的知识点：1.标准输入与输出✅Python标准输入input()机试中，很多题目要求从标准输入stdin读取数据，通常使用：n=int(input())#读取一个整数s=input().strip()#读取一行字符串arr=list(map(int,inpu
【雅思博客06】Daily Life whale fall 雅思考研
对话A:Honey,thehouseissuchamess!Ineedyoutohelpmetidyupabit.Mybossandherhusbandarecomingoverfordinner,andthehouseneedstobespotless!B:I’minthemiddleofsomethingrightnow.I’llbethereinasecond.A:Thiscan’twait
如何查看华为服务器配置信息,华为服务器查看配置 Zcc四月如何查看华为服务器配置信息
华为服务器查看配置内容精选换一换网站的访问与云服务器的网络配置、端口通信、防火墙配置、安全组配置等多个环节相关联。任意一个环节出现问题，都会导致网站无法访问。本节操作介绍网站无法访问时的排查思路。关于网站无法访问排查思路的操作视频请点击：https://bbs.huaweicloud.com/videos/103592如果打开网站有报错提示信息，首先应该根据报错提示信息在华为云上安装完成后输入公网
系统服务器一般都要求冗余配置,服务器冗余配置白药葫芦系统服务器一般都要求冗余配置
服务器冗余配置内容精选换一换迁移前，若选择迁移到已有服务器，请做以下准备工作：需配置目的端服务器所在VPC安全组，如果是Windows系统需要开放TCP的8899端口、8900端口和22端口；如果是Linux系统，块级迁移开放8900端口和22端口，文件级迁移开放22端口。请参见如何配置目的端服务器安全组规则？配置目的端服务器VPC安全组。迁移过程中禁止操作目的端弹当目的端设置错误或因业务需求需要
Manus：全球首款通用AI Agent的探索与挑战搬砖码农SmallNNN AI工具人工智能 AI工具
一、Manus简介Manus是由中国初创公司Monica.im开发的一款通用型AIAgent产品。它以“知识与行动的结合”为核心理念，致力于实现“知行合一”，通过“规划-执行-验证”的多代理协同架构，能够自主拆解复杂任务并并行处理。二、如何申请Manus官方试用？目前Manus处于内测阶段，需通过邀请码体验，以下是主要申请途径：官网申请：访问Manus官网，点击“GetStarted”→“Appl
dataframe数据常用python操作 shlay 统计分析软件 python 信息可视化数据分析
dataframe数据常用python操作dataframe数据常用知识点1.创建dataframe1.1使用字典创建DataFrame：1.2使用列表创建DataFrame：1.3使用numpy数组创建DataFrame：1.4从TXT文件中创建DataFrame：1.5从CSV文件中创建DataFrame：1.6从Excel文件中创建DataFrame：2.dataframe数据保存3.dat
如何查看Linux服务器的硬件配置 Ray.1998 各种命令服务器 linux 运维
Linux系统提供了多种命令和工具来查看硬件配置信息。下面是一些常用的方法：1.CPU信息lscpu:提供CPU的详细统计信息，包括型号、核心数、线程数、缓存大小等。Bashlscpu/proc/cpuinfo:包含每个CPU核心的详细参数，如型号、频率、缓存等。Bashcat/proc/cpuinfo2.内存信息free:显示系统内存的使用情况。Bashfree-m/proc/meminfo:提
doris ：SAP HANA 向阳1218 大数据 doris
DorisJDBCCatalog支持通过标准JDBC接口连接OceanBase数据库。本文档介绍如何配置OceanBase数据库连接。使用须知要连接到OceanBase数据库，您需要OceanBase3.1.0或更高版本OceanBase数据库的JDBC驱动程序，您可以从Maven仓库下载最新或指定版本的OceanBaseJDBC驱动程序。推荐使用OceanBaseConnector/J2.4.8
C语言笔记（郝斌） cndsdss c语言单片机 stm32 开发语言笔记 linux 改行学it
二次复习做的笔记，很基础，适合新手入门，复习巩固C语言前言1.为什么学习c语言优点：代码量小速度快功能强大可移植性较好缺点：危险性高开发周期长应用领域广：系统软件应用软件为学习数据结构C++打基础2.怎样学C语言多思考多上机多上机多上机目标：能看懂程序，能调试程序3.学习的目标熟练掌握C语言的语法规则理解面向过程的思想4.学习重点流程控制函数指针动态内存分配1.基本编程知识1.1CPU内存条硬盘显
python刷题:哥德巴赫猜想小赵睡不醒： python python 算法开发语言
Description哥德巴赫猜想：对于任一个大于或等于4的偶数n，至少存在一对素数p1和p2,使得n＝p1+p2。这个猜想目前既没有被证明，也没有被否定。没有人确定这个猜想是否成立。但是，如果对于给定的一个偶数，存在这样一对素数的话，人们是可以找到的。我们的要求是编写一个程序，对于给定的一个偶数，计算出存在多少对素数满足这个猜想。在输入中给出一系列偶数。对于每一个数，程序输出存在的素数对数。注意
嵌入式单片机基础篇（三十四）之I2C通信以及stm32单片机程序详解 lostlll AT24C02 嵌入式单片机嵌入式字符串单片机 stm32 IIC
I2C通信以及stm32单片机程序详解1、初始化IO口：#defineIIC_SCLPBout(6)//SCL#defineIIC_SDAPBout(7)//SDA#defineREAD_SDAPBin(7)//输入SDA（1）在固件库中操作IDR寄存器读取IO端口数据是通过GPIO_ReadInputDataBit函数实现的：uint8_tGPIO_ReadInputDataBit(GPIO_T
【华为OD机考真题】- 路灯照明（Java）敲击Time 华为od java 链表
输入描述第一行为一个数N，表示路灯个数：1100，70+20100&&lightCoverArea[index]+100100&&lightCoverArea[index]+100>preVal){preVal=lightCoverArea[index];}elseif(preVal100){preVal=lightCoverArea[index];}judgeUnCover(num,lightC
华为OD机试 - 幸运数字（Java 2024 E卷 100分）哪吒华为od java 开发语言
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试（JAVA）真题（E卷+D卷+A卷+B卷+C卷）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新，全天CSDN在线答疑。一、题目描述有位客人来自异国，在该国使用m进
华为OD技术面试真题 - 技术面】- 前端八股文真题题库（8) 算法大师华为od 面试前端华为OD机试E卷 javascript java python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.vue中key的作用？为什么不能用index作为key作用为什么不能用index作为key示例说明2.Vue2和Vue3?defineProperty和Proxy?Vue2的`Object.defineProperty()`Vue3的`Proxy`比较和应用场景
印度股票行情数据API接口教程 StockTV CryptoRzz python 数据分析
印度股票实时行情数据接口印度股票实时行情API数据接口原创印度交易所股票行情数据API接口获取数据源测试Key:StockTVAPI功能列表模块功能描述示例方法股票市场列表、指数、K线、IPO日历等get_indices(),get_kline()外汇实时汇率、交叉汇率、K线图表get_real_time_rates()期货期货列表、实时行情、历史数据get_futures_market()加密货
一文看懂DeepSeek与Manus，谁才是你的职场“真命天子” 2501_90774747 pdf
「清华北大-Deepseek使用手册」链接：https://pan.quark.cn/s/98782f7d61dc「清华大学Deepseek整理）1－6版本链接：https://pan.quark.cn/s/72194e32428a资源链接：https://pan.quark.cn/s/3d4088555ca0资源链接：https://pan.quark.cn/s/df8ce3ea6f4e「Dee
深入浅出Java Annotation(元注解和自定义注解） Josh_Persistence Java Annotation 元注解自定义注解
一、基本概述　　 Annontation是Java5开始引入的新特征。中文名称一般叫注解。它提供了一种安全的类似注释的机制，用来将任何的信息或元数据（metadata）与程序元素（类、方法、成员变量等）进行关联。　　更通俗的意思是为程序的元素（类、方法、成员变量）加上更直观更明了的说明，这些说明信息是与程序的业务逻辑无关，并且是供指定的工具或
mysql优化特定类型的查询 annan211 java 工作 mysql
本节所介绍的查询优化的技巧都是和特定版本相关的，所以对于未来mysql的版本未必适用。 1 优化count查询对于count这个函数的网上的大部分资料都是错误的或者是理解的都是一知半解的。在做优化之前我们先来看看真正的count()函数的作用到底是什么。 count()是一个特殊的函数，有两种非常不同的作用，他可以统计某个列值的数量，也可以统计行数。在统
MAC下安装多版本JDK和切换几种方式棋子chessman jdk
环境： MAC AIR,OS X 10.10,64位历史：过去 Mac 上的 Java 都是由 Apple 自己提供，只支持到 Java 6，并且OS X 10.7 开始系统并不自带（而是可选安装）（原自带的是1.6）。后来 Apple 加入 OpenJDK 继续支持 Java 6，而 Java 7 将由 Oracle 负责提供。在终端中输入jav
javaScript （1） Array_06 JavaScript java 浏览器
JavaScript 1、运算符　　运算符就是完成操作的一系列符号，它有七类：　　赋值运算符（=,+=,-=,*=,/=,%=,<<=,>>=,|=,&=）、算术运算符(+,-,*,/,++,--,%)、比较运算符(>,<,<=,>=,==,===,!=,!==)、逻辑运算符(||,&&,!)、条件运算(?:)、位
国内顶级代码分享网站袁潇含 java jdk oracle .net PHP
现在国内很多开源网站感觉都是为了利益而做的当然利益是肯定的,否则谁也不会免费的去做网站 &
Elasticsearch、MongoDB和Hadoop比较随意而生 mongodb hadoop 搜索引擎
IT界在过去几年中出现了一个有趣的现象。很多新的技术出现并立即拥抱了“大数据”。稍微老一点的技术也会将大数据添进自己的特性，避免落大部队太远，我们看到了不同技术之间的边际的模糊化。假如你有诸如Elasticsearch或者Solr这样的搜索引擎，它们存储着JSON文档，MongoDB存着JSON文档，或者一堆JSON文档存放在一个Hadoop集群的HDFS中。你可以使用这三种配
mac os 系统科研软件总结张亚雄 mac os
1.1 Microsoft Office for Mac 2011 大客户版，自行搜索。 1.2 Latex （MacTex）: 系统环境：https://tug.org/mactex/ &nb
Maven实战（四）生命周期 AdyZhang maven
1. 三套生命周期 Maven拥有三套相互独立的生命周期，它们分别为clean，default和site。每个生命周期包含一些阶段，这些阶段是有顺序的，并且后面的阶段依赖于前面的阶段，用户和Maven最直接的交互方式就是调用这些生命周期阶段。以clean生命周期为例，它包含的阶段有pre-clean, clean 和 post
Linux下Jenkins迁移 aijuans Jenkins
1. 将Jenkins程序目录copy过去源程序在/export/data/tomcatRoot/ofctest-jenkins.jd.com下面 tar -cvzf jenkins.tar.gz ofctest-jenkins.jd.com &
request.getInputStream()只能获取一次的问题 ayaoxinchao request Inputstream
问题：在使用HTTP协议实现应用间接口通信时，服务端读取客户端请求过来的数据，会用到request.getInputStream()，第一次读取的时候可以读取到数据，但是接下来的读取操作都读取不到数据原因： 1. 一个InputStream对象在被读取完成后，将无法被再次读取，始终返回-1； 2. InputStream并没有实现reset方法（可以重
数据库SQL优化大总结之百万级数据库优化方案 BigBird2012 SQL优化
网上关于SQL优化的教程很多，但是比较杂乱。近日有空整理了一下，写出来跟大家分享一下，其中有错误和不足的地方，还请大家纠正补充。这篇文章我花费了大量的时间查找资料、修改、排版，希望大家阅读之后，感觉好的话推荐给更多的人，让更多的人看到、纠正以及补充。 1.对查询进行优化，要尽量避免全表扫描，首先应考虑在 where 及 order by 涉及的列上建立索引。 2.应尽量避免在 where
jsonObject的使用 bijian1013 java json
在项目中难免会用java处理json格式的数据，因此封装了一个JSONUtil工具类。 JSONUtil.java package com.bijian.json.study; import java.util.ArrayList; import java.util.Date; import java.util.HashMap;
[Zookeeper学习笔记之六]Zookeeper源代码分析之Zookeeper.WatchRegistration bit1129 zookeeper
Zookeeper类是Zookeeper提供给用户访问Zookeeper service的主要API，它包含了如下几个内部类首先分析它的内部类，从WatchRegistration开始，为指定的znode path注册一个Watcher， /** * Register a watcher for a particular p
【Scala十三】Scala核心七：部分应用函数 bit1129 scala
何为部分应用函数？ Partially applied function: A function that’s used in an expression and that misses some of its arguments.For instance, if function f has type Int => Int => Int, then f and f(1) are p
Tomcat Error listenerStart 终极大法 ronin47 tomcat
Tomcat报的错太含糊了，什么错都没报出来，只提示了Error listenerStart。为了调试，我们要获得更详细的日志。可以在WEB-INF/classes目录下新建一个文件叫logging.properties，内容如下 Java代码 handlers = org.apache.juli.FileHandler, java.util.logging.ConsoleHa
不用加减符号实现加减法 BrokenDreams 实现
今天有群友发了一个问题，要求不用加减符号(包括负号)来实现加减法。分析一下，先看最简单的情况，假设1+1，按二进制算的话结果是10，可以看到从右往左的第一位变为0，第二位由于进位变为1。
读《研磨设计模式》-代码笔记-状态模式-State bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 当一个对象的内在状态改变时允许改变其行为，这个对象看起来像是改变了其类状态模式主要解决的是当控制一个对象状态的条件表达式过于复杂时的情况把状态的判断逻辑转移到表示不同状态的一系列类中，可以把复杂的判断逻辑简化如果在
CUDA程序block和thread超出硬件允许值时的异常 cherishLC CUDA
调用CUDA的核函数时指定block 和 thread大小，该大小可以是dim3类型的（三维数组），只用一维时可以是usigned int型的。以下程序验证了当block或thread大小超出硬件允许值时会产生异常！！！GPU根本不会执行运算！！！所以验证结果的正确性很重要！！！在VS中创建CUDA项目会有一个模板，里面有更详细的状态验证。以下程序在K5000GPU上跑的。
诡异的超长时间GC问题定位 chenchao051 jvm cms GC hbase swap
HBase的GC策略采用PawNew+CMS, 这是大众化的配置，ParNew经常会出现停顿时间特别长的情况，有时候甚至长到令人发指的地步，例如请看如下日志： 2012-10-17T05:54:54.293+0800: 739594.224: [GC 739606.508: [ParNew: 996800K->110720K(996800K), 178.8826900 secs] 3700
maven环境快速搭建 daizj 安装 mavne 环境配置
一下载maven 安装maven之前，要先安装jdk及配置JAVA_HOME环境变量。这个安装和配置java环境不用多说。 maven下载地址：http://maven.apache.org/download.html，目前最新的是这个apache-maven-3.2.5-bin.zip，然后解压在任意位置，最好地址中不要带中文字符，这个做java 的都知道，地址中出现中文会出现很多
PHP网站安全，避免PHP网站受到攻击的方法 dcj3sjt126com PHP
对于PHP网站安全主要存在这样几种攻击方式:1、命令注入(Command Injection)2、eval注入(Eval Injection)3、客户端脚本攻击(Script Insertion)4、跨网站脚本攻击(Cross Site Scripting, XSS)5、SQL注入攻击(SQL injection)6、跨网站请求伪造攻击(Cross Site Request Forgerie
yii中给CGridView设置默认的排序根据时间倒序的方法 dcj3sjt126com GridView
public function searchWithRelated() { $criteria = new CDbCriteria; $criteria->together = true; //without th
Java集合对象和数组对象的转换 dyy_gusi java集合
在开发中，我们经常需要将集合对象（List，Set）转换为数组对象，或者将数组对象转换为集合对象。Java提供了相互转换的工具，但是我们使用的时候需要注意，不能乱用滥用。 1、数组对象转换为集合对象最暴力的方式是new一个集合对象，然后遍历数组，依次将数组中的元素放入到新的集合中，但是这样做显然过
nginx同一主机部署多个应用 geeksun nginx
近日有一需求，需要在一台主机上用nginx部署2个php应用，分别是wordpress和wiki，探索了半天，终于部署好了，下面把过程记录下来。 1. 在nginx下创建vhosts目录，用以放置vhost文件。 mkdir vhosts 2. 修改nginx.conf的配置，在http节点增加下面内容设置，用来包含vhosts里的配置文件 #
ubuntu添加admin权限的用户账号 hongtoushizi ubuntu useradd
ubuntu创建账号的方式通常用到两种：useradd 和adduser . 本人尝试了useradd方法，步骤如下： 1:useradd 使用useradd时，如果后面不加任何参数的话，如：sudo useradd sysadm 创建出来的用户将是默认的三无用户：无home directory ,无密码,无系统shell。顾应该如下操作：
第五章常用Lua开发库2-JSON库、编码转换、字符串处理 jinnianshilongnian nginx lua
JSON库在进行数据传输时JSON格式目前应用广泛，因此从Lua对象与JSON字符串之间相互转换是一个非常常见的功能；目前Lua也有几个JSON库，本人用过cjson、dkjson。其中cjson的语法严格（比如unicode \u0020\u7eaf），要求符合规范否则会解析失败（如\u002），而dkjson相对宽松，当然也可以通过修改cjson的源码来完成
Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解 yaerfeng1989 timer quartz 定时器
原创整理不易，转载请注明出处：Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解代码下载地址：http://www.zuidaima.com/share/1772648445103104.htm 有两种流行Spring定时器配置：Java的Timer类和OpenSymphony的Quartz。 1.Java Timer定时首先继承jav
Linux下df与du两个命令的差别？ pda158 linux
　一、df显示文件系统的使用情况，与du比較，就是更全盘化。　　最经常使用的就是 df -T，显示文件系统的使用情况并显示文件系统的类型。　　举比例如以下：　　[root@localhost ~]# df -T 　　Filesystem Type &n
[转]SQLite的工具类 ---- 通过反射把Cursor封装到VO对象 ctfzh VO android sqlite 反射 Cursor
在写DAO层时，觉得从Cursor里一个一个的取出字段值再装到VO(值对象)里太麻烦了，就写了一个工具类，用到了反射，可以把查询记录的值装到对应的VO里，也可以生成该VO的List。使用时需要注意：考虑到Android的性能问题，VO没有使用Setter和Getter，而是直接用public的属性。表中的字段名需要和VO的属性名一样，要是不一样就得在查询的SQL中
该学习笔记用到的Employee表 vipbooks oracle sql 工作
这是我在学习Oracle是用到的Employee表，在该笔记中用到的就是这张表，大家可以用它来学习和练习。 drop table Employee; -- 员工信息表 create table Employee( -- 员工编号 EmpNo number(3) primary key, -- 姓