kiki商

X64 函数调用的一些问题

对于X86 和 X64 的编码来说，主要有下面几个方面的不同：

1. X64 具有 64-bit 的寻址能力

2. 16 个64-bit 整数寄存器以及16 个 XMM/YMM 寄存器用于浮点运算

3. X64 默认使用的是__fastcall调用约定

4. 基于RISC 的异常处理结构

__fastcall调用约定

该调用约定使用寄存器来传递前4个参数，其余的参数使用栈来传递。尽管如此，主调函数依然为通过寄存器传递的参数保留了相应的栈空间。

Vs2010 关闭所有的优化选项，然后编译运行如下程序：

#include

void Func6(inta,intb,intc,int d,inte,intf)

{

return;

}

void Func5(inta,intb,intc,int d,inte)

{

Func6(0,1,2,3,4,5);

}

void Func4(inta,intb,intc,int d)

{

Func5(0,1,2,3,4);

}

void Func3(inta ,intb ,intc)

{

Func4(0,1,2,3);

}

void Func2(inta,intb)

{

Func3(0,1,2);

}

void Func1(inta)

{

Func2(0,1);

}

void Func0()

{

Func1(0);

}

int main()

{

Func0();

return 0;

}

无参数和一个参数

; int __cdecl main(int argc, const char**argv, const char **envp)

main proc near

sub rsp, 28h

call sub_140001130

xor eax, eax

add rsp, 28h

retn

main endp

main 函数刚开始申请了 28 h 的空间，然后调用子函数

sub_140001130 proc near

sub rsp, 28h

xor ecx, ecx

call sub_140001110

add rsp, 28h

retn

sub_140001130 endp

xor ecx,ecx 即参数第一个参数为0，然后调用子层函数。

两个参数、三个参数、四个参数

sub_140001110 proc near

arg_0= dword ptr 8

mov [rsp+arg_0], ecx

sub rsp, 28h

mov edx, 1

xor ecx, ecx

call sub_1400010E0

add rsp, 28h

retn

sub_140001110 endp

sub_1400010E0 proc near

arg_0= dword ptr 8

arg_8= dword ptr 10h

mov [rsp+arg_8], edx

mov [rsp+arg_0], ecx

sub rsp, 28h

mov r8d, 2

mov edx, 1

xor ecx, ecx

call sub_1400010B0

add rsp, 28h

retn

sub_1400010E0 endp

sub_1400010B0 proc near

arg_0= dword ptr 8

arg_8= dword ptr 10h

arg_10= dword ptr 18h

mov [rsp+arg_10], r8d

mov [rsp+arg_8], edx

mov [rsp+arg_0], ecx

sub rsp, 28h

mov r9d, 3

mov r8d, 2

mov edx, 1

xor ecx, ecx

call sub_140001070

add rsp, 28h

retn

sub_1400010B0 endp

上面三个函数调用分别传递了2，3，4个参数。我们知道x64 fast call 的参数传递规则，从右向左入栈且前四个参数由参数寄存器传递，即rcx，rdx，r8，r9。上面的汇编代码也证实了这点，那么我们就像知道，当参数个数超过4个时，参数如何传递，参数传递的位置又是哪儿呢？

五个参数

sub_140001070 proc near

var_18= dword ptr -18h

arg_0= dword ptr 8

arg_8= dword ptr 10h

arg_10= dword ptr 18h

arg_18= dword ptr 20h

mov [rsp+arg_18], r9d

mov [rsp+arg_10], r8d

mov [rsp+arg_8], edx

mov [rsp+arg_0], ecx

sub rsp, 38h

mov [rsp+38h+var_18], 4

mov r9d, 3

mov r8d, 2

mov edx, 1

xor ecx, ecx

call sub_140001020

add rsp, 38h

retn

sub_140001070 endp

上面的 mov [rsp+20h],4 操作对应的显然就是第5个参数4。而我们看到其位置为：

[4]

[]

[]rsp的位置

中间的四个位置用于什么用途呢？我们知道，参数寄存器的个数刚好为四个。当我们在无参数内部增加一些代码，并观察函数行为：

void Func5(inta,intb,intc,int d,inte)

{

a += 1;

b += 2;

c += 3;

d += 4;

e += 5;

Func6(0,1,2,3,4,5);

}

sub_140001020 proc near

var_18= dword ptr -18h

var_10= dword ptr -10h

arg_0= dword ptr 8

arg_8= dword ptr 10h

arg_10= dword ptr 18h

arg_18= dword ptr 20h

arg_20= dword ptr 28h

mov [rsp+arg_18], r9d ；将 r9d 保留到 rsp+20h

mov [rsp+arg_10], r8d ; 将 r8d 保留到 rsp + 18h

mov [rsp+arg_8], edx ; 将 edx 保留到 rsp + 10h

mov [rsp+arg_0], ecx ; 将ecx 保留到 rsp + 8h

sub rsp, 38h

mov eax, [rsp+38h+arg_0]

inc eax

mov [rsp+38h+arg_0], eax ; 这里 [rsp + 8h+38h]++

mov eax, [rsp+38h+arg_8]

add eax, 2

mov [rsp+38h+arg_8], eax ; 这里 [rsp + 10h+38h]+=2

mov eax, [rsp+38h+arg_10]

add eax, 3

mov [rsp+38h+arg_10], eax ；这里 [rsp + 18h+38h]+=3

mov eax, [rsp+38h+arg_18]

add eax, 4

mov [rsp+38h+arg_18], eax ；这里 [rsp + 20h+38h]+=4

mov eax, [rsp+38h+arg_20]

add eax, 5

mov [rsp+38h+arg_20], eax ；这里 [rsp + 28h+38h]+=5 就是我们传入的第5个参数的位置

mov [rsp+38h+var_10], 5

mov [rsp+38h+var_18], 4

mov r9d, 3

mov r8d, 2

mov edx, 1

xor ecx, ecx

call sub_140001000

add rsp, 38h

retn

sub_140001020 endp

通过汇编我们看到，当我们对形参进行修改的时候，函数将参数寄存器的值放入了栈空间中，然后再对栈空间进行操作，跟我们之前所熟悉的对于函数参数的操作是相同的。无论子函数的参数是多少个，我们的函数都为其至少预留了4*8 的栈空间，当参数更多的时候，其增加栈的大小。

六个参数

sub_140001020 proc near

var_18= dword ptr -18h

var_10= dword ptr -10h

arg_0= dword ptr 8

arg_8= dword ptr 10h

arg_10= dword ptr 18h

arg_18= dword ptr 20h

mov [rsp+arg_18], r9d

mov [rsp+arg_10], r8d

mov [rsp+arg_8], edx

mov [rsp+arg_0], ecx

sub rsp, 38h

mov [rsp+38h+var_10], 5

mov [rsp+38h+var_18], 4

mov r9d, 3

mov r8d, 2

mov edx, 1

xor ecx, ecx

call sub_140001000

add rsp, 38h

retn

sub_140001020 endp

通过查看上面的几个函数调用我们发现，函数刚开始都进行了

sub rsp [某个值] 的操作

由于函数内部均没有使用局部变量，可以总结出这个值有如下规律

参数个数 <= 4 时28h，参数个数为5,6个时38h

看了以上的程序我们应该想到的一个问题：

函数刚开始的sub esp 操作应该开辟多达的栈空间？与子函数参数个数是否有联系

这里先给出一个结论：函数开始部分（即下面介绍的prolog）申请栈空间的时候（通过 push和 sub esp操作），大小需要符合16n+8，以满足在函数调用的时候rsp是16h对齐的要求。call指令的时候使用了8字节。而要理解这个过程如何实现，需要先了解易失性寄存器、Prolog 和 epilog的概念。

易失性寄存器与非易失性寄存器

易失性寄存器 假设被调用者修改的寄存器，调用者负责其保存和恢复工作。

非易失性寄存器 被假设为“在函数调用之后依然不变”，因此被调用者负责其保存和恢复。

图片来源：https://msdn.microsoft.com/en-us/library/9z1stfyw.aspx

常用非易失性寄存器有：R12 R15 RDI RSI RBX RBP RSP

关于 Prolog 和 Epilog

Prolog所有申请栈空间，调用子函数，保存非易失性寄存器或者使用SHE 的函数必须有prolog。而且其地址范围存储在与之相应函数表条目相关联的unwind(展开)数据中描述（PE 文件中）。

如果需要，prolog 将参数寄存器存储在其归属地址中，将堆栈上的非易失性寄存器分配给本地和临时的堆栈的固定部分，并且可选地建立帧指针。即

1.保存寄存器的值到栈空间中以便于函数返回的时候恢复

2.为函数执行操作所需要的局部变量以及函数调用申请栈空间。

相应的unwind 数据必须描述该prolog的动作，且提供足够的信息来撤销prolog所做的操作。Prolog 相当于函数执行前的准备工作。相应的Epilog 为函数执行完毕后的清理工作。

Epilog代码存储在与每个函数退出的时候。通常只有一个prolog，但是可以有很多epilog,Epilog代码将堆栈修改为固定分配大小（如果需要），释放固定堆栈分配，通过从堆栈中弹出其保存的值来恢复非易失性寄存器，并返回。

在prolog 中通常首先保存易失性寄存器，然后再分配固定的栈空间，否则在通过rsp 访问局部变量的时候需要一个额外的偏移量（push 操作的个数*8）。非易失性寄存器可以以任何顺序保存。但是，在prolog 中首次使用非易失性寄存器必须保存它。

Epilog 代码必须遵循一系列严格的规则，以使展开代码从中断和异常中可靠的展开。这减少了所需的展开数据结构的数量，因为不需要额外的数据来描述每个epilog。相反，展开代码可以通过向前扫描代码流来确定epilog正在执行，以识别一个epilog。

如果函数没有使用帧指针，那么 epilog 必须首先释放堆栈的固定部分，然后弹出非易失性寄存器，并将控制权返回给调用函数。

Epilog 的合法形式

Add rsp 或者 lea rsp,constant[FPReg]

后面加上一系列或者零个 pop 寄存器的操作。

最后为一个返回或者跳转操作。

在epilog 中，只有jmp 的一部分子集操作是允许的-----ModRM 跳转指令：且 ModRM mod 字段为00 -----即只允许直接内存跳转 [base]形式的memory寻址。

如果帧指针没有使用，epilog必须使用add rsp,constant回收栈空间，可能不使用lea RSP,constant [RSP]，由于这些限制的存在，展开代码在寻找epilogs时有较少的识别模式。

遵循这些规则以允许展开代码确定epilog当前正在执行，并模拟epilog的其余部分的执行以允许重新创建调用函数的上下文。

参考链接：

http://www.mouseos.com/x64/doc6.html

其它的任何代码不能出现在epilog 中，

在了解上述概念之后我们开始解释上面的

16n + 8 的实现

通过上面的介绍，如果函数有prolog，其包含三部分的组成。Push 非易失性寄存器进栈，开辟固定大小的栈空间即 sub esp 【固定值】。

Push非易失性寄存器就是为了在函数中使用该寄存器之后的恢复。sub esp操作要负责一下几个方面：函数调用时参数的传递，函数内部的局部变量。局部变量是固定的，由于栈空间在函数刚开始的代码中确定直到后面函数返回都不会变化，对于不同的子函数调用，分配的用于函数调用的栈空间并不会动态改变大小，因此，我们需要考虑的是函数参数最多的子函数的函数参数个数，另外，发生函数调用时，函数内部总是会为rcx,rdx,r8,r9保留栈空间。综上，函数内部申请固定大小栈空间的时候，其大小=（局部变量+ max(参数最多的函数的参数个数,4)*8）。这个固定值+前面的push操作应该符合16n+8的要求。不同的编译器对于具体实现的方法不同，没有明确答案，但是其必须满足16 对齐。Vs2010 在实现的时候貌似其局部变量16对齐，然后函数参数个数16对齐，然后总的三个部分再合起来满足参数对齐的要求。比如下面这个函数：

void For()

{

unsigned long long j;

Func5(0,1,2,3,4);

}

微软sub rsp 48h,开48h栈空间=alignmen(8,16)+alignment(5*8,16) + 8(用于对齐)

而intel编译器是这样操作的：

push rbp

sub rsp,50h

void For()

{

unsigned long long j;

unsigned long long i;

Func6(0,1,2,3,4,5);

}

此时vs2010 同样开48h栈空间

Intel 编译器这样做：

push rbp

sub rsp,50h

相比微软，函数开始添加了push rbp的操作。我们这里仅仅介绍了解vs2010的做法，其实不必深究，知道了在call之前，rsp 16对齐且有足够空间用于参数传递即可。

实验认证16n+8

void For()

{

char szTemp[] = "Hello";

for(inti = 0;i <sizeof(szTemp) ;i++)

{

putchar(szTemp[i]);

}

putchar('\n');

}

int main()

{

For();

return 0;

}

为了生成的汇编代码更简单易读，我们在上面的配置基础上进行如下配置：

sub_140001000 proc near

var_28= byte ptr -28h ; szTemp 其值指向的为一个栈空间的地址

var_20= dword ptr -20h ；i

push rsi

push rdi

sub rsp, 38h ；这里就是prolog 分别push rsi rdi，申请38h

；很容易发现，38h + rsi + rdi = 48h符合 16n+8

lea rax, [rsp+48h+var_28]

lea rcx, aHello ;"Hello"

mov rdi, rax

mov rsi, rcx

mov ecx, 6

rep movsb ;szTemp[] = “Hello”，拷贝操作需要循环，使用了rdi和dsi寄存器

mov [rsp+48h+var_20], 0

jmp short loc_140001034

loc_14000102A:

mov eax, [rsp+48h+var_20]

inc eax

mov [rsp+48h+var_20], eax ；i++

loc_140001034:

movsxd rax, [rsp+48h+var_20]

cmp rax, 6

jnb short loc_140001053

movsxd rax, [rsp+48h+var_20]

movsx eax, [rsp+rax+48h+var_28]

mov ecx, eax ; Ch

call cs:putchar

jmp short loc_14000102A

loc_140001053: ; Ch

mov ecx, 0Ah

call cs:putchar

add rsp, 38h

pop rdi

pop rsi

retn ；这里就是epilog，先add rsp后恢复寄存器rdi rsi，为prolog的逆操作，然后retn返回

sub_140001000 endp

函数内部 38h = szTemp 六个字节对齐后为8个字节 + i变量8字节 + putchar 4 *8 字节参数对16对齐依然是20h。然后为了符合 16n + 8的格式而添加的8 字节，总共为38h。如下一个程序所示，如果我们添加对于5参数函数的调用，此时最大参数个数为5，对应的5*8 并16对齐后为30h，函数申请内存应变为0x48h。而如果添加6参数函数调用，同理该值变为 48h-----经验证上述假设推理完全正确

void Func5(inta,intb,intc,int d,inte)

{

return;

}

void For()

{

char szTemp[] = "Hello";

for(inti = 0;i <sizeof(szTemp) ;i++)

{

putchar(szTemp[i]);

}

putchar('\n');

Func5(0,1,2,3,4);

}

int main()

{

For();

return 0;

}

sub_140001020 proc near

var_38= dword ptr -38h

var_28= byte ptr -28h

var_20= dword ptr -20h

push rsi

push rdi

sub rsp, 48h

lea rax, [rsp+58h+var_28]

lea rcx, aHello ;"Hello"

mov rdi, rax

mov rsi, rcx

mov ecx, 6

rep movsb

mov [rsp+58h+var_20], 0

jmp short loc_140001054

另外补充一下X64 中的两类函数类型

帧函数与叶子函数

帧函数（frame function）

帧函数分配帧空间，调用其它函数，保存非易失性寄存器或使用异常处理函数，这样的函数需要一个function table entry 以及一个prolog 以及epilog，帧函数可以动态分配栈空间，使用栈帧。

叶子函数是不需要function table entry 的函数，不调用任何函数，不分配空间，或者保存非易失性寄存器，允许其在栈没有对齐的情况下执行。

关于函数参数传递的问题：

https://msdn.microsoft.com/en-us/library/zthk2dkh.aspx

你可能感兴趣的:(基础知识)

【WinPcap】——ARP欺骗猫和鱼爪 WinPcap 网络协议 winpcap 网络协议
利用WinPcap的简单ARP欺骗基础知识关于WinPcap在vc的环境搭建关于ARP等结构下图是从TCP/IP详解中摘录的图片：
【C++】C++从入门到精通教程（持续更新...）废人一枚 C++c++开发语言
前言最近在整理之前一些C++资料，重新整理出了一套C++从基础到实践的教程，包含概念、代码、运行结果以及知识点的扩展，感兴趣的后续大家持续关注。以下是更新的文章目录，文章之后整理了一个知识思维导图，看起来比较清楚点。目录1、C++基础知识C++基础知识一个简单的C++程序函数重载引用的概念引用与指针的区别引用作为函数参数引用作为返回值面向对象类的定义类的声明结构体与类的区别inline函数this
Visual C++从入门到精通第三版 PDF 下载范武心Lucinda
VisualC++从入门到精通第三版PDF下载【下载地址】VisualC从入门到精通第三版PDF下载VisualC++从入门到精通第三版PDF下载项目地址:https://gitcode.com/open-source-toolkit/f4bb4资源介绍本仓库提供《VisualC++从入门到精通第三版》的PDF版本下载。这本书是一本非常适合初学者的入门书籍，内容涵盖了从C++基础知识到Visual
笔记：代码随想录算法训练营day56:图论理论基础、深搜理论基础、98. 所有可达路径、广搜理论基础 jingjingjing1111 笔记
学习资料：代码随想录连通图是给无向图的定义，强连通图是给有向图的定义朴素存储：二维数组邻接矩阵邻接表：list基础知识：C++容器类|菜鸟教程深搜是沿着一个方向搜到头再不断回溯，转向；广搜是每一次搜索要把当前能够得到的方向搜个遍深搜三部曲：传入参数、终止条件、处理节点+递推+回溯98.所有可达路径卡码网题目链接（ACM模式）先是用邻接矩阵，矩阵的x,y表示从x到y有一条边主要还是用回溯方法遍历整个
【自学笔记】NFT基础知识点总览-持续更新 Long_poem 笔记区块链
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录NFT（非同质化代币）基础知识点总览1.NFT简介2.NFT的应用场景3.NFT的工作原理4.NFT的创建和发行5.代码示例代码解释总结NFT（非同质化代币）基础知识点总览1.NFT简介NFT（Non-FungibleToken，非同质化代币）是一种基于区块链技术的独特数字资产，每个NFT都是唯一的、不可互换的。与同质化代币（
C++编程：从入门到精通的指南 zifeng0015 c++java jvm
本文将引导读者走进C++编程的世界，从基础知识讲起，逐步深入到高级特性。无论你是编程新手还是希望提升C++技能的开发者，本文都将为你提供有价值的指导和建议。正文：一、C++简介C++是一种面向对象的编程语言，由BjarneStroustrup于1985年开发。它结合了C语言的低级特性和面向对象编程的高级特性，因此既适合进行系统级编程，也适合进行大型应用软件开发。二、C++基础变量和数据类型：C++
oracle基础知识之表的集合运算数字天下 oracle 数据库
一个查询就是一个集合：查询的结果集一条记录就是一个元素。集合运算是用来把两个或多个查询的结果集做并、交、查的集合运算，包含集合运算的查询称为复合查询。*Select基本语法如下：SELECTcolumn_1,column_2,…FROMtable_nameWHEREsearch_conditionORDERBYcolumn_1,column_2;2.常用集合运算方式的应用（1）联合运算：联合运算实
掌握C#企业级应用的数据一致性与分布式事务：从基础到高级的全面解析墨夶 C#学习资料1 c#分布式 wpf
在当今的企业级应用开发中，确保数据的一致性是至关重要的。尤其是在涉及分布式系统时，如何处理跨服务、跨数据库的操作以保证数据的一致性和可靠性成为了一个复杂但必须解决的问题。本文将深入探讨使用C#进行企业级应用开发时的数据一致性和分布式事务管理，提供详细的代码示例和最佳实践。第一部分：理解数据一致性与分布式事务的基础知识1.1数据一致性的重要性在企业级应用中，数据一致性是指关联数据之间的逻辑关系是否正
集成学习（Ensemble Learning）基础知识1 代码骑士 #机器学习集成学习机器学习人工智能
文章目录一、集成学习1、基本概念2、回顾:误差的偏差-方差分解3、为什么集成学习有效？4、基学习器：“好而不同”5、集成学习的两个基本问题（1）如何训练出具有差异性的多个基学习器？（2）如何将多个基学习器的预测结果集成为最终的强学习器预测结果？二、自助法（Bagging）1、Bagging2、BootstrapBootstrap采样的数学性质3、Bagging:集成学习的两个基本问题（1）如何训练
批处理脚本基础知识快速掌握感叹号的豆浆 c++
一、批处理脚本概述定义批处理脚本是一种基于命令行的自动化脚本语言，通过.bat或.cmd文件保存，由Windows系统的cmd.exe解释器执行。核心作用自动化重复性任务（如文件操作、系统配置）批量处理文件（搜索、复制、删除）集成命令行工具（如ping、netstat）简单的系统管理（服务控制、注册表操作）执行环境原生支持：WindowsCMD.EXEPowerShell兼容：可通过&或call调
零基础怎么开始学网络安全（非常详细）零基础入门到精通，收藏这一篇就够了程序员羊羊 web安全安全网络 php 学习
一、学习建议1.了解基础概念：开始之前，了解网络安全的基本概念和术语是很重要的。你可以查找网络安全入门教程或在线课程，了解网络安全领域的基本概念，如黑客、漏洞、攻击类型等。2.网络基础知识：学习计算机网络基础知识，了解网络通信原理，不同网络协议（如TCP/IP）的工作方式，以及网络拓扑结构等。3.操作系统知识：了解常见的操作系统，特别是Windows和Linux。掌握基本的命令行操作和系统管理技能
QR二维码开发实战：生成、管理与扫描的最佳实践 34号树洞 javascript 二维码开发 Python Javascript URL QRCode
目录一、QR二维码是什么？1.QR二维码的基础知识2.QR二维码的生成3.QR二维码的应用场景4.QR二维码的管理二、开发QR二维码1.生成二维码（支持移动端+网页）2.生成“活码”（可修改目标URL的二维码）3.扫描二维码4.嵌入二维码功能到App5.高级功能6.推荐技术栈7.开发注意事项一、QR二维码是什么？1.QR二维码的基础知识QR码结构：了解QR码的组成部分，如定位图案、校正图案、数据区
使用 EchoAPI 实现 API 断言的全面指南 Kairo_01 postman
API断言是API测试中的一个关键部分。通过执行API断言，您可以验证API响应数据的准确性，从而增强API的可靠性和稳定性。在本文中，我们将介绍API断言的基础知识，并演示如何通过用户友好的API测试工具Apipost来轻松执行响应断言。什么是API断言？API断言是指验证API响应返回的数据是否正确并符合预期的过程。具体而言，主要包括以下检查：验证响应状态码是否在预期范围内。确保响应体内容与规
JVM八股文系列一:JVM基础知识 suikasa JVM八股文 java jvm
一.JVM基础知识1.JVM从编译到执行1.1Java程序的执行过程一个Java程序，首先经过javac编译成.class文件，然后JVM将其加载到方法区，执行引擎将会执行这些字节码。执行时，会翻译成操作系统相关的函数。JVM作为.class文件的翻译存在，输入字节码，调用操作系统函数。过程如下：Java文件->编译器>字节码->JVM->机器码。JVM也就是Java虚拟机。它能识别.class后
五、AIGC大模型_08Agent基础知识学不会lostfound AI 人工智能 agent 不同生命周期的知识用AI处理 AIGC
0、概述根据知识的生命周期分类，我们通常会采取不同的方法（微调、RAG、Agent）来将知识融入到AI中0.1长生命周期知识这类知识通常具有较高的稳定性和通用性，不会因时间的推移而轻易改变。它们是知识体系中的“基石”，在较长时间内保持有效性和价值。特点：稳定性强：如数学定理、物理公式等，这些知识经过长期验证，具有高度的确定性和普适性基础性强：往往是学习和研究其他知识的基础，例如教科书中的基础知识更
JavaScript基础-事件基础難釋懷 javascript 开发语言
在现代Web开发中，交互性是网站用户体验的重要组成部分。通过使用JavaScript，我们可以捕获用户的操作并作出响应，实现动态网页效果。这一切都离不开事件（Events）的概念。本文将介绍JavaScript中事件的基础知识，包括事件类型、如何绑定事件处理器以及一些常见的实践技巧。一、什么是事件？在浏览器环境中，事件是由浏览器生成的通知，表明某种情况已经发生。这些情况可能是用户交互（如点击按钮）
Hadoop相关面试题努力的搬砖人. java 面试 hadoop
以下是150道Hadoop面试题及其详细回答，涵盖了Hadoop的基础知识、HDFS、MapReduce、YARN、HBase、Hive、Sqoop、Flume、ZooKeeper等多个方面，每道题目都尽量详细且简单易懂：Hadoop基础概念类1.什么是Hadoop？Hadoop是一个由Apache基金会开发的开源分布式计算框架，主要用于处理和存储大规模数据集。它提供了高容错性和高扩展性的分布式存
Java的正则表达式一朵忧伤的蔷薇 java 正则表达式开发语言
Java中的正则表达式(RegularExpressions,简称regex)是一种强大的工具，用于在字符串中搜索、匹配和替换特定的模式。以下是Java正则表达式的一些基础知识点：1.基本语法字符类:.匹配任意单个字符（除了换行符）。\d匹配任意数字，相当于[0-9]。\D匹配任意非数字。\w匹配任意字母、数字或下划线，相当于[a-zA-Z0-9_]。\W匹配任意非字母、数字或下划线。\s匹配任意
迁移学习基础知识 zhooooooou 深度学习迁移学习人工智能机器学习
简介使用迁移学习的优势：1、能够快速的训练出一个理想的结果2、当数据集较小时也能训练出理想的效果。注意：在使用别人预训练的参数模型时，要注意别人的预处理方式。原理：对于浅层的网络结构，他们学习到的角点信息和纹理信息都是通用的，将学习好的浅层网络的信息迁移到新的网络中，这样新的网络也拥有了识别底层通用特征的能力，从而能加快网络学习新的数据集的高维特征。常见的迁移学习的方式：1、载入权重后训练所有参数
Java基础知识三（运算符）浪迹天涯的贺 Java基础系列上 java 开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档前言更新第三篇文章，这篇文章讲一下Java的运算符相关的知识，对于Java中所有的运算符的种类和内容做一个总结在Java编程中，运算符（Operators）是执行特定操作的符号，它们用于操作变量和数据。本文将详细介绍Java中的运算符种类、用法以及其作用。1.算术运算符（ArithmeticOperators）算术运算符用于执行基本的
3.14学习总结 2402_88131930 学习
今天完成了几道关于二叉树的算法题关于二叉树的最小最大深度和数据流中的第k大元素，用到优先队列，学习了有关java的基础知识，学习了双指针法。
c# 正则表达式基础知识观无 c#正则表达式 mysql
一、使用原理模式匹配机制：在C#中，正则表达式通过定义一种模式来描述文本的特征。例如，\d表示匹配任意一个数字字符。当使用正则表达式进行匹配时，正则表达式引擎会从输入文本的起始位置开始，逐个字符地将输入文本与模式进行比较。引擎尝试找到一个连续的字符序列，该序列与整个模式完全匹配。如果找到了这样的序列，则匹配成功；否则，匹配失败。回溯机制：当正则表达式中存在可选部分（如a?表示a可选出现一次或不出现
Nginx面试题努力的搬砖人. java 后端 nginx
以下是150道Nginx面试题及其详细回答，涵盖了Nginx的基础知识、配置与优化、负载均衡、安全与性能、高级特性等多个方面，每道题目都尽量详细且简单易懂：Nginx基础概念类1.什么是Nginx？Nginx是一个高性能的HTTP和反向代理服务器，同时也是一个IMAP/POP3/SMTP代理服务器。它以其事件驱动的方式处理请求，能够处理大量的并发连接，适用于高并发场景。例如，当有大量用户同时访问一
Java面试常见的面试题(持续更新版) Java进阶八股文 java 面试开发语言职场和发展 jvm spring boot
一丶基础知识1.面向对象(工作时间不是很长的出现频率)什么是面向对象?什么是面向过程?面向过程:例子:我要洗衣服把衣服放进洗衣机→加入洗衣液→关上洗衣机门→按下启动按钮面向对象:例子:我要洗衣服对象有我洗衣机我要做的事:把衣服放进去加入洗衣液关门按启动按钮洗衣机要做的事:清洗以上可以看出,面向过程比较高效比较直接,面向对象更易于扩展丶维护和复用封装明确标识出允许外部使用的所有成员函数和数据项,内部
Python基础知识---数据与变量、进制转换银白101 python 开发语言
1.1软件开发概述（1）软件定义定义：是指有一系列按照特定顺序组织的计算机数据与指令的集合。程序=数据+指令程序=数据结构+算法软件的分类：系统软件：主要负责管理操作计算机底层的硬件，为用户提供一个操作的界面，为用户提供最基本的计算机功能WindowsLinuxMACAndroidIOSHarmonyOS应用软件：主要负责处理某一特殊领域功能的软件：微信、陌陌、Soul、网易云音乐、支付宝、Off
目标：掌握无位置传感器（FOC）控制PMSM的设计与实现老衲在深渊电赛单片机嵌入式硬件电赛无位置传感电机
第一阶段：基础知识准备（1~2周）目标：掌握电机控制理论和LKS32MC071开发环境时间安排：每天3~4小时产出目标：✅能够理解PMSM电机的基本工作原理✅熟悉FOC控制方法✅了解无位置传感器控制的原理✅掌握LKS32MC071芯片的基础开发Step1：理解永磁同步电机（PMSM）原理（1-2天）学习内容：•什么是PMSM（永磁同步电机）•PMSM数学模型（d-q轴建模）•三相交流电机的控制方式
学习pytorch 阿什么名字不会重复呢学习 pytorch 人工智能
学习PyTorch是一个很好的选择，尤其是如果你对深度学习和机器学习感兴趣。以下是一个详细的学习计划，可以帮助你系统地掌握PyTorch的基本概念和应用。学习计划概览学习周期：8周（每周约4-5小时）目标：掌握PyTorch基础，能够实现简单的深度学习模型。第1周：基础知识目标：了解深度学习的基础知识，掌握Python和NumPy基础。任务：学习Python基础（数据类型、控制流、函数、类）。资源
【机器学习-基础知识】统计和贝叶斯推断人类发明了工具 ML&DL学习分享机器学习概率论人工智能
1.概率论基本概念回顾1.概率分布定义：概率分布（ProbabilityDistribution）指的是随机变量所有可能取值及其对应概率的集合。它描述了一个随机变量可能取的所有值以及每个值被取到的概率。对于离散型随机变量，使用概率质量函数来描述。对于连续型随机变量，使用概率密度函数来描述。举例说明：投掷一颗六面骰子，每个面上的数字（1到6）都有相同的概率（1/6）出现，这就是一个简单的概率分布例子
Python 基础知识整理笔记 chuanauc 笔记
闹麻了，因为各种原因，现在需要重新回顾一下Python，话不多说，开始吧1.Python是解释型语言&&Python与C++代码执行过程的区别：（1）C++源码（Source）：C++的源码文件是.cpp文件预处理（PreProcess）：生成.i文件预处理的操作有处理#include、#define等宏指令，编译（Compile）：将.cpp文件编译为.s文件，此时的.s文件是汇编文件，无法被C
图像分割基础：使用Python和scikit-image库 0dayNu1L 机器学习项目实战 python 人工智能机器学习
大家好，今天我们将一起探讨图像分割的基础知识，并使用Python编程语言以及scikit-image库来实现一个简单的图像分割示例。图像分割是图像处理中的一项重要技术，它允许我们将图像划分为多个部分或对象，这对于图像分析和计算机视觉任务至关重要。0dayNu1L-CSDN博客目录一、环境准备二、图像分割示例1.导入必要的库2.读取并显示图像3.创建标签数组并进行阈值分割4.使用颜色表示标签三、结果
遍历dom 并且存储（将每一层的DOM元素存在数组中）换个号韩国红果果 JavaScript html
数组从0开始！！ var a=[],i=0; for(var j=0;j<30;j++){ a[j]=[];//数组里套数组，且第i层存储在第a[i]中 } function walkDOM(n){ do{ if(n.nodeType!==3)//筛选去除#text类型 a[i].push(n); //con
Android+Jquery Mobile学习系列(9)-总结和代码分享白糖_ JQuery Mobile
目录导航经过一个多月的边学习边练手，学会了Android基于Web开发的毛皮，其实开发过程中用Android原生API不是很多，更多的是HTML/Javascript/Css。个人觉得基于WebView的Jquery Mobile开发有以下优点： 1、对于刚从Java Web转型过来的同学非常适合，只要懂得HTML开发就可以上手做事。 2、jquerym
impala参考资料 dayutianfei impala
记录一些有用的Impala资料 1. 入门资料 >>官网翻译： http://my.oschina.net/weiqingbin/blog?catalog=423691 2. 实用进阶 >>代码&架构分析： Impala/Hive现状分析与前景展望：http
JAVA 静态变量与非静态变量初始化顺序之新解周凡杨 java 静态非静态顺序
今天和同事争论一问题，关于静态变量与非静态变量的初始化顺序，谁先谁后，最终想整理出来！测试代码： import java.util.Map; public class T { public static T t = new T(); private Map map = new HashMap(); public T(){ System.out.println(&quo
跳出iframe返回外层页面 g21121 iframe
在web开发过程中难免要用到iframe，但当连接超时或跳转到公共页面时就会出现超时页面显示在iframe中，这时我们就需要跳出这个iframe到达一个公共页面去。首先跳转到一个中间页，这个页面用于判断是否在iframe中，在页面加载的过程中调用如下代码： <script type="text/javascript"> //<!-- function
JAVA多线程监听JMS、MQ队列 510888780 java多线程
背景：消息队列中有非常多的消息需要处理，并且监听器onMessage（）方法中的业务逻辑也相对比较复杂，为了加快队列消息的读取、处理速度。可以通过加快读取速度和加快处理速度来考虑。因此从这两个方面都使用多线程来处理。对于消息处理的业务处理逻辑用线程池来做。对于加快消息监听读取速度可以使用1.使用多个监听器监听一个队列；2.使用一个监听器开启多线程监听。对于上面提到的方法2使用一个监听器开启多线
第一个SpringMvc例子布衣凌宇 spring mvc
第一步：导入需要的包；第二步：配置web.xml文件 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee" xmlns:xsi=
我的spring学习笔记15-容器扩展点之PropertyOverrideConfigurer aijuans Spring3
PropertyOverrideConfigurer类似于PropertyPlaceholderConfigurer，但是与后者相比，前者对于bean属性可以有缺省值或者根本没有值。也就是说如果properties文件中没有某个bean属性的内容，那么将使用上下文（配置的xml文件）中相应定义的值。如果properties文件中有bean属性的内容，那么就用properties文件中的值来代替上下
通过XSD验证XML antlove xml schema xsd validation SchemaFactory
1. XmlValidation.java package xml.validation; import java.io.InputStream; import javax.xml.XMLConstants; import javax.xml.transform.stream.StreamSource; import javax.xml.validation.Schem
文本流与字符集百合不是茶 PrintWrite()的使用字符集名字别名获取
文本数据的输入输出; 输入;数据流,缓冲流输出;介绍向文本打印格式化的输出PrintWrite(); package 文本流; import java.io.FileNotFound
ibatis模糊查询sqlmap-mapping-**.xml配置 bijian1013 ibatis
正常我们写ibatis的sqlmap-mapping-*.xml文件时，传入的参数都用##标识，如下所示： <resultMap id="personInfo" class="com.bijian.study.dto.PersonDTO"> <res
java jvm常用命令工具——jdb命令(The Java Debugger) bijian1013 java jvm jdb
用来对core文件和正在运行的Java进程进行实时地调试，里面包含了丰富的命令帮助您进行调试，它的功能和Sun studio里面所带的dbx非常相似，但 jdb是专门用来针对Java应用程序的。现在应该说日常的开发中很少用到JDB了，因为现在的IDE已经帮我们封装好了，如使用ECLI
【Spring框架二】Spring常用注解之Component、Repository、Service和Controller注解 bit1129 controller
在Spring常用注解第一步部分【Spring框架一】Spring常用注解之Autowired和Resource注解（http://bit1129.iteye.com/blog/2114084）中介绍了Autowired和Resource两个注解的功能，它们用于将依赖根据名称或者类型进行自动的注入，这简化了在XML中，依赖注入部分的XML的编写，但是UserDao和UserService两个bea
cxf wsdl2java生成代码super出错,构造函数不匹配 bitray super
由于过去对于soap协议的cxf接触的不是很多,所以遇到了也是迷糊了一会.后来经过查找资料才得以解决. 初始原因一般是由于jaxws2.2规范和jdk6及以上不兼容导致的.所以要强制降为jaxws2.1进行编译生成.我们需要少量的修改: 我们原来的代码 wsdl2java com.test.xxx -client http://..... 修改后的代
动态页面正文部分中文乱码排障一例 ronin47
公司网站一部分动态页面，早先使用apache+resin的架构运行，考虑到高并发访问下的响应性能问题，在前不久逐步开始用nginx替换掉了apache。不过随后发现了一个问题，随意进入某一有分页的网页，第一页是正常的（因为静态化过了）；点“下一页”，出来的页面两边正常，中间部分的标题、关键字等也正常，唯独每个标题下的正文无法正常显示。因为有做过系统调整，所以第一反应就是新上
java-54- 调整数组顺序使奇数位于偶数前面 bylijinnan java
import java.util.Arrays; import java.util.Random; import ljn.help.Helper; public class OddBeforeEven { /** * Q 54 调整数组顺序使奇数位于偶数前面 * 输入一个整数数组，调整数组中数字的顺序，使得所有奇数位于数组的前半部分，所有偶数位于数组的后半
从100PV到1亿级PV网站架构演变 cfyme 网站架构
一个网站就像一个人，存在一个从小到大的过程。养一个网站和养一个人一样，不同时期需要不同的方法，不同的方法下有共同的原则。本文结合我自已14年网站人的经历记录一些架构演变中的体会。 1：积累是必不可少的架构师不是一天练成的。 1999年，我作了一个个人主页，在学校内的虚拟空间，参加了一次主页大赛，几个DREAMWEAVER的页面，几个TABLE作布局，一个DB连接，几行PHP的代码嵌入在HTM
[宇宙时代]宇宙时代的GIS是什么？ comsci Gis
我们都知道一个事实，在行星内部的时候，因为地理信息的坐标都是相对固定的，所以我们获取一组GIS数据之后，就可以存储到硬盘中，长久使用。。。但是，请注意，这种经验在宇宙时代是不能够被继续使用的宇宙是一个高维时空
详解create database命令 czmmiao database
完整命令 CREATE DATABASE mynewdb USER SYS IDENTIFIED BY sys_password USER SYSTEM IDENTIFIED BY system_password LOGFILE GROUP 1 ('/u01/logs/my/redo01a.log','/u02/logs/m
几句不中听却不得不认可的话 datageek
1、人丑就该多读书。 2、你不快乐是因为：你可以像猪一样懒，却无法像只猪一样懒得心安理得。 3、如果你太在意别人的看法，那么你的生活将变成一件裤衩，别人放什么屁，你都得接着。 4、你的问题主要在于：读书不多而买书太多，读书太少又特爱思考，还他妈话痨。 5、与禽兽搏斗的三种结局：(1)、赢了，比禽兽还禽兽。(2)、输了，禽兽不如。(3)、平了，跟禽兽没两样。结论：选择正确的对手很重要。 6
1 14:00 PHP中的“syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM”错误 dcj3sjt126com PHP
原文地址：http://www.kafka0102.com/2010/08/281.html 因为需要，今天晚些在本机使用PHP做些测试，PHP脚本依赖了一堆我也不清楚做什么用的库。结果一跑起来，就报出类似下面的错误：“Parse error: syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM in /home/kafka/test/
xcode6 Auto layout and size classes dcj3sjt126com ios
官方GUI https://developer.apple.com/library/ios/documentation/UserExperience/Conceptual/AutolayoutPG/Introduction/Introduction.html iOS中使用自动布局（一） http://www.cocoachina.com/ind
通过PreparedStatement批量执行sql语句【sql语句相同，值不同】梦见x光 sql 事务批量执行
比如说：我有一个List需要添加到数据库中，那么我该如何通过PreparedStatement来操作呢？ public void addCustomerByCommit(Connection conn , List<Customer> customerList) { String sql = "inseret into customer(id
程序员必知必会----linux常用命令之十【系统相关】 hanqunfeng Linux常用命令
一.linux快捷键 Ctrl+C : 终止当前命令 Ctrl+S : 暂停屏幕输出 Ctrl+Q : 恢复屏幕输出 Ctrl+U : 删除当前行光标前的所有字符 Ctrl+Z : 挂起当前正在执行的进程 Ctrl+L : 清除终端屏幕，相当于clear 二.终端命令 clear : 清除终端屏幕 reset : 重置视窗，当屏幕编码混乱时使用 time com
NGINX IXHONG nginx
pcre 编译安装 nginx conf/vhost/test.conf upstream admin { server 127.0.0.1:8080; } server { listen 80; &
设计模式--工厂模式 kerryg 设计模式
工厂方式模式分为三种： 1、普通工厂模式：建立一个工厂类，对实现了同一个接口的一些类进行实例的创建。 2、多个工厂方法的模式：就是对普通工厂方法模式的改进，在普通工厂方法模式中，如果传递的字符串出错，则不能正确创建对象，而多个工厂方法模式就是提供多个工厂方法，分别创建对象。 3、静态工厂方法模式：就是将上面的多个工厂方法模式里的方法置为静态，
Spring InitializingBean/init-method和DisposableBean/destroy-method mx_xiehd java spring bean xml
1.initializingBean/init-method 实现org.springframework.beans.factory.InitializingBean接口允许一个bean在它的所有必须属性被BeanFactory设置后，来执行初始化的工作，InitialzingBean仅仅指定了一个方法。通常InitializingBean接口的使用是能够被避免的，（不鼓励使用，因为没有必要
解决Centos下vim粘贴内容格式混乱问题 qindongliang1922 centos vim
有时候，我们在向vim打开的一个xml，或者任意文件中，拷贝粘贴的代码时，格式莫名其毛的就混乱了，然后自己一个个再重新，把格式排列好，非常耗时，而且很不爽，那么有没有办法避免呢？答案是肯定的，设置下缩进格式就可以了，非常简单：在用户的根目录下直接vi ~/.vimrc文件然后将set pastetoggle=<F9> 写入这个文件中，保存退出，重新登录，
netty大并发请求问题 tianzhihehe netty
多线程并发使用同一个channel java.nio.BufferOverflowException: null at java.nio.HeapByteBuffer.put(HeapByteBuffer.java:183) ~[na:1.7.0_60-ea] at java.nio.ByteBuffer.put(ByteBuffer.java:832) ~[na:1.7.0_60-ea]
Hadoop NameNode单点问题解决方案之一 AvatarNode wyz2009107220 NameNode
我们遇到的情况 Hadoop NameNode存在单点问题。这个问题会影响分布式平台24*7运行。先说说我们的情况吧。我们的团队负责管理一个1200节点的集群(总大小12PB)，目前是运行版本为Hadoop 0.20，transaction logs写入一个共享的NFS filer(注：NetApp NFS Filer)。经常遇到需要中断服务的问题是给hadoop打补丁。 DataNod