编译原理 (预处理>编译>汇编>链接)

　一般高级语言程序编译的过程：预处理、编译、汇编、链接。gcc在后台实际上也经历了这几个过程，我们可以通过-v参数查看它的编译细节，如果想看某个具体的编译过程，则可以分别使用-E,-S,-c和 -O，对应的后台工具则分别为cpp,cc1,as,ld。下面我们将逐步分析这几个过程以及相关的内容，诸如语法检查、代码调试、汇编语言等。

1、预处理

预处理是C语言程序从源代码变成可执行程序的第一步，主要是C语言编译器对各种预处理命令进行处理，包括头文件的包含、宏定义的扩展、条件编译的选择等。打印出预处理之后的结果：gcc -E hello.c 或者 cpp hello.c这样我们就可以看到源代码中的各种预处理命令是如何被解释的，从而方便理解和查错。

gcc调用了cpp的(虽然我们通过gcc的-v仅看到cc1)，cpp即The C Preprocessor，主要用来预处理宏定义、文件包含、条件编译等。下面介绍它的一个比较重要的选项-D。在命令行定义宏：gcc –Dmacro=1 hello.c 或者 cpp –Dmacro=1 hello.c等同于在文件的开头定义宏，即#define maco，但是在命令行定义更灵活。例如，在源代码中有这些语句:

#ifdef DEBUG



printf("this code is for debuggingn");



#endif

2、编译

编译之前，C语言编译器会进行词法分析、语法分析(-fsyntax-only)，接着会把源代码翻译成中间语言，即汇编语言。如果想看到这个中间结果，可以用-S选项。

编译程序工作时，先分析，后综合，从而得到目标程序。所谓分析，是指词法分析和语法分析；所谓综合是指代码优化，存储分配和代码生成。为了完成这些分析综合任务，编译程序采用对源程序进行多次扫描的办法，每次扫描集中完成一项或几项任务，也有一项任务分散到几次扫描去完成的。下面举一个四遍扫描的例子：第一遍扫描做词法分析；第二遍扫描做语法分析；第三遍扫描做代码优化和存储分配；第四遍扫描做代码生成。

值得一提的是，大多数的编译程序直接产生机器语言的目标代码，形成可执行的目标文件，但也有的编译程序则先产生汇编语言一级的符号代码文件，然后再调用汇编程序进行翻译加工处理，最后产生可执行的机器语言目标文件。

语法检查之后是翻译动作，gcc提供了一个优化选项-O，以便根据不同的运行平台和用户要求产生经过优化的汇编代码。例如，

$ gcc -o hello hello.c             #采用默认选项，不优化
$ gcc -O2 -o hello2 hello.c        #优化等次是2
$ gcc -Os -o hellos hello.c        #优化目标代码的大小

$ time ./hello #查看代码运行时间
hello, world

根据上面的简单演示，可以看出gcc有很多不同的优化选项，主要看用户的需求了，目标代码的大小和效率之间貌似存在一个“纠缠”，需要开发人员自己权衡。

下面我们通过-S选项来看看编译出来的中间结果，汇编语言，还是以之前那个hello.c为例。

$ gcc -S hello.c                 #默认输出是hello.s，可自己指定



$ cat hello.s



cat hello.s



        .file   "hello.c"



        .section        .rodata



.LC0:



        .string "hello, world"



        .text



.globl main



        .type   main, @function



main:



        leal    4(%esp), %ecx



        andl    $-16, %esp



        pushl   -4(%ecx)



        pushl   %ebp



        movl    %esp, %ebp



        pushl   %ecx



        subl    $4, %esp



        movl    $.LC0, (%esp)



        call    puts



        movl    $0, %eax



        addl    $4, %esp



        popl    %ecx



        popl    %ebp



        leal    -4(%ecx), %esp



        ret



        .size   main, .-main



        .ident  "GCC: (GNU) 4.1.3 20070929 (prerelease) (Ubuntu 4.1.2-16ubuntu2)"



        .section        .note.GNU-stack,"",@progbits

和intel的汇编语法不太一样，这里用的是AT&T语法格式。这里需要补充的是，在写C语言代码时，如果能够对编译器比较熟悉（工作原理和一些细节）的话，可能会很有帮助。包括这里的优化选项(有些优化选项可能在汇编时采用)和可能的优化措施。

3、汇编

把作为中间结果的汇编代码翻译成了机器代码，即目标代码，不过它还不可以运行。如果要产生这一中间结果，可用gcc的-c选项，当然，也可通过as命令_汇编_汇编语言源文件来产生。

$ file hello.s

hello.s: ASCII assembler program text

$ gcc -c hello.s #用gcc把汇编语言编译成目标代码

$ file hello.o #file命令可以用来查看文件的类型

hello.o: ELF 32-bit LSB relocatable, Intel 80386, version 1 (SYSV), not stripped

$as -o hello.o hello.s #用as把汇编语言编译成目标代码

$ file hello.o

hello.o: ELF 32-bit LSB relocatable, Intel 80386, version 1 (SYSV), not stripped

gcc和as默认产生的目标代码都是ELF格式的，因此这里主要讨论ELF格式的目标代码。目标代码不再是普通的文本格式，无法直接通过文本编辑器浏览，需要一些专门的工具。

binutils(GNU Binary Utilities)的很多工具都采用这个库来操作目标文件，这类工具有objdump, objcopy, nm, strip等，不过另外一款非常优秀的分析工具readelf并不是基于这个库，所以你也应该可以直接用elf.h头文件中定义的相关结构来操作ELF文件。

ELF文件的结构：

1. ELF Header (ELF文件头)说明了文件的类型，大小，运行平台，节区数目等。

2. Porgram Headers Table (程序头表，实际上叫段表好一些，用于描述可执行文件和可共享库)

Section 1

Section 2

...

3. Section Headers Table(节区头部表，用于链接可重定位文件成可执行文件或共享库)

可以分别通过 readelf文件的-h，-l和-S参数查看ELF文件头(ELF Header)、程序头部表（Program Headers Table，段表）和节区表(Section Headers Table)。

下面通过这几段代码来演示通过readelf -h参数查看ELF的不同类型。期间将演示如何创建动态连接库(即可共享文件)、静态连接库，并比较它们的异同。

$ gcc -c myprintf.c test.c #编译产生两个目标文件myprintf.o和test.o，它们都是可重定位文件(REL)

$ readelf -h test.o | grep Type

Type: REL (Relocatable file)

$ readelf -h myprintf.o | grep Type

Type: REL (Relocatable file)

$ gcc -o test myprintf.o test.o #根据目标代码连接产生可执行文件，这里的文件类型是可执行的(EXEC)

$ readelf -h test | grep Type

Type: EXEC (Executable file)

$ ar rcsv libmyprintf.a myprintf.o #用ar命令创建一个静态连接库

$ readelf -h libmyprintf.a | grep Type #因此，使用静态连接库和可重定位文件一样，它们之间唯一不同是前者可以是多个可重定位文件的“集合”。

Type: REL (Relocatable file)

$ gcc -o test test.o -llib -L./ #可以直接连接进去，也可以使用-l参数，-L指定库的搜索路径

$ gcc -Wall myprintf.o -shared -Wl,-soname,libmyprintf.so.0 -o libmyprintf.so.0.0 #编译产生动态链接库，并支持major和minor版本号，动态链接库类型为DYN

$ ln -sf libmyprintf.so.0.0 libmyprintf.so.0

$ ln -sf libmyprintf.so.0 libmyprintf.so

$ readelf -h libmyprintf.so | grep Type

Type: DYN (Shared object file)

$ gcc -o test test.o -llib -L./ #编译时和静态连接库类似，但是执行时需要指定动态连接库的搜索路径

$ LD_LIBRARY_PATH=./ ./test #LD_LIBRARY_PATH为动态链接库的搜索路径

$ gcc -static -o test test.o -llib -L./ #在不指定static时会优先使用动态链接库，指定时则阻止使用动态连接库这个时候会把所有静态连接库文件加入到可执行文件中.

可重定位文件本身不可以运行，仅仅是作为可执行文件、静态连接库（也是可重定位文件）、动态连接库的 “组件”。

下面来看看ELF文件的主体内容，节区（Section)。ELF文件具有很大的灵活性，它通过文件头组织整个文件的总体结构，通过节区表 (Section Headers Table)和程序头（Program Headers Table或者叫段表)来分别描述可重定位文件和可执行文件。在可重定位文件中，节区表描述的就是各种节区本身；而在可执行文件中，程序头描述的是由各个节区组成的段（Segment），以便程序运行时动态装载器知道如何对它们进行内存映像，从而方便程序加载和运行。

可以通过readelf的-S参数查看ELF的节区。先来看看可重定位文件的节区信息，通过节区表来查看：

$ gcc -c myprintf.c #默认编译好myprintf.c，将产生一个可重定位的文件myprintf.o

$ readelf -S myprintf.o #通过查看myprintf.o的节区表查看节区信息

There are 11 section headers, starting at offset 0xc0:

Section Headers:

[Nr] Name Type Addr Off Size ES Flg Lk Inf Al

[ 0] NULL 00000000 000000 000000 00 0 0 0

[ 1] .text PROGBITS 00000000 000034 000018 00 AX 0 0 4

[ 2] .rel.text REL 00000000 000334 000010 08 9 1 4

[ 3] .data PROGBITS 00000000 00004c 000000 00 WA 0 0 4

[ 4] .bss NOBITS 00000000 00004c 000000 00 WA 0 0 4

[ 5] .rodata PROGBITS 00000000 00004c 00000e 00 A 0 0 1

[ 6] .comment PROGBITS 00000000 00005a 000012 00 0 0 1

[ 7] .note.GNU-stack PROGBITS 00000000 00006c 000000 00 0 0 1

[ 8] .shstrtab STRTAB 00000000 00006c 000051 00 0 0 1

[ 9] .symtab SYMTAB 00000000 000278 0000a0 10 10 8 4

[10] .strtab STRTAB 00000000 000318 00001a 00 0 0 1

Key to Flags:

W (write), A (alloc), X (execute), M (merge), S (strings)

I (info), L (link order), G (group), x (unknown)

O (extra OS processing required) o (OS specific), p (processor specific)

$ objdump -d -j .text myprintf.o #这里是程序指令部分，用objdump的-d选项可以看到反编译的结果，-j指定需要查看的节区

myprintf.o: file format elf32-i386

Disassembly of section .text:

00000000 :



   0:   55                      push   %ebp



   1:   89 e5                   mov    %esp,%ebp



   3:   83 ec 08                sub    $0x8,%esp



   6:   83 ec 0c                sub    $0xc,%esp



   9:   68 00 00 00 00          push   $0x0



   e:   e8 fc ff ff ff          call   f



  13:   83 c4 10                add    $0x10,%esp



  16:   c9                      leave



  17:   c3                      ret

$ readelf -r myprintf.o #用-r选项可以看到有关重定位的信息，这里有两部分需要重定位

Relocetion section '.rel.text' at offset 0x334 contains 2 entries:

Offset Info Type Sym.Value Sym. Name

0000000a 00000501 R_386_32 00000000 .rodata

0000000f 00000902 R_386_PC32 00000000 puts

$ readelf -x .rodata myprintf.o #.rodata节区包含只读数据，即我们要打印的hello, world!.

Hex dump of section '.rodata':

0x00000000 68656c6c 6f2c2077 6f726c64 2100 hello, world!.

$ readelf -x .data myprintf.o #没有这个节区,.data应该包含一些初始化的数据

Section '.data' has no data to dump.

$ readelf -x .bss myprintf.o #也没有这个节区，.bss应该包含一些未初始化的数据，程序默认初始为0

Section '.bss' has no data to dump.

$ readelf -x .comment myprintf.o #是一些注释，可以看到是是GCC的版本信息

Hex dump of section '.comment':

0x00000000 00474343 3a202847 4e552920 342e312e .GCC: (GNU) 4.1.

0x00000010 3200 2.

$ readelf -x .note.GNU-stack myprintf.o #这个也没有内容

Section '.note.GNU-stack' has no data to dump.

$ readelf -x .shstrtab myprintf.o #包括所有节区的名字

Hex dump of section '.shstrtab':

0x00000000 002e7379 6d746162 002e7374 72746162 ..symtab..strtab

0x00000010 002e7368 73747274 6162002e 72656c2e ..shstrtab..rel.

0x00000020 74657874 002e6461 7461002e 62737300 text..data..bss.

0x00000030 2e726f64 61746100 2e636f6d 6d656e74 .rodata..comment

0x00000040 002e6e6f 74652e47 4e552d73 7461636b ..note.GNU-stack

0x00000050 00 .

$ readelf –x .symtab myprintf.o #符号表，包括所有用到的相关符号信息，如函数名、变量名

Symbol table '.symtab' contains 10 entries:

Num: Value Size Type Bind Vis Ndx Name

0: 00000000 0 NOTYPE LOCAL DEFAULT UND

1: 00000000 0 FILE LOCAL DEFAULT ABS myprintf.c

2: 00000000 0 SECTION LOCAL DEFAULT 1

3: 00000000 0 SECTION LOCAL DEFAULT 3

4: 00000000 0 SECTION LOCAL DEFAULT 4

5: 00000000 0 SECTION LOCAL DEFAULT 5

6: 00000000 0 SECTION LOCAL DEFAULT 7

7: 00000000 0 SECTION LOCAL DEFAULT 6

8: 00000000 24 FUNC GLOBAL DEFAULT 1 myprintf

9: 00000000 0 NOTYPE GLOBAL DEFAULT UND puts

$ readelf -x .strtab myprintf.o #字符串表，用到的字符串，包括文件名、函数名、变量名等。

Hex dump of section '.strtab':

0x00000000 006d7970 72696e74 662e6300 6d797072 .myprintf.c.mypr

0x00000010 696e7466 00707574 7300 intf.puts.

从上表可以看出，对于可重定位文件，会包含这些基本节区.text, .rel.text, .data, .bss, .rodata, .comment, .note.GNU-stack, .shstrtab, .symtab和.strtab。

看一看myprintf.c产生的汇编代码。

$ gcc -S myprintf.c

$ cat myprintf.s



        .file   "myprintf.c"



        .section        .rodata



.LC0:



        .string "hello, world!"



        .text



.globl myprintf



        .type   myprintf, @function



myprintf:



        pushl   %ebp



        movl    %esp, %ebp



        subl    $8, %esp



        subl    $12, %esp



        pushl   $.LC0



        call    puts



        addl    $16, %esp



        leave



        ret



        .size   myprintf, .-myprintf



        .ident  "GCC: (GNU) 4.1.2"



        .section        .note.GNU-stack,"",@progbits

4、链接

链接是处理可重定位文件，把它们的各种符号引用和符号定义转换为可执行文件中的合适信息(一般是虚拟内存地址)的过程。链接又分为静态链接和动态链接，前者是程序开发阶段程序员用ld(gcc实际上在后台调用了ld)静态链接器手动链接的过程，而动态链接则是程序运行期间系统调用动态链接器(ld-linux.so)自动链接的过程。比如，如果链接到可执行文件中的是静态连接库libmyprintf.a，那么.rodata节区在链接后需要被重定位到一个绝对的虚拟内存地址，以便程序运行时能够正确访问该节区中的字符串信息。而对于puts，因为它是动态连接库libc.so中定义的函数，所以会在程序运行时通过动态符号链接找出puts函数在内存中的地址，以便程序调用该函数。

静态链接过程主要是把可重定位文件依次读入，分析各个文件的文件头，进而依次读入各个文件的节区，并计算各个节区的虚拟内存位置，对一些需要重定位的符号进行处理，设定它们的虚拟内存地址等，并最终产生一个可执行文件或者是动态链接库。这个链接过程是通过ld来完成的，ld在链接时使用了一个链接脚本（linker scripq），该链接脚本处理链接的具体细节。这里主要介绍可重定位文件中的节区（节区表描述的）和可执行文件中段（程序头描述的）的对应关系以及gcc编译时采用的一些默认链接选项。

下面先来看看可执行文件的节区信息，通过程序头（段表）来查看：

=======================================================================

$ readelf -S test.o                        #为了比较，先把test.o的节区表也列出
There are 10 section headers, starting at offset 0xb4:
Section Headers:
  [Nr] Name              Type            Addr     Off    Size   ES Flg Lk Inf Al
  [ 0]                   NULL            00000000 000000 000000 00      0   0  0
  [ 1] .text             PROGBITS        00000000 000034 000024 00  AX  0   0  4
  [ 2] .rel.text         REL             00000000 0002ec 000008 08      8   1  4
  [ 3] .data             PROGBITS        00000000 000058 000000 00  WA  0   0  4
  [ 4] .bss              NOBITS          00000000 000058 000000 00  WA  0   0  4
  [ 5] .comment          PROGBITS        00000000 000058 000012 00      0   0  1
  [ 6] .note.GNU-stack   PROGBITS        00000000 00006a 000000 00      0   0  1
  [ 7] .shstrtab         STRTAB          00000000 00006a 000049 00      0   0  1
  [ 8] .symtab           SYMTAB          00000000 000244 000090 10      9   7  4
  [ 9] .strtab           STRTAB          00000000 0002d4 000016 00      0   0  1
Key to Flags:
  W (write), A (alloc), X (execute), M (merge), S (strings)
  I (info), L (link order), G (group), x (unknown)
  O (extra OS processing required) o (OS specific), p (processor specific)

=======================================================================

$ gcc -o test test.o libmyprintf.o
$ readelf -l test        #我们发现，test和test.o,libmyprintf.o相比，多了很多节区，如.interp和.init等
Elf file type is EXEC (Executable file)
Entry point 0x80482b0
There are 7 program headers, starting at offset 52
Program Headers:
  Type           Offset   VirtAddr   PhysAddr   FileSiz MemSiz  Flg Align
  PHDR           0x000034 0x08048034 0x08048034 0x000e0 0x000e0 R E 0x4
  INTERP         0x000114 0x08048114 0x08048114 0x00013 0x00013 R   0x1
      [Requesting program interpreter: /lib/ld-linux.so.2]
  LOAD           0x000000 0x08048000 0x08048000 0x0047c 0x0047c R E 0x1000
  LOAD           0x00047c 0x0804947c 0x0804947c 0x00104 0x00108 RW  0x1000
  DYNAMIC        0x000490 0x08049490 0x08049490 0x000c8 0x000c8 RW  0x4
  NOTE           0x000128 0x08048128 0x08048128 0x00020 0x00020 R   0x4
  GNU_STACK      0x000000 0x00000000 0x00000000 0x00000 0x00000 RW  0x4

Section to Segment mapping:
  Segment Sections...
   00
   01     .interp
   02     .interp .note.ABI-tag .hash .dynsym .dynstr .gnu.version .gnu.version_r .rel.dyn .rel.plt .init .plt .text .fini .rodata .eh_frame
   03     .ctors .dtors .jcr .dynamic .got .got.plt .data .bss
   04     .dynamic
   05     .note.ABI-tag
   06

上表给出了可执行文件的如下几个段(segment)，

PHDR: 给出了程序表自身的大小和位置，不能出现一次以上。
INTERP: 因为程序中调用了puts（在动态链接库中定义），使用了动态连接库，因此需要动态装载器／链接器(ld-linux.so)
LOAD: 包括程序的指令，.text等节区都映射在该段，只读(R)
LOAD: 包括程序的数据，.data, .bss等节区都映射在该段，可读写(RW)
DYNAMIC: 动态链接相关的信息，比如包含有引用的动态连接库名字等信息
NOTE: 给出一些附加信息的位置和大小
GNU_STACK: 这里为空，应该是和GNU相关的一些信息

这里的段可能包括之前的一个或者多个节区，也就是说经过链接之后原来的节区被重排了，并映射到了不同的段，这些段将告诉系统应该如何把它加载到内存中。这些新的节区来自哪里？它们的作用是什么呢？先来通过gcc的-v参数看看它的后台链接过程。

=======================================================================

$ gcc -v -o test test.o myprintf.o #把可重定位文件链接成可执行文件
Reading specs from /usr/lib/gcc/i486-slackware-linux/4.1.2/specs
Target: i486-slackware-linux
Configured with: ../gcc-4.1.2/configure --prefix=/usr --enable-shared --enable-languages=ada,c,c++,fortran,java,objc --enable-threads=posix --enable-__cxa_atexit --disable-checking --with-gnu-ld --verbose --with-arch=i486 --target=i486-slackware-linux --host=i486-slackware-linux
Thread model: posix
gcc version 4.1.2
/usr/libexec/gcc/i486-slackware-linux/4.1.2/collect2 --eh-frame-hdr -m elf_i386 -dynamic-linker /lib/ld-linux.so.2 -o test /usr/lib/gcc/i486-slackware-linux/4.1.2/http://www.cnblogs.com/../crt1.o /usr/lib/gcc/i486-slackware-linux/4.1.2/http://www.cnblogs.com/../crti.o /usr/lib/gcc/i486-slackware-linux/4.1.2/crtbegin.o -L/usr/lib/gcc/i486-slackware-linux/4.1.2 -L/usr/lib/gcc/i486-slackware-linux/4.1.2 -L/usr/lib/gcc/i486-slackware-linux/4.1.2/http://www.cnblogs.com/http://www.cnblogs.com/i486-slackware-linux/lib -L/usr/lib/gcc/i486-slackware-linux/4.1.2/http://www.cnblogs.com/.. test.o myprintf.o -lgcc --as-needed -lgcc_s --no-as-needed -lc -lgcc --as-needed -lgcc_s --no-as-needed /usr/lib/gcc/i486-slackware-linux/4.1.2/crtend.o /usr/lib/gcc/i486-slackware-linux/4.1.2/http://www.cnblogs.com/../crtn.o

你可能感兴趣的:(编译原理)

【Lua源码分析系列】1. 概述 lua源码分析编译原理虚拟机
如题，这是一系列关于Lua的源码分析的文章。分析的重点在编译原理和虚拟机的部分，而不是相关的库的实现部分。写这系列文章，最初是因为想要设计一门编程语言以及它的虚拟机，为此参考现有的优秀的实现。为何选择Lua？其实本人更加想分析Javascript的v8引擎和Chakra引擎的，只是感觉能力还不太够。而Lua的实现相当小巧，只有几万行C代码，与C/C++的互操作相当方便，并且实现的质量也是工业级别的
编译原理第一章习题优惠 699 机器翻译编辑器 vscode
1、选择题(从下列各题4个备选答案中选出一个或多个正确答案写在题干中的横线上)C(1)若源程序是高级语言编写的程序，目标程序是_______，则称它为编译程序A.汇编语言程序或高级语言程序B.高级语言程序或机器语言程序C.汇编语言程序或机器语言程序D.连接程序或运行程序A(2)编译程序是对_______程序进行翻译。A.高级语言B.机器语言C.自然语言D.汇编语言AC(3)如果编译程序生成的目标程
《CPython Internals》阅读笔记：p97-p117 python
《CPythonInternals》学习第7天，p97-p117总结，总计21页。一、技术总结1.词法分析(lexicalanalysis)根据《Compilers-Principles,Techniques,andTools》(《编译原理》第2版)第5页：Thefirstphaseofacompileriscalledlexicalanalysisorscanning.Thelexcicalan
【编译原理】方舟编译技术课程 — 词法分析 CSU_THU_SUT 编译原理编译器编译原理 llvm
打开目录阅读更佳参考视频：方舟·编译技术入门与实战以及西交冯博琴老师的相关视频编译的过程包括词法分析（分析程序符号）、语法分析（分析语法单位）、中间代码生成、代码优化和目标代码生成。一、编译过程各部分的任务（1）词法分析：输入源程序，扫描分解源程序字符串，识别五类符号，包括定义符、标识符、运算符、界符和常数，转为单词符号。（2）语法分析：在词法分析基础上，将单词符号转为语法单位（如短句、子句、句子
包含所有的计算机视频教程 rart2008 程序人生 windows 移动开发企业应用网络分布式应用 asp.net
计算机视频教程http://www.study66.cn/soft/show.asp?id=1237北京师范大-多媒体视频http://www.study66.cn/soft/show.asp?id=1240北京理工大学编译原理串讲http://www.study66.cn/soft/show.asp?id=1241北京大学计算机网络视频教程http://www.study66.cn/soft/s
程序员心中的一道坎：主存的编址与计算和串并联系统！冰河团队
写在前面很多小伙伴认为程序员就是写写代码，不需要了解计算机底层的知识和原理。其实，这种观点是错误的。如果你想突破程序员的职业发展瓶颈，计算机硬件、操作系统原理、编译原理等是一定要掌握的知识。而【冰河技术】微信公众号的【程序员进阶系列】专题就是要系统的向大家分享程序员进阶需要掌握的各项知识技能。今天，我们来聊聊一个让程序员很头疼的话题：计算机中的主存是如何进行编址和计算的？主存编址与计算这里，小伙伴
树数据结构（Tree Data Structures）的全面指南：深度解析、算法实战与应用案例 Chauvin912 数据结构科普数据结构算法
树数据结构（TreeDataStructures）的全面指南：深度解析、算法实战与应用案例引言树数据结构（TreeDataStructures）作为计算机科学中的基石之一，以其独特的层次结构和分支特性，在众多领域发挥着关键作用。从文件系统的组织到数据库的索引，从编译原理的语法分析到人工智能的决策制定，树数据结构无处不在。本文将深入探讨树数据结构的基本概念、类型、遍历方式及其在实际应用中的广泛案例。
2018-09-07 Maymomo
编译原理Ch1概念编译程序本质上是一个翻译程序，将一门源语言(高级语言)翻译成功能等价的低级语言(汇编语言，机器语言等)的程序。编译程序由八部分组成：词法分析程序语法分析程序语义分析程序中间代码生成程序代码优化程序目标代码生成程序表格管理程序出错处理程序词法分析顺序读入源程序文件，解析出一个个的单词.我的理解是将语言的保留字，标识符，运算符和数值等提取出来。如下简单的C代码(假设不经历预处理器处理
C++竞赛初阶L1-14-第六单元-数组(31~33课)541: T456471 计算书费麓小墨哥 c++免费文章 c++开发语言青少年编程算法数据结构
题目内容下面是一个图书的单价表：计算概论28.9元/本数据结构与算法32.7元/本数字逻辑45.6元/本C++程序设计教程78元/本人工智能35元/本计算机体系结构86.2元/本编译原理27.8元/本操作系统43元/本计算机网络56元/本JAVA程序设计65元/本依次给定每种图书购买的数量，编程计算应付的总费用。输入格式输入一行，含10个非负整数，每两个整数之间有一个空格。第i个整数表示要购买上述
Vue 模版编译原理 I will.874 vue.js javascript 前端
当我们使用Vue编写完一个组件以后，Vue会根据模版编译一个render函数，调用render函数生成虚拟DOM，然后将虚拟DOM映射成真实DOM当数据发生变化时，Vue会触发更新视图，调用render函数返回新的虚拟DOM，对比新旧虚拟DOM，修改真实DOM，从而更新页面在此期间，有以下4个关键步骤：模版编译。生成渲染函数render执行render函数生成虚拟DOM首次渲染，根据虚拟DOM生成
【编译原理】一篇就够了——学习笔记与课程实验超详细整理一棵___大树编译原理学习笔记学习算法
⭐⭐⭐⭐⭐⭐Github主页https://github.com/A-BigTree更多学习笔记链接https://github.com/A-BigTree/college_assignment编译原理实验https://github.com/A-BigTree/college_assignment/compiler_Experiment如果可以，麻烦各位看官顺手点个star~如果文章对你有所帮助
解析器模式详解 d303577562 设计模式设计模式
1.简介在软件开发中，会遇到有些问题多次重复出现，而且有一定的相似性和规律性。如果将它们归纳成一种简单的语言，那么这些问题实例将是该语言的一些句子，这样就可以用“编译原理”中的解释器模式来实现了。虽然使用解释器模式的实例不是很多，但对于满足以上特点，且对运行效率不是很高的应用实例，如果用解释器模式来实现，其效果是非常好的。2.定义解释器（Interpreter）模式的定义：给分析对象定义一个语言，
用python+pyqt5手工编写一个含交互界面的简易的词法分析器 x1Nge. 学习记录 python
python+pyqt5手工编写一个含交互界面的简易词法分析器@author：x1nge.编译原理基础实验基础在之前的一篇博文中我记录了一个不含交互界面的简易词法分析器程序编写内容点击此处查看在本文我将用pyqt5写一个简单的交互界面，也修改了部分代码使得程序更加完整。具体实验分析本文全部源码见本文末尾，上次编写的不含交互界面的源码也可点此处下载交互界面可以用QtDesigner快速编写，或者自己
今日总结薛灵均
1.今日工作感觉还行吧。2.刷了抖音和知乎，练了口语。3.读了《线》10-12章4.做了一会儿矫正动作5.听了歌，印象比较深刻的是《大地》《女人花》《月亮惹的祸》《花心》《心如止水》《屋顶》《我曾》6.看了一点点java和编译原理7.决定明天开始恢复excel的学习8.今天吃的鸭翅好吃9.成年人了，该学会哭过就整理好情绪好好反省自己。10.明天做学编译原理吧，相信自己。还要开始着手面试的事了。按自
java设计模式之解释器模式劉鵬杰 JAVA 设计模式 java 设计模式解释器模式
解释器模式（InterpreterPattern）1.基本介绍在编译原理中，一个算术表达式通过词法分析器形成词法单远，而这些词法单远再通过语法分析器构建语法分析树，最终形成一颗抽象的语法分析树，（词法分析器和语法分析器都可以看做是解释器）解释器模式是指给定一个语言（表达式），定义它的文法的一种表示，并定义一个解释器，使用该解释器来解释语言中的句子（表达式）。2.应用场景可以将一个需要解释执行的语言
程序员泛滥的时代，怎么样才能让自己脱颖而出？ Java自闭师
由于LZ本人是Java后端开发出身，因此所推荐的学习内容是JavaWeb和Java后端开发的路线，非JavaWeb和Java后端开发的同学请适当参考其学习思想即可，切勿照搬。2、下面的推荐内容，目的是让你尽快成为一个可以参加工作的Java开发者，更适用于处于待业状态，准备转行Java的同学。如果你是在校学生，务必要在学好基础（比如计算机系统、算法、编译原理等等）的前提下，再考虑去进行下面的学习。对
编译原理（三）词法分析 Cookie__C
词法分析词法分析是编译的第一个阶段，它的主要任务是从左到右逐个字符地对源程序进行扫描，产生一个个单词序列。词法分析阶段设计的主要问题是字符串（单词）的识别问题。具体说，如何判定任意的一个字符串是否为合法字符串(单词)的问题。字符串（单词）集合可用不同的工具来表示，常见的有：单词的描述技术：正规式。识别机制：有穷自动机（有限自动机）。因此，要研究如何从正规表达式或自动机构造出相应的单词识别器的问题。
STM32必备知识点（面试和工作用的到）树的编程知识屋嵌入式基础 stm32 求职招聘单片机
STM32必备知识点（面试和工作用的到）文章目录STM32必备知识点（面试和工作用的到）前言嵌入式C基础一、位操作1.不改变其他位的值的状况下，对某几个位进行设值2.移位操作提高代码的可读性:将第pinpos位设置为13.~取反操作使用技巧4.举例：二、ifdef条件编译三、extern变量申明二、编译原理1、Gcc编译的C语言程序占用的内存分为哪几个部分？三、STM32资料1、常用小知识2、基础
编译原理-递归下降分析法-c简单实现都灵的夏天_
一、实验目的：根据某一文法编制调试递归下降分析程序，以便对任意输入的符号串进行分析。本次实验的目的主要是加深对递归下降分析法的理解。二、实验预习提示1、递归下降分析法的功能词法分析器的功能是利用函数之间的递归调用模拟语法树自上而下的构造过程。2、递归下降分析法的前提改造文法：消除二义性、消除左递归、提取左因子，判断是否为LL（1）文法，3、递归下降分析法实验设计思想及算法为G的每个非终结符号U构造
深入了解C++：底层编译原理程韬123 linux 运维 c++缓存开发语言
进程的虚拟空间划分任何编程语言，都会产生两样东西，指令和数据。.exe程序运行的时候会从磁盘被加载到内存中，但是不能直接加载到物理内存中。Linux会给当前进程分配一块空间，比如x8632位linux环境下会给进程分配2^32(4G)大小的空间，这个空间被叫做【进程的虚拟地址空间】，进程的虚拟地址空间其实并不存在，从底层来看它不过是内核创建的一系列数据结构而已。以x8632位linux为例，讲解进
深入了解C++：底层编译原理（二）程韬123 c++开发语言
C++文件需要经历编译和链接两大步骤才能生成可执行文件。编译会生成二进制可重定位的目标文件，其中的重定位指的是符号重定位，发生了链接阶段。二进制可重定位的目标文件：也就是我们通常所说的.o，.obj文件。二进制文件构成：二进制文件就是.o文件，其中的内容除了elf文件头，还由各个段组成，有些段和内存空间个段可以匹配，比如.text,.data.,.bss段。objdump-s和readelf-S是
(三)JVM成神路之全面详解执行引擎子系统与JIT即时编译原理竹子爱熊猫 JVM java 高并发编程架构
引言执行引擎子系统是JVM的重要组成部分之一，在JVM系列的开篇曾提到：JVM是一个架构在平台上的平台，虚拟机是一个相似于“物理机”的概念，与物理机一样，都具备代码执行的能力。但虚拟机与物理机最大的不同在于：物理机的执行引擎是直接建立在处理器、高速缓存、平台指令集与操作系统层面上的，物理机的执行引擎可以直接调用各处资源对代码进行直接执行，而虚拟机则是建立在软件层面上的平台，它的执行引擎则是负责解释
JVM成神路之全面详解执行引擎子系统、JIT即时编译原理与分派实现头顶假发程序员 Java 编程 jvm java linux
引言执行引擎子系统是JVM的重要组成部分之一，在JVM系列的开篇曾提到：JVM是一个架构在平台上的平台，虚拟机是一个相似于“物理机”的概念，与物理机一样，都具备代码执行的能力。但虚拟机与物理机最大的不同在于：物理机的执行引擎是直接建立在处理器、高速缓存、平台指令集与操作系统层面上的，物理机的执行引擎可以直接调用各处资源对代码进行直接执行，而虚拟机则是建立在软件层面上的平台，它的执行引擎则是负责解释
疫情爆发前我因流感被隔离了冷冷的方格田
时间：2019年末记录初衷：可能因为印象比较深刻，给我身体和精神上带来了较大的折磨，并且紧挨着就发生了新冠（以下是正文，没有太多修辞，仅仅是个人经历的一次记录）12月9日daybegin早上起来忽然感觉头昏脑胀，喉咙不知不明的痛。不过，作为一个在校大学生，作业任务让我很快压过了生病的念头。今天的计划是把编译原理的实验报告写完，这事就算结束了。早早的起床，洗漱吃饭，到自习室。实验报告写了一半，困意来
Makefile编译原理 make 中的路径搜索_2 嵌入式_笔记 Linux驱动 linux
一.make中的路径搜索VPATH变量和vpath关键字同时指定搜索路径。实验1VPATH和vpath同时指定搜索路径mhr@ubuntu:~/work/makefile1/18$tree.├──inc│└──func.h├──main.c├──makefile├──src1│└──func.c└──src2└──func.cmakefileVPATH:=src1CFLAGS:=-Iincvpat
Makefile编译原理 make 中的路径搜索_1 嵌入式_笔记 Linux驱动 linux
一.make中的路径搜索问题：在实际的工程项目中，所有的源文件和头文件都放在同一个文件夹中吗？实验1：VPATH引子mhr@ubuntu:~/work/makefile1/17$lltotal28drwxrwxr-x4mhrmhr4096Apr2200:46./drwxrwxr-x7mhrmhr4096Apr2200:32../drwxrwxrwx2mhrmhr4096Jan232018inc/-
Makefile编译原理 make的隐性规则嵌入式_笔记 Linux驱动数据库服务器运维
一.makefile中的同名目标下面程序怎么执行？为什么？实验1：makefile中出现同名目标时.PHONY:allall:@echo"command-1"all:@echo"command-2"VAR:=testall:@echo"all:$(VAR)"mhr@ubuntu:~/work/makefile1$makeallmakefile:12:warning:overridingrecipe
【软件设计师】——编译原理栉风沐雪软件设计师开发语言汇编软件工程
编译系统的结构词法分析/扫描(Scanning)从左向右逐行扫描源程序的字符，识别出各个单词，确定单词的类型。将识别出的单词转换成统一的机内表示，词法单元(token)形式：token:单词类型种别种别码关键字program,if,else…一词一码标识符变量名，数组名，记录名…多词一码常量整型，浮点型，字符型…一型一码运算符算术、关系、逻辑一词\一型一码界限符;()={}…一词一码语法分析(pa
《编译原理》曹元_
第一章编译引论1、编译程序：将某一种程序设计语言写的程序翻译成等价的另一种语言的程序的程序2、源语言：用来编写源程序的语言（汇编，高级程序设计语言）3、源程序：用源语言写的程序4、目标语言：目标程序描述的语言5、目标程序：源程序经过编译后生成的程序6、宿主语言：编译程序的实现语言7、宿主机：编译程序的运行环境8、分类：解释程序【接受某语言的源程序将其直接翻译成目标代码且执行】；编译程序【接受某语言
编译原理研究性学习专题 2——递归下降语法分析设计原理与实现 dor.yang 课程作业记录博客学习 java 前端编译原理递归下降
1实验内容完成以下描述赋值语句的LL(1)文法的递归下降分析程序G[S]:S→V=EE→TE’E’→ATE’|eT→FT’T’→MFT’|EF→(E)|iA→+|-M→*|/V→i设计说明：终结符号i为用户定义的简单变量，即标识符的定义。2实验要求（1）输入串应是词法分析的输出二元式序列，即某算术表达式“专题1”的输出结果，输出为输入串是否为该文法定义的算术表达式的判断结果；（2）递归下降分析程序
Nginx负载均衡 510888780 nginx 应用服务器
Nginx负载均衡一些基础知识: nginx 的 upstream目前支持 4 种方式的分配 1)、轮询（默认）每个请求按时间顺序逐一分配到不同的后端服务器，如果后端服务器down掉，能自动剔除。 2)、weight 指定轮询几率，weight和访问比率成正比
RedHat 6.4 安装 rabbitmq bylijinnan erlang rabbitmq redhat
在 linux 下安装软件就是折腾，首先是测试机不能上外网要找运维开通，开通后发现测试机的 yum 不能使用于是又要配置 yum 源，最后安装 rabbitmq 时也尝试了两种方法最后才安装成功机器版本： [root@redhat1 rabbitmq]# lsb_release LSB Version: :base-4.0-amd64:base-4.0-noarch:core
FilenameUtils工具类 eksliang FilenameUtils common-io
转载请出自出处：http://eksliang.iteye.com/blog/2217081 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
xml文件解析SAX 不懂事的小屁孩 xml
xml文件解析:xml文件解析有四种方式， 1.DOM生成和解析XML文档(SAX是基于事件流的解析) 2.SAX生成和解析XML文档(基于XML文档树结构的解析) 3.DOM4J生成和解析XML文档 4.JDOM生成和解析XML 本文章用第一种方法进行解析，使用android常用的DefaultHandler import org.xml.sax.Attributes;
通过定时任务执行mysql的定期删除和新建分区，此处是按日分区酷的飞上天空 mysql
使用python脚本作为命令脚本，linux的定时任务来每天定时执行 #!/usr/bin/python # -*- coding: utf8 -*- import pymysql import datetime import calendar #要分区的表 table_name = 'my_table' #连接数据库的信息 host,user,passwd,db =
如何搭建数据湖架构？听听专家的意见蓝儿唯美架构
Edo Interactive在几年前遇到一个大问题：公司使用交易数据来帮助零售商和餐馆进行个性化促销，但其数据仓库没有足够时间去处理所有的信用卡和借记卡交易数据 “我们要花费27小时来处理每日的数据量，”Edo主管基础设施和信息系统的高级副总裁Tim Garnto说道：“所以在2013年，我们放弃了现有的基于PostgreSQL的关系型数据库系统，使用了Hadoop集群作为公司的数
spring学习——控制反转与依赖注入 a-john spring
控制反转（Inversion of Control，英文缩写为IoC）是一个重要的面向对象编程的法则来削减计算机程序的耦合问题，也是轻量级的Spring框架的核心。控制反转一般分为两种类型，依赖注入（Dependency Injection，简称DI）和依赖查找（Dependency Lookup）。依赖注入应用比较广泛。
用spool+unixshell生成文本文件的方法 aijuans xshell
例如我们把scott.dept表生成文本文件的语句写成dept.sql,内容如下: 　　set pages 50000; 　　set lines 200; 　　set trims on; 　　set heading off; 　　spool /oracle_backup/log/test/dept.lst; 　　select deptno||','||dname||','||loc
1、基础--名词解析(OOA/OOD/OOP) asia007 学习基础知识
OOA:Object-Oriented Analysis（面向对象分析方法）是在一个系统的开发过程中进行了系统业务调查以后，按照面向对象的思想来分析问题。OOA与结构化分析有较大的区别。OOA所强调的是在系统调查资料的基础上，针对OO方法所需要的素材进行的归类分析和整理，而不是对管理业务现状和方法的分析。　　OOA（面向对象的分析）模型由5个层次（主题层、对象类层、结构层、属性层和服务层）
浅谈java转成json编码格式技术百合不是茶 json编码 java转成json编码
json编码;是一个轻量级的数据存储和传输的语言在java中需要引入json相关的包,引包方式在工程的lib下就可以了 JSON与JAVA数据的转换（JSON 即 JavaScript Object Natation，它是一种轻量级的数据交换格式，非常适合于服务器与 JavaScript 之间的数据的交
web.xml之Spring配置(基于Spring+Struts+Ibatis) bijian1013 java web.xml SSI spring配置
指定Spring配置文件位置 <context-param> <param-name>contextConfigLocation</param-name> <param-value> /WEB-INF/spring-dao-bean.xml,/WEB-INF/spring-resources.xml, /WEB-INF/
Installing SonarQube（Fail to download libraries from server） sunjing Install Sonar
1. Download and unzip the SonarQube distribution 2. Starting the Web Server The default port is "9000" and the context path is "/". These values can be changed in &l
【MongoDB学习笔记十一】Mongo副本集基本的增删查 bit1129 mongodb
一、创建复本集假设mongod,mongo已经配置在系统路径变量上，启动三个命令行窗口，分别执行如下命令： mongod --port 27017 --dbpath data1 --replSet rs0 mongod --port 27018 --dbpath data2 --replSet rs0 mongod --port 27019 -
Anychart图表系列二之执行Flash和HTML5渲染白糖_ Flash
今天介绍Anychart的Flash和HTML5渲染功能 HTML5 Anychart从6.0第一个版本起，已经逐渐开始支持各种图的HTML5渲染效果了，也就是说即使你没有安装Flash插件，只要浏览器支持HTML5，也能看到Anychart的图形（不过这些是需要做一些配置的）。这里要提醒下大家，Anychart6.0版本对HTML5的支持还不算很成熟，目前还处于
Laravel版本更新异常4.2.8-> 4.2.9 Declaration of ... CompilerEngine ... should be compa bozch laravel
昨天在为了把laravel升级到最新的版本，突然之间就出现了如下错误： ErrorException thrown with message "Declaration of Illuminate\View\Engines\CompilerEngine::handleViewException() should be compatible with Illuminate\View\Eng
编程之美-NIM游戏分析-石头总数为奇数时如何保证先动手者必胜 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class Nim { /**编程之美 NIM游戏分析问题：有N块石头和两个玩家A和B，玩家A先将石头随机分成若干堆，然后按照BABA...的顺序不断轮流取石头，能将剩下的石头一次取光的玩家获胜，每次取石头时，每个玩家只能从若干堆石头中任选一堆，
lunce创建索引及简单查询 chengxuyuancsdn 查询创建索引 lunce
import java.io.File; import java.io.IOException; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Docume
[IT与投资]坚持独立自主的研究核心技术 comsci it
和别人合作开发某项产品....如果互相之间的技术水平不同,那么这种合作很难进行,一般都会成为强者控制弱者的方法和手段..... 所以弱者,在遇到技术难题的时候,最好不要一开始就去寻求强者的帮助,因为在我们这颗星球上,生物都有一种控制其
flashback transaction闪回事务查询 daizj oracle sql 闪回事务
闪回事务查询有别于闪回查询的特点有以下3个：（1）其正常工作不但需要利用撤销数据，还需要事先启用最小补充日志。（2）返回的结果不是以前的“旧”数据，而是能够将当前数据修改为以前的样子的撤销SQL（Undo SQL）语句。（3）集中地在名为flashback_transaction_query表上查询，而不是在各个表上通过“as of”或“vers
Java I/O之FilenameFilter类列举出指定路径下某个扩展名的文件游其是你 FilenameFilter
这是一个FilenameFilter类用法的例子，实现的列举出“c:\\folder“路径下所有以“.jpg”扩展名的文件。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
C语言学习五函数，函数的前置声明以及如何在软件开发中合理的设计函数来解决实际问题 dcj3sjt126com c
# include <stdio.h> int f(void) //括号中的void表示该函数不能接受数据，int表示返回的类型为int类型 { return 10; //向主调函数返回10 } void g(void) //函数名前面的void表示该函数没有返回值 { //return 10; //error 与第8行行首的void相矛盾 } in
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Pl dcj3sjt126com centos
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Please verify its path and try again 处理很简单，修改文件“/etc/yum.repos.d/epel.repo”，将baseurl的注释取消， mirrorlist注释掉。即可。 &n
单例模式 shuizhaosi888 单例模式
单例模式懒汉式 public class RunMain { /** * 私有构造 */ private RunMain() { } /** * 内部类，用于占位，只有 */ private static class SingletonRunMain { priv
Spring Security（09）——Filter 234390216 Spring Security
Filter 目录 1.1 Filter顺序 1.2 添加Filter到FilterChain 1.3 DelegatingFilterProxy 1.4 FilterChainProxy 1.5
公司项目NODEJS实践0.1 逐行分析JS源代码 mongodb nginx ubuntu nodejs
一、前言前端如何独立用nodeJs实现一个简单的注册、登录功能，是不是只用nodejs+sql就可以了？其实是可以实现，但离实际应用还有距离，那要怎么做才是实际可用的。网上有很多nod
java.lang.Math liuhaibo_ljf java Math lang
System.out.println(Math.PI); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1)); System.out.println(Math.abs(111111111)); System.out.println(Mat
linux下时间同步 nonobaba ntp
今天在linux下做hbase集群的时候，发现hmaster启动成功了，但是用hbase命令进入shell的时候报了一个错误 PleaseHoldException: Master is initializing，查看了日志，大致意思是说master和slave时间不同步，没办法，只好找一种手动同步一下，后来发现一共部署了10来台机器，手动同步偏差又比较大，所以还是从网上找现成的解决方
ZooKeeper3.4.6的集群部署 roadrunners zookeeper 集群部署
ZooKeeper是Apache的一个开源项目，在分布式服务中应用比较广泛。它主要用来解决分布式应用中经常遇到的一些数据管理问题，如：统一命名服务、状态同步、集群管理、配置文件管理、同步锁、队列等。这里主要讲集群中ZooKeeper的部署。 1、准备工作我们准备3台机器做ZooKeeper集群，分别在3台机器上创建ZooKeeper需要的目录。数据存储目录
Java高效读取大文件 tomcat_oracle java
　　读取文件行的标准方式是在内存中读取，Guava 和Apache Commons IO都提供了如下所示快速读取文件行的方法：　　Files.readLines(new File(path), Charsets.UTF_8); 　　FileUtils.readLines(new File(path)); 　　这种方法带来的问题是文件的所有行都被存放在内存中，当文件足够大时很快就会导致
微信支付api返回的xml转换为Map的方法 xu3508620 xml map 微信api
举例如下： <xml> <return_code><![CDATA[SUCCESS]]></return_code> <return_msg><![CDATA[OK]]></return_msg> <appid><