Python编程导师

自己动手制作C 语言编译器（3）：词法分析器

本篇我们要讲解如何构建词法分析器。

什么是词法分析器

简而言之，词法分析器用于对源码字符串做预处理，以减少语法分析器的复杂程度。

词法分析器以源码字符串为输入，输出为标记流（token stream），即一连串的标记，每个标记通常包括：(token, token value)即标记本身和标记的值。例如，源码中若包含一个数字'998'，词法分析器将输出(Number, 998)，即（数字，998）。再例如：

2 + 3 * (4 - 5)

=>

(Number, 2) Add (Number, 3) Multiply Left-Bracket (Number, 4) Subtract (Number, 5) Right-Bracket

通过词法分析器的预处理，语法分析器的复杂度会大大降低，这点在后面的语法分析器我们就能体会。如果想一起交流的可以加这个群：941636044 ，有什么问题可以群里面交流，群里面也有一些方便学习C语言C++编程的资料可以给你利用。

词法分析器与编译器

要是深入词法分析器，你就会发现，它的本质上也是编译器。我们的编译器是以标记流为输入，输出汇编代码，而词法分析器则是以源码字符串为输入，输出标记流。

+-------+ +--------+

-- source code --> | lexer | --> token stream --> | parser | --> assembly

+-------+ +--------+

在这个前提下，我们可以这样认为：直接从源代码编译成汇编代码是很困难的，因为输入的字符串比较难处理。所以我们先编写一个较为简单的编译器（词法分析器）来将字符串转换成标记流，而标记流对于语法分析器而言就容易处理得多了。

词法分析器的实现

由于词法分析的工作很常见，但又枯燥且容易出错，所以人们已经开发出了许多工具来生成词法分析器，如lex, flex。这些工具允许我们通过正则表达式来识别标记。

这里注意的是，我们并不会一次性地将所有源码全部转换成标记流，原因有二：

1.字符串转换成标记流有时是有状态的，即与代码的上下文是有关系的。

2.保存所有的标记流没有意义且浪费空间。

所以实际的处理方法是提供一个函数（即前几篇中提到的next()），每次调用该函数则返回下一个标记。

支持的标记

在全局中添加如下定义：

// tokens and classes (operators last and in precedence order)

enum {

  Num = 128, Fun, Sys, Glo, Loc, Id,

  Char, Else, Enum, If, Int, Return, Sizeof, While,

  Assign, Cond, Lor, Lan, Or, Xor, And, Eq, Ne, Lt, Gt, Le, Ge, Shl, Shr, Add, Sub, Mul, Div, Mod, Inc, Dec, Brak

};

这些就是我们要支持的标记符。例如，我们会将=解析为Assign；将==解析为Eq；将!=解析为Ne等等。

所以这里我们会有这样的印象，一个标记（token）可能包含多个字符，且多数情况下如此。而词法分析器能减小语法分析复杂度的原因，正是因为它相当于通过一定的编码（更多的标记）来压缩了源码字符串。

当然，上面这些标记是有顺序的，跟它们在 C 语言中的优先级有关，如*(Mul)的优先级就要高于+(Add)。它们的具体使用在后面的语法分析中会提到。

最后要注意的是还有一些字符，它们自己就构成了标记，如右方括号]或波浪号~等。我们不另外处理它们的原因是：

1.它们是单字符的，即并不是多个字符共同构成标记（如==需要两个字符）；

2.它们不涉及优先级关系。

词法分析器的框架

即next()函数的主体：

void next() {

    char *last_pos;

    int hash;

    while (token = *src) {

        ++src;

        // parse token here

    }

    return;

}

这里的一个问题是，为什么要用while循环呢？这就涉及到编译器（记得我们说过词法分析器也是某种意义上的编译器）的一个问题：如何处理错误？

对词法分析器而言，若碰到了一个我们不认识的字符该怎么处理？一般处理的方法有两种：

指出错误发生的位置，并退出整个程序

指出错误发生的位置，跳过当前错误并继续编译

这个while循环的作用就是跳过这些我们不识别的字符，我们同时还用它来处理空白字符。我们知道，C 语言中空格是用来作为分隔用的，并不作为语法的一部分。因此在实现中我们将它作为“不识别”的字符，这个while循环可以用来跳过它。

换行符

换行符和空格类似，但有一点不同，每次遇到换行符，我们需要将当前的行号加一：

// parse token here

...

if (token == '\n') {

++line;

}

...

宏定义

C 语言的宏定义以字符#开头，如# include 。我们的编译器并不支持宏定义，所以直接跳过它们。

else if (token == '#') {

    // skip macro, because we will not support it

    while (*src != 0 && *src != '\n') {

        src++;

    }

}

标识符与符号表

标识符（identifier）可以理解为变量名。对于语法分析而言，我们并不关心一个变量具体叫什么名字，而只关心这个变量名代表的唯一标识。例如int a;定义了变量a，而之后的语句a = 10，我们需要知道这两个a指向的是同一个变量。

基于这个理由，词法分析器会把扫描到的标识符全都保存到一张表中，遇到新的标识符就去查这张表，如果标识符已经存在，就返回它的唯一标识。

那么我们怎么表示标识符呢？如下：

struct identifier {

    int token;

    int hash;

    char * name;

    int class;

    int type;

    int value;

    int Bclass;

    int Btype;

    int Bvalue;

}

这里解释一下具体的含义：

1.token：该标识符返回的标记，理论上所有的变量返回的标记都应该是Id，但实际上由于我们还将在符号表中加入关键字如if,while等，它们都有对应的标记。

2.hash：顾名思义，就是这个标识符的哈希值，用于标识符的快速比较。

3.name：存放标识符本身的字符串。

4.class：该标识符的类别，如数字，全局变量或局部变量等。

5.type：标识符的类型，即如果它是个变量，变量是int型、char型还是指针型。

6.value：存放这个标识符的值，如标识符是函数，刚存放函数的地址。

7.BXXXX：C 语言中标识符可以是全局的也可以是局部的，当局部标识符的名字与全局标识符相同时，用作保存全局标识符的信息。

由上可以看出，我们实现的词法分析器与传统意义上的词法分析器不太相同。传统意义上的符号表只需要知道标识符的唯一标识即可，而我们还存放了一些只有语法分析器才会得到的信息，如type。

由于我们的目标是能自举，而我们定义的语法不支持struct，故而使用下列方式。

Symbol table:

----+-----+----+----+----+-----+-----+-----+------+------+----

.. |token|hash|name|type|class|value|btype|bclass|bvalue| ..

----+-----+----+----+----+-----+-----+-----+------+------+----

|<--- one single identifier --->|

即用一个整型数组来保存相关的ID信息。每个ID占用数组中的9个空间，分析标识符的相关代码如下：

int token_val;                // value of current token (mainly for number)

int *current_id,              // current parsed ID

    *symbols;                 // symbol table

// fields of identifier

enum {Token, Hash, Name, Type, Class, Value, BType, BClass, BValue, IdSize};

void next() {

        ...

        else if ((token >= 'a' && token <= 'z') || (token >= 'A' && token <= 'Z') || (token == '_')) {

            // parse identifier

            last_pos = src - 1;

            hash = token;

            while ((*src >= 'a' && *src <= 'z') || (*src >= 'A' && *src <= 'Z') || (*src >= '0' && *src <= '9') || (*src == '_')) {

                hash = hash * 147 + *src;

                src++;

            }

            // look for existing identifier, linear search

            current_id = symbols;

            while (current_id[Token]) {

                if (current_id[Hash] == hash && !memcmp((char *)current_id[Name], last_pos, src - last_pos)) {

                    //found one, return

                    token = current_id[Token];

                    return;

                }

                current_id = current_id + IdSize;

            }

            // store new ID

            current_id[Name] = (int)last_pos;

            current_id[Hash] = hash;

            token = current_id[Token] = Id;

            return;

        }

        ...

}

查找已有标识符的方法是线性查找symbols表。

数字

数字中较为复杂的一点是需要支持十进制、十六进制及八进制。逻辑也较为直接，可能唯一不好理解的是获取十六进制的值相关的代码。

token_val = token_val * 16 + (token & 16) + (token >= 'A' ? 9 : 0);

这里要注意的是在ASCII码中，字符a对应的十六进制值是61,A是41，故通过(token & 16)可以得到个位数的值。其它就不多说了，这里这样写的目的是装B（其实是抄 c4 的源代码的）。

void next() {

        ...

        else if (token >= '0' && token <= '9') {

// parse number, three kinds: dec(123) hex(0x123) oct(017)

token_val = token - '0';

if (token_val > 0) {

// dec, starts with [1-9]

while (*src >= '0' && *src <= '9') {

token_val = token_val*10 + *src++ - '0';

}

} else {

// starts with number 0

if (*src == 'x' || *src == 'X') {

//hex

token = *++src;

while ((token >= '0' && token <= '9') || (token >= 'a' && token <= 'f') || (token >= 'A' && token <= 'F')) {

token_val = token_val * 16 + (token & 15) + (token >= 'A' ? 9 : 0);

token = *++src;

}

} else {

// oct

while (*src >= '0' && *src <= '7') {

token_val = token_val*8 + *src++ - '0';

}

}

}

token = Num;

return;

}

        ...

}

字符串

在分析时，如果分析到字符串，我们需要将它存放到前一篇文章中说的data段中。然后返回它在data段中的地址。另一个特殊的地方是我们需要支持转义符。例如用\n表示换行符。由于本编译器的目的是达到自己编译自己，所以代码中并没有支持除\n的转义符，如\t,\r等，但仍支持\a表示字符a的语法，如\"表示"。

在分析时，我们将同时分析单个字符如'a'和字符串如"a string"。若得到的是单个字符，我们以Num的形式返回。相关代码如下：

void next() {

        ...

        else if (token == '"' || token == '\'') {

            // parse string literal, currently, the only supported escape

            // character is '\n', store the string literal into data.

            last_pos = data;

            while (*src != 0 && *src != token) {

                token_val = *src++;

                if (token_val == '\\') {

                    // escape character

                    token_val = *src++;

                    if (token_val == 'n') {

                        token_val = '\n';

                    }

                }

                if (token == '"') {

                    *data++ = token_val;

                }

            }

            src++;

            // if it is a single character, return Num token

            if (token == '"') {

                token_val = (int)last_pos;

            } else {

                token = Num;

            }

            return;

        }

}

注释

在我们的 C 语言中，只支持//类型的注释，不支持/* comments */的注释。

void next() {

        ...

        else if (token == '/') {

            if (*src == '/') {

                // skip comments

                while (*src != 0 && *src != '\n') {

                    ++src;

                }

            } else {

                // divide operator

                token = Div;

                return;

            }

        }

        ...

}

这里我们要额外介绍lookahead的概念，即提前看多个字符。上述代码中我们看到，除了跳过注释，我们还可能返回除号/(Div)标记。

提前看字符的原理是：有一个或多个标记是以同样的字符开头的（如本小节中的注释与除号），因此只凭当前的字符我们并无法确定具体应该解释成哪一个标记，所以只能再向前查看字符，如本例需向前查看一个字符，若是/则说明是注释，反之则是除号。

我们之前说过，词法分析器本质上也是编译器，其实提前看字符的概念也存在于编译器，只是这时就是提前看k个“标记”而不是“字符”了。平时听到的LL(k)中的k就是需要向前看的标记的个数了。

另外，我们用词法分析器将源码转换成标记流，能减小语法分析复杂度，原因之一就是减少了语法分析器需要“向前看”的字符个数。

其它

其它的标记的解析就相对容易一些了，我们直接贴上代码：

void next() {

        ...

        else if (token == '=') {

            // parse '==' and '='

            if (*src == '=') {

                src ++;

                token = Eq;

            } else {

                token = Assign;

            }

            return;

        }

        else if (token == '+') {

            // parse '+' and '++'

            if (*src == '+') {

                src ++;

                token = Inc;

            } else {

                token = Add;

            }

            return;

        }

        else if (token == '-') {

            // parse '-' and '--'

            if (*src == '-') {

                src ++;

                token = Dec;

            } else {

                token = Sub;

            }

            return;

        }

        else if (token == '!') {

            // parse '!='

            if (*src == '=') {

                src++;

                token = Ne;

            }

            return;

        }

        else if (token == '<') {

            // parse '<=', '<<' or '<'

            if (*src == '=') {

                src ++;

                token = Le;

            } else if (*src == '<') {

                src ++;

                token = Shl;

            } else {

                token = Lt;

            }

            return;

        }

        else if (token == '>') {

            // parse '>=', '>>' or '>'

            if (*src == '=') {

                src ++;

                token = Ge;

            } else if (*src == '>') {

                src ++;

                token = Shr;

            } else {

                token = Gt;

            }

            return;

        }

        else if (token == '|') {

            // parse '|' or '||'

            if (*src == '|') {

                src ++;

                token = Lor;

            } else {

                token = Or;

            }

            return;

        }

        else if (token == '&') {

            // parse '&' and '&&'

            if (*src == '&') {

                src ++;

                token = Lan;

            } else {

                token = And;

            }

            return;

        }

        else if (token == '^') {

            token = Xor;

            return;

        }

        else if (token == '%') {

            token = Mod;

            return;

        }

        else if (token == '*') {

            token = Mul;

            return;

        }

        else if (token == '[') {

            token = Brak;

            return;

        }

        else if (token == '?') {

            token = Cond;

            return;

        }

        else if (token == '~' || token == ';' || token == '{' || token == '}' || token == '(' || token == ')' || token == ']' || token == ',' || token == ':') {

            // directly return the character as token;

            return;

        }

        ...

}

代码较多，但主要逻辑就是向前看一个字符来确定真正的标记。

关键字与内置函数

虽然上面写完了词法分析器，但还有一个问题需要考虑，那就是“关键字”，例如if,while,return等。它们不能被作为普通的标识符，因为有特殊的含义。

一般有两种处理方法：

1.词法分析器中直接解析这些关键字。

2.在语法分析前将关键字提前加入符号表。

这里我们就采用第二种方法，将它们加入符号表，并提前为它们赋予必要的信息（还记得前面说的标识符Token字段吗？）。这样当源代码中出现关键字时，它们会被解析成标识符，但由于符号表中已经有了相关的信息，我们就能知道它们是特殊的关键字。

内置函数的行为也和关键字类似，不同的只是赋值的信息，在main函数中进行初始化如下：

// types of variable/function

enum { CHAR, INT, PTR };

int *idmain;                  // the `main` function

void main() {

    ...

    src = "char else enum if int return sizeof while "

          "open read close printf malloc memset memcmp exit void main";

     // add keywords to symbol table

    i = Char;

    while (i <= While) {

        next();

        current_id[Token] = i++;

    }

    // add library to symbol table

    i = OPEN;

    while (i <= EXIT) {

        next();

        current_id[Class] = Sys;

        current_id[Type] = INT;

        current_id[Value] = i++;

    }

    next(); current_id[Token] = Char; // handle void type

    next(); idmain = current_id; // keep track of main

    ...

    program();

}

小结

本章我们为我们的编译器构建了词法分析器，通过本章的学习，我认为有几个要点需要强调：

1.词法分析器的作用是对源码字符串进行预处理，作用是减小语法分析器的复杂程度。

2.词法分析器本身可以认为是一个编译器，输入是源码，输出是标记流。

3.lookahead(k)的概念，即向前看k个字符或标记。

4.词法分析中如何处理标识符与符号表。

下一章中，我们将介绍递归下降的语法分析器。我们下一章见。如果想一起交流的可以加这个群：941636044 ，有什么问题可以群里面交流，群里面也有一些方便学习C语言C++编程的资料可以给你利用哦！

你可能感兴趣的:(编程,C语言,c/c++,词法分析器,编译器,编程,C语言,程序)

2025年美赛数学建模 MCM Problem B: Managing Sustainable Tourism 问题 B：可持续旅游管理思路+代码解析【第一问】一键难忘付费专栏数学建模 2025美赛 2025年美赛数学建模可持续旅游管理
本文为个人解题笔记，仅供参考学习。本文B题的第一问。其他问题均在本专栏内，订阅一次，全部可见。本文为个人解题笔记，仅供参考学习。第一小问【为阿拉斯加州朱诺建⽴⼀个可持续旅游业模型。】BuildamodelforasustainabletourismindustryinJuneau,Alaska.Youmaywanttoconsiderfactorssuchasthenumberofvisitors
Ceph的原理与架构 stybxiao Ceph ceph
Ceph的原理与架构Ceph的原理与架构Ceph的起源与哲学Ceph的技术Ceph的架构及组件
[笔记] 如何在win上安装fbprophet库（Anaconda-Spyder） WangMH_CHN 笔记
fbprophet库是Google开发的一个用于时间序列分析的库，该库的运行需要用到C++编译，因此最开始使用python安装的时候会出现很多问题。本文总结了整个安装过程，记录在此。首先，先阐述初始配置情况：我习惯使用在Anaconda上使用Spyder来写代码，win10系统，系统基础的环境是python3.11。但是fbprophet只支持py2.7、3.5~3.8，因此需要配置一
LoongServe论文解读：prefill/decode分离、弹性并行、零KV Cache迁移 04290629 LLM笔记 transformer 人工智能算法深度学习
LoongServe论文解读：prefill/decode分离、弹性并行、零KVCache迁移LoongServe:EfficientlyServingLong-contextLargeLanguageModelswithElasticSequenceParallelism论文提出了一种支持弹性分配的推理框架，通过引入弹性序列并行（ElasticSequenceParallelism，简称ESP）
Kylin3.3配置vncserver服务 stybxiao kylin3.3 linux
一．安装vncserver服务包rpm-ivhtigervnc-server-1.3.1-9.ky3.kb1.x86_64.rpm二．远程root用户操作步骤：1.cp/lib/systemd/system/[email protected]/etc/systemd/system/vncserver@:1.service2.在/etc/systemd/system/vncserver@:1.se
解决 Lombok 与 Java 模块系统的兼容性问题：从错误到解决方案码农阿豪@新空间代码工作室包罗万象 java 开发语言
个人名片作者简介：java领域优质创作者个人主页：码农阿豪工作室：新空间代码工作室（提供各种软件服务)个人邮箱：[[email protected]]个人微信：15279484656个人导航网站：www.forff.top座右铭：总有人要赢。为什么不能是我呢？专栏导航：码农阿豪系列专栏导航面试专栏：收集了java相关高频面试题，面试实战总结️Spring5系列专栏：整理了Spring5重要知识点与
python文件：py,ipynb, pyi, pyc, pyd, pyo都是什么文件？ m 哆哆.ღ python python 开发语言
python：py,ipynb,pyi,pyc,pyd,pyo都是什么文件？1python文件类型介绍1.1.py文件：源代码.py文件是Python最基本的源代码文件格式，用于存储纯文本形式的Python代码。它是开发者编写程序的主要场所，包含函数、类、变量定义以及执行逻辑。Python解释器直接读取并执行.py文件中的指令。例如，创建一个简单的hello.py文件，内容如下：print("He
2022年美国大学生数学建模竞赛A题自行车运动员的能量特征解题全过程文档及程序数模竞赛Paid answer 美国大学生数学建模竞赛笔记数学建模算法大数据美国大学生数学建模竞赛
2022年美国大学生数学建模竞赛A题自行车运动员的能量特征原题再现：背景自行车公路赛有多种类型，包括标准赛、团体计时赛和个人计时赛。这些比赛的自行车运动员获胜的机会可能会有所不同，具体取决于赛事的类型、路线和自行车运动员的能力。在个人计时赛中，每个骑自行车的运动员都应该单独骑固定的路线，获胜者是在最少时间内完成骑行路线的自行车运动员。单个自行车运动员可以在不同的时间长度内产生不同水平的
Python 数据分析 - 初识 Pandas 一名技术极客 #Python 进阶爬虫 python 数据分析 pandas
Python数据分析-初识Pandas简介SeriesDataFrame创建基本操作添加删除简介Pandas基于NumPy开发，它提供了快速、灵活、明确的数据结构，旨在简单、直观地处理数据。Pandas适用于处理以下类型的数据：有序和无序的时间序列数据带行列标签的矩阵数据，包括同构或异构型数据与SQL或Excel表类似的，含异构列的表格数据任意其它形式的观测、统计数据集，数据转入Pandas数据结
c语言可变参数,C 可变参数详解 weixin_39710003 c语言可变参数
所谓可变参数又称参数个数可变函数，即函数参数数目可变，我想你也会经常遇到一个问题就是你想要一个可变数量的参数，不是就指定的函数，那c语言中的可变参数就能发挥作用了。就像我前面说的，c可变参数就是能改变参数个数的。原型声明格式为：typeVarArgFunc(typeFixedArg1,typeFixedArg2,…);我们来一个例子来练习：intfunc(int,...){...}intmain(
c语言可变参数回调,[转]可变参数函数详解 kinzafinance c语言可变参数回调
可变参数函数又称参数个数可变函数(本文也简称变参函数)，即函数参数数目可变。原型声明格式为：typeVarArgFunc(typeFixedArg1,typeFixedArg2,…);其中，参数可分为两部分：数目确定的固定参数和数目可变的可选参数。函数至少需要一个固定参数，其声明与普通函数参数相同；可选参数由于数目不定(0个或以上)，声明时用"…"表示(“…”用作参数占位符)。固定参数和可选参数共
github最强Chatbox AI 模型桌面，支持 ChatGPT、Claude等主流模型，适用于 Win、Linux等，总结文档图片并互动，智能编程，AI实时联网搜索与查询，图片生成，科研写作等 struggle2025 人工智能深度学习语音识别计算机视觉语言模型图像处理数据分析
一、软件介绍（文末提供下载）Chatbox是一个AI模型桌面客户端，支持ChatGPT、Claude、GoogleGemini、Ollama等主流模型，适用于Windows、Mac、Linux、Web、Android和iOS全平台。github地址：GitHub-Bin-Huang/chatbox:User-friendlyDesktopClientAppforAIModels/LLMs(GPT,
【uniapp】uniapp使用java线程池新青年. uni-app javascript
标题由于js是性能孱弱的单线程语言，只要在渲染中执行了一些其他操作，会中断渲染，导致页面卡死，卡顿，吐司不消失等问题。在安卓端可以调用java线程池，把耗时操作写入线程池里面，优化性能。实现使用native.js,直接贴出代码classJavaExecutorPool{constructor(){//#ifdefAPP-PLUSconstScheduledThreadPoolExecutor=pl
理解Ceph的三种存储方式(块设备、文件系统、对象存储) 118路司机大数据
前言Ceph是一个开源的、统一的、分布式的存储系统这是我们宣传Ceph时常说的一句话，其中“统一”是说Ceph可以一套存储系统同时提供块设备存储、文件系统存储和对象存储三种存储功能。一听这句话，具有一定存储基础的用户应该已经大致了解了Ceph的存储接口，而没有存储基础的小白用户则一脸懵逼。本文旨在让小白用户理解Ceph的块存储、文件系统存储和对象存储接口。一.Ceph的块设备存储接口什么是块设备？
计算机网络之计算机网络协议、接口、服务等概念 DKPT #计算机网络开发语言计算机网络笔记算法 c语言
一、计算机网络协议定义：计算机网络协议是实现计算机网络中不同计算机系统之间的通信所必须遵守的通信规则的集合。这些规则规定了数据如何在网络中传递、处理的格式、同步问题等。要素：语法：数据与控制信息的结构或格式。语义：需要发出何种控制信息，完成何种动作以及做出何种响应。同步：事件实现顺序的详细说明。示例：TCP/IP协议：互联网上最常用的协议，它规定了如何在互联网上传递数据，包括IP协议（负责数据包的
Ceph存储架构详解 wespten 虚拟化技术 SDN NFV 云计算技术 OpenStack 数据库存储块存储文件存储对象存储分布式网络存储 ceph 架构
1、Ceph三大存储接口Ceph能够提供企业中三种常见的存储需求：块存储、文件存储和对象存储。正如Ceph官方所定义的一样“Cephuniquelydeliversobject,block,andfilestorageinoneunifiedsystem.”，Ceph在一个统一的存储系统中同时提供了对象存储、块存储和文件存储，即Ceph是一个统一存储，能够将企业企业中的三种存储需求统一汇总到一个存
Python中使用SQLite 昂热校长
开发十年，就只剩下这套Java开发体系了>>>SQLite：SQLite是一种数据库，Python中集成了SQLite3，所以在Python中使用SQLite，可以直接导入SQLite包，不需要做额外的配置。更多的SQLite简介和相关知识可以查看专门的教程：http://www.runoob.com/sqlite/sqlite-tutorial.htmlPython中使用SQLite:可以直接像
用例驱动的设计阶段 njj10 文档 mvc 任务存储
我们在画完用例图，和用例文档后可以开始进入到设计阶段了。首先，我们为了便于画顺序图，需要画一个所谓的健壮图，健壮图的作用是1。正常性检查——检查用例是否可以被系统实现；2。完整性检查——把用例中所有的功能列出来，以防在画顺序图时遗漏功能。健壮性图为：边界类，控制类，实体类。对应与MVC模式。边界类直接和用户接触，例如窗口，按钮等，控制类是一些业务逻辑，实体类一般用于存储数据。健壮图能把用例初步可视
pycharm、anaconda安装tensorflow问题努力的南波万 pycharm tensorflow neo4j
(pythonconda01)C:\Users\lvd13>condainstalltensorflowChannels:-defaultsPlatform:win-64Collectingpackagemetadata(repodata.json):doneSolvingenvironment:|warninglibmambaAddedemptydependencyforproblemtypeS
2025年美赛数学建模 MCM Problem B: Managing Sustainable Tourism 问题 B：可持续旅游管理代码解析 2025年数学建模美赛 2025年美赛MCM/ICM 数学建模旅游 2025美赛 2025年数学建模美赛 python代码 matlab 可持续旅游管理
目录代码框架：遗传算法优化可持续旅游模型python代码代码解析：matlab代码代码解析：代码框架：遗传算法优化可持续旅游模型python代码importnumpyasnpimportrandomimportmatplotlib.pyplotasplt#定义遗传算法的参数POP_SIZE=100#种群大小GENS=500#迭代代数MUTATION_RATE=0.01#变异率CROSSOVER_R
秒杀架构-详细 Ybb_studyRecord 笔记架构 java 分布式
秒杀架构秒杀架构秒杀活动的特点要解决的问题涉及技术点问题解决方案瞬时大流量的冲击超卖、少卖问题高可用恶意请求用户秒杀流程图秒杀架构核心：把量变少，限流适当增加机器，重新设计秒杀架构，让普通业务和秒杀业务分离开，秒杀不影响普通业务，分治法，分而治之（分散流量）把量拆开1.在不同地区部署同样的架构+限流，分散流量2.所有静态页全部扔到CDN中，原生支持多地域分散流量秒杀活动的特点1，瞬时大流量所以需要
springboot中DTO、VO、Entity相互转换会说法语的猪后端 springboot java spring boot 后端 java
在我们平时开发中，dto、vo、entity之间的相互转换是很频繁的操作，这篇就简单记录一下我在平时开发中转换的方法。在这之前先简单描述一下dto、vo、entityDTO：一般我们在开发中会定义数据传输对象（DataTransferObject,DTO）来接收前端传递的参数是最常见的。VO：平时开发中，一般会定义VO（viewobject）来封装返回给前端的数据Entity：在我们开发中，Ent
uniapp 自定义图片预览组件PicturePreview（Vue3、组合式、ts）舍予一前端知识汇总 uni-app javascript 前端
组件import{ref}from'vue';constimages=ref>([]);constcurrentIndex=ref(0);constshow=ref(false);constscale=ref(1);functiononSwiperChange(e:any){scale.value=1;currentIndex.value=e.detail.current;}constonScal
《C++ 并发编程指南》：开启并发编程新篇章孔秋宗Mora
《C++并发编程指南》：开启并发编程新篇章Cplusplus-Concurrency-In-PracticeADetailedCplusplusConcurrencyTutorial《C++并发编程指南》项目地址:https://gitcode.com/gh_mirrors/cp/Cplusplus-Concurrency-In-Practice项目介绍《C++并发编程指南》是一本开源书籍，旨在为
使用 Go 和 Tesseract 实现验证码识别一休哥助手 golang 开发语言后端
一、验证码识别的背景与挑战1.1验证码的作用验证码（CAPTCHA,CompletelyAutomatedPublicTuringtesttotellComputersandHumansApart）主要用于区分人类用户和机器程序。常见验证码类型包括：文本型验证码：包含扭曲、旋转或噪声干扰的字符。图片型验证码：让用户选择特定内容的图片。行为型验证码：要求用户完成特定操作（如拖拽滑块）。1.2验证码识
C++ 并发编程指南（3）线程安全一个不务正业的程序猿 C++并发编程指南 c++安全 java
文章目录一、线程安全1、什么是线程安全？2、并发编程Bug源头2.1、可见性问题2.2、有序性问题2.3、原子性问题3、线程安全的基本原则前言在多线程编程中，线程安全是一个至关重要的概念。当多个线程并发访问共享数据时，如果没有适当的同步机制，就可能导致数据竞争、死锁、饥饿等问题。一、线程安全1、什么是线程安全？解释一线程安全是指代码在多线程环境下运行时的安全性。如果一个类或者函数在多线程环境中被安
python 操作sqlite COSummer python python sqlite
importsqlite3if__name__=='__main__':cx=sqlite3.connect("C:/Users/503061752/Desktop/AutoTest.sdb")cu=cx.cursor()cu.execute("select*fromwaiting_time")res=cu.fetchall()forcurresinres:print(curres)以上代码实现的
前端经典样式参考 momomo_mocs 前端 javascript 开发语言
左边导航栏；右边展示区组件间通信方式使用-根目录{{idx+1}}.{{navigateItem.title}}import{reactive}from'vue'letnavigaters=reactive([{title:"PropsLearn",linkPath:"/props"},{title:"CustomEvent",linkPath:"/props"},{title:"Provide-
日常Bug-uni.navigateBack返回带参数打豆豆升级日常Bug
此类需求大致意思：从A页面进入B页面，B页面返回并传值给A页面我使用的这种方法是：B页面返回前改变A页面中data的值，不需要A页面做操作，要是想要在A页面做操作的话，可以监听A页面值的改变H5中使用//B页面返回letpages=getCurrentPages();letprevPage=pages[pages.length-2]//-1是当前页面-2则是上一页面prevPage.$data.g
深入探讨：服务器如何响应前端请求及后端如何查看前端提交的数据我的青春不太冷服务器前端运维
深入探讨：服务器如何响应前端请求及后端如何查看前端提交的数据一、服务器如何响应前端请求前端与后端的交互主要通过HTTP协议实现。以下是详细步骤：1.前端发起HTTP请求GET请求：用于从服务器获取数据。POST请求：用于向服务器提交数据。例如，使用JavaScript的fetchAPI发送POST请求：fetch('https://example.com/api/data',{method:'PO
312个免费高速HTTP代理IP（能隐藏自己真实IP地址） yangshangchuan 高速免费 superword HTTP代理
124.88.67.20:843 190.36.223.93:8080 117.147.221.38:8123 122.228.92.103:3128 183.247.211.159:8123 124.88.67.35:81 112.18.51.167:8123 218.28.96.39:3128 49.94.160.198:3128 183.20
pull解析和json编码百合不是茶 android pull解析 json
n.json文件: [{name:java,lan:c++,age:17},{name:android,lan:java,age:8}] pull.xml文件 <?xml version="1.0" encoding="utf-8"?> <stu> <name>java
[能源与矿产]石油与地球生态系统 comsci 能源
按照苏联的科学界的说法,石油并非是远古的生物残骸的演变产物,而是一种可以由某些特殊地质结构和物理条件生产出来的东西,也就是说,石油是可以自增长的.... 那么我们做一个猜想: 石油好像是地球的体液,我们地球具有自动产生石油的某种机制,只要我们不过量开采石油,并保护好
类与对象浅谈沐刃青蛟 java 基础
类，字面理解，便是同一种事物的总称，比如人类，是对世界上所有人的一个总称。而对象，便是类的具体化，实例化，是一个具体事物，比如张飞这个人，就是人类的一个对象。但要注意的是：张飞这个人是对象，而不是张飞，张飞只是他这个人的名字，是他的属性而已。而一个类中包含了属性和方法这两兄弟，他们分别用来描述对象的行为和性质（感觉应该是
新站开始被收录后，我们应该做什么？ IT独行者 PHP seo
新站开始被收录后，我们应该做什么？百度终于开始收录自己的网站了，作为站长，你是不是觉得那一刻很有成就感呢，同时，你是不是又很茫然，不知道下一步该做什么了？至少我当初就是这样，在这里和大家一份分享一下新站收录后，我们要做哪些工作。至于如何让百度快速收录自己的网站，可以参考我之前的帖子《新站让百
oracle 连接碰到的问题文强chu oracle
Unable to find a java Virtual Machine－－安装64位版Oracle11gR2后无法启动SQLDeveloper的解决方案作者：草根IT网来源：未知人气：813标签：导读：安装64位版Oracle11gR2后发现启动SQLDeveloper时弹出配置java.exe的路径，找到Oracle自带java.exe后产生的路径“C:\app\用户名\prod
Swing中按ctrl键同时移动鼠标拖动组件（类中多借口共享同一数据）小桔子 java 继承 swing 接口监听
都知道java中类只能单继承，但可以实现多个接口，但我发现实现多个接口之后，多个接口却不能共享同一个数据，应用开发中想实现：当用户按着ctrl键时，可以用鼠标点击拖动组件，比如说文本框。编写一个监听实现KeyListener,NouseListener,MouseMotionListener三个接口，重写方法。定义一个全局变量boolea
linux常用的命令 aichenglong linux 常用命令
1 startx切换到图形化界面 2 man命令:查看帮助信息 man 需要查看的命令,man命令提供了大量的帮助信息,一般可以分成4个部分 name:对命令的简单说明 synopsis:命令的使用格式说明 description:命令的详细说明信息 options:命令的各项说明 3 date:显示时间语法：date [OPTION]... [+FORMAT]
eclipse内存优化 AILIKES java eclipse jvm jdk
一基本说明在JVM中，总体上分2块内存区,默认空余堆内存小于 40%时，JVM就会增大堆直到-Xmx的最大限制；空余堆内存大于70%时，JVM会减少堆直到-Xms的最小限制。 1)堆内存(Heap memory):堆是运行时数据区域，所有类实例和数组的内存均从此处分配,是Java代码可及的内存，是留给开发人
关键字的使用探讨百合不是茶关键字
//关键字的使用探讨/*访问关键词private 只能在本类中访问public 只能在本工程中访问protected 只能在包中和子类中访问默认的只能在包中访问*//*final 类方法变量 final 类不能被继承 final 方法不能被子类覆盖，但可以继承 final 变量只能有一次赋值，赋值后不能改变 final 不能用来修饰构造方法*///this()
JS中定义对象的几种方式 bijian1013 js
1. 基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)： <html> <head> <title>基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)</title> </head> <script> var obj = new Object();
表驱动法实例 bijian1013 java 表驱动法 TDD
获得月的天数是典型的直接访问驱动表方式的实例，下面我们来展示一下： MonthDaysTest.java package com.study.test; import org.junit.Assert; import org.junit.Test; import com.study.MonthDays; public class MonthDaysTest { @T
LInux启停重启常用服务器的脚本 bit1129 linux
启动，停止和重启常用服务器的Bash脚本，对于每个服务器，需要根据实际的安装路径做相应的修改 #! /bin/bash Servers=(Apache2, Nginx, Resin, Tomcat, Couchbase, SVN, ActiveMQ, Mongo); Ops=(Start, Stop, Restart); currentDir=$(pwd); echo
【HBase六】REST操作HBase bit1129 hbase
HBase提供了REST风格的服务方便查看HBase集群的信息，以及执行增删改查操作 1. 启动和停止HBase REST 服务 1.1 启动REST服务前台启动（默认端口号8080） [hadoop@hadoop bin]$ ./hbase rest start 后台启动 hbase-daemon.sh start rest 启动时指定
大话zabbix 3.0设计假设 ronin47
What’s new in Zabbix 2.0? 去年开始使用Zabbix的时候，是1.8.X的版本，今年Zabbix已经跨入了2.0的时代。看了2.0的release notes，和performance相关的有下面几个： :: Performance improvements::Trigger related da
http错误码大全 byalias http协议 javaweb
响应码由三位十进制数字组成，它们出现在由HTTP服务器发送的响应的第一行。响应码分五种类型，由它们的第一位数字表示： 1）1xx：信息，请求收到，继续处理 2）2xx：成功，行为被成功地接受、理解和采纳 3）3xx：重定向，为了完成请求，必须进一步执行的动作 4）4xx：客户端错误，请求包含语法错误或者请求无法实现 5）5xx：服务器错误，服务器不能实现一种明显无效的请求
J2EE设计模式-Intercepting Filter bylijinnan java 设计模式数据结构
Intercepting Filter类似于职责链模式有两种实现其中一种是Filter之间没有联系，全部Filter都存放在FilterChain中，由FilterChain来有序或无序地把把所有Filter调用一遍。没有用到链表这种数据结构。示例如下： package com.ljn.filter.custom; import java.util.ArrayList;
修改jboss端口 chicony jboss
修改jboss端口 %JBOSS_HOME%\server\{服务实例名}\conf\bindingservice.beans\META-INF\bindings-jboss-beans.xml 中找到 <!-- The ports-default bindings are obtained by taking the base bindin
c++ 用类模版实现数组类 CrazyMizzz C++
最近c++学到数组类，写了代码将他实现，基本具有vector类的功能 #include<iostream> #include<string> #include<cassert> using namespace std; template<class T> class Array { public: //构造函数
hadoop dfs.datanode.du.reserved 预留空间配置方法 daizj hadoop 预留空间
对于datanode配置预留空间的方法为：在hdfs-site.xml添加如下配置 <property> <name>dfs.datanode.du.reserved</name> <value>10737418240</value>
mysql远程访问的设置 dcj3sjt126com mysql 防火墙
第一步: 激活网络设置你需要编辑mysql配置文件my.cnf. 通常状况，my.cnf放置于在以下目录： /etc/mysql/my.cnf (Debian linux) /etc/my.cnf （Red Hat Linux/Fedora Linux) /var/db/mysql/my.cnf (FreeBSD) 然后用vi编辑my.cnf，修改内容从以下行： [mysqld] 你所需要: 1
ios 使用特定的popToViewController返回到相应的Controller dcj3sjt126com controller
1、取navigationCtroller中的Controllers NSArray * ctrlArray = self.navigationController.viewControllers; 2、取出后，执行， [self.navigationController popToViewController:[ctrlArray objectAtIndex:0] animated:YES
Linux正则表达式和通配符的区别 eksliang 正则表达式通配符和正则表达式的区别通配符
转载请出自出处：http://eksliang.iteye.com/blog/1976579 首先得明白二者是截然不同的通配符只能用在shell命令中,用来处理字符串的的匹配。判断一个命令是否为bash shell(linux 默认的shell)的内置命令 type -t commad 返回结果含义 file 表示为外部命令 alias 表示该
Ubuntu Mysql Install and CONF gengzg Install
http://www.navicat.com.cn/download/navicat-for-mysql Step1: 下载Navicat ，网址：http://www.navicat.com/en/download/download.html Step2：进入下载目录，解压压缩包：tar -zxvf navicat11_mysql_en.tar.gz
批处理，删除文件bat huqiji windows dos
@echo off ::演示：删除指定路径下指定天数之前（以文件名中包含的日期字符串为准）的文件。 ::如果演示结果无误，把del前面的echo去掉，即可实现真正删除。 ::本例假设文件名中包含的日期字符串（比如：bak-2009-12-25.log） rem 指定待删除文件的存放路径 set SrcDir=C:/Test/BatHome rem 指定天数 set DaysAgo=1
跨浏览器兼容的HTML5视频音频播放器天梯梦 html5
HTML5的video和audio标签是用来在网页中加入视频和音频的标签，在支持html5的浏览器中不需要预先加载Adobe Flash浏览器插件就能轻松快速的播放视频和音频文件。而html5media.js可以在不支持html5的浏览器上使video和audio标签生效。 How to enable <video> and <audio> tags in
Bundle自定义数据传递 hm4123660 android Serializable 自定义数据传递 Bundle Parcelable
我们都知道Bundle可能过put****()方法添加各种基本类型的数据，Intent也可以通过putExtras(Bundle)将数据添加进去，然后通过startActivity()跳到下一下Activity的时候就把数据也传到下一个Activity了。如传递一个字符串到下一个Activity 把数据放到Intent
C＃：异步编程和线程的使用（.NET 4.5 ） powertoolsteam .net 线程 C#异步编程
异步编程和线程处理是并发或并行编程非常重要的功能特征。为了实现异步编程，可使用线程也可以不用。将异步与线程同时讲，将有助于我们更好的理解它们的特征。本文中涉及关键知识点 1. 异步编程 2. 线程的使用 3. 基于任务的异步模式 4. 并行编程 5. 总结异步编程什么是异步操作？异步操作是指某些操作能够独立运行，不依赖主流程或主其他处理流程。通常情况下，C＃程序
spark 查看 job history 日志 Stark_Summer 日志 spark history job
SPARK_HOME/conf 下: spark-defaults.conf 增加如下内容 spark.eventLog.enabled true spark.eventLog.dir hdfs://master:8020/var/log/spark spark.eventLog.compress true spark-env.sh 增加如下内容 export SP
SSH框架搭建 wangxiukai2015eye spring Hibernate struts
MyEclipse搭建SSH框架 Struts Spring Hibernate 1、new一个web project。 2、右键项目，为项目添加Struts支持。选择Struts2 Core Libraries -<MyEclipes-Library> 点击Finish。src目录下多了struts