shiyicode

自制Lex-词法分析器生成器(C++)

前言

前一阵子，编译原理课实验内容是要去做一个词法分析器，实现后，觉得没有把正规表达式和NFA、DFA这些知识用上，所以就产生了想自己去实现一个lex的想法，于是就有了这篇博文。
如果还不知道词法分析器该怎么实现，可以去看c语言词法分析初试(C++实现)。

简介

上图是维基百科对lex的定义。
从中可以明确lex的功能：读进一个代表词法分析器规则的输入字符串流，然后输出以C语言实做的词法分析器源代码。
本质上，本人是在对原lex进行模仿，但使用规则细节什么的与其并不一致，比如原lex用正则表达式来表示词法分析器规则，而本人的自制lex使用的是正规表达式，所以接下来关于原lex的内容不再赘述。

执行流程

1.解析lex文本

1.1文本规则

%{
    c代码区块
%}
%!
    定义区块
%!
%%
    规则1 方法体
%$
    规则2 方法体
%$
    ... 
%%

由上可以看到，整个lex文本分为三个区块。

c代码区

用%{ %}包围，里面内容是c代码，这些代码会原样复制进程序生成的词法分析器源代码中，也就是说，我们可以在这个区块里预定义一些c函数、变量等等。

定义区

用%! %!包围，里面内容是一些定义，格式为 a = b。

a表示我们定义一种输入字符，比如所有的字母、数字，或是a-v，3-7等等区间，或是除了字母以外的任何字符。我们可以给这些值的集合起一个名字为a。
b表示一个函数名，该函数接受一个char字符，返回1或者0，表示输入是否匹配。该函数必须自己在c代码区进行实现。
例如：我们定义 digit = isDigit
digit表示所有的数字，则我们需要实现这样一个函数：

int isDigit(char ch){
    if(ch >= '0' && ch <= '9')
        return 1;
    return 0;
}

完成上述之后，我们就可以在规则区里以{a}的形式在正规表达式中使用该自定义输入。

规则区

这里可以说是整个lex文件最核心的部分了。
我们需要在这里对所有的词法规则用正规表达式进行描述。
还是举个例子，我们要将c语言的标识符的规则进行描述：

正规表达式  方法体

({letter}|_)({letter}|_|digit)* {printf("<$ID, %s>", LEX_TEXT);}

letter表示所有字母，digit表示所有数字，这两者都属于是我们在定义区所自定义的输入类型。
那么上面正规表达式代表的含义就是所有以字母或者下划线开头并后续字母是字母数字或者下划线的字符串，即是我们认为合法的标识符。
后面{}包含的内容是我们的方法体，即定义我们生成的词法分析器当识别出符合正规式定义的字符串后需要进行的操作，该操作用c语言来进行描述。
LEX_TEXT为我们预设定的保存识别出的串的char数组。
那么上面的规则所定义的就是对标识符进行匹配，并在匹配成功之后将其进行输出。

1.2文本识别细节

这部分做的比较粗略。
1.上述三个区域的界符即%{，%!等必须出现在每行的行首，否则会被忽略。
2.所有出现在三个区域外的文本内容全部忽略
3.当出现文本忽略时会报出警告(文本内容及行号)
4.当出现文本识别错误时会进行报错(文本内容及行号)并程序终止。
5.因为正规式里面原本就有(,),|,*等符号，再加上{}用于标识自定义输入的符号以及空格，这些字符均需要进行转义，我定义的转义标志是%，与c语言的\没有什么区别。用%$表示正规表达式里的空。

根据lex文本内容生成NFA等

这部分我用了一个栈来实现，具体细节可参看之前写的一篇博客正规表达式转NFA(C++)，细节有所差异，但是实现思想是一致的，这里就不再重复描述了。
除了要生成NFA，还要完成两件事。
1. 保存定义区里自定义输入与对应判断函数名的映射。
2. 保存NFA的终点状态的序号集合，并保存其各自对应的方法体的映射。

根据NFA生成DFA

这里使用的方法是子集法：
每个状态表示为一个数字，这一点在上面已经提过，那么我们用一个vector表示一个状态集合。
再使用一个set和一个queue，set用于对vector进行查重，queue用于遍历，从起始状态的集合开始，将其经每个输入到达的状态加入queue，当然，前提是该状态集合没有在set中出现过。
这里有个重点是关于空的处理，见代码。

//i为当前状态，input为输入，state为存放可到达的状态的集合
void Lex::findBeGo(int i, string input, vector<int>* state)
{
    for(auto x : nfaVet[i])
    {
        int sId = x.toId;
        bool flag = true;
        for(auto iter=state->begin(); iter!=state->end(); iter++)
            if((*iter) == sId)
            {
                flag = false;
                break;
            }

        if(flag && input.compare(x.input) == 0)
        {
            state->push_back(sId);
            findBeGo(sId, "", state);
        }
    }
}

当然，这里也需要保存DFA的终点状态的序号，并保存其各自对应的方法体的映射。

将DFA转换为C代码

如果用自动机的模式写过一次词法分析器，就很明了，DFA只跟自动机的状态里面内容相关。
即：switch(状态){//} ；里面的内容是需要根据DFA动态生成的，其他的都不需要改变。
所以我们一开始就将switch部分上下的代码都确定，然后根据DFA来生成。
对每一个case来说，我们需要输出的内容只有以下几点：
1. 状态id
2. 状态接受的输入，以及该输入转向的状态id
3. 枚举完所有可接受的输入后，如果当前字符与以上输入都不符合，那么根据该状态是否是终止状态来确定是结束并执行方法体还是报错。例子如下：

case ID:
        {
            ch = *str++;
            SYLEX_TEXT[SYLEX_TEXT_LEN++]=ch;
            if(ch == 输入1){
                SYLEX_STATE = 转向的状态;
            }
            else
            if(ch == 输入2){
                SYLEX_STATE = 转向的状态;
            }
            else
            {
                //根据id是否可终止，来决定是报错还是执行方法体
            }

这里还有个细节，关于我们的自定义输入，因为普通输入字符我们直接是用if(ch == ‘X’)来判断。而自定义输入，我们是通过if(函数名(ch))来判断，所以在输出源代码时，需要先对其输入进行判断是否是自定义输入，这里我们用第一步时建立的映射直接就可以解决。

源码

全部流程都封装在了Lex类中，因为篇幅问题，就只贴类的成员变量和成员函数声明部分的代码。
有兴趣的朋友，可以去github上看完整代码，链接如下。
shiyi1996/project/tree/master/Lex

//
//  Lex.hpp
//  Lex
//
//  Created by shiyi on 2016/10/18.
//  Copyright © 2016年 shiyi. All rights reserved.
//

#ifndef Lex_hpp
#define Lex_hpp

#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 

using namespace std;

struct Node
{
    Node(int fromId, string input, int toId)
    {
        this->fromId = fromId;
        this->input = input;
        this->toId = toId;
    }
    int fromId;
    string input;
    int toId;
};

class Lex
{
public:
    static const int MAXID = 100000;

    Lex(string _lexFile);
    Lex(string _lexFile, string _outCFile);
    void init();

    //写入scanner函数之前
    void outCodeLeft();
    //写入scanner函数之后
    void outCodeRight();
    //写入scanner函数
    void outCodeMid();
    //解析lex源文件
    void scanner();
    //错误警告等输出
    inline void printError(int line, string str, string mess);
    inline void printWaring(int line, string str, string mess);
    //解析方法体
    void getFunc(string str, int line);
    //解析正规式
    void getRegular(string str, int line);

    //------日后补充
    //判断正规式是否合法
    bool isExpre(vectorstring, bool>>);
    //DFA最小化
    void getSimpDFA();

    // -----------

    //添加NFA节点
    inline void addNFANode(int fromId, string input, int toId);
    //添加DFA节点
    inline void addDFANode(int fromId, string input, int toId);

    //正规式转NFA
    void regrToNFA(vectorstring, bool>> regr, int startId, int endId, int &itemId);
    //生成NFA
    void getNFA();
    //生成DFA
    void getDFA();
    //nfa查询
    void findBeGo(int i, string input, vector<int>* state);
    //获取nfa目标状态集合
    vector<int>* getState(vector<int>* fromState, string input);
    //获取终态
    void getVt(map<vector<int>, int> stateMap);

    //执行操作
    void work();

    //输出-测试-
    inline void print();

private:
    string lexFile;
    string outCFile;
    //自定义输入对应方法体
    map<string, string> funcMap;
    //正规式
    vector<vectorstring, bool>>> regrVet;
    //方法体
    vector<string> funcVet;
    //NFA
    vector nfaVet[MAXID];
    //DFA
    vector dfaVet[MAXID];
    //储存所有输入
    set<string> inputSet;
    //DFAend
    int dfaEnd[MAXID];
    //NFAend   值为funcVet item的下标
    int nfaEnd[MAXID];
    int nfaNum;
    int dfaNum;
};

#endif /* Lex_hpp */

测试

Lex代码

%{
#include
#include
#include

const int KEY_NUM = 32;
const char* KEY_SET[] = {
    "auto", "break", "case", "char", "const", "continue",
    "default", "do", "double", "else", "enum", "extern",
    "float", "for", "goto", "if", "int", "long", "register",
    "return", "short", "signed", "sizeof", "static", "struct",
    "switch", "typedef", "union", "unsigned", "void", "volatile",
    "while"
};

int isDigit(char ch)
{
    if(ch <= '9' && ch >= '0')
        return 1;
    return 0;
}

int isLetter(char ch)
{
    if((ch >= 'a' && ch <= 'z') || (ch >= 'A' && ch <= 'Z'))
        return 1;
    return 0;
}

int getKeyId(char *str)
{
    for(int i=0; iif(strcmp(KEY_SET[i], str) == 0)
            return i+1;
    }
    return 0;
}

int isNoOne(char ch)
{
    if(ch != '\'' && ch != '\0')
        return 1;
    return 0;
}

int isNoTow(char ch)
{
    if(ch != '\"' && ch != '\0')
        return 1;
    return 0;
}

%}

%!
noone=isNoOne
notow=isNoTow
letter=isLetter
digit=isDigit
%!


%%
({letter}|_)({letter}|_|{digit})* {
    int id = getKeyId(SYLEX_TEXT);
    if(id != 0)
        printf("<%s,->\n", SYLEX_TEXT);
    else
    {
        printf("<$ID,%s>\n", SYLEX_TEXT);
    }
}
%$
(+|-|%$){digit}{digit}*(.{digit}{digit}*|%$)((E|e){digit}{digit}*|%$) {
    printf("<$NUM,%s>\n", SYLEX_TEXT);
}
%$
%(|%)|%{|%}|[|]|;|,|. {
    printf("<%s,->\n", SYLEX_TEXT);
}
%$
% |{\t}|{\n} {

}
%$
(%*(%=|%$))|(/(=|%$))|(+(+|=|%$))|(-(-|=|%$))|(<(<|=|%$))|(>(>|=|%$))|(=(=|%$))|(&(&|=|%$))|(%|(%||=|%$))|(^(=|%$))|(~(=|%$)) {
    printf("<%s,->\n", SYLEX_TEXT);
}
%$
({\'}{noone}*{\'})|({\"}{notow}*{\"}) {
    printf("<$STR,%s>\n", SYLEX_TEXT);
}
%$
#include(% )*((<({letter}|_)({letter}|_|{digit})*.h>)|("({letter}|_)({letter}|_|{digit})*.h")) {
    printf("%s 应该预处理的，暂时先忽略", SYLEX_TEXT);
}
%%

生成的词法分析器C代码

//%{ start
#include
#include
#include

const int KEY_NUM = 32;
const char* KEY_SET[] = {
    "auto", "break", "case", "char", "const", "continue",
    "default", "do", "double", "else", "enum", "extern",
    "float", "for", "goto", "if", "int", "long", "register",
    "return", "short", "signed", "sizeof", "static", "struct",
    "switch", "typedef", "union", "unsigned", "void", "volatile",
    "while"
};

int isDigit(char ch)
{
    if(ch <= '9' && ch >= '0')
        return 1;
    return 0;
}

int isLetter(char ch)
{
    if((ch >= 'a' && ch <= 'z') || (ch >= 'A' && ch <= 'Z'))
        return 1;
    return 0;
}

int getKeyId(char *str)
{
    for(int i=0; iif(strcmp(KEY_SET[i], str) == 0)
            return i+1;
    }
    return 0;
}

int isNoOne(char ch)
{
    if(ch != '\'' && ch != '\0')
        return 1;
    return 0;
}

int isNoTow(char ch)
{
    if(ch != '\"' && ch != '\0')
        return 1;
    return 0;
}

//%} end
//%! start
//%! end
//%% start
//%% end
#include 
#include 
#include 

#define SYLEX_MAXSIZE_TEXT 120
#define SYLEX_MAXSIZE_BUFF 1024

char SYLEX_FILE_NAME[100];
char SYLEX_OUT_FILE_NAME[100];
int SYLEX_LINE = 0;
int SYLEX_STATE = 0;
int SYLEX_TEXT_LEN = 0;
char SYLEX_TEXT[SYLEX_MAXSIZE_TEXT];
char SYLEX_BUFF[SYLEX_MAXSIZE_BUFF];

//扫描函数
void SYLEX_scanner(char *str)
{
    char ch = ' ';
    while(ch != '\0')
    {
        //printf("%c %d\n", ch, SYLEX_STATE);
        switch(SYLEX_STATE) {
        case 0:
        {
            ch = *str++;
            SYLEX_TEXT[SYLEX_TEXT_LEN++]=ch;
            if(ch == ' '){
                SYLEX_STATE = 1;
            }
            else
            if(ch == '#'){
                SYLEX_STATE = 2;
            }
            else
            if(ch == '&'){
                SYLEX_STATE = 3;
            }
            else
            if(ch == '('){
                SYLEX_STATE = 4;
            }
            else
            //。。。
            else
            if(ch == '}'){
                SYLEX_STATE = 28;
            }
            else
            if(ch == '~'){
                SYLEX_STATE = 29;
            }
            else
            {
printf("Error in line %d\n", SYLEX_LINE);
exit(1);
            }
            break;
        }
        case 1:
        {
            ch = *str++;
            SYLEX_TEXT[SYLEX_TEXT_LEN++]=ch;
            {
SYLEX_TEXT[SYLEX_TEXT_LEN-1] = '\0';
SYLEX_TEXT_LEN=0;
SYLEX_STATE=0;
str--;
//**************s
{}
//**************e
            }
            break;
        }
      //考虑篇幅，省略中间的状态
        case 81:
        {
            ch = *str++;
            SYLEX_TEXT[SYLEX_TEXT_LEN++]=ch;
            {
SYLEX_TEXT[SYLEX_TEXT_LEN-1] = '\0';
SYLEX_TEXT_LEN=0;
SYLEX_STATE=0;
str--;
//**************s
{   printf("%s 应该预处理的，暂时先忽略", SYLEX_TEXT);}
//**************e
            }
            break;
        }
        }
    }
}

int main(int argc, char **args)
{
    if(argc == 1)
    {
        printf("没有输入源文件名");
        return 0;
    }
    else if(argc == 2)
    {
        strcpy(SYLEX_FILE_NAME, args[1]);
        sprintf(SYLEX_OUT_FILE_NAME, "%s.out", SYLEX_FILE_NAME);
    }
    else
    {
        strcpy(SYLEX_FILE_NAME, args[1]);
        strcpy(SYLEX_OUT_FILE_NAME, args[2]);
    }
    FILE* file = fopen(SYLEX_FILE_NAME, "r");
    while(NULL != fgets(SYLEX_BUFF, SYLEX_MAXSIZE_BUFF, file))
    {
        ++SYLEX_LINE;
        SYLEX_scanner(SYLEX_BUFF);
    }
    return 0;
}

测试C代码

#include 
#include 
#include"aaa.h"

int main()
{
    int a = 5;
    int b = a + 3.5E3;
    char s[] = "I love the world\n";
    for(int i=0; i<5; i++)
        printf("%s\n",s);
}

输出

#include  应该预处理的，暂时先忽略#include  应该预处理的，暂时先忽略#include"aaa.h" 应该预处理的，暂时先忽略
<$ID,main>
<(,->
<),->
<{,->

<$ID,a>
<=,->
<$NUM,5>
<;,->

<$ID,b>
<=,->
<$ID,a>
<+,->
<$NUM,3.5E3>
<;,->

<$ID,s>
<[,->
<],->
<=,->
<$STR,"I love the world\n">
<;,->

<(,->

<$ID,i>
<=,->
<$NUM,0>
<;,->
<$ID,i>
<<,->
<$NUM,5>
<;,->
<$ID,i>
<++,->
<),->
<$ID,printf>
<(,->
<$STR,"%s\n">
<,,->
<$ID,s>
<),->
<;,->
<},->

C/C++编译原理 weixin_33809981
转自：http://m.blog.csdn.net/blog/business122/21722039http://m.blog.csdn.net/blog/business122/21722151C/C++编译就是要将C/C++的代码映射到相应的机器码，以及讨论其中的内存管理模式，包括内存的分配，如何使用等等，整型、数组、指针等这些在内存中的实现机制。C/C++的编译包括几个部分，分别是编译，汇
跟我一起学Python数据处理（六十八）：用图表让数据可视化 lilye66 信息可视化 python 开发语言 pandas
跟我一起学Python数据处理（六十八）：用图表让数据可视化大家好！在数据处理的学习道路上，我一直希望能和大家携手共进、共同成长。今天咱们继续深入学习Python数据处理中的重要内容——数据可视化。学会用合适的图表展示数据，不仅能让数据变得直观易懂，还能帮助我们发现数据背后隐藏的信息和规律。话不多说，咱们马上开始今天的学习之旅！一、不同图表的特点与应用场景在数据可视化的世界里，有各种各样的图表，每
跟我一起学Python数据处理（六十九）：用Bokeh实现数据可视化及时间序列数据处理 lilye66 信息可视化 python 开发语言 pandas
跟我一起学Python数据处理（六十九）：用Bokeh实现数据可视化及时间序列数据处理大家好！一直以来，我都希望能和各位小伙伴在Python数据处理的学习道路上并肩前行，共同进步。今天，咱们继续深入探索数据处理中的数据可视化环节，重点学习Bokeh库的使用以及时间相关数据的处理与展示。掌握这些知识，能让我们更高效地挖掘数据价值，把数据背后的故事清晰地呈现出来。话不多说，开启今天的学习之旅吧！一、B
菜鸟的成长之路东风吹破了青花瓷计算机数据结构与算法基础篇入门
菜鸟的成长之路基础能力数据结构与算法数据结构链表数组栈队列字典bitset树堆完全二叉树平衡二叉树二叉查找树B树红黑树lsm树图通用算法排序十种排序算法查找二分查找深度广度优先搜索分治贪心回朔动态规划网络协议OSITCP/IP状态转移拥塞控制可靠工作原理socket编程HTTP/HTTPSIO模型同步IOreactor阻塞IO非阻塞IOIO多路复用信号驱动异步IOC10K问题长链接短链接编译原理l
使用新版本golang项目中goyacc依赖问题的处理武昌库里写JAVA 面试题汇总与解析课程设计 spring boot vue.js 算法数据结构
背景最近项目使用中有用到gomod和goyacc工具。goyacc涉及到编译原理的词法分析，文法分析等功能，可以用来生成基于golang的语法分析文件。本期是记录一个使用中遇到的依赖相关的问题。因为用到goyacc，需要生成goyacc的可执行文件。而项目使用了gomod去管理依赖，包括因为golang版本，导致后续遇到很多的问题，这里进行下记录。分析首先，本地的golang版本是1.15.6li
【Golang学习之旅】Go 语言微服务架构实践（gRPC、Kafka、Docker、K8s）程序员林北北架构 golang 学习微服务云原生 kafka
文章目录1.前言：为什么选择Go语言构建微服务架构1.1微服务架构的兴趣与挑战1.2为什么选择Go语言构建微服务架构2.Go语言简介2.1Go语言的特点与应用2.2Go语言的生态系统3.微服务架构中的gRPC实践3.1什么是gRPC？3.2gRPC在Go语言中的实现1.前言：为什么选择Go语言构建微服务架构1.1微服务架构的兴趣与挑战随着互联网技术的飞速发展，尤其是云计算的普及，微服务架构已经成为
【Python深入浅出㊸】解锁Python3中的TensorFlow：开启深度学习之旅奔跑吧邓邓子 Python深入浅出 python 深度学习 tensorflow
目录一、TensorFlow简介1.1定义与背景1.2特点二、Python3与TensorFlow的关系2.1版本对应2.2为何选择Python3三、安装TensorFlow3.1安装步骤3.2验证安装四、TensorFlow基本概念与使用方法4.1计算图（Graph）4.2会话（Session）4.3张量（Tensor）4.4变量（Variable）4.5占位符（Placeholder）五、Te
精益六西格玛入门：从理论到实践的全面解析——张驰咨询张驰课堂精益六西格玛
在质量管理领域，六西格玛与精益管理是两个常被提及且相辅相成的概念。对于初次接触六西格玛的质量人来说，如何学习、学到何种程度才算入门，以及是否应该同时学习精益六西格玛，这些问题无疑会成为他们探索之路上的重要疑问。今天，张驰咨询就来一一解答这些疑惑，为您的六西格玛学习之旅指明方向。一、六西格玛与精益六西格玛：选择哪条路？在质量管理领域，六西格玛与精益方法各有其独特的魅力与实用性。六西格玛方法的核心在于
编译原理第五章——自下而上分析——LR(1)超详细分析！爱吃芝麻汤圆 #编译原理汇编
本文中内容整理西安交通大学软件学院吴晓军老师的ppt中，仅供学习使用，请勿转载或他用参考教材：《程序设计语言编译原理》（第3版）陈火旺等国防工业出版社编译原理第五章——自下而上分析目录一、复习：语法分析的两种方式二、自下而上分析概述1.核心思想：移进-规约2.规范规约3.规范规约的两个问题三、算符优先分析1.概念辨析-算符文法、算符优先文法2.概念辨析-算符优先分析法、直观算符优先分析法3.概念辨
R 语言必备十大资源后端
引言R是进行统计计算和数据分析的热门编程语言之一，广泛应用于数据科学家、研究者和统计学家之间，用于处理大数据、执行复杂分析和结果可视化。如果你是R的新手或希望提升你的R技能，这里有一些核心资源可以助你一臂之力，无论是从基础学起还是提高现有水平，包括官方站点、知名学府和互动式学习平台。1.R项目官网(r-project.org)R项目的官方网站是开启R学习之旅的首选，它提供免费的R软件、文档、教程和
Java程序员Python一小时速成 BossFriday AI &LLM java python 开发语言
背景由于最近要开发一些AILLM（LargeLanguageModel大语言模型）应用程序，然后又想使用LangChain（LangChain是一个用于构建和操作大语言模型（LLMs）的框架，旨在帮助开发者更方便地集成和使用各种LLMs和AI服务。），不过LangChain使用Python，因此需要先了解下Python。之前我是Python零基础小白，不过在我看来任何一门语言的本质不过都是编译原理
【LangChain学习之旅】—（14）代理（下）：结构化工具对话、Self-Ask with Search以及Plan and execute代理之墨_ Langchain langchain 大模型
【LangChain学习之旅】—（14）代理（下）：结构化工具对话、Self-AskwithSearch以及Planandexecute代理什么是结构化工具什么是PlaywrightPlaywright使用结构化工具对话代理思考过程使用Self-AskwithSearch代理使用Planandexecute代理总结再学习几种更为复杂的代理：StructuredToolChat（结构化工具对话）代理
【前端基础】深入解析JavaScript中的编译原理、内存管理、垃圾回收机制和正则表达式呀啊~~ 【前端基础】前端 javascript 正则表达式学习
深入解析JavaScript前言一、JavaScript的编译原理二、JavaScript的内存管理2.1内存分配2.2内存泄漏2.3内存管理优化三、垃圾回收机制3.1垃圾回收原理3.2优化垃圾回收四、正则表达式（Regex）4.1正则表达式语法4.2常见正则操作4.3性能优化总结前言JavaScript作为一种高效的动态语言，广泛应用于Web开发中，背后有一系列复杂的机制支持它的执行和优化。在本
【Golang学习之旅】Go + Redis 缓存设计与优化（项目实战）程序员林北北缓存 golang 学习
文章目录业务需求1.缓存设计2.Go+Redis代码实现3.代码解析4.性能优化在本节中，我们将通过一个实际的项目案例，演示如何在Go中使用Redis实现高效的缓存设计与优化。业务需求假设我们正在开发一个电商平台，需要缓存商品信息以提高页面加载速度。商品信息经常被查询，但修改频率较低，因此使用Redis作为缓存会大大减少数据库的查询压力。1.缓存设计缓存粒度：我们将每个商品的信息作为一个缓存项进行
c0语言编译器,GitHub - PositiveMumu/C0Compiler: 基于java语言和JavaCC的C0语言编译器（包括编译程序和解释执行程序）... 炒锅电解氯化钠 c0语言编译器
C0Compiler作者：积极向上小木木联系方式：[email protected]年编译原理大作业,基于java语言和JavaCC工具的C0语言编译器1.C0语言介绍C0语言的语法结构定义如下：->[]{}->intid{,id};->(intid|voidid)'('')'->voidmain'('')'->'{'[]'}'->{}->｜|'{''}'||||||;->if'('
【Golang学习之旅】Go 语言基础语法概览程序员林北北 golang 学习开发语言
文章目录前言1.Go语言简介1.1Go语言是什么？1.2Go语言的应用场景2.Go语言开发环境2.1安装Go2.2配置Go环境2.3Hello,World!（第一个Go程序）3.Go语言基础语法3.1变量与常量3.2数据类型3.3条件判断与循环3.4数组与切片（slice）3.5Map（哈希表）4.Go语言函数5.Go语言并发编程（Goroutine&Channel）5.1Goroutine（轻量
【Golang学习之旅】Go 语言数据类型详解（string、slice、map等）程序员林北北 golang 学习开发语言
文章目录前言1.Go语言数据类型概览2.Go语言基本数据类型2.1整型（int，uint，float）2.2布尔类型（bool）2.3字符串（string）3.Go语言复合数据类型3.1数组（Array）3.2切片（Slice）3.3映射（Map）4.结构体（Struct）5.指针（Pointer）总结&进阶学习方向前言✅适合人群：Golang新手|后端开发者|面试求职者✅文章亮点：超详细解析+代
从小公司到进大厂，我的进阶学习之旅！ iOS面试题Swift iOS开发 iOS ios 移动开发
iOS高级进发OC源码下载地址苹果开发文档如何阅读苹果开发文档GNUstep是GNU计划的项目之一，它将Cocoa的OC库重新开源实现了一遍源码地址：http://www.gnustep.org/resources/downloads.php虽然GNUstep不是苹果官方源码，但还是具有一定的参考价值iOS底层1、一个NSObject对象占用多少内存2、OC对象的分类3、KVO实现原理4、KVC实
28岁开始零基础学前端，这些血的教训你一定要避免 2501_90336583 前端
写了一个Vue动态表单组件，发布到NPM上。模仿Vue1.0版本写了一个MiniVue，这让我对Vue的理解达到了源码级别。写了几篇关于Vue的文章。计算机理论知识计算机理论知识决定了一个程序员的天花板（在国内还得加上英语）。数据结构与算法算法看了《剑指offer题解》、《Leetcode题解》这两本书，还是挺有用的，也有刷到的题面试正好碰上了的。编译原理、计算机原理由于编译原理和计算机原理是看的
想要在web3工作，这份web3学习路线图必不可少 Ray Change web3 学习
想要在web3工作，这份web3学习路线图必不可少欢迎踏上Web3学习之旅！Web3——去中心化互联网的新纪元正以前所未有的速度席卷全球。作为前瞻视野的你，是否渴望掌握这一颠覆性技术，跻身引领行业变革的精英行列？希望这份路线图可以帮助到你。推荐Web3Roadmap：Web3学习路线图-登链社区阶段一：Web3基础知识与区块链原理目标：理解Web3与区块链的基本概念、发展历程与价值主张。掌握区块链
跟我一起学 Python 数据处理（一）：入门篇 lilye66 python plotly numpy pandas matplotlib conda
跟我一起学Python数据处理（一）：入门篇在当今数字化时代，数据处理能力变得愈发关键。无论是从事新闻、分析工作，还是立志成为数据科学家，掌握数据处理技巧都能让我们从海量信息中提取有价值的内容，并以清晰、有说服力的方式呈现出来。Python作为一门强大且应用广泛的编程语言，在数据处理领域占据着重要地位。本文将开启Python数据处理的学习之旅，与大家一同探索其中的奥秘，共同进步。一、确定研究主题与
跟我一起学 Python 数据处理（四）：Python 基础环境深度剖析与工具安装 lilye66 python flask pandas scrapy beautifulsoup
跟我一起学Python数据处理（四）：Python基础环境深度剖析与工具安装在Python学习之旅中，我们已经迈出了搭建环境的关键第一步。今天，我们继续深入探索，让大家对Python基础环境有更透彻的理解，并顺利安装必备的工具，为后续高效的数据处理学习筑牢根基。一、Python提示符与系统提示符的奥秘当我们成功启动Python后，会看到>>>这个Python提示符，它就像是进入Python世界的大
Python学习之旅：进阶阶段（七）数据结构-计数器（collections.Counter）喜-喜 Python python 学习数据结构
在Python编程的进阶学习中，数据处理是一项重要的任务。collections.Counter作为Python标准库collections模块中的一员，为我们提供了一种高效且便捷的方式来统计数据出现的次数。接下来，就让我们一起深入了解这个强大的计数器。一、什么是计数器 collections.Counter本质上是一个特殊的字典，它用于统计可迭代对象中元素出现的次数。普通字典是通过键值对来
Python学习之旅：进阶阶段（五）数据结构-双端队列（collections.deque）喜-喜 Python python 数据结构学习
在Python的进阶学习过程中，数据结构的掌握至关重要。今天要介绍的双端队列（deque，即double-endedqueue），是一种非常实用的数据结构，Python的collections模块中的deque类为我们提供了强大的双端队列操作功能。接下来，就一起深入了解双端队列吧。一、什么是双端队列双端队列，从名字就能看出它的特点，它是一种特殊的队列，允许我们在队列的两端进行插入和删除操作
探索Python列表生成式：魔法般的快捷方式！很酷的站长 Python python 开发语言
欢迎来到Python世界的一个魅力角落，今天我们要聊聊Python列表生成式—一个强大的工具，用来创建列表的魔法般的快捷方式。让我们踏上一段有趣的学习之旅，一起探索这项Python中的神奇魔法。起步：什么是列表生成式？列表生成式，顾名思义，是生成列表的一个简单又直接的方法。它使用了一种紧凑的语法来构造列表，能够以一种更清晰、更简洁的方式来表达循环和过滤逻辑。基础示例让我们看看这个魔法是如何工作的，
16、Spring 框架基础：开启 Java 企业级开发的新时代翻晒时光 java spring 后端
嘿，Java开发者们！今天我们要一起探索Spring框架的基础知识。Spring框架是Java企业级开发中最受欢迎的框架之一，它为我们提供了一种轻量级、非侵入式的开发方式，帮助我们构建可维护、可扩展和松耦合的应用程序。让我们一起开启Spring框架的学习之旅，感受它如何简化我们的开发过程，提升开发效率，开启Java企业级开发的新时代！一、Spring框架概述1.什么是Spring框架？Spring
unix&linux大学教程的学习之旅 Freeflicker linux unix 学习
1、unix&linux第一章、第二章第一章主要是作者讲解unix的发展历史第二章前部分讲解unix发展中的重要历史事件和对unix，linux做出重大推进的人物unix=unix内核+实用工具内核：操作系统核心单内核：一个独立大的程序,能够独立完成所有任务。微内核：规模较小，是一个非常小的程序，只能执行最基本的任务。为了执行其他功能，微内核要调用其他程序，这些程序称为服务器。unix、linux
咱们一起学 LINUX（一）：从基础起步，探寻 Linux 程序的诞生奥秘 lilye66 咱们一起学习LINUX linux c++运维
咱们一起学LINUX（一）：从基础起步，探寻Linux程序的诞生奥秘在编程的广袤世界里，Linux占据着极为重要的地位。我一直对Linux充满热情，也深知很多朋友渴望深入了解它，所以希望通过这一系列博客，与大家携手共进，一同探索Linux的奇妙之处。今天，就让我们先从Linux程序的诞生过程开启这段学习之旅。一、HelloWorld示例与程序生成步骤在编程领域，“HelloWorld”程序就像是一
用ESP-IDF驱动WS2812 楚谭 ESP-IDF c语言
WS2812b(54条消息)ESP32学习】驱动ws2812_sidongshi的博客-CSDN博客_esp32ws2812关于LED看这个资料吧,我不再继续说明ESP-IDF这个也初学,不太熟悉其中编译原理,大概说一下延时问题inti;for(i=0;i<(20);i++);关于纳秒级别延时函数,上面这段代码在72M的stm32103中大概是延时1.4ns左右,但是在ESP-IDF中这种写法会被
深度探索：SQL Server 技术学习之旅小码快撩数据库 sqlserver sql
引言在数字化时代，数据库管理系统作为企业信息系统的核心组件，承载着海量数据的存储、管理和分析重任。其中，MicrosoftSQLServer作为一款久经市场考验的企业级关系型数据库平台，凭借其强大的功能、卓越的性能以及与微软生态系统的深度集成，赢得了全球众多企业的青睐。本文旨在引导读者踏上深入学习SQLServer的旅程，全方位领略其核心技术要点，为构建高效、稳定且安全的数据库系统奠定坚实基础。一
[星球大战]阿纳金的背叛 comsci
本来杰迪圣殿的长老是不同意让阿纳金接受训练的......... 但是由于政治原因,长老会妥协了...这给邪恶的力量带来了机会所以......现代的地球联邦接受了这个教训...绝对不让某些年轻人进入学院
看懂它，你就可以任性的玩耍了！ aijuans JavaScript
javascript作为前端开发的标配技能，如果不掌握好它的三大特点：1.原型 2.作用域 3. 闭包 ,又怎么可以说你学好了这门语言呢？如果标配的技能都没有撑握好，怎么可以任性的玩耍呢？怎么验证自己学好了以上三个基本点呢，我找到一段不错的代码，稍加改动，如果能够读懂它，那么你就可以任性了。 function jClass(b
Java常用工具包 Jodd Kai_Ge java jodd
Jodd 是一个开源的 Java 工具集，包含一些实用的工具类和小型框架。简单，却很强大！写道 Jodd = Tools + IoC + MVC + DB + AOP + TX + JSON + HTML < 1.5 Mb Jodd 被分成众多模块，按需选择，其中工具类模块有： jodd-core &nb
SpringMvc下载 120153216 springMVC
@RequestMapping(value = WebUrlConstant.DOWNLOAD) public void download(HttpServletRequest request,HttpServletResponse response,String fileName) { OutputStream os = null; InputStream is = null;
Python 标准异常总结 2002wmj python
Python标准异常总结 AssertionError 断言语句（assert）失败 AttributeError 尝试访问未知的对象属性 EOFError 用户输入文件末尾标志EOF（Ctrl+d） FloatingPointError 浮点计算错误 GeneratorExit generator.close()方法被调用的时候 ImportError 导入模块失
SQL函数返回临时表结构的数据用于查询 357029540 SQL Server
这两天在做一个查询的SQL，这个SQL的一个条件是通过游标实现另外两张表查询出一个多条数据，这些数据都是INT类型，然后用IN条件进行查询，并且查询这两张表需要通过外部传入参数才能查询出所需数据，于是想到了用SQL函数返回值，并且也这样做了，由于是返回多条数据，所以把查询出来的INT类型值都拼接为了字符串，这时就遇到问题了，在查询SQL中因为条件是INT值，SQL函数的CAST和CONVERST都
java 时间格式化 | 比较大小| 时区个人笔记 7454103 java eclipse tomcat c MyEclipse
个人总结！不当之处多多包含！引用 1.0 如何设置 tomcat 的时区：位置：(catalina.bat---JAVA_OPTS 下面加上) set JAVA_OPT
时间获取Clander的用法 adminjun Clander 时间
/** * 得到几天前的时间 * @param d * @param day * @return */ public static Date getDateBefore(Date d,int day){ Calend
JVM初探与设置 aijuans java
JVM是Java Virtual Machine（Java虚拟机）的缩写，JVM是一种用于计算设备的规范，它是一个虚构出来的计算机，是通过在实际的计算机上仿真模拟各种计算机功能来实现的。Java虚拟机包括一套字节码指令集、一组寄存器、一个栈、一个垃圾回收堆和一个存储方法域。 JVM屏蔽了与具体操作系统平台相关的信息，使Java程序只需生成在Java虚拟机上运行的目标代码（字节码）,就可以在多种平台
SQL中ON和WHERE的区别 avords
SQL中ON和WHERE的区别数据库在通过连接两张或多张表来返回记录时，都会生成一张中间的临时表，然后再将这张临时表返回给用户。 www.2cto.com 在使用left jion时，on和where条件的区别如下： 1、 on条件是在生成临时表时使用的条件，它不管on中的条件是否为真，都会返回左边表中的记录。
说说自信 houxinyou 工作生活
自信的来源分为两种,一种是源于实力,一种源于头脑.实力是一个综合的评定,有自身的能力,能利用的资源等.比如我想去月亮上,要身体素质过硬,还要有飞船等等一系列的东西.这些都属于实力的一部分.而头脑不同,只要你头脑够简单就可以了!同样要上月亮上,你想,我一跳,1米,我多跳几下,跳个几年,应该就到了!什么?你说我会往下掉?你笨呀你!找个东西踩一下不就行了吗? 无论工作还
WEBLOGIC事务超时设置 bijian1013 weblogic jta 事务超时
系统中统计数据，由于调用统计过程，执行时间超过了weblogic设置的时间，提示如下错误：统计数据出错! 原因：The transaction is no longer active - status: 'Rolling Back. [Reason=weblogic.transaction.internal
两年已过去，再看该如何快速融入新团队 bingyingao java 互联网融入架构新团队
偶得的空闲，翻到了两年前的帖子该如何快速融入一个新团队，有所感触，就记下来，为下一个两年后的今天做参考。时隔两年半之后的今天，再来看当初的这个博客，别有一番滋味。而我已经于今年三月份离开了当初所在的团队，加入另外的一个项目组，2011年的这篇博客之后的时光，我很好的融入了那个团队，而直到现在和同事们关系都特别好。大家在短短一年半的时间离一起经历了一
【Spark七十七】Spark分析Nginx和Apache的access.log bit1129 apache
Spark分析Nginx和Apache的access.log，第一个问题是要对Nginx和Apache的access.log文件进行按行解析，按行解析就的方法是正则表达式： Nginx的access.log解析正则表达式 val PATTERN = """([^ ]*) ([^ ]*) ([^ ]*) (\\[.*\\]) (\&q
Erlang patch bookjovi erlang
Totally five patchs committed to erlang otp, just small patchs. IMO, erlang really is a interesting programming language, I really like its concurrency feature. but the functional programming style
log4j日志路径中加入日期 bro_feng java log4j
要用log4j使用记录日志，日志路径有每日的日期，文件大小5M新增文件。实现方式 log4j: <appender name="serviceLog" class="org.apache.log4j.RollingFileAppender"> <param name="Encoding" v
读《研磨设计模式》-代码笔记-桥接模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 个人觉得关于桥接模式的例子，蜡笔和毛笔这个例子是最贴切的：http://www.cnblogs.com/zhenyulu/articles/67016.html * 笔和颜色是可分离的，蜡笔把两者耦合在一起了：一支蜡笔只有一种
windows7下SVN和Eclipse插件安装 chenyu19891124 eclipse插件
今天花了一天时间弄SVN和Eclipse插件的安装，今天弄好了。svn插件和Eclipse整合有两种方式，一种是直接下载插件包，二种是通过Eclipse在线更新。由于之前Eclipse版本和svn插件版本有差别，始终是没装上。最后在网上找到了适合的版本。所用的环境系统：windows7JDK：1.7svn插件包版本：1.8.16Eclipse：3.7.2工具下载地址：Eclipse下在地址：htt
[转帖]工作流引擎设计思路 comsci 设计模式工作应用服务器 workflow 企业应用
作为国内的同行，我非常希望在流程设计方面和大家交流，刚发现篇好文(那么好的文章，现在才发现，可惜)，关于流程设计的一些原理，个人觉得本文站得高，看得远，比俺的文章有深度，转载如下 ================================================================================= 自开博以来不断有朋友来探讨工作流引擎该如何
Linux 查看内存，CPU及硬盘大小的方法 daizj linux cpu 内存硬盘大小
一、查看CPU信息的命令 [root@R4 ~]# cat /proc/cpuinfo |grep "model name" && cat /proc/cpuinfo |grep "physical id" model name : Intel(R) Xeon(R) CPU X5450 @ 3.00GHz model name :
linux 踢出在线用户 dongwei_6688 linux
两个步骤： 1.用w命令找到要踢出的用户，比如下面： [root@localhost ~]# w 18:16:55 up 39 days, 8:27, 3 users, load average: 0.03, 0.03, 0.00 USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT
放手吧,就像不曾拥有过一样 dcj3sjt126com
内容提要：静悠悠编著的《放手吧就像不曾拥有过一样》集结“全球华语世界最舒缓心灵”的精华故事，触碰生命最深层次的感动，献给全世界亿万读者。《放手吧就像不曾拥有过一样》的作者衷心地祝愿每一位读者都给自己一个重新出发的理由，将那些令你痛苦的、扛起的、背负的，一并都放下吧！把憔悴的面容换做一种清淡的微笑，把沉重的步伐调节成春天五线谱上的音符，让自己踏着轻快的节奏，在人生的海面上悠然漂荡，享受宁静与
php二进制安全的含义 dcj3sjt126com PHP
PHP里，有string的概念。 string里，每个字符的大小为byte（与PHP相比，Java的每个字符为Character，是UTF8字符，C语言的每个字符可以在编译时选择）。 byte里，有ASCII代码的字符，例如ABC，123，abc，也有一些特殊字符，例如回车，退格之类的。特殊字符很多是不能显示的。或者说，他们的显示方式没有标准，例如编码65到哪儿都是字母A，编码97到哪儿都是字符
Linux下禁用T440s，X240的一体化触摸板(touchpad) gashero linux ThinkPad 触摸板
自打1月买了Thinkpad T440s就一直很火大，其中最让人恼火的莫过于触摸板。 Thinkpad的经典就包括用了小红点(TrackPoint)。但是小红点只能定位，还是需要鼠标的左右键的。但是自打T440s等开始启用了一体化触摸板，不再有实体的按键了。问题是要是好用也行。实际使用中，触摸板一堆问题，比如定位有抖动，以及按键时会有飘逸。这就导致了单击经常就
graph_dfs hcx2013 Graph
package edu.xidian.graph; class MyStack { private final int SIZE = 20; private int[] st; private int top; public MyStack() { st = new int[SIZE]; top = -1; } public void push(i
Spring4.1新特性——Spring核心部分及其他 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
配置HiveServer2的安全策略之自定义用户名密码验证 liyonghui160com
具体从网上看 http://doc.mapr.com/display/MapR/Using+HiveServer2#UsingHiveServer2-ConfiguringCustomAuthentication LDAP Authentication using OpenLDAP Setting
一位30多的程序员生涯经验总结 pda158 编程工作生活咨询
1.客户在接触到产品之后，才会真正明白自己的需求。　　这是我在我的第一份工作上面学来的。只有当我们给客户展示产品的时候，他们才会意识到哪些是必须的。给出一个功能性原型设计远远比一张长长的文字表格要好。 2.只要有充足的时间，所有安全防御系统都将失败。　　安全防御现如今是全世界都在关注的大课题、大挑战。我们必须时时刻刻积极完善它，因为黑客只要有一次成功，就可以彻底打败你。 3.
分布式web服务架构的演变自由的奴隶 linux Web 应用服务器互联网
最开始，由于某些想法，于是在互联网上搭建了一个网站，这个时候甚至有可能主机都是租借的，但由于这篇文章我们只关注架构的演变历程，因此就假设这个时候已经是托管了一台主机，并且有一定的带宽了，这个时候由于网站具备了一定的特色，吸引了部分人访问，逐渐你发现系统的压力越来越高，响应速度越来越慢，而这个时候比较明显的是数据库和应用互相影响，应用出问题了，数据库也很容易出现问题，而数据库出问题的时候，应用也容易
初探Druid连接池之二——慢SQL日志记录 xingsan_zhang 日志连接池 druid 慢SQL
由于工作原因，这里先不说连接数据库部分的配置，后面会补上，直接进入慢SQL日志记录。 1.applicationContext.xml中增加如下配置： <bean abstract="true" id="mysql_database" class="com.alibaba.druid.pool.DruidDataSourc