Zach_z

编译器----词法分析

本文通过学习王博俊、张宇的《DIY Compiler and Linker》，实现词法分析器，一方面作为自己的学习笔记，一方面也作与大家分享与交流

代码下载地址

词法分析的任务

源程序由字符序列构成，词法分析器扫描源程序字符串，根据语言的词法规则分析并识别具有独立意义的最小语法单位：单词(包括关键字、运算符、标识符等)，并以某种编码形式输出。

词法分析流程图

这次实现的词法分析器完全按照下图所编写：

从图中可以看到
1. 先打开源文件，如果无法打开则异常退出
2. 打开源文件后进行初始化，标致行号为第一行，再初始化动态数组，并把运算符、关键字、常量直接放入单词表（单词表是由动态数组和哈希表一起组成的复合结构）
3. 开始读取一个字符，并从第一个字符开始进行“取单词”的工作，如果遇到空白字符或者注释则忽略，如果是有效字符则判断这一单词并给出编号或者标识符索引码
4. 为了能显示出来我们的词法分析，对不同类别的单词进行着色输出到我们屏幕上
5. 循环往复第3、4步直到文件末尾，关闭文件，正常结束

实现词法分析器

1. 自定义动态字符串和动态数组

自定义动态字符串和动态数组是词法分析需要用到的数据结构

首先，常量字符串的长度没办法预知，可能是空串，也可能很长，则需要动态字符串来存储
其次，单词的个数也无法预知，可能只有一个单词，也可能有许多，对于单词的存储，也需要一个按需分配的动态数组

词法分析器是用C语言写的，需要自定义动态字符串和动态数组

1.1 动态字符串

dynstring.h(实际上放在头文件lexical_analysis.h):

/*动态字符串定义*/
typedef struct DynString
{
    int count; //字符串长度
    int capacity; //包含该字符串的缓冲区长度
    char *data; //指向字符串的指针
}DynString;
void dynstring_init(DynString *pstr, int initsize);//初始化动态字符串存储容量，用于dynstring_reset()
void dynstring_free(DynString *pstr);//释放动态字符串使用的内存空间,用于dynstring_reset()
void dynstring_realloc(DynString *cstr, int new_size);//重新分配字符串容量
void dynstring_chcat(DynString *cstr, int ch);//字符串中添加字符
void dynstring_reset(DynString *cstr);//重置动态字符串

dynstring.c:

#include "lexical_analysis.h"


/***********************************************************
*  功能:      初始化动态字符串储存容量
*  pstr:        动态字符串指针
*  initsize:    字符串初始化分配空间
**********************************************************/
void dynstring_init(DynString *pstr, int initsize)
{
    if (pstr != NULL)
    {
        pstr->data = (char *)malloc(sizeof(char) * initsize);
        pstr->count = 0;
        pstr->capacity = initsize;
    }
}

/***********************************************************
*  功能:  释放动态字符串使用的内存空间
*  pstr:    动态字符串指针
**********************************************************/
void dynstring_free(DynString *pstr)
{
    if (pstr != NULL)
    {
        if (pstr->data) free(pstr->data);
        pstr->count = 0;
        pstr->capacity = 0;
    }
}

/***********************************************************
*  功能:  重置动态字符串,先释放,重新初始化
*  pstr:    动态字符串指针
**********************************************************/
void dynstring_reset(DynString *pstr)
{
    dynstring_free(pstr);
    dynstring_init(pstr, 10);//初始化字符串分配10个字节空间
}

/***********************************************************
*  功能:      重新分配字符串容量
*  pstr:        动态字符串指针
*  new_size:    字符串新长度
**********************************************************/
void dynstring_realloc(DynString *pstr, int new_size)
{
    int capacity;
    char *data;
    capacity = pstr->capacity;
    while (capacity < new_size)
    {
        capacity *= 2;//本来分配空间扩大一倍
    }
    data = (char *)realloc(pstr->data, capacity);
    if (!data)//realloc 返回NULL 即分配失败
        error("内存分配失败");
    pstr->capacity = capacity;
    pstr->data = data;
}

/***********************************************************
*  功能:  追加单个字符到动态字符串对象
*  pstr:    动态字符串指针
*  ch:      所要追加的字符
**********************************************************/
void dynstring_chcat(DynString *pstr, int ch)
{
    int count;
    count = pstr->count + 1;
    if (count > pstr->capacity)
        dynstring_realloc(pstr, count);
    pstr->data[count - 1] = ch;
    pstr->count = count;
}

1.2 动态数组

dynarray.h(实际上放在头文件lexical_analysis.h):

/*动态数组定义*/
typedef struct DynArray
{
    int count;//动态数组元素个数
    int capacity;//动态数组缓冲区长度
    void **data;//指向数据指针的数组
}DynArray;

void dynarray_realloc(DynArray *parr, int new_size);//重新分配动态数组容量,用于dynarray_add()函数
void dynarray_add(DynArray *parr, void *data);//追加动态数组元素
void dynarray_init(DynArray *parr, int initsize);//初始化动态数组存储容量
void dynarray_free(DynArray *parr);//释放动态数组使用的内存空间
int dynarray_search(DynArray *parr, int key);//动态数组元素查找

dynarray.c:

#include "lexical_analysis.h"

/***********************************************************
* 功能:       初始化动态数组储存容量
* parr:     动态数组指针
* initsize: 动态数组初始化分配空间
**********************************************************/
void dynarray_init(DynArray *parr, int initsize)
{
    if (parr != NULL)
    {
        parr->data = (void **)malloc(sizeof(void*) * initsize);
        parr->count = 0;
        parr->capacity = initsize;
    }
}

/***********************************************************
*  功能:  释放动态数组使用的内存空间
*  parr:    动态数组指针
**********************************************************/
void dynarray_free(DynArray *parr)
{
    void **p;
    for (p = parr->data; parr->count; ++p, --parr->count)
    {
        if (*p)
            free(*p);
    }
    free(parr->data);
    parr->data = NULL;
}
/***********************************************************
*  功能:      重新分配动态数组容量
*  parr:        动态数组指针
*  new_size:    动态数组最新元素个数
**********************************************************/
void dynarray_realloc(DynArray *parr, int new_size)
{
    int capacity;
    void *data;

    capacity = parr->capacity;
    while (capacity < new_size)
        capacity *= 2;
    data = realloc(parr->data, capacity);
    if (!data)
        error("内存分配失败");
    parr->capacity = capacity;
    parr->data = (void **)data;
}

/***********************************************************
*  功能:  追加动态数组元素
*  parr:    动态数组指针
*  data:    所要追加的新元素
**********************************************************/
void dynarray_add(DynArray *parr, void *data)
{
    int count;
    count = parr->count + 1;
    if (count * sizeof(void*) > parr->capacity)
        dynarray_realloc(parr, count * sizeof(void*));
    parr->data[count - 1] = data;
    parr->count = count;
}

/***********************************************************
*  功能:  动态数组元素查找
*  parr:    动态数组指针
*  key: 要查找的元素
**********************************************************/
int dynarray_search(DynArray *parr, int key)
{
    int i;
    int **p;
    p = (int **)parr->data;
    for (i = 0; i < parr->count; ++i, p++)
    {
        if (key == **p)
            return i;
    }
    return -1;
}

1.3 动态字符串与动态数组存储结构图

2. 单词表

单词表由动态数组和哈希表两部分构成

2.1 哈希表

单词表中步存储重复的单词，每遇到一个单词就遍历去单词表中查找效率很低，因此需要哈希表

这里使用ELF字符串哈希值计算

ELFhash—字符串哈希算法解释

unsigned int ELFHash(char *str)
{
    unsigned int hash = 0;
    unsigned int x = 0;

    while (*str)
    {
        hash = (hash << 4) + (*str++);
        if ((x=hash & 0xf0000000)!=0)
            hash ^= x >> 24;
        hash &= ~x;
    }
    return (hash & 0x7fffffff);
}

2.2 单词表实现

tkword.h(实际上放在头文件lexical_analysis.h):

/*单词存储结构定义*/
typedef struct TkWord
{
    int tkcode;//单词编码
    struct TkWord *next; //指向哈希冲突的同义词
    char *spelling; //单词字符串
}TkWord;

int ELFHash(char *str);//计算哈希地址
TkWord* tkword_direct_insert(TkWord* tp);//将运算符、关键字、常量直接放入单词表
TkWord* tkword_find(char *p, int keyno);//在单词表中查找单词,用于tkword_insert()
void *mallocz(int size);//分配堆内存并将数据初始化为'0',用于tkword_insert()
TkWord* tkword_insert(char *p);//标识符插入单词表，先查找，查找不到再插入单词表

tkword.c:

#include "lexical_analysis.h"

TkWord* tk_hashtable[MAXKEY];   // 单词哈希表
DynArray tktable;       // 单词表

/***********************************************************
* 功能:   计算哈希地址
* key:哈希关键字
* MAXKEY:哈希表长度
**********************************************************/
int ELFHash(char *str)
{
    int hash = 0;
    int x = 0;

    while (*str)
    {
        hash = (hash << 4) + *str++;
        x = hash & 0xf0000000;
        if (x)
            hash ^= x >> 24;
        hash &= ~x;
    }
    return hash % MAXKEY;
}

/***********************************************************
* 功能: 将运算符、关键字、常量直接放入单词表
* tp:    单词指针
**********************************************************/
TkWord* tkword_direct_insert(TkWord* tp)
{
    int keyno;
    dynarray_add(&tktable, tp);
    keyno = ELFHash(tp->spelling);
    tp->next = tk_hashtable[keyno];
    tk_hashtable[keyno] = tp;
    return tp;
}

/***********************************************************
* 功能:    在单词表中查找单词
*  p:       单词字符串指针
*  keyno:   单词的哈希值
**********************************************************/
TkWord* tkword_find(char *p, int keyno)
{
    TkWord *tp = NULL, *tp1;
    for (tp1 = tk_hashtable[keyno]; tp1; tp1 = tp1->next)
    {
        if (!strcmp(p, tp1->spelling))
        {
            token = tp1->tkcode;
            tp = tp1;
        }
    }
    return tp;
}

/***********************************************************
* 功能:   分配堆内存并将数据初始化为'0'
* size: 分配内存大小
**********************************************************/
void *mallocz(int size)
{
    void *ptr;
    ptr = malloc(size);
    if (!ptr && size)
        error("内存分配失败");
    memset(ptr, 0, size);
    return ptr;
}

/***********************************************************
* 功能:   标识符插入单词表，先查找，查找不到再插入单词表
* p:        单词字符串指针
**********************************************************/
TkWord* tkword_insert(char *p)
{
    TkWord *tp;
    int keyno;
    char *s;
    char *end;
    int length;

    keyno = ELFHash(p);
    tp = tkword_find(p, keyno);
    if (tp == NULL)
    {
        length = strlen(p);
        tp = (TkWord*)mallocz(sizeof(TkWord) + length + 1);
        tp->next = tk_hashtable[keyno];
        tk_hashtable[keyno] = tp;
        dynarray_add(&tktable, tp);
        tp->tkcode = tktable.count - 1;
        s = (char*)tp + sizeof(TkWord);
        tp->spelling = (char *)s;
        for (end = p + length; p < end;)
        {
            *s++ = *p++;
        }
        *s = (char)'\0';
    }
    return tp;
}

2.3 单词表存储结构

3.错误处理

在进行词法分析之前，还需要先做一个错误处理的部分，在编译和链接的过程中，需要根据错误种类和具体错误，来直观的输出错误

error.h(实际上放在头文件lexical_analysis.h):

/* 错误级别 */
enum e_ErrorLevel
{
    LEVEL_WARNING,
    LEVEL_ERROR,
};

/* 工作阶段 */
enum e_WorkStage
{
    STAGE_COMPILE,
    STAGE_LINK,
};

void handle_exception(int stage, int level, char *fmt, va_list ap);//异常处理：作为编译警告、错误和链接错误调用的功能函数
void warning(char *fmt, ...);//编译警告处理
void error(char *fmt, ...);//错误处理
void expect(char *msg);//提示错误，此处缺少某个语法成分
void link_error(char *fmt, ...);//链接错误处理
void *get_tkstr(int v);//取得单词v所代表的源码字符串

error.c:

#include "lexical_analysis.h"

/******************************************************************
* 异常处理
* stage: 编译阶段还是链接阶段
* level：错误级别
* fmt：参数输出格式
* ap：可变参数列表
*******************************************************************/
void handle_exception(int stage, int level, char *fmt, va_list ap)
{
    char buf[1024];
    vsprintf(buf, fmt, ap);
    if (stage == STAGE_COMPILE)
    {
        if (level == LEVEL_WARNING)
            printf("%s(第%d行): 编译警告: %s!\n", filename, line_num, buf);
        else
        {
            printf("%s(第%d行): 编译错误: %s!\n", filename, line_num, buf);
            exit(-1);
        }
    }
    else
    {
        printf("链接错误: %s!\n", buf);
        exit(-1);
    }
}

/******************************************************************
* 编译警告处理
* fmt：参数输出格式
* ap：可变参数列表
*******************************************************************/
void warning(char *fmt, ...)
{
    va_list ap = NULL;
    va_start(ap, fmt);
    handle_exception(STAGE_COMPILE, LEVEL_WARNING, fmt, ap);
    va_end(ap);
}

/******************************************************************
* 编译错误处理
* fmt：参数输出格式
* ap：可变参数列表
*******************************************************************/
void error(char *fmt, ...)
{
    va_list ap = NULL;
    va_start(ap, fmt);
    handle_exception(STAGE_COMPILE, LEVEL_ERROR, fmt, ap);
    va_end(ap);
}

/******************************************************************
* 链接错误处理
* fmt：参数输出格式
* ap：可变参数列表
*******************************************************************/
void link_error(char *fmt, ...)
{
    va_list ap = NULL;
    va_start(ap, fmt);
    handle_exception(STAGE_LINK, LEVEL_ERROR, fmt, ap);
    va_end(ap);
}

/******************************************************************
* 提示错误，此处缺少某个语法成分
* msg：需要什么语法成分
*******************************************************************/
void expect(char *msg)
{
    error("缺少%s", msg);
}

/******************************************************************
* 功能：取得单词v所代表的源码字符串
* v：单词编号
*******************************************************************/
char *get_tkstr(int v)
{
    if (v > tktable.count)
        return NULL;
    else if (v >= TK_CINT && v <= TK_CSTR)
        return sourcestr.data;
    else
        return ((TkWord*)tktable.data[v])->spelling;
}

4. 词法分析

将源程序的字符串解析成一个个单词符号

4.1 单词编码

因为要把字符串解析成一个个单词，而这些单词有可能是运算符有可能是关键字，也有可能是自定义的标识符，所以需要给他们绑定一个身份
lexical_analysis.h:

/* 单词编码 */
enum e_TokenCode
{
    /* 运算符及分隔符 */
    TK_PLUS,        // + 加号
    TK_MINUS,       // - 减号
    TK_STAR,        // * 星号
    TK_DIVIDE,      // / 除号
    TK_MOD,         // % 求余运算符
    TK_EQ,          // == 等于号
    TK_NEQ,         // != 不等于号
    TK_LT,          // < 小于号
    TK_LEQ,         // <= 小于等于号
    TK_GT,          // > 大于号
    TK_GEQ,         // >= 大于等于号
    TK_ASSIGN,      // = 赋值运算符 
    TK_POINTSTO,    // -> 指向结构体成员运算符
    TK_DOT,         // . 结构体成员运算符
    TK_AND,         // & 地址与运算符
    TK_OPENPA,      // ( 左圆括号
    TK_CLOSEPA,     // ) 右圆括号
    TK_OPENBR,      // [ 左中括号
    TK_CLOSEBR,     // ] 右圆括号
    TK_BEGIN,       // { 左大括号
    TK_END,         // } 右大括号
    TK_SEMICOLON,   // ; 分号    
    TK_COMMA,       // , 逗号
    TK_ELLIPSIS,    // ... 省略号
    TK_EOF,         // 文件结束符

    /* 常量 */
    TK_CINT,        // 整型常量
    TK_CCHAR,       // 字符常量
    TK_CSTR,        // 字符串常量                                

    /* 关键字 */
    KW_CHAR,        // char关键字
    KW_SHORT,       // short关键字
    KW_INT,         // int关键字
    KW_VOID,        // void关键字  
    KW_STRUCT,      // struct关键字   
    KW_IF,          // if关键字
    KW_ELSE,        // else关键字
    KW_FOR,         // for关键字
    KW_CONTINUE,    // continue关键字
    KW_BREAK,       // break关键字   
    KW_RETURN,      // return关键字
    KW_SIZEOF,      // sizeof关键字

    KW_ALIGN,       // __align关键字   
    KW_CDECL,       // __cdecl关键字 standard c call
    KW_STDCALL,     // __stdcall关键字 pascal c call

    /* 标识符 */
    TK_IDENT
};

4.2 词法分析实现

首先进行初始化，即是让关键字、运算符这些特权单词，在正式词法分析之前进入单词表
之后进行取单词，根据一个个字符的先后顺序，解析空白和注释、解析标识符、解析整数、判断出一个个单词
lex.h(lexical_analysis.h):

/* 词法状态 */
enum e_LexState
{
    LEX_NORMAL,
    LEX_SEP
};

void init_lex();//词法分析初始化
void skip_white_space();//忽略空格,TAB及回车
void parse_comment();//解析注释
void preprocess();//预处理，忽略分隔符及注释
int is_nodigit(char c);//判断c是否为字母(a-z,A-Z)或下划线(-)
int is_digit(char c);//判断c是否为数字
TkWord* parse_identifier();//解析标识符
void parse_num();//解析整型常量
void parse_string(char sep);//解析字符常量、字符串常量
void get_token();//取单词

lex.c:

#include "lexical_analysis.h"

DynString tkstr;        //单词字符串
DynString sourcestr;    //单词源码字符串

char ch;        //当前取到的源码字符
int token;      //单词编码
int tkvalue;    //单词值
int line_num;   //行号


/***********************************************************
* 功能:   词法分析初始化
**********************************************************/
void init_lex()
{
    TkWord *tp;
    static TkWord keywords[] = {
    { TK_PLUS,      NULL,     "+" },
    { TK_MINUS,     NULL,     "-" },
    { TK_STAR,      NULL,     "*" },
    { TK_DIVIDE,    NULL,     "/" },
    { TK_MOD,       NULL,     "%" },
    { TK_EQ,        NULL,     "==" },
    { TK_NEQ,       NULL,     "!=" },
    { TK_LT,        NULL,     "<" },
    { TK_LEQ,       NULL,     "<=" },
    { TK_GT,        NULL,     ">" },
    { TK_GEQ,       NULL,     ">=" },
    { TK_ASSIGN,    NULL,     "=" },
    { TK_POINTSTO,  NULL,     "->" },
    { TK_DOT,       NULL,     "." },
    { TK_AND,       NULL,     "&" },
    { TK_OPENPA,    NULL,     "(" },
    { TK_CLOSEPA,   NULL,     ")" },
    { TK_OPENBR,    NULL,     "[" },
    { TK_CLOSEBR,   NULL,     "]" },
    { TK_BEGIN,     NULL,     "{" },
    { TK_END,       NULL,     "}" },
    { TK_SEMICOLON, NULL,     ";" },
    { TK_COMMA,     NULL,     "," },
    { TK_ELLIPSIS,  NULL,   "..." },
    { TK_EOF,       NULL,    "End_Of_File" },
    { TK_CINT,      NULL,       "整型常量" },
    { TK_CCHAR,     NULL,       "字符常量" },
    { TK_CSTR,      NULL,       "字符串常量" },
    { KW_CHAR,      NULL,       "char" },
    { KW_SHORT,     NULL,       "short" },
    { KW_INT,       NULL,       "int" },
    { KW_VOID,      NULL,       "void" },
    { KW_STRUCT,    NULL,       "struct" },
    { KW_IF,        NULL,       "if" },
    { KW_ELSE,      NULL,       "else" },
    { KW_FOR,       NULL,       "for" },
    { KW_CONTINUE,  NULL,       "continue" },
    { KW_BREAK,     NULL,       "break" },
    { KW_RETURN,    NULL,       "return" },
    { KW_SIZEOF,    NULL,       "sizeof" },
    { KW_ALIGN,     NULL,       "__align" },
    { KW_CDECL,     NULL,       "__cdecl" },
    { KW_STDCALL,   NULL,       "__stdcall" },
    { 0,            NULL,       NULL }
    };

    dynarray_init(&tktable, 8);
    for (tp = &keywords[0]; tp->spelling != NULL; tp++)
    {
        tkword_direct_insert(tp);
    }
}

/***********************************************************
*  功能:  忽略空格,TAB及回车
**********************************************************/
void skip_white_space()
{
    while (ch == ' ' || ch == '\t' || ch == '\r')
    {
        if (ch == '\r')
        {
            getch();
            if (ch != '\n')
                return;
            line_num++;
        }
        printf("%c", ch);
        getch();
    }
}

/***********************************************************
*  功能:  解析注释
**********************************************************/
void parse_comment()
{
    getch();
    do
    {
        do
        {
            if (ch == '\n' || ch == '*' || ch == CH_EOF)
                break;
            else
                getch();
        } while (1);
        if (ch == '\n')
        {
            line_num++;
            getch();
        }
        else if (ch == '*')
        {
            getch();
            if (ch == '/')
            {
                getch();
                return;
            }
        }
        else
        {
            error("一直到文件尾未看到配对的注释结束符");
            return;
        }
    } while (1);
}

/***********************************************************
*  功能:  预处理，忽略分隔符及注释
**********************************************************/
void preprocess()
{
    while (1)
    {
        if (ch == ' ' || ch == '\t' || ch == '\r')
            skip_white_space();
        else if (ch == '/')
        {
            //向前多读一个字节看是否是注释开始符，猜错了把多读的字符再放回去
            getch();
            if (ch == '*')
            {
                parse_comment();
            }
            else
            {
                ungetc(ch, fin); //把一个字符退回到输入流中
                ch = '/';
                break;
            }
        }
        else
            break;
    }
}

/***********************************************************
* 功能:   判断c是否为字母(a-z,A-Z)或下划线(-)
* c:        字符值
**********************************************************/
int is_nodigit(char c)
{
    return (c >= 'a'  && c <= 'z') || (c >= 'A' && c <= 'Z') || c == '_';
}

/***********************************************************
* 功能:   判断c是否为数字
* c:        字符值
**********************************************************/
int is_digit(char c)
{
    return c >= '0'&&c <= '9';
}

/***********************************************************
* 功能:   解析标识符
**********************************************************/
TkWord* parse_identifier()
{
    dynstring_reset(&tkstr);
    dynstring_chcat(&tkstr, ch);
    getch();
    while (is_nodigit(ch) || is_digit(ch))
    {
        dynstring_chcat(&tkstr, ch);
        getch();
    }
    dynstring_chcat(&tkstr, '\0');
    return tkword_insert(tkstr.data);
}

/***********************************************************
* 功能:   解析整型常量
**********************************************************/
void parse_num()
{
    dynstring_reset(&tkstr);
    dynstring_reset(&sourcestr);
    do {
        dynstring_chcat(&tkstr, ch);
        dynstring_chcat(&sourcestr, ch);
        getch();
    } while (is_digit(ch));
    if (ch == '.')
    {
        do {
            dynstring_chcat(&tkstr, ch);
            dynstring_chcat(&sourcestr, ch);
            getch();
        } while (is_digit(ch));
    }
    dynstring_chcat(&tkstr, '\0');
    dynstring_chcat(&sourcestr, '\0');
    tkvalue = atoi(tkstr.data);

}

/***********************************************************
* 功能:   解析字符常量、字符串常量
* sep:      字符常量界符标识为单引号(')
字符串常量界符标识为双引号(")
**********************************************************/
void parse_string(char sep)
{
    char c;
    dynstring_reset(&tkstr);
    dynstring_reset(&sourcestr);
    dynstring_chcat(&sourcestr, sep);
    getch();
    for (;;)
    {
        if (ch == sep)
            break;
        else if (ch == '\\')
        {
            dynstring_chcat(&sourcestr, ch);
            getch();
            switch (ch) //解析转义字符
            {
            case '0':
                c = '\0';
                break;
            case 'a':
                c = '\a';
                break;
            case 'b':
                c = '\b';
                break;
            case 't':
                c = '\t';
                break;
            case 'n':
                c = '\n';
                break;
            case 'v':
                c = '\v';
                break;
            case 'f':
                c = '\f';
                break;
            case 'r':
                c = '\r';
                break;
            case '\"':
                c = '\"';
                break;
            case '\'':
                c = '\'';
                break;
            case '\\':
                c = '\\';
                break;
            default:
                c = ch;
                if (c >= '!'&&c < '~')
                    warning("非法转义字符：\'\\%c\'", c);
                else
                    warning("非法转义字符：\'\\0x%x\'", c);
                break;
            }
            dynstring_chcat(&tkstr, c);
            dynstring_chcat(&sourcestr, ch);
            getch();
        }
        else
        {
            dynstring_chcat(&tkstr, ch);
            dynstring_chcat(&sourcestr, ch);
            getch();
        }
    }
    dynstring_chcat(&tkstr, '\0');
    dynstring_chcat(&sourcestr, sep);
    dynstring_chcat(&sourcestr, '\0');
    getch();
}

/***********************************************************
*  功能:  取单词
**********************************************************/
void get_token()
{
    preprocess();
    switch (ch)
    {
    case 'a': case 'b': case 'c': case 'd': case 'e': case 'f': case 'g':
    case 'h': case 'i': case 'j': case 'k': case 'l': case 'm': case 'n':
    case 'o': case 'p': case 'q': case 'r': case 's': case 't':
    case 'u': case 'v': case 'w': case 'x': case 'y': case 'z':
    case 'A': case 'B': case 'C': case 'D': case 'E': case 'F': case 'G':
    case 'H': case 'I': case 'J': case 'K': case 'L': case 'M': case 'N':
    case 'O': case 'P': case 'Q': case 'R': case 'S': case 'T':
    case 'U': case 'V': case 'W': case 'X': case 'Y': case 'Z':
    case '_':
    {
        TkWord* tp;
        tp = parse_identifier();
        token = tp->tkcode;
        break;
    }
    case '0': case '1': case '2': case '3':
    case '4': case '5': case '6': case '7':
    case '8': case '9':
        parse_num();
        token = TK_CINT;
        break;
    case '+':
        getch();
        token = TK_PLUS;
        break;
    case '-':
        getch();
        if (ch == '>')
        {
            token = TK_POINTSTO;
            getch();
        }
        else
            token = TK_MINUS;
        break;
    case '/':
        token = TK_DIVIDE;
        getch();
        break;
    case '%':
        token = TK_MOD;
        getch();
        break;
    case '=':
        getch();
        if (ch == '=')
        {
            token = TK_EQ;
            getch();
        }
        else
            token = TK_ASSIGN;
        break;
    case '!':
        getch();
        if (ch == '=')
        {
            token = TK_NEQ;
            getch();
        }
        else
            error("暂不支持'!'(非操作符)");
        break;
    case '<':
        getch();
        if (ch == '=')
        {
            token = TK_LEQ;
            getch();
        }
        else
            token = TK_LT;
        break;
    case '>':
        getch();
        if (ch == '=')
        {
            token = TK_GEQ;
            getch();
        }
        else
            token = TK_GT;
        break;
    case '.':
        getch();
        if (ch == '.')
        {
            getch();
            if (ch != '.')
                error("省略号拼写错误");
            else
                token = TK_ELLIPSIS;
            getch();
        }
        else
        {
            token = TK_DOT;
        }
        break;
    case '&':
        token = TK_AND;
        getch();
        break;
    case ';':
        token = TK_SEMICOLON;
        getch();
        break;
    case ']':
        token = TK_CLOSEBR;
        getch();
        break;
    case '}':
        token = TK_END;
        getch();
        break;
    case ')':
        token = TK_CLOSEPA;
        getch();
        break;
    case '[':
        token = TK_OPENBR;
        getch();
        break;
    case '{':
        token = TK_BEGIN;
        getch();
        break;
    case ',':
        token = TK_COMMA;
        getch();
        break;
    case '(':
        token = TK_OPENPA;
        getch();
        break;
    case '*':
        token = TK_STAR;
        getch();
        break;
    case '\'':
        parse_string(ch);
        token = TK_CCHAR;
        tkvalue = *(char *)tkstr.data;
        break;
    case '\"':
    {
        parse_string(ch);
        token = TK_CSTR;
        break;
    }
    case EOF:
        token = TK_EOF;
        break;
    default:
        error("不认识的字符:\\x%02x", ch); //上面字符以外的字符，只允许出现在源码字符串，不允许出现的源码的其它位置
        getch();
        break;
    }
}

5. 控制程序

包括主函数,初始化程序、着色程序和cleanup扫尾清理

lexical_analysis.h:

void getch();//从源文件中读取一个字符

extern TkWord* tk_hashtable[MAXKEY];// 单词哈希表
extern DynArray tktable;            // 单词动态数组
extern DynString tkstr;     //单词字符串
extern DynString sourcestr; //单词源码字符串

extern char ch;     //当前取到的源码字符
extern int token;       //单词编码
extern int tkvalue; //单词值
extern int line_num;    //行号

extern FILE *fin;
extern char *filename;
extern char *outfile;

lexical_analysis.c:

#include "lexical_analysis.h"

FILE *fin = NULL;
char *filename;
char *outfile;

/***********************************************************
* 功能:   词法着色
**********************************************************/
void color_token(int lex_state)
{
    HANDLE h = GetStdHandle(STD_OUTPUT_HANDLE);
    char *p;
    switch (lex_state)
    {
    case LEX_NORMAL:
    {
        if (token >= TK_IDENT)
            SetConsoleTextAttribute(h, FOREGROUND_INTENSITY);
        else if (token >= KW_CHAR)
            SetConsoleTextAttribute(h, FOREGROUND_GREEN | FOREGROUND_INTENSITY);
        else if (token >= TK_CINT)
            SetConsoleTextAttribute(h, FOREGROUND_RED | FOREGROUND_GREEN);
        else
            SetConsoleTextAttribute(h, FOREGROUND_RED | FOREGROUND_INTENSITY);
        p = get_tkstr(token);
        printf("%s", p);
        break;
    }
    case LEX_SEP:
        printf("%c", ch);
        break;
    }
}

/***********************************************************
*  功能:  词法分析测试
**********************************************************/
void test_lex()
{
    do
    {
        get_token();
        color_token(LEX_NORMAL);
    } while (token != TK_EOF);
    printf("\n代码行数: %d行\n", line_num);
}


/***********************************************************
* 功能:   初始化
**********************************************************/
void init()
{
    line_num = 1;
    init_lex();
}


/***********************************************************
* 功能:   扫尾清理工作
**********************************************************/
void cleanup()
{
    int i;
    for (i = TK_IDENT; i < tktable.count; i++)
    {
        free(tktable.data[i]);
    }
    free(tktable.data);
}

/***********************************************************
* 功能:   得到文件扩展名
* fname:    文件名称
**********************************************************/
char *get_file_ext(char *fname)
{
    char *p;
    p = strrchr(fname, '.');
    return p + 1;
}
/***********************************************************
* 功能:   从源文件中读取一个字符
**********************************************************/
void getch()
{
    ch = getc(fin);
}


/***********************************************************
* 功能:   main主函数
**********************************************************/
int main(int argc, char ** argv)
{

    fin = fopen(argv[1], "rb");
    system("pause");
    if (!fin)
    {
        printf("不能打开SC源文件!\n");
        return 0;
    }
    init();
    getch();
    test_lex();
    cleanup();
    fclose(fin);
    printf("%s 词法分析成功!", argv[1]);
    system("pause");
    return 1;
}

测试

测试代码：

/*********************************************************** 
 * color_token_demo.c
 **********************************************************/
struct  point
{
    int  x;  
    int  y;
};
void  main()
{
    int  arr[10]; 
    int  i; 
    struct  point  pt;
    pt.x =1024;
    pt.y=768;
    for(i = 0; i < 10; i = i + 1)   
    {
        arr[i]=i;           
        if (i == 6)
        {
            continue;       
        }
        else
        {
            printf("arr[%d]=%d\n",i,arr[i]);
        }
    }
    printf("pt.x = %d, pt.y = %d\n",pt.x,pt.y);
}

结果：

你可能感兴趣的:(编译器,编译器)

C语言宏函数南林yan C语言 c语言
一、什么是宏函数？通过宏定义的函数是宏函数。如下，编译器在预处理阶段会将Add(x,y)替换为((x)*(y))#defineAdd(x,y)((x)*(y))#defineAdd(x,y)((x)*(y))intmain(){inta=10;intb=20;intd=10;intc=Add(a+d,b)*2;cout<
Python编译器鹿鹿~ Python编译器 Python python 开发语言后端
嘿嘿嘿我又来了啊有些小盆友可能不知道Python其实是有编译器的，也就是PyCharm。你们可能会问到这个是干嘛的又不可以吃也不可以穿好像没有什么用，其实你还说对了这个还真的不可以吃也不可以穿，但是它用来干嘛的呢。用来编译你所打出的代码进行运行（可能这里说的有点不对但是只是个人认为）现在我们来说说PyCharm是用来干嘛的。PyCharm是一种PythonIDE，带有一整套可以帮助用户在使用Pyt
sublime个人设置 bawangtianzun sublime text 编辑器
如何拥有jiangly蒋老师同款编译器(sublimec++配置竞赛向）_哔哩哔哩_bilibiliSublimeText4的安装教程（新手竞赛向）-知乎(zhihu.com)创建文件自动保存为c++打开SublimeText软件。转到"Tools"（工具）>"Developer"（开发者）>"NewPlugin"（新建插件）。在打开的新文件中，粘贴以下代码：importsublimeimport
linux gcc 格式,Linux下gcc与gdb简介神奇的战士 linux gcc 格式
gcc编译器可以将C、C++等语言源程序、汇编程序编译、链接成可执行程序。gdb是GNU开发的一个Unix/Linux下强大的程序调试工具。linux下没有后缀名的概念。但gcc根据文件的后缀来区别输入文件的类别：.cC语言源代码文件.a由目标文件构成的库文件.C、.cc、.cppC++源码文件.h头文件.i经过预处理之后的C语言文件.ii经过预处理之后的C++文件.o编译后的目标文件.s汇编源码
Linux中GCC与GDB 常用命令详解 Dijkstra's Monk-ey Linux与安全 linux gdb shell 安全 c语言
GCC和GDB常用命令详解GCC常用的选项GDBLINUX下编程，少不了和GCC,GDB打交道，现在总结下常用命令，掌握这些足够用了。GCC常用的选项选项语义-o指定生成的输出文件-E仅执行编译预处理gcc的-E选项，可以让编译器在预处理后停止，并输出预处理结果。-S将C代码转换为汇编代码gcc的-S选项，表示在程序编译期间，在生成汇编代码后停止-wall显示警告信息-c生成目标文件（.o），仅执
Java【泛型】 SkyrimCitadelValinor Java基础 java
Java泛型的概述不同类的数据如果封装方法相同，不必为每一种类单独定义一个类，只需定义一个泛型类，减少类的声明，提高编程效率。通过准确定义泛型类，可避免对象类型转换时产生的错误。泛型又提供了一种类型安全检测机制，只有数据类型相匹配的变量才能正常的赋值，否则编译器就不通过。Java中的泛型与C++类模板的作用相同，但是编译方式不同，Java泛型类只会生成一部分目标代码，牺牲运行速度，而C++的类模板
Makefile问答之 04 优化异常与警告设置捕鲸叉 Linux使用 Linux系统编程 Makefile linux
Makefile怎样指定优化选项，包括编译和链接优化，常用的选项有哪些？在Makefile中，你可以通过设置编译器和链接器的选项来指定优化选项。优化选项可以分为编译优化和链接优化，以下是如何在Makefile中指定这些选项，以及一些常用的选项。示例Makefile#编译器CC=gcc#编译选项CFLAGS=-Wall-O2#链接选项LDFLAGS=-O2#需要链接的库LDLIBS=#目标文件TAR
Java泛型编程 shymoy java 开发语言
文章目录为什么需要泛型如何实现技术细节泛型数组泛型类型实现接口接收参数小结为什么需要泛型如果为每一种类型都写一个类来适配，会造成code冗长且难读，所以需要写一个同一的抽象的方法来实现，并让编译器自动的传入这些类型。如何实现通常放在类后面的尖括号里publicclassGenertic{}也可以指代多个publicclassGenertic{}这个类中的变量都可以用K和V来表示了泛型不仅可以应用在
python 编译器spyder 安装_离线安装spyder的Python环境 weixin_39552037 python 编译器spyder 安装
一、介绍：要求在不联网、无法使用anaconda的情况下，在一台离线的win7设备上配置Spyder的python的开发环境，用于提高数据处理效率，且安装方法在win732位和64位的各种设备上均可流畅安装。二、问题难点总结：1.离线安装Python的第三方函数库Python在联网情况下安装第三方包很容易，但离线安装操作比较复杂，如某第三方库a，联网状态下仅一行代码pipinstalla，然而离线
C++快速入门扫盲总结六竹书生__wa C/C++Qt
C++快速入门扫盲总结C++语言新特性C++的新特性C++的输入输出方式C++之命名空间namespaceC++面向对象类和对象构造函数与析构函数this指针继承重载函数重载运算符重载多态数据封装数据抽象接口（抽象类）C++语言新特性C++的新特性C++比C语言新增的数据类型是布尔类型（bool）。但是在新的C语言标准里已经有布尔类型了，但是在旧的C语言标准里是没有布尔类型的，编译器也无法解释布尔
C++多线程的简单使用好学松鼠 C++C++多线程 async promise
多线程的使用，本文主要简单介绍使用多线程的几种方式，并使用几个简单的例子来介绍多线程，使用编译器为visualstudio。一、AsyncFuture使用的知识点有std::async和std::future1、std::async函数原型templatefuture::type>async(launchpolicy,Fn&&fn,Args&&...args);功能：第二个参数接收一个可调用对象（
Java 入门基础篇05 - Java的关键字仔仔 v1.0 Java基础 java 开发语言 intellij-idea
什么是关键字？就是被java语言赋予特殊含义的单词。关键字的特点组成关键的字母都是小写。常见关键字class,public,static,void.....。关键字注意事项goto和const是java语言的保留字，关键字在IDEA编译器中有明确的颜色变化。关键字列表ABSTRACTCONTINUEFORNEWSWITCHassertdefaultgotopackagesynchronizedbo
Linux之ansible的playbook剧本(yaml文件) 小橞 linux ansible 运维服务器
playbook剧本一个剧本（即playbook），可以包含多个play每个play用于在指定的主机上，通过模块和参数执行相应的任务每个play可以包含多个任务。任务有模块和参数构成。paly要建立在ansible文件夹下才能使用因为yaml文件对格式要求很严格所有本人在编写时会设置一下vim编译器的一些功能格式setai：自动缩进setts=2：设置tab键缩进两个空格setet：将tab键转换
IDEA测试类启动报 “java: 常量字符串过长” 解决办法无休居士 Java工程常见异常 java intellij-idea ide
目录标题问题描述问题分析解决办法其他办法问题描述问题分析字符串长度过长，导致idea默认使用的javac编译器编译不了。查询资料发现，原因是javac在编译期间，常量字符串最大长度为65534。解决办法Javac编译器改为Eclipse编译器。File->Settings->Build,Execution,Deployment->Compiler->JavaCompiler其他办法如果不是新建pr
新手入门：SDK和IDE的区别 xiazhongzhou 编译器其他经验分享
SDK就是SoftwareDevelopmentKit的缩写，中文意思就是“软件开发工具包”。这是一个覆盖面相当广泛的名词，可以这么说：辅助开发某一类软件的相关文档、范例和工具的集合都可以叫做“SDK”。IDE电子集成驱动器:IDE(IntegratedDevelopmentEnvironment集成开发环境)集成开发环境（简称IDE）软件是用于程序开发环境的应用程序，一般包括代码编辑器、编译器、
sdk和ide earlene_wyl
ide：集成开发环境，是一种辅助程序开发人员开发软件的应用软件。IDE通常包括编程语言编辑器、自动建立工具、通常还包括调试器。有些IDE包含编译器／解释器，如微软的MicrosoftVisualStudio，有些则不包含，如Eclipse、SharpDevelop等，这些IDE是通过调用第三方编译器来实现代码的编译工作的。有时IDE还会包含版本控制系统和一些可以设计图形用户界面的工具。许多支持面向
[Windows] MinGW 与 MSYS2 ERIC-ZI Windows windows
一、MinGW(MinimalistGNUforWindows)MinGW（MinimalistGNUforWindows）是一个专为Windows系统设计的工具集，旨在为Windows开发者提供一个轻量级且高效的GNU工具链。该工具集的核心是GNU编译器集合（GCC），其中包括了支持多种编程语言的编译器，如C、C++和Ada。MinGW的主要目标是让开发者能够在Windows系统上直接编译和运行
[ IDE ] 什么是SDK ERIC-ZI IDE IDE 开发环境
一、定义在嵌入式系统开发中，SDK（SoftwareDevelopmentKit，软件开发工具包）是一个综合性的工具集合，它被设计用于帮助开发者更有效地为特定的硬件平台编写软件。嵌入式SDK通常包含一系列的工具、库文件、文档和示例代码，旨在简化开发过程并提高开发效率。二、SDK的主要组成编译器和链接器：这些工具用于将开发者编写的源代码转化为目标硬件可以理解和执行的机器码。库文件：库文件包含了一些预
反思的魔力：用语言的力量强化AI智能体步子哥人工智能机器学习
在浩瀚的代码海洋中，AI智能体就像初出茅庐的航海家，渴望探索未知的宝藏。然而，面对复杂的编程任务，他们常常迷失方向。今天，就让我们跟随“反思”的灯塔，见证AI智能体如何通过语言的力量，点亮智慧的明灯，成为代码世界的征服者！智能体的困境近年来，大型语言模型（LLM）在与外部环境（如游戏、编译器、API）交互的领域中大放异彩，化身为目标驱动的智能体。然而，传统的强化学习方法如同一位严苛的训练师，需要大
go 语言常见问题（4） jzpfbpx golang 开发语言后端
31.go语言编程的好处是什么编译和运行都很快。在语言层级支持并行操作。有垃圾处理器。内置字符串和maps。函数是go语言的最基本编程单位。32.说说go语言的select机制select机制用来处理异步IO问题select机制最大的一条限制就是每个case语句里必须是一个IO操作golang在语言级别支持select关键字33.解释一下go语言中的静态类型声明静态类型声明是告诉编译器不需要太多的
天下苦英伟达久矣！PyTorch官方免CUDA加速推理，Triton时代要来？诗者才子酒中仙物联网 /互联网 /人工智能 /其他 pytorch 人工智能 python
在做大语言模型（LLM）的训练、微调和推理时，使用英伟达的GPU和CUDA是常见的做法。在更大的机器学习编程与计算范畴，同样严重依赖CUDA，使用它加速的机器学习模型可以实现更大的性能提升。虽然CUDA在加速计算领域占据主导地位，并成为英伟达重要的护城河之一。但其他一些工作的出现正在向CUDA发起挑战，比如OpenAI推出的Triton，它在可用性、内存开销、AI编译器堆栈构建等方面具有一定的优势
Swift基础语法 huang1233 Swift swift
print("HelloSwift").不用编写main函数,Swift将全局范围内的首句可执行作为程序入口.一句代码尾部可以省略分号(;),多句代码写在同一行时必须用分号(;)隔开.用var定义变量,let定义常量,编译器能自动推断出变量\常量的类型leta=10letb=20varc=a+b+10c+=30Playground可以快速预览代码效果,是学习语法的好帮手Command+Shift+
Swift基本语法-简例 ☆MOON 移动互联网-iOS笔记 python 正则表达式爬虫
Swift基本语法简例安全类型?与!区别变量与常量字符串拼接多行字符串数组操作字典操作数组遍历控制条件判断switch语句循环遍历函数闭包对象枚举结构体协议扩展泛型get，set属性属性观察懒加载，重写方法回调及保护安全类型?与!区别?表示：返回值是一个可选类型，需要解包处理，如果有值就是相应类型的，如果没有值，就是“nil”，适用于不确定值的情形!表示：不需要解包处理（第一次赋值时编译器已自动解
C++20 新特征：概念（Concepts）全面解析 jianglq C++开发 C++学习 c++20 开发语言
基本概念C++20引入了一个重要的新特性——概念（Concepts）。概念允许你在编写模板时指定模板参数（类型或非类型）应该满足的条件。这种约束使得编译器能够在编译时检查类型是否符合预期，从而提前发现错误，并给出更清晰的错误信息。概念是编译时多态的一种形式，它增强了模板编程的能力，使得代码更加健壮、可读性和可维护性更高。历史演变概念的想法早在C++的设计阶段就已经存在，但由于早期的技术限制和技术挑
c语言中宏描述错误,C 宏定义与错误处理 Yyviuss c语言中宏描述错误
宏定义C语言中宏定义，又叫预处理器。它不是编译器的组成部分，但却是编译过程中一个单独的步骤。简言之，C预处理器只不过是一个文本替换工具而已，它们会指示编译器在实际编译之前完成所需的预处理。指令描述#define定义宏#include包含一个源代码文件#undef取消已定义的宏#ifdef如果宏已经定义，则返回真#ifndef如果宏没有定义，则返回真#if如果给定条件为真，则编译下面代码#else#
如何用C语言改变宏定义的大小,C语言中宏定义使用的小细节李叫瘦如何用C语言改变宏定义的大小
C语言中宏定义使用的小细节#pragma#pragma预处理指令详解在所有的预处理指令中，#Pragma指令可能是最复杂的了，它的作用是设定编译器的状态或者是指示编译器完成一些特定的动作。#pragma指令对每个编译器给出了一个方法,在保持与C和C++语言完全兼容的情况下,给出主机或操作系统专有的特征。依据定义,编译指示是机器或操作系统专有的,且对于每个编译器都是不同的。其格式一般为:#Pragm
c语言中宏的用法汇总 Alfred.HOO C c语言
1.用作符号常量/明示常量时#define预处理指令和其他预处理指令一样，以#号作为一行的开始。指令可以出现在源文件的任何地方，其定义从出现的地方到该文件的末尾有效。预处理器指令从#开始，到后面的第一个换行符为止。宏的名字中不允许有空格，而且必须遵循c变量的命名规则：只能使用字母/数字/下划线，而且首字符不能是数字。注意，宏定义还可以包含其他宏(一些编译器不支持这种嵌套功能)。例如:#define
flutter 泛型_Flutter入门——泛型 weixin_39627408 flutter 泛型
在查看基本数组类型List的API文档，会看到该类型实际上是List。表示法将List标记为泛型(或参数化)类型-具有正式类型参数的类型。按照惯例，大多数类型变量都有单字母名称，例如E，T，S，K和V.为什么要使用泛型类型安全通常需要泛型，除了允许让代码运行之外，还可以：正确指定泛型类型会生成更好的代码。例如，可以使用List(字符串列表)，来表示列表中只包含字符串，这样编译器就会启用类型检查，非
软考架构-架构风格 zyhJhon 架构
一、概念：风格就是架构的模式，比如C/S、B/S架构，比如现实生活中的中式风格、欧式风格描述某一特定应用领域中系统组织的方式软件架构风格反映了领域中众多系统所共有的结构和语义特性，并指导如何将各个模块和子系统有效地组织成一个完整的系统。架构设计的核心问题是能否达到架构级的软件复用架构风格定义了用于描述系统的术语表和一组指导构架系统的规则二、风格分类架构风格考点说明数据流-批处理传统编译器，每个阶段
【第三天】python和pycharm要不要一起下的问题解答秋凉fz python pycharm 开发语言
要！！！下了pycharm但是没下载python也是运行不了的原文链接：Python环境搭建—安利Python小白的Python和Pycharm安装详细教程-知乎工欲善其事，必先利其器。首先我们先来安装Python，在这里安利一下：其实在没有安装Python之前也可以安装Pycharm的，两者并没有什么冲突关系。但是话说回来，如果没有Python编译器，那么Pycharm其实只是个驱壳，即便你编好
分享100个最新免费的高匿HTTP代理IP mcj8089 代理IP 代理服务器匿名代理免费代理IP 最新代理IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ 120.198.243.130:80,中国/广东省 58.251.78.71:8088,中国/广东省 183.207.228.22:83,中国/
mysql高级特性之数据分区 annan211 java 数据结构 mongodb 分区 mysql
mysql高级特性 1 以存储引擎的角度分析，分区表和物理表没有区别。是按照一定的规则将数据分别存储的逻辑设计。器底层是由多个物理字表组成。 2 分区的原理分区表由多个相关的底层表实现，这些底层表也是由句柄对象表示，所以我们可以直接访问各个分区。存储引擎管理分区的各个底层表和管理普通表一样(所有底层表都必须使用相同的存储引擎)，分区表的索引只是
JS采用正则表达式简单获取URL地址栏参数 chiangfai js 地址栏参数获取
GetUrlParam:function GetUrlParam(param){ var reg = new RegExp("(^|&)"+ param +"=([^&]*)(&|$)"); var r = window.location.search.substr(1).match(reg); if(r!=null
怎样将数据表拷贝到powerdesigner (本地数据库表) Array_06 powerDesigner
================================================== 1、打开PowerDesigner12，在菜单中按照如下方式进行操作 file->Reverse Engineer->DataBase 点击后，弹出 New Physical Data Model 的对话框 2、在General选项卡中 Model name:模板名字，自
logbackのhelloworld 飞翔的马甲日志 logback
一、概述 1.日志是啥？当我是个逗比的时候我是这么理解的：log.debug()代替了system.out.print(); 当我项目工作时，以为是一堆得.log文件。这两天项目发布新版本，比较轻松，决定好好地研究下日志以及logback。传送门1：日志的作用与方法： http://www.infoq.com/cn/articles/why-and-how-log 上面的作
新浪微博爬虫模拟登陆随意而生新浪微博
转载自：http://hi.baidu.com/erliang20088/item/251db4b040b8ce58ba0e1235 近来由于毕设需要，重新修改了新浪微博爬虫废了不少劲，希望下边的总结能够帮助后来的同学们。现行版的模拟登陆与以前相比，最大的改动在于cookie获取时候的模拟url的请求
synchronized 香水浓 java thread
Java语言的关键字，可用来给对象和方法或者代码块加锁，当它锁定一个方法或者一个代码块的时候，同一时刻最多只有一个线程执行这段代码。当两个并发线程访问同一个对象object中的这个加锁同步代码块时，一个时间内只能有一个线程得到执行。另一个线程必须等待当前线程执行完这个代码块以后才能执行该代码块。然而，当一个线程访问object的一个加锁代码块时，另一个线程仍然
maven 简单实用教程 AdyZhang maven
1. Maven介绍 1.1. 简介 java编写的用于构建系统的自动化工具。目前版本是2.0.9，注意maven2和maven1有很大区别，阅读第三方文档时需要区分版本。 1.2. Maven资源见官方网站；The 5 minute test，官方简易入门文档；Getting Started Tutorial，官方入门文档；Build Coo
Android 通过 intent传值获得null aijuans android
我在通过intent 获得传递兑现过的时候报错，空指针,我是getMap方法进行传值，代码如下 1 2 3 4 5 6 7 8 9 public void getMap(View view){ Intent i =
apache 做代理报如下错误：The proxy server received an invalid response from an upstream baalwolf response
网站配置是apache＋tomcat,tomcat没有报错，apache报错是： The proxy server received an invalid response from an upstream server. The proxy server could not handle the request GET /. Reason: Error reading fr
Tomcat6 内存和线程配置 BigBird2012 tomcat6
1、修改启动时内存参数、并指定JVM时区（在windows server 2008 下时间少了8个小时）在Tomcat上运行j2ee项目代码时，经常会出现内存溢出的情况，解决办法是在系统参数中增加系统参数： window下，在catalina.bat最前面 set JAVA_OPTS=-XX:PermSize=64M -XX:MaxPermSize=128m -Xms5
Karam与TDD bijian1013 Karam TDD
一.TDD 测试驱动开发（Test-Driven Development,TDD）是一种敏捷（AGILE）开发方法论，它把开发流程倒转了过来，在进行代码实现之前，首先保证编写测试用例，从而用测试来驱动开发（而不是把测试作为一项验证工具来使用）。 TDD的原则很简单： a.只有当某个
[Zookeeper学习笔记之七]Zookeeper源代码分析之Zookeeper.States bit1129 zookeeper
public enum States { CONNECTING, //Zookeeper服务器不可用，客户端处于尝试链接状态 ASSOCIATING, //？？？ CONNECTED, //链接建立，可以与Zookeeper服务器正常通信 CONNECTEDREADONLY, //处于只读状态的链接状态，只读模式可以在
【Scala十四】Scala核心八：闭包 bit1129 scala
Free variable A free variable of an expression is a variable that’s used inside the expression but not defined inside the expression. For instance, in the function literal expression (x: Int) => (x
android发送json并解析返回json ronin47 android
package com.http.test; import org.apache.http.HttpResponse; import org.apache.http.HttpStatus; import org.apache.http.client.HttpClient; import org.apache.http.client.methods.HttpGet; import
一份IT实习生的总结 brotherlamp PHP php资料 php教程 php培训 php视频
今天突然发现在不知不觉中自己已经实习了 3 个月了，现在可能不算是真正意义上的实习吧，因为现在自己才大三，在这边撸代码的同时还要考虑到学校的功课跟期末考试。让我震惊的是，我完全想不到在这 3 个月里我到底学到了什么，这是一件多么悲催的事情啊。同时我对我应该 get 到什么新技能也很迷茫。所以今晚还是总结下把，让自己在接下来的实习生活有更加明确的方向。最后感谢工作室给我们几个人这个机会让我们提前出来
据说是2012年10月人人网校招的一道笔试题-给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。将重物放到天平左侧，问在两边如何添加砝码 bylijinnan java
public class ScalesBalance { /** * 题目： * 给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。（假设N无限大，但一种重量的砝码只有一个） * 将重物放到天平左侧，问在两边如何添加砝码使两边平衡 * * 分析： * 三进制 * 我们约定括号表示里面的数是三进制，例如 47=(1202
dom4j最常用最简单的方法 chiangfai dom4j
要使用dom4j读写XML文档,需要先下载dom4j包,dom4j官方网站在 http://www.dom4j.org/目前最新dom4j包下载地址:http://nchc.dl.sourceforge.net/sourceforge/dom4j/dom4j-1.6.1.zip 解开后有两个包,仅操作XML文档的话把dom4j-1.6.1.jar加入工程就可以了,如果需要使用XPath的话还需要
简单HBase笔记 chenchao051 hbase
一、Client-side write buffer 客户端缓存请求描述：可以缓存客户端的请求，以此来减少RPC的次数，但是缓存只是被存在一个ArrayList中，所以多线程访问时不安全的。可以使用getWriteBuffer()方法来取得客户端缓存中的数据。默认关闭。二、Scan的Caching 描述： next( )方法请求一行就要使用一次RPC,即使
mysqldump导出时出现when doing LOCK TABLES daizj mysql mysqdump 导数据
　　执行　mysqldump -uxxx -pxxx -hxxx -Pxxxx database tablename > tablename.sql　导出表时，会报 mysqldump: Got error: 1044: Access denied for user 'xxx'@'xxx' to database 'xxx' when doing LOCK TABLES 解决
CSS渲染原理 dcj3sjt126com Web
从事Web前端开发的人都与CSS打交道很多，有的人也许不知道css是怎么去工作的，写出来的css浏览器是怎么样去解析的呢？当这个成为我们提高css水平的一个瓶颈时，是否应该多了解一下呢？一、浏览器的发展与CSS
《阿甘正传》台词 dcj3sjt126com
Part Ⅰ: 《阿甘正传》Forrest Gump经典中英文对白 Forrest: Hello! My names Forrest. Forrest Gump. You wanna Chocolate? I could eat about a million and a half othese. My momma always said life was like a box ochocol
Java处理JSON dyy_gusi json
Json在数据传输中很好用，原因是JSON 比 XML 更小、更快，更易解析。在Java程序中，如何使用处理JSON，现在有很多工具可以处理，比较流行常用的是google的gson和alibaba的fastjson，具体使用如下： 1、读取json然后处理 class ReadJSON { public static void main(String[] args)
win7下nginx和php的配置 geeksun nginx
1. 安装包准备 nginx : 从nginx.org下载nginx-1.8.0.zip php：从php.net下载php-5.6.10-Win32-VC11-x64.zip， php是免安装文件。 RunHiddenConsole: 用于隐藏命令行窗口 2. 配置 # java用8080端口做应用服务器，nginx反向代理到这个端口即可 p
基于2.8版本redis配置文件中文解释 hongtoushizi redis
转载自： http://wangwei007.blog.51cto.com/68019/1548167 在Redis中直接启动redis-server服务时, 采用的是默认的配置文件。采用redis-server xxx.conf 这样的方式可以按照指定的配置文件来运行Redis服务。下面是Redis2.8.9的配置文
第五章常用Lua开发库3-模板渲染 jinnianshilongnian nginx lua
动态web网页开发是Web开发中一个常见的场景，比如像京东商品详情页，其页面逻辑是非常复杂的，需要使用模板技术来实现。而Lua中也有许多模板引擎，如目前我在使用的lua-resty-template，可以渲染很复杂的页面，借助LuaJIT其性能也是可以接受的。如果学习过JavaEE中的servlet和JSP的话，应该知道JSP模板最终会被翻译成Servlet来执行；而lua-r
JZSearch大数据搜索引擎颠覆者 JavaScript
系统简介：大数据的特点有四个层面：第一，数据体量巨大。从TB级别，跃升到PB级别；第二，数据类型繁多。网络日志、视频、图片、地理位置信息等等。第三，价值密度低。以视频为例，连续不间断监控过程中，可能有用的数据仅仅有一两秒。第四，处理速度快。最后这一点也是和传统的数据挖掘技术有着本质的不同。业界将其归纳为4个“V”——Volume，Variety，Value，Velocity。大数据搜索引
10招让你成为杰出的Java程序员 pda158 java 编程框架
如果你是一个热衷于技术的 Java 程序员，那么下面的 10 个要点可以让你在众多 Java 开发人员中脱颖而出。　　 1. 拥有扎实的基础和深刻理解 OO 原则　　对于 Java 程序员，深刻理解 Object Oriented Programming（面向对象编程）这一概念是必须的。没有 OOPS 的坚实基础，就领会不了像 Java 这些面向对象编程语言
tomcat之oracle连接池配置小网客 oracle
tomcat版本7.0 配置oracle连接池方式：修改tomcat的server.xml配置文件： <GlobalNamingResources> <Resource name="utermdatasource" auth="Container" type="javax.sql.DataSou
Oracle 分页算法汇总 vipbooks oracle sql 算法 .net
这是我找到的一些关于Oracle分页的算法，大家那里还有没有其他好的算法没？我们大家一起分享一下！ -- Oracle 分页算法一 select * from ( select page.*,rownum rn from (select * from help) page -- 20 = (currentPag