小C语言--词法分析程序

小C语言--词法分析程序

Time Limit: 1000MS Memory Limit: 5000KB

Problem Description

小C语言文法 
1. <程序>→(){<声明序列><语句序列>}
2. <声明序列>→<声明序列><声明语句>|<声明语句>|<空>
3. <声明语句>→<标识符表>;
4. <标识符表>→<标识符>,<标识符表>|<标识符>
5. <语句序列>→<语句序列><语句>|<语句>
6. <语句>→< if语句>|< while语句>|< for语句>|<复合语句>|<赋值语句>
7. < if语句>→< if关键字>(<表达式>)<复合语句>|(<表达式>)<复合语句>< else关键字><复合语句>
8. < while语句>→< while关键字>(<表达式>)<复合语句>
9. < for语句>→< for关键字>(<表达式>;<表达式>;<表达式>)<复合语句>
10. <复合语句>→{<语句序列>}
11. <赋值语句>→<表达式>;
12. <表达式>→<标识符>=<算数表达式>|<布尔表达式>
13. <布尔表达式>→<算数表达式> |<算数表达式><关系运算符><算数表达式>
14. <关系运算符>→>|<|>=|<=|==|!=
15. <算数表达式>→<算数表达式>+<项>|<算数表达式>-<项>|<项>
16. <项>→<项>*<因子>|<项>/<因子>|<因子>
17. <因子>→<标识符>|<无符号整数>|(<算数表达式>)
18. <标识符>→<字母>|<标识符><字母>|<标识符><数字>
19. <无符号整数>→<数字>|<无符号整数><数字>
20. <字母>→a|b|…|z|A|B|…|Z
21. <数字>→0|1|2|3|4|5|6|7|8|9

22. < main关键字>→main
23. < if关键字>→if
24. < else关键字>→else
25. < for关键字>→for
26. < while关键字>→while
27. < int关键字>→int


小C语言文法如上,现在我们对小C语言写的一个源程序进行词法分析,分析出关键字、自定义标识符、整数、界符
和运算符。
关键字:main if else for while int
自定义标识符:除关键字外的标识符
整数:无符号整数
界符:{ } ( ) , ;
运算符:= + - * / < <= > >= == !=

Input

输入一个小C语言源程序,保证输入合法。

Output

按照源程序中单词出现顺序输出,输出二元组形式的单词串。

(单词种类,单词值)

单词一共5个种类:

关键字:用keyword表示
自定义标识符:用identifier表示
整数:用integer表示
界符:用boundary表示
运算符:用operator表示

每种单词值用该单词的符号串表示。

Example Input

main() 
{
    int a, b;
    if(a == 10)
    {
        a = b;
    }
}

Example Output

(keyword,main)
(boundary,()
(boundary,))
(boundary,{)
(keyword,int)
(identifier,a)
(boundary,,)
(identifier,b)
(boundary,;)
(keyword,if)
(boundary,()
(identifier,a)
(operator,==)
(integer,10)
(boundary,))
(boundary,{)
(identifier,a)
(operator,=)
(identifier,b)
(boundary,;)
(boundary,})
(boundary,})

Hint

Author

cai++

c++:

#include
using namespace std;
int main()
{
    string K[6],S[5],s;
    K[0]="main";
    K[1]="if";
    K[2]="else";
    K[3]="for";
    K[4]="while";
    K[5]="int";
    S[0]="keyword";
    S[1]="identifier";
    S[2]="integer";
    S[3]="boundary";
    S[4]="operator";
    while(cin>>s)
    {
        int l=s.length();
     if(s[0]>='0'&&s[0]<='9')
     {
         cout<<"("<='0'&&s[i]<='9')
             {
                 cout<'||s[0]=='<'||s[0]=='!')
        {
            cout<<"("<= 'a' && s[i] <= 'z') || (s[i] >= 'A' && s[i] <= 'Z'))
                {
                    str = str+s[i];

                }
                else if(s[i] >= '0' && s[i]<='9')
                {
                    str = str+s[i];
                }
                else
                {
                    int j;
                    flag1=1;
                    int flag=0;

                 if(str.length()>0)
                 {
                     for(j=0;j<6;j++)
                     {
                         if(K[j]==str)
                         {
                             flag=1;
                            cout<<"("<=6)
                     {
                         cout<<"("<= 6)
                {
                     cout<<"("<


c:

    #include  
    #include  
    int isDigit(char ch)  
    {  
        if(ch>='0'&&ch<='9')  
            return 1;  
        else return 0;  
    }  
      
    int isLitter(char ch)  
    {  
        if(ch>='a'&&ch<='z'||ch>='A'&&ch<='Z')  
            return 1;  
        else return 0;  
    }  
      
    int isKeyword(char tmp[])  
    {  
        if(!strcmp(tmp,"main")|| !strcmp(tmp,"if") || !strcmp(tmp,"else") || !strcmp(tmp,"for") || !strcmp(tmp,"while") || !strcmp(tmp,"int"))  
            return 1;  
        else return 0;  
    }  
    void get()  
    {  
        char ch;  
        int line=0;//行数  
        char tmp[100];  
        int i=0;  
        while(~scanf("%c",&ch))  
        {  
            if(ch==' '||ch=='\t')//为空格或是tab  
                continue;  
            //回车  
            else if(ch=='\n')  
                line++;  
            //是否是界符  
            else if(ch=='('||ch==')'||ch=='{'||ch=='}'||ch==','||ch==';')  
                printf("(boundary,%c)\n",ch);  
      
            else if(isDigit(ch))//如果是数字  
            {  
                while(isDigit(ch))  
                {  
                    tmp[i++]=ch;  
                    scanf("%c",&ch);  
                }  
                tmp[i]='\0';//加上结束符  
                i=0;  
                printf("(integer,%s)\n",tmp);  
                ungetc(ch,stdin);//将字符退回到输入流中  
            }  
            else if(isLitter(ch)||ch=='_')  
            {  
                while(isLitter(ch)||isDigit(ch)||ch=='_')  
                {  
                    tmp[i++]=ch;  
                    scanf("%c",&ch);  
                }  
                tmp[i]='\0';  
                i=0;  
                if(isKeyword(tmp))  //关键字  
                    printf("(keyword,%s)\n",tmp);  
                else            //自定义标识符  
                    printf("(identifier,%s)\n",tmp);  
                ungetc(ch,stdin);  
            }  
      
            //是否是运算符  
            else  
            {  
                char c=ch;  
                // if(ch=='='||ch=='<'||ch=='>'||ch=='!')  
                // {  
                scanf("%c",&ch);  
                if(ch=='=')     //判断是否是两个字节操作符  
                    printf("(operator,%c=)\n",ch);  
                // }  
                // else  
                // {  
                else        //单个字节操作符  
                {  
                    printf("(operator,%c)\n",c);  
                    ungetc(ch,stdin);  
                }  
            }  
      
        }  
    }  
    int main()  
    {  
        get();  
    }  


你可能感兴趣的:(编译原理)