编译原理-1-词法分析

在上一篇文章中,大致介绍了下编译过程。从这篇文章开始,我们就开始逐步慢慢深入的学习编译过程中的步骤。今天我们就来具体看看词法分析到底是怎么回事。

========================华丽丽的分割线============================================

     

int fun(int a,int c);
int m=10;
int main()
{
    int i=4;
    int j=5;
    m = fun(i,j);
    return 0;
}

int fun(int a,int b)
{
    int c=0;
    c=a+b;
    return c;
}
  对于如上源码,在计算机上存储的形式与如上我们看到的形式不同,以16进制形式展现的话,上述c语言代码看上去就是:

   696E742066756E28696E7420612C696E
   742063293B0D0A696E74206D3D31303B
   0D0A696E74206D61696E28290D0A7B0D
   0A20202020696E7420693D343B0D0A20
   202020696E74206A3D353B0D0A202020
   206D203D2066756E28692C6A293B0D0A
   2020202072657475726E20303B0D0A7D
   0D0A0D0A696E742066756E28696E7420
   612C696E742062290D0A7B0D0A202020
   20696E7420633D303B0D0A2020202063
   3D612B623B0D0A202020207265747572
   6E20633B0D0A7D
   看到上述的一连串数字,心里肯定想:这TM啥玩意?给个提示:想到了ASCII码表了么?明白了吧。

    好,咱们现在就根本ASCII码表,来翻译上述一连串数字到底是啥玩意:


 69  6E   74  20    66  75   6E  28  69  6E  74  20   61  2C  69    6E

   i      n      t    空格   f    u      n     (     i      n     t   空格 a      ,        i      n

   74    20     63   29  3B  0A  69   6E   74  20   6D   3D   31   30  3B

    t    空格    b     )       ;    \n       i     n     t   空格   m     =      1     0      ;

    ……

  根据不同语言的要求,遍历一连串数字,切分出符号并提取出信息。

例如对于c语言来说,可用使用如下状态图来切分符号,提取出标识符、数字、符号等。

编译原理-1-词法分析_第1张图片

     一句话总结:词法分析就是根据输入的一连串数据,根据语言特性,切分出有用的标识符、符号等信息,为下一步语法分析做准备。

你可能感兴趣的:(编译原理,词法分析)