前端 指的是编译器对程序代码的分析和理解过程,
后端: 生成目标代码的过程
词法分析:
语法是由一个个token组成的,我们可以制定一些来区分每一个token,比如对于>
, 既可能表示是表示GT,也可能表示的是GE
这些规则也可以由词法分析器的生成工具来生成, 这些生成工具是基于一些规则来work的。
这些规则用正则文法来表达,符合正则文法的表达式称之为正则表达式, 生成工具可以读入正则表达式,生成一种叫,"有限自动机"的算法
有限自动机是有限个状态的自动机,当达到某个状态的时候,就会做某件事情,比如当你写了一个标识符,
语法分析
编译器的下一个阶段是语法分析,语法分析是在词法分析的基础上面识别出程序的语法结构,这个结构就是一个树状结构,是计算机容易理解和执行的。
这棵树叫做抽象语法树, AST,树木的每一个节点是一个语法单元, 形成ast之后的好处就是,让计算机很容易去处理,一种非常直观的构造思路是自上而下进行分析。
首先构造根节点,代表整个程序,之后向下扫描 Token 串,构建它的子节点, 当它看到一个 int 类型的 Token 时,知道这儿遇到了一个变量声明语句,于是建立一个“变量声明”节点;接着遇到 age,建立一个子节点,这是第一个变量;之后遇到 =,意味着这个变量有初始化值,那么建立一个初始化的子节点;最后,遇到“字面量”其值是 45。
语义分析:
语义分析是最后一步就是让计算机理解我们的真实意图,将一些模棱两可的地方给消除掉,同时我们会将这个属性进行标注,这样之后编译器就可以理解我们的真实意思了