• 编译原理随笔2(词法分析)


    0、理论基础

    • 正规文法
    • 有限自动机

    1、主要任务

      从左到右扫描源程序,预处理后、 按照词法规则识别每个正确的单词,转换为对应的二元式(类号,内码),提交给语法分析使用。

    2、预处理

    •   处理注释、空格、跳格、回车换行
    • 一行语句结束后,配上一个特殊字符说明
    • 识别标号去(goto语句中标号),区分标号语句
    • 输出源程序清单以便复核

    3、超前搜索

    对于某些关键词不加保护的语言,需要超前搜索

    注:一般高级语言不需要超前搜索

    4、输出格式

    基本字(保留字)、标志词、常量、运算符、界符

    二元式:(类号,内码)

    5、扫描器设计

    1. 写出该语言的词法规则
    2. 将词法规则转换成状态转换图
    3. 将各转换图的初态连在一起,构成识别此语言的自动机
    4. 设计扫描器
      • 扫描器作为语法分析的一个过程,当语法分析需要一个单词时,就调用扫描器。
      • 扫描器从初态出发,当识别一个单词后,便进入终态,送入二元式
      • 注:用状态转化矩阵替换状态图,方便计算机实现。

    6、总结

    • 正规文法、正规集、正规式的关系
      • 正规文法是产生式的文法,是乔姆斯基 3文法,分为左线性文法、右线性文法
      • 正规集是满足正规文法的所有集合。
      • 正规式,使用一个简单的式子表示语言的组成
      • 关系:正规文法和正规式是规则,正规集是个集合。正规文法和正规式是等价的,可以相互转换
    • 正规文法->正规式
    • NFA的确定化:子集法
    • DFA的最小化:
    • 对含有e弧的NFA进行确定化
    • 正规文法、正规式、自动机的相互转换
  • 相关阅读:
    5.常见类和API
    4.异常
    3.面向对象
    2.控制语句和数组
    1.初始java 数据类型 运算符
    C#设计模式——桥接模式
    C#设计模式——适配器模式
    C#设计模式——原型模式
    C#设计模式——建造者模式
    C#设计模式——抽象工厂模式
  • 原文地址:https://www.cnblogs.com/sqchao/p/11563024.html
Copyright © 2020-2023  润新知