语义分析 - 润新知

语义分析
【设计思想】
（1）输入待分析的字符串。
语法如下：
a.关键字：begin,if,then,while,do,end.
b.运算符和界符：:= + - * / < <= > >= <> = ; ( ) #
c.其他单词是标识符(ID)和整形常数(NUM)：ID=letter(letter|digit)*，NUM=digitdigit*
d.空格由空白、制表符和换行符组成。空格一般用来分隔ID、NUM、运算符、界符和关键字，词法分析阶段通常被忽略。
（2）扫描字符串，采用递归向下进行分析。
主要函数如下：
a.scaner()//词法分析函数，char token[8]用来存放构成单词符号的字符串;
b.parser()//语法分析，在语法分析的基础上插入相应的语义动作：将输入串翻译成四元式序列。只对表达式、赋值语句进行翻译。
c.emit(char *result,char *arg1,char *op,char *ag2)//该函数功能是生成一个三地址语句返回四元式表中。
d.char *newtemp()//该函数返回一个新的临时变量名，临时变量名产生的顺序为T1,T2,…。
【要求】
四元式表的结构如下：
struct {char result[8];
char ag1[8];
char op[8];
char ag2[8];
}quad[20];
（3）输出为三地址指令形式的四元式序列。
例如：语句串begin a:=2+3*4;x:=(a+b)/c;end#，
输出的三地址指令如下：
t1=3*4
t2=2+t1
a=t2
t3=a+b
t4=t3/c
x=t4

源程序
#include<stdio.h>
#include<string.h>
#include<iostream>
#include<stdlib.h>
using namespace std;
struct {
    char result[12];
    char ag1[12];
    char op[12];
    char ag2[12];
}quad;
//变量的定义
char prog[80], token[12];
char ch; int syn, p, m = 0, n, sum = 0, kk; //p 是缓冲区 prog 的指针， m 是 token 的指针
char *rwtab[6] = { "begin", "if", "then", "while", "do", "end" };
void scaner();
char *factor(void);
char *term(void);
char *expression(void);
int yucu();
void emit(char *result, char *ag1, char *op, char *ag2);
char *newtemp();
int statement();
int k = 0;
void emit(char *result, char *ag1, char *op, char *ag2) {
    strcpy_s(quad.result, result);
    strcpy_s(quad.ag1, ag1);
    strcpy_s(quad.op, op);
    strcpy_s(quad.ag2, ag2);
    //cout<<quad.result<<"="<<quad.ag1<<quad.op<<quad.ag2<<endl;
    cout << "( " << quad.op << ", " << "entry(" << quad.ag1 << "), " << "entry(" << quad.ag2 << "), "<<quad.result<<") "<<endl;
        //cout<<"entry("<<quad.ag1<<"entry("<<quad.op<<quad.ag2<<endl;
}
char *newtemp() {
    char *p;
    char m[12];
    p = (char *)malloc(12);
    k++;
    _itoa_s(k, m, 10);
    strcpy_s(p + 1, m);
    p[0] = 't';
    return (p);
}
//对字符的扫描
void scaner() {
    for (n = 0; n<8; n++)
        token[n] = NULL;
    ch = prog[p++];
    while (ch == ' ') {
        ch = prog[p];
        p++;
    }
    if ((ch >= 'a'&&ch <= 'z') || (ch >= 'A'&&ch <= 'Z')) {
        if ((ch >= 'a'&&ch <= 'c') || (ch >= 'A'&&ch <= 'C')){
            m = 0;
            while ((ch >= '0'&&ch <= '9') || (ch >= 'a'&&ch <= 'z') || (ch >= 'A'&&ch <= 'Z')) {
                token[m++] = ch;
                ch = prog[p++];
            }
            token[m++] = '';
            p--;
            syn = 10;
            for (n = 0; n<6; n++) {
                if (strcmp(token, rwtab[n]) == 0) {
                    syn = n + 1;
                    break;
                }
            }
        }
        else
            cout << "Error!" << endl;
    }
    else if ((ch >= '0'&&ch <= '9')) {
        {
            sum = 0;
            while ((ch >= '0'&&ch <= '9')) {
                sum = sum * 10 + ch - '0';
                ch = prog[p++];
            }
        }
        p--;
        syn = 11;
        if (sum>32767)
            syn = -1;
    }
    else switch (ch)
    {
    case'<':
        m = 0;
        token[m++] = ch;
            ch = prog[p++];
        if (ch == '>') {
            syn = 21;
            token[m++] = ch;
        }
        else if (ch == '=')
        {
            syn = 22;
            token[m++] = ch;
        }
        else {
            syn = 23;
            p--;
        }
        break;
    case'>':
        m = 0;
        token[m++] = ch;
        ch = prog[p++];
        if (ch == '=') {
            syn = 24;
            token[m++] = ch;
        }
        else {
            syn = 20;
            p--;
        }
        break;
    case':':
        m = 0; token[m++] = ch;
        ch = prog[p++];
        if (ch == '=') {
            syn = 18;
            token[m++] = ch;
        }
        else {
            syn = 17;
            p--;
        }
        break;
    case'*':
        syn = 13;
            token[0] = ch;
        break;
    case'/':
        syn = 14;
        token[0] = ch;
        break;
    case'+':
        syn = 15;
        token[0] = ch;
        break;
    case'-':
        syn = 16;
        token[0] = ch;
        break;
    case'=':
        syn = 25;
        token[0] = ch;
        break;
    case';':
        syn = 26;
        token[0] = ch;
        break;
    case'(':
        syn = 27;
        token[0] = ch;
        break;
    case')':
        syn = 28;
        token[0] = ch;
        break;
    case'#':
        syn = 0;
        token[0] = ch;
        break;
    default:
        syn = -1;
        break;
    }
}
int lrparser()
{
    //cout<<" 调用 lrparser"<<endl;
    int schain = 0;
        kk = 0;
    if (syn == 1) {
        scaner();
        schain = yucu();
        //cout<<"SYN= "<<syn<<endl;
        if (syn == 6) {
            scaner();
            if (syn == 0 && (kk == 0))
                cout << "success!" << endl;
        }
        /* else
        {
        if(kk!=1)
        cout<<"缺 end!"<<endl;
        kk=1;
        } */
    }
    else
    {
        cout << "Error!" << endl;
        kk = 1;
    }
    return(schain);
}
int yucu() { // cout<<" 调用 yucu"<<endl;
    int schain = 0;
    schain = statement();
    while (syn == 26) {
        scaner();
        schain = statement();
    }
    return(schain);
}
int statement()
{
    //cout<<" 调用 statement"<<endl;
    char *eplace, *tt;
    eplace = (char *)malloc(12);
    tt = (char *)malloc(12);
    int schain = 0;
        switch (syn) {
        case 10:
            strcpy(tt, token);
            scaner();
            // if(syn==18) {
            scaner();
            strcpy(eplace, expression());
            emit(tt, eplace, "", "");
            schain = 0;
            /* }
            else { cout<<"缺少赋值符 !"<<endl;
            kk=1;
            } */
            return (schain);
            break;
    }
    return (schain);
}
char *expression(void) {
    char *tp, *ep2, *eplace, *tt;
    tp = (char *)malloc(12);
    ep2 = (char *)malloc(12);
    eplace = (char *)malloc(12);
    tt = (char *)malloc(12);
    strcpy(eplace, term()); //调用 term 分析产生表达式计算的第一项 eplace
    while ((syn == 15) || (syn == 16)) {
        if (syn == 15)
            strcpy(tt, "+");
        else
            strcpy(tt, "-");
        scaner();
        strcpy(ep2, term()); //调用 term 分析产生表达式计算的第二项 ep2
        strcpy(tp, newtemp()); // 调用 newtemp 产生临时变量 tp 存储计算结果
        emit(tp, eplace, tt, ep2); //生成四元式送入四元式表
        strcpy(eplace, tp);
    }
    return(eplace);
}
char *term(void) {
    // cout<<" 调用 term"<<endl;
    char *tp, *ep2, *eplace, *tt;
    tp = (char *)malloc(12);
    ep2 = (char *)malloc(12);
    eplace = (char *)malloc(12);
    tt = (char *)malloc(12);
    strcpy(eplace, factor());
    while ((syn == 13) || (syn == 14)) {
        if (syn == 13)strcpy(tt, "*");
        else strcpy(tt, "/");
        scaner(); strcpy(ep2, factor()); // 调用 factor 分析产生表达式计算的第二项 ep2
        strcpy(tp, newtemp());
        //调用 newtemp产生临时变量 tp 存储计算结果 emit(tp,eplace,tt,ep2); //生成四元式送入四元式表
        strcpy(eplace, tp);
    }
    return(eplace);
}
char *factor(void) {
    char *fplace;
    fplace = (char *)malloc(12);
    strcpy(fplace, "");
    if (syn == 10) {
        strcpy(fplace, token);
        scaner();
    }
    else if (syn == 11) {
        itoa(sum, fplace, 10);
        scaner();
    }
    else if (syn == 27) {
        scaner();
        fplace = expression(); //调用 expression分析返回表达式的值
        if (syn == 28)
            scaner();
        else {
            cout << "缺)错误 !" << endl;
            kk = 1;
        }
    }
    else {
        cout << "缺(错误 !" << endl;
        kk = 1;
    }
    return(fplace);
}
void main() {
    p = 0;
    cout << "Please input a string<end with '#':" << endl;
    do {
        cin.get(ch);
        prog[p++] = ch;
    } while (ch != '#');
    p = 0;
    scaner();
    lrparser();
}
1. 实验结果
相关阅读:
VS Code 编译运行C/C++
滴水逆向-文件读写&内存分配-PE准备阶段
 技术从业者的未来（三）
房价预测-California House Prices
记录一下Linux的文件夹的rwx权限使用。
对微任务和宏任务的执行顺序的个人理解
 算法１.4 节 ----- 算法分析
 .NetCore中间件实现原理
 谷歌浏览器禁用JS步骤
 管理经验分享
原文地址：https://www.cnblogs.com/aishanyishi/p/10305043.html