一、实验目的
了解词法分析程序的两种设计方法:1.根据状态转换图直接编程的方式;2.利用DFA编写通用的词法分析程序。
二、实验内容及要求
1.根据状态转换图直接编程
编写一个词法分析程序,它从左到右逐个字符的对源程序进行扫描,产生一个个的单词的二元式,形成二元式(记号)流文件输出。在此,词法分析程序作为单独的一遍,如下图所示。
具体任务有:
(1)组织源程序的输入
(2)拼出单词并查其类别编号,形成二元式输出,得到单词流文件
(3)删除注释、空格和无用符号
(4)发现并定位词法错误,需要输出错误的位置在源程序中的第几行。将错误信息输出到屏幕上。
(5)对于普通标识符和常量,分别建立标识符表和常量表(使用线性表存储),当遇到一个标识符或常量时,查标识符表或常量表,若存在,则返回位置,否则返回0并且填写符号表或常量表。
标识符表结构:变量名,类型(整型、实型、字符型),分配的数据区地址
注:词法分析阶段只填写变量名,其它部分在语法分析、语义分析、代码生成等阶段逐步填入。
常量表结构:常量名,常量值
2.编写DFA模拟程序
算法如下:
DFA(S=S0,MOVE[][],F[],ALPHABET[])
/*S为状态,初值为DFA的初态,MOVE[][]为状态转换矩阵,F[] 为终态集,ALPHABET[] 为字母表,其中的字母顺序与MOVE[][] 中列标题的字母顺序一致。*/
{
Char  Wordbuffer[10]=“”//单词缓冲区置空
Nextchar=getchar();//读
i=0;
while(nextchar!=NULL)//NULL代表此类单词
{ if (nextchar!∈ALPHABET[]) {ERROR(“非法字符”),return(“非法字符”);}
      S=MOVE[S][nextchar]  //下一状态
    if(S=NULL)return(“不接受”);//下一状态为空,不能识别,单词错误
      wordbuffer[i]=nextchar ; //保存单词符号
      i++;
      nextchar=getchar();
}
Wordbuffer[i]=‘\0’;
If(S∈F)return(wordbuffer);  //接受
    Else  return(“不接受”);
}
该算法要求:实现DFA算法,给定一个DFA(初态、状态转换矩阵、终态集、字母表),调用DFA(),识别给定源程序中的单词,查看结果是否正确。
1.能对任何S语言源程序进行分析
    在运行词法分析程序时,应该用问答形式输入要被分析的S源语言程序的文件名,然后对该程序完成词法分析任务。
2.能检查并处理某些词法分析错误
词法分析程序能给出的错误信息包括:总的出错个数,每个错误所在的行号,错误的编号及错误信息。
    本实验要求处理以下两种错误(编号分别为1,2):
    1:非法字符:单词表中不存在的字符处理为非法字符,处理方式是删除该字符,给出错误信息,“某某字符非法”。
    2:源程序文件结束而注释未结束。注释格式为:/* …… */
三、实验程序设计说明
1.实验方案设计
包括设计词法分析器模块调用结构图和各模块流程图。
模块结构:
1.Initscanner函数:程序初始化:输入并打开源程序文件和目标程序文件,初始化保留字表
    2.Scanner函数:若文件未结束,反复调用lexscan函数识别单词。
3.Lexscan函数:根据读入的单词的第一个字符确定调用不同的单词识别函数
4.Isalpha函数:识别保留字和标识符
5.Isnumber函数:识别整数,如有精力,可加入识别实数部分工功能
6.Isanotation函数:处理除号/和注释
7.Isother函数识别其他特殊字符
8.Output函数:输出单词的二元式到目标文件,输出格式(单词助记符,单词内码值),如(int,-)(rlop,>)……
9.Error函数:输出错误信息到屏幕
10.除此之外,还可以设置查符号表,填写符号表等函数,学生可自行设计。
2.程序源代码

#include<stdio.h>
#include<string.h>
#include<stdlib.h>
#define    LENGTH 46
#define N 100
//************************
typedef struct token
{
    char name[30];
    int code;
    int addr;
}token;
typedef struct KeyWord
{
    char name[30];
    int code;
}KeyWord;
typedef struct symble
{
    char name[30];//字符名字
    int number;//字符编码
    int type;
}symble;
//**********************************
char ch;
int error_count; //错误出现的个数
int var_count;  //
int num_count;  //
int label_count;
int code_count;  //
int addr_count;  //内码编址
int LineOfPro;  //错误出现的行号
char filename[30];
FILE *SourceFin;    //源文件
FILE *TokenFout;    //输出文件
FILE *SymbleFout;  //符号表
FILE *NumFout;  //常量表
KeyWord key[14]={{"void",1},{"main",2},{"int",3},{"float",4},{"const",5},{"for",6},
{"if",7},{"else",8},{"then",9},{"while",10},{"switch",11},{"break",12},{"begin",13},{"end",14}};
token CurrentToken;
token zancun;
symble CurrentSimble;
symble SymbleList[N];
symble NumList[N];
//***********************************
void Scanner();      //主程序
void IsAlpha();      //关键字
void IsNumber();      //数字
void IsAnotation();  //注释
void IsOther();      //其它
void OutPut();        //输出
void Error(int a);    //错误类型
int Flag_WordHave();  //查添符号表
int Flag_NumHave();  //查添常量表
//*************************************
int main()
{
    int i=0,j=0;
    code_count=0;
    var_count=1;
    label_count=1;
    addr_count=0;
    num_count=0;
    LineOfPro=0; //行号
isalpha 函数    Scanner();
    printf("输出标识符表:\n");
    for(i=0;i<var_count-1;i++)
        printf("<%s,%d>",SymbleList[i].name,i+1);
    printf("\n");
    printf("输出数字表:\n");
    for(i=0;i<num_count;i++)
        printf("<%s,%d>",NumList[i-1].name,i+1);
    return 0;
}
//*************主程序***************
void Scanner()
{
    int i=0;   
    if((SourceFin=fopen("","r"))==NULL)

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。