【编译原理-实验-1】词法分析器最详细设计报告(c++版)
词法分析器
⼀、实验⽬的
了解词法分析程序的两种设计⽅法:1.根据状态转换图直接编程的⽅式;2.利⽤DFA编写通⽤的词法分析程序。(选做)
⼆、实验内容
1.根据状态转换图直接编程
编写⼀个词法分析程序,它从左到右逐个字符的对源程序进⾏扫描,产⽣⼀个个的单词的⼆元式,形成⼆元式(记号)流⽂件输出。在此,词法分析程序作为单独的⼀遍,如下图所⽰。
具体任务有:
(1)组织源程序的输⼊
(2)识别单词的类别并记录类别编号和值,形成⼆元式输出,得到单词流⽂件
(3)删除注释、空格和⽆⽤符号
(4)发现并定位词法错误,需要输出错误的位置在源程序中的第⼏⾏。将错误信息输出到屏幕上。
(5)对于普通标识符和常量,分别建⽴标识符表和常量表(使⽤线性表存储),当遇到⼀个标识符或常量时,查标识符表或常量表,若存在,则返回位置,否则返回0并且填写符号表或常量表。
标识符表结构:变量名,类型(整型、实型、字符型),分配的数据区地址
注:词法分析阶段只填写变量名,其它部分在语法分析、语义分析、代码⽣成等阶段逐步填⼊。
常量表结构:常量名,常量值
2.编写DFA模拟程序(选做)
算法如下:
DFA(S=S0,MOVE[ ][ ],F[ ],ALPHABET[ ])
/S为状态,初值为DFA的初态,MOVE[ ][ ]为状态转换矩阵,F[ ] 为终态集,ALPHABET[] 为字母表,其中的字母顺序与MOVE[ ][ ] 中列标题的字母顺序⼀致。/
{
Char Wordbuffer[10]=“”//单词缓冲区置空
Nextchar=getchar();//读
i=0;
while(nextchar!=NULL)//NULL代表此类单词
{ if (nextchar!∈ALPHABET[]) {ERROR(“⾮法字符”),return(“⾮法字符”);}
S=MOVE[S][nextchar] //下⼀状态
if(S=NULL)return(“不接受”);//下⼀状态为空,不能识别,单词错误
wordbuffer[i]=nextchar ; //保存单词符号
i++;
nextchar=getchar();
}
Wordbuffer[i]=‘\0’;
If(S∈F)return(wordbuffer); //接受
Else return(“不接受”);
}
该算法要求:实现DFA算法,给定⼀个DFA(初态、状态转换矩阵、终态集、字母表),调⽤DFA(),识别给定源程序中的单词,查看结果是否正确。
三、实验要求
1.能对任何S语⾔源程序进⾏分析(S语⾔定义见下⾯)
在运⾏词法分析程序时,应该⽤问答形式输⼊要被分析的S源语⾔程序的⽂件名,然后对该程序完成词法分析任务。
2.能检查并处理某些词法分析错误
词法分析程序能给出的错误信息包括:总的出错个数,每个错误所在的⾏号,错误的编号及错误信息。
本实验要求处理以下两种错误(编号分别为1,2):
1:⾮法字符:单词表中不存在的字符处理为⾮法字符,处理⽅式是删除该字符,给出错误信息,“某某字符⾮法”。
2:源程序⽂件结束⽽注释未结束。注释格式为:/* …… */
四、S语⾔定义
1.保留字和特殊符号表
单词代码单词单词助记符内码值1int int-
2char char-
3float float-
4void void-
5const const-
6for for-
7if if-
8else else-
9then then-
10while while-
11switch switch-
12break break-
13begin begin-
14end end-
15
16
17标识符id在符号表中的位置18数字(包括整数和实数)num在常数表中的位置19++-
20---
21**-
22//-
23%%-
24((-
25))-
26[[-
27]]-
单词代码单词单词助记符内码值28
29<relop-
30>relop-
31<=relop-
32>=relop-
33==relop-
34!=relop-
35,,-
36;;-
37/=/=-
38+=+=-
39-=-=-
40*=*=-
41%=%=-
42||or-
43&&and-
44!not-
45==-
单词的构词规则:
字母=[A-Z a-z]
数字=[0-9]
标识符=(字母|)(字母|数字|)*
数字=数字(数字)*( .数字+| )
2.S语⾔表达式和语句说明
1.算术表达式:+、-、、/、%
2.关系运算符:>、>=、<、<=、==、!=
3.赋值运算符:=,+=、-=、=、/=、%=
4.变量说明:类型标识符 变量名表;
5.类型标识符:int char float
6.If语句:if 表达式then 语句 [else 语句]
7.For语句:for(表达式1;表达式2;表达式3) 语句
8.While语句:while 表达式 do 语句
9.S语⾔程序:由函数构成,函数不能嵌套定义。
函数格式为:
返回值函数名(参数)
begin
数据说明
语句
end
10.复合语句构成
begin
语句序列
end
五、程序参考结构说明
1.Initscanner函数:程序初始化:输⼊并打开源程序⽂件和⽬标程序⽂件,初始化保留字表
2.Scanner函数:若⽂件未结束,反复调⽤lexscan函数识别单词。
3.Lexscan函数:根据读⼊的单词的第⼀个字符确定调⽤不同的单词识别函数
4.Isalpha函数:识别保留字和标识符
5.Isnumber函数:识别整数,如有精⼒,可加⼊识别实数部分⼯功能
6.Isanotation函数:处理除号/和注释
7.Isother函数识别其他特殊字符
8.Output函数:输出单词的⼆元式到⽬标⽂件,输出格式(单词助记符,单词内码值),如(int,-)(rlop,>)……9.Error函数:输出错误信息到屏幕
10.除此之外,还可以设置查符号表,填写符号表等函数,学⽣可⾃⾏设计。
六、实验过程说明
测试源程序⽰例:
//aa.c
void aa()
begin
float rate,circle;
rate=3;
circle=3.14*rate*rate;
end
输出结果:
(1)输出结果⽂件:
(void,-)(id,0)((,-)(),-)(begin,-)(float,-)(id,1)……
(2)标识符的符号表:
Name type address
0 aa
1 rate
2 circle
isalpha 函数3
4
5
(3)常数表:
Name value 03
13.14
2
3
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论