【编译原理-实验-1】词法分析器最详细设计报告(c++版)--688IT编程网

【编译原理-实验-1】词法分析器最详细设计报告（c++版）

词法分析器

⼀、实验⽬的

了解词法分析程序的两种设计⽅法：1.根据状态转换图直接编程的⽅式；2.利⽤DFA编写通⽤的词法分析程序。（选做）

⼆、实验内容

1．根据状态转换图直接编程

编写⼀个词法分析程序，它从左到右逐个字符的对源程序进⾏扫描，产⽣⼀个个的单词的⼆元式，形成⼆元式（记号）流⽂件输出。在此，词法分析程序作为单独的⼀遍，如下图所⽰。

具体任务有：

（1）组织源程序的输⼊

（2）识别单词的类别并记录类别编号和值，形成⼆元式输出，得到单词流⽂件

（3）删除注释、空格和⽆⽤符号

（4）发现并定位词法错误，需要输出错误的位置在源程序中的第⼏⾏。将错误信息输出到屏幕上。

（5）对于普通标识符和常量，分别建⽴标识符表和常量表（使⽤线性表存储），当遇到⼀个标识符或常量时，查标识符表或常量表，若存在，则返回位置，否则返回0并且填写符号表或常量表。

标识符表结构：变量名，类型（整型、实型、字符型），分配的数据区地址

注：词法分析阶段只填写变量名，其它部分在语法分析、语义分析、代码⽣成等阶段逐步填⼊。

常量表结构：常量名，常量值

2．编写DFA模拟程序（选做）

算法如下：

DFA（S=S0,MOVE[ ][ ],F[ ],ALPHABET[ ]）

/S为状态，初值为DFA的初态，MOVE[ ][ ]为状态转换矩阵，F[ ] 为终态集，ALPHABET[] 为字母表，其中的字母顺序与MOVE[ ][ ] 中列标题的字母顺序⼀致。/

{

Char Wordbuffer[10]=“”//单词缓冲区置空

Nextchar=getchar（）；//读

i=0；

while（nextchar！=NULL）//NULL代表此类单词

{ if （nextchar！∈ALPHABET[]） {ERROR（“⾮法字符”），return（“⾮法字符”）；}

S=MOVE[S][nextchar] //下⼀状态

if（S=NULL）return（“不接受”）；//下⼀状态为空，不能识别，单词错误

wordbuffer[i]=nextchar ； //保存单词符号

i++；

nextchar=getchar（）；

}

Wordbuffer[i]=‘\0’;

If（S∈F）return（wordbuffer）； //接受

Else return（“不接受”）；

}

该算法要求：实现DFA算法，给定⼀个DFA（初态、状态转换矩阵、终态集、字母表），调⽤DFA（），识别给定源程序中的单词，查看结果是否正确。

三、实验要求

1．能对任何S语⾔源程序进⾏分析（S语⾔定义见下⾯）

在运⾏词法分析程序时，应该⽤问答形式输⼊要被分析的S源语⾔程序的⽂件名，然后对该程序完成词法分析任务。

2．能检查并处理某些词法分析错误

词法分析程序能给出的错误信息包括：总的出错个数，每个错误所在的⾏号，错误的编号及错误信息。

本实验要求处理以下两种错误（编号分别为1，2）：

1：⾮法字符：单词表中不存在的字符处理为⾮法字符，处理⽅式是删除该字符，给出错误信息，“某某字符⾮法”。

2：源程序⽂件结束⽽注释未结束。注释格式为：/* …… */

四、S语⾔定义

1.保留字和特殊符号表

单词代码单词单词助记符内码值1int int-

2char char-

3float float-

4void void-

5const const-

6for for-

7if if-

8else else-

9then then-

10while while-

11switch switch-

12break break-

13begin begin-

14end end-

17标识符id在符号表中的位置18数字（包括整数和实数）num在常数表中的位置19++-

20---

21**-

22//-

23%%-

24((-

25))-

26[[-

27]]-

单词代码单词单词助记符内码值28

29<relop-

30>relop-

31<=relop-

32>=relop-

33==relop-

34!=relop-

35,,-

36;;-

37/=/=-

38+=+=-

39-=-=-

40*=*=-

41%=%=-

42||or-

43&&and-

44!not-

45==-

单词的构词规则：

字母=[A-Z a-z]

数字=[0-9]

标识符=（字母|）（字母|数字|）*

数字=数字(数字)*( .数字+| )

2．S语⾔表达式和语句说明

1．算术表达式:+、-、、/、%

2．关系运算符：>、>=、<、<=、==、！=

3．赋值运算符：=，+=、-=、=、/=、%=

4．变量说明：类型标识符变量名表；

5．类型标识符：int char float

6．If语句：if 表达式then 语句 [else 语句]

7．For语句：for（表达式1；表达式2；表达式3）语句

8．While语句：while 表达式 do 语句

9．S语⾔程序：由函数构成，函数不能嵌套定义。

函数格式为：

返回值函数名（参数）

begin

数据说明

语句

end

10．复合语句构成

begin

语句序列

end

五、程序参考结构说明

1．Initscanner函数：程序初始化：输⼊并打开源程序⽂件和⽬标程序⽂件，初始化保留字表

2．Scanner函数：若⽂件未结束，反复调⽤lexscan函数识别单词。

3．Lexscan函数：根据读⼊的单词的第⼀个字符确定调⽤不同的单词识别函数

4．Isalpha函数：识别保留字和标识符

5．Isnumber函数：识别整数，如有精⼒，可加⼊识别实数部分⼯功能

6．Isanotation函数：处理除号/和注释

7．Isother函数识别其他特殊字符

8．Output函数：输出单词的⼆元式到⽬标⽂件，输出格式（单词助记符，单词内码值），如（int，-）（rlop，>）……9．Error函数：输出错误信息到屏幕

10．除此之外，还可以设置查符号表，填写符号表等函数，学⽣可⾃⾏设计。

六、实验过程说明

测试源程序⽰例：

//aa.c

void aa()

begin

float rate,circle;

rate=3;

circle=3.14*rate*rate;

end

输出结果：

（1）输出结果⽂件：

（void,-）(id,0)((,-)(),-)(begin,-)(float,-)(id,1)……

（2）标识符的符号表：

Name type address

0 aa

1 rate

2 circle

isalpha 函数3

（3）常数表：

Name value 03

13.14

688IT编程网

【编译原理-实验-1】词法分析器最详细设计报告(c++版)

发表评论

推荐文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

688IT编程网

【编译原理-实验-1】词法分析器最详细设计报告(c++版)

发表评论

推荐文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时 正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

非零金额正则表达式

半小时正则表达式