词法分析器(lex实现)--688IT编程网

院系：计算机学院

实验课程：编译原理

实验项目：C++源代码单词扫描程序（词法分析）指导老师：陈寅

开课时间：2014～2015年度第1学期

专业：数据库

班级：2班

学生：雷楚楚

学号：20122100158

C++源代码单词扫描程序（词法分析）

一、实验目的

设计并实现一个词法分析器，深刻理解编译原理中词法分析器的原理。

二、实验内容

1、C++源代码扫描程序识别C++记号。C++语言包含了几种类型的记号：标识符，关键字，数（包括整数、浮点数），字符串，注释，特殊符号（分解符）和运算符号等。

2、打开一个C++源文件，打印出所有以上的记号。

3、选作部分：为了提高C++源程序的可读性，C++程序在书写过程中加入了空行、空格、缩进、注释等。假设你想牺牲可读性，以节省磁盘空间，那么你可以存贮一个删除了所有不必要空格和注释的C++源程序的压缩文本。因此，程序中还

看可以有这样的压缩功能。

4、进一步实现减少源文件大小的压缩功能。

5、完善软件文档。

二、实验过程

１、对C++文法中的各类单词分类

（1）保留字：asm、do、if、return、typedef、auto、double、inline、short、typeid、bool、try、include、long、sizeof、union、case、enum、mutable、static、unsigned、long、sizeof、union、case、enum、mutable、static、unsigned、catch、explicit、namespace、using、char、export、int、signed、break、else、new、struct、virtual、class、extern、operator、switch、void、const、false、private、template、volatile、float、protected、this、continue、for、public、throw、while、default、friend、register、true、delete、goto、try、include、std、iomanip、setw、setprecision、endl、setiosflags、ios （2）数字：包括整数和浮点数

（3）标识符：由字母打头的字母和数字的字符串，可包含下划线

（4）运算符："&="、"^="、"、="、"<<="、">>="、"*="、"/="、"%="、"+="、"-="、"="、"?:"、"、、"、"&&"、"、"、"^"、

"&"、"=="、"!="、">"、">="、"<"、"<="、"<<"、">>"、"+"、"-"、"*"、"/"、"%"、".*"、"->*"、"&"、"+"、"-"、"++"、"--"、"->"、"::"

（5）界符："{"、"}"、"("、")"、"#"、","、":"、";"、"."、"\""

（6）注释：包括//和/**/两种类型的注释

(7）字符串：包含在“”里面的内容

２、将各类单词对应到Flex中：

（1）保留字：

（2）数字：包括整数和浮点数（正负）

[+-]?([0-9]*|0|([0-9]*\.[0-9]*))

（3）标识符：由字母打头的字母和数字的字符串，包含下划线

[A-Za-z]([A-Za-z]|[0-9]|_)*

（4）运算符：

"&="|"^="|"|="|"<<="|">>="|"*="|"/="|"%="|"+="|"-="|"="|"?:"|"|

|"|"&&"|"|"|"^"|"&"|"=="|"!="|">"|">="|"<"|"<="|"<<"|">>"|"+"|"

-"|"*"|"/"|"%"|".*"|"->*"|"&"|"+"|"-"|"++"|"--"|"->"|"::"

（5）界符：

"{"|"}"|"("|")"|"#"|","|":"|";"|"."|"\""

（6）注释：包括//和/**/两种类型的注释正则匹配到第一个关键字就停止

\/\*(\s|.)*?\*\/（/**/）

\/\/[^\n]*（//）

(7）字符串：包含在“”里面的内容

'[^'\n]*'|\"[^\"]*\"

(8)除其他情况之外判断为出错

３、跳过空行和空格

[\t]+{}/*空格*/ \n|.{}/*空行*/

４、为lex制定一些规则

5、写子程序

让用户输入要进行词法扫描的文件，当lex读完输入文件之后就会调用函数yywrap。如果返回1表示程序的工作已经完成了，否则，返回0。

五、运行结果

1、将源代码存储为c.l，然后用flex进行编译，编译后生成文件。具体在Linux上的命令如下：

2、输入测试文件：test.in如下：

688IT编程网

词法分析器(lex实现)

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符回溯引用和前后查匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式选择题

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

688IT编程网

词法分析器(lex实现)

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符 回溯引用和前后查 匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式 选择题

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

java正则表达式选择题

非零金额正则表达式

基本的元字符回溯引用和前后查匹配模式

java正则表达式选择题

非零金额正则表达式