Lex的简单⼊门和正则表达式基础
编译原理上机课任务如下:
=================================================这是分割线
=========================================================
flex 是- fast lexical analyzer generator 的简称,⼀个词法分析器⽣成⼯具。
下述⽂件已经保存到我的百度云
(⼀)⽬录介绍
在本实验⽬录中,包括两个⼦⽬录。
1、⼦⽬录 flex
它包含了 , flex.hlp, libfl.lib 三个⽂件,另外还有⼀个例⼦⽂件 example.l 及该例⼦⽣成的 。
2、⼦⽬录 lex_yy
这个⽬录是为 建⽴的⼀个项⽬(使⽤ VC6)。它包含有 , libfl.lib (拷贝⾃⽬录 flex),以及相关的项⽬⽂件。在debug ⼦⽬录中是已经⽣成的词法分析器 , 利⽤它可以进⾏词法分析。
(⼆)实验⽰范
1、编写 lex 程序,如 example.l ⽂件所⽰
2、调⽤ flex 以⽣成 , DOS命令格式: flex < example.l
3、新建⼀个⽬录(如 lex_yy), 把 及 libfl.lib 拷贝到该⽬录下。
4、⽤VC6打开,并⽣成⼀个新项⽬。
5、编译并链接libfl.lib,得到词法分析器 。
6、验证词法分析器的功能:
1)编写⼀输⼊⽂件(如lex_yy/)
2) 调⽤ (DOS 命令格式 < 12.txt )
3) 观察输出结果是否与预想的相符。
(三)实验要求
1、编写⼀个词法分析器,它针对输⼊⽂件,实现以下功能:
1)每遇到你的学号,就输出你的名字,对于其他的串原样输出。
2)统计输⼊⽂件中单词的数⽬、字符的数⽬。
例如:(以肖永跃的上机题为例):
输⼊⽂件如下所⽰:
200213001 hello world
wo ai tian an men
hello world i love
200213001
输出应该如下所⽰:
肖永钦 hello world
wo ai tian an men
hello world i love
肖永钦
# of ids = 11, # of chars = 66
=================================================这是分割线
=========================================================
下⾯讲⼀下实验中学习到的⼩技巧:
CMD窗⼝是可以直接拖⽂件进去的,还有cd等命令都可以使⽤
XP下不能shift+右键,就出现在此打开命令⾏窗⼝,所以想到⽬录可以试试cd命令,⽤法和linux下是⼀样的。
当然,这样还是有点⿇烦,如果你需要打  flex < example.l 这样的命令的话。因为你要先进到⽬录下再打⼀⾏命令。我们可以这样操作来完成 flex < example.l 命令的输⼊:
1、点住⽂件“”拖进cmd窗⼝⾥松⼿
2、打⼀个“<”
3、点住⽂件“example.l”拖进cmd窗⼝⾥松⼿
这时显⽰如下:
看~~⼀样的吧,⽽且还是绝对路径,前⾯都不⽤cd命令进⼦⽬录了
=================================================这是分割线
=========================================================
接下来讲⼀下实验中⽤到的代码:
⾸先介绍⼀下flex:(这篇⽂章稍后将转载到我的博客)
那么来分析⼀下这次上机实验的代码:
//定义部分
int num_words = 0, num_chars = 0;
space [\t\n]
blank {space}+
letter [(A-Z)(a-z)]正则表达式获取括号内容
digit [0-9]
word ({letter}|{digit})+
//规则部分
%%
//模式必须顶头写模式的格式为正则式或者{}括起来的已经定义好的宏
//空⽩后接C语⾔语句,表⽰识别后的相应动作
201392326 {printf("我");num_chars+=9;}
{blank} {printf("%s",yytext);}
{word} {num_words++;num_chars+=yyleng;printf(" #%d# ",num_words);}
//⽤户附加C语⾔部分
%%
int main()
{
yylex();
printf("\n#number of words = %d, #number of chars = %d\n ", num_words, num_chars);
return 0;
}
下⾯着重介绍⼀下实验中带来困惑的地⽅:
※正则表达式⾥括号的使⽤⽅法和区别!
():⼩括号起到分组功能,也就是和数学⾥意义相同,⽤于把⼀部分括在⼀起。
【】:中括号表⽰括号中的某⼀个,例如代码中的【0-9】表⽰0~9中的任⼀数字,【ABC】表⽰A或B或C
{ }:花括号表⽰重复若⼲次,例如“A{3}”即“AAA”,“AAB{2}”即“AABB”,表⽰最近处的单元重复若⼲次,在FLEX分析时也表⽰引⽤宏(貌似不加也可以,但保险起见建议添 加)。
回头看⼀个复杂的例⼦: AC【DF】(AB){2}
等价于:AC D|F ABAB
关于括号实验时有不少问题,好⼼的学长⼗分有耐⼼,还推荐了⼀个好东西
正则表达式30分钟⼊门教程:
这是⼀部⾮常好⾮常好的正则表达式教程,值得深⼊学习!
其中电话号码的例⼦可以帮助理解括号君~

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。