编译器的自动生成工具LEX的使用方法--688IT编程网

编译器的自动生成工具LEX和YACC的使用方法

Lex自动地表示把输入串词法结构的正规式及相应的动作转换成一个宿主语言的程序,即词法分析程序,它有一个固定的名字yylex,在这里yylex是一个C语言的程序。

yylex将识别出输入串中的词形,并且在识别出某词形时完成指定的动作。

看一个简单的例子:写一个lex源程序,将输入串中的小写字母转换成相应的大定字母。

程序如下:

[a-z]printf(“%c”.yytext[0]+'A'-'a');

上述程序中的第一行%%是一个分界符,表示识别规则的开始。第二行就是识别规则。左边是识别小写字母的正规式。右边就是识别出小写字母时采取的动作:将小写字母转换成相应的大写字母。

Lex的工作原理是将源程序中的正规式转换成相应的确定有限自动机,而相应的动作则插入到yylex中适当的地方,控制流由该确定有限自动机的解释器掌握,不同的源程序,这个解释器是相同的。

1.2 lex源程序的格式

lex源程序的一般格式是:

{辅助定义的部分}

{识别规则部分}

{用户子程序部分}

其中用花括号起来的各部分都不是必须有的。当没有“用户子程序部分”时,第二个%%也可以省去。第一个%%是必须的,因为它标志着识别规则部分的开始,最短的合法的lex源程序是:

它的作用是将输入串照原样抄到输出文件中。

识别规则部分是Lex源程序的核心。它是一张表,左边一列是正规式,右边一列是相应的动作。下面是一条典型的识别规则:

integer printf("found keywcrd INT");

这条规则的意思是在输入串中寻词形“integer”,每当与之匹配成功时,就打印出“foundkeyword INT”这句话。

注意在识别规则中,正规式与动作之间必须用空格分隔开。动作部分如果只是一个简单的C表达式,则可以写在正规式右边同一行中,如果动作需要占两行以上,则须用花括号

括起来,否则会出错。上倒也可以写成:

integer {printf("found keyword INT");}

下面先介绍识别规则部分的写法,再介绍其余部分。

1.3 Lex用的正规式

一个正规式表示一个字符串的集合。正规式由正文字符与正规式运算符组成.正文字符组成基本的正规式,表示某一个符号串;

正规式运算符则将基本的正规式组合成为复杂的正规式,表示字符串的集合。

例如:

仅表示字符串ab,而

(a b)+

表示字符串的集合:

{ab,abab,ababab,…)。

Lex中的正规式运算符有下列十六种:

” [ ]∧-?"*+| ()/${} %<>

上述运算符需要作为正文字符出现在正规式中时,必须借助于双引号”或反斜线\,具体用法是;

xyz“++”或xyz\+\+

表示字符串xyz++

为避免死记上述十多个运算符,建议在使用非数字或字母字符时都用双引号或反斜线。

要表示双引号本身可用\”,要表示反外线用”\”或

前面说过,在识别规则中空格表示正规式的结束,因此要在正规式中引进空格必须借助双引号或反斜线,但出现在方括号[]之内的空格是例外。

几个特殊符号:

\n是回车换行(newline)

\t是tab

b是退格(back space)

下面按照运算符的功能分别介绍上述正规式运算符。

1.字符的集合

用方括号对可以表示字符的集合。正规式

c语言编译器怎么用?

[a b c]

与单个字符a或b或c匹配

在方括号中大多数的运算符都不起作用,只有\-和∧例外。

运算符-表示字符的范围,例如

[a-z 0-9 <>-]

表示由所有小写字母,所有数字、尖括号及下划线组成的字符集合。

如果某字符集合中包括-在内,则必须把它写在第一个或最后一个位置上,如

[-+0-9]

与所有数字和正负号匹配

在字符集合中,运算符∧必须写在第一个位置即紧接在左方括号之后,它的作用是求方括号中除∧之外的字符组成的字符集合相对于计算机的字符集的补集,例如[∧abc]与除去a、b 和c以外的任何符号匹配。

688IT编程网

编译器的自动生成工具LEX的使用方法

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

688IT编程网

编译器的自动生成工具LEX的使用方法

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时 正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

java正则表达式选择题

非零金额正则表达式

半小时正则表达式