(转)LUA正则表达式不完全指南--688IT编程网

（转）LUA正则表达式不完全指南

转⾃剑侠，并稍微修改个别⽂字。

好不容易闲下来，研究了⼀下正则表达式，然后越钻越深，经过跟⼤神们讨论学习后，就没有然后了。总之╮(╯▽╰)╭很有⽤的⼀个东西，⾄少对于⽤户输⼊的读取⽅⾯会⽐较⽅便，所以就简单举例说说。

注：正则这个⽐较不好理解，经常容易转不过弯来，个⼈觉得最好的学习⽅式就是⾃⼰去试，举⼀反三，才会知道错在哪⾥，我尽量提供不同种类同样⽤法的例⼦⽅便理解。

正则表达式使⽤单个字符串来描述、匹配⼀系列符合某个句法规则的字符串。在很多⽂本编辑器⾥，正则表达式通常被⽤来检索、替换那些符合某个模式的⽂本。（好吧，这是百度来的）

简单来说就是按照⼀定想法获取与替换字符串。想怎么换就怎么换（真的( ⊙o⊙ )？）

⽇常运⽤的时候，会遇到的情况⽐如某段话⾥带有关键字，多个关键字等

“⽇常⼤战xxx来”，“收xxx，带价密”

这时候捕获这些字符串下来进⾏分析与记录，让你不⾄于错过某些不应该错过的，或者说⾃动密那个⼈预定位置什么的……嗯，好像扯远了，那是插件，今天只说lua。

元字

符

描述

. 匹配任意字符，包括中⽂、字母、数字、符号等

%特殊符号转义，例如：%.为匹配点，%%为匹配百分⽐符号，跟“\”⽤来转义引号是⼀样的

%a alphabet，匹配字母，⼤⼩写都匹配，%A为匹配除字母外其他字符

%b bisymmetric，匹配对称字符，%bxy，x为开始匹配字符，y为结束匹配字符，xy可随意指定。例如：%b<>为匹配包括<>在内的所有字符

%c control character，匹配控制字符，详见百度，%C为匹配除控制字符外其他字符

%d digit，匹配数字，0到9，%D为匹配除数字外其他字符

%l lower case，匹配⼩写字母a-z，%L为匹配⼩写字母外其他字符

%p punctuation，匹配标点符号，%P为匹配标点符号外其他字符

%s space，匹配空⽩符号，包括\t（tab键四格空⽩），\n（新⾏的标⽰），\r（换⾏的标⽰），%S为匹配空⽩符号外其他字符

%u upper case，匹配⼤写字母A-Z，%U为匹配⼤写字母外其他字符

%w words，匹配字母和数字，%W为匹配字母和数字外其他字符

%x hex，匹配⼗六进制数字，%X为匹配⼗六进制数字外其他字符

%z zero，匹配代表0的字符，%Z为匹配0字符外其他字符

()匹配与返回括号内的内容，例如：123(.+)，匹配与返回带有123字样后续内容。详见下

[]⾃定义匹配字符集，例如：[a-z0-9，%.]匹配a到z以及0-9还有逗号，百分⽐号跟点，[^a-z0-9，%.]匹配除字符集以外的其他字符+匹配前⼀字符1次或多次，常⽤于连贯性字符，例如：%a+ 以单词为单位匹配

*匹配前⼀字符0次或多次，最长匹配，常⽤于匹配空⽩符，例如%s*，将会匹配字符串内所有单个或者连贯空格

-匹配前⼀字符0次或多次，最短匹配，在进⾏所有字符匹配时匹配最短，例如：|123|456|，⽤|(.*)|则会返回123|456，⽽|(.-)|则只返回123

匹配前⼀字符0次或1次，例如：匹配正负数字，因为正数不带负号

^匹配开头，例如：^%d+为以数字开头的匹配，可与匹配结尾⼀同使⽤$匹配结尾，例如：%d+$为以数字开头的结尾，可与匹配开头⼀同使⽤

常⽤string操作:

参考资料:

string.find(s,pattern[,init[,plain]])

匹配第⼀个符合条件的项⽬的起始位置与终⽌位置，如果没到则返回nil

s代表⽬标字符串

pattern代表你要匹配的规则，见上⾯正则表格

init代表开始匹配的位置，默认为1，可以是负数，可不填

plain布尔值，如果为true时，则执⾏匹配任何匹配规则不⽣效，只是简单的字⾯匹配