按键精灵安卓版提取你想要的内容(正则匹配的简单介绍)
正则匹配是⼀种能够在复杂内容当中提取你指定内容的⽅法,我昨天的⽂章涉及到这个了,今天就来简单介绍⼀下。
举个例⼦,我们在做接码案例的时候会收到验证码,“【某某app】验证码:8456,请注意保管好您验证码,请勿泄露!”,对于这段内容,我们希望提取⾥⾯的数字验证码,这个时候就⽤到正则匹配的⽅法。
Import "shanhai.lua"
Dim 验证码短信="【某某app】验证码:8456,请注意保管好您验证码,请勿泄露!"
Dim 验证码=shanhai.RegexFind(验证码短信,"%d%d%d%d")
TracePrint 验证码(0)
这⾥⾯⽤到了⼭海插件的RegexFind命令,它是基于lua语⾔的正则表达式命令,之后我讲解基本都是在这个命令的基础上完成的。
上⾯例⼦中shanhai.RegexFind(验证码短信,"%d%d%d%d"),有两个参数,⼀个是验证码短信,也就是我们说的复杂内容,这个就不⽤多说,重点是第⼆个参数,这⾥我们单独提出来看看。
%d%d%d%d,这是4个%d,对于我们要提取的内容:4位数字的验证码,依据我们的经验,%d应该是代表⼀个数字。如果你要提取⼀个6位数字,那么就写6个%d。
对于不确定数字个数的情况,可以%d+
+代表匹配之前字符⼀次或者多次。
我们代码中调试输出是TracePrint 验证码(0),后⾯有(0),说明正则匹配的返回值是⼀个数组。对于数组来说,我们要写上数组下标。
Import "shanhai.lua"
Dim 验证码短信="【某某app】验证码:8456,请注意保管好您验证码,请勿泄露!"
Dim 验证码=shanhai.RegexFind(验证码短信,"%d+")
TracePrint 验证码(0)
由于内容只有⼀段数字,所以这样写%d+也是可以的。但是如果有两段或者多段数字,那么就会把所有的数字都提取出来,如下图
这种情况,验证码(0)是1,验证码(1)是8456,你可以直接调⽤ 验证码(1),获取验证码。需要注意的%d+并不是把所有的数字连在⼀起输出,⽽是分段的,连续数字是⼀组。
不知道⼤家还记不记得我之前提取中⽂的案例:
Dim m="你好囧犇hello ⽔电费world3aasdas50849638"
Dim 汉字
Import "shanhai.lua"
Dim s=shanhai.RegexFind(m,"[\128-\254]+")
TracePrint s(0)
For i = 0 To UBOUND(s)
汉字=汉字&s(i)
Next
TracePrint 汉字
这⾥边的[\128-\254]表⽰ascii码的128-254,[]也是⽐较特殊的,代表字符集。⽐如想写数字,可以写成[0-9]
除了提取验证码,其实还有⼀个内容我们也⽐较常⽤,提取界⾯xml的内容。举个例⼦:提取界⾯当中
所有APP的名称。
Import "shanhai.lua"
Dim uixml()
TracePrint m
Dim arr=shanhai.RegexFind(m,"text=""(.-)""")
For Each k In arr
TracePrint k
Next
正则表达式提取中文还是单独把正则表达式拿出来text=""(.-)""
这⾥边好多引号,这个⼜涉及到⼀个知识点,按键精灵的转义字符引号,特别强调⼀下是按键精灵的,因为正则表达式的转义字符是%
在xml⾥⾯,是这样的格式 text="系统应⽤"
引号⽐较特殊,需要在引号前⾯加⼀个引号,也就是如果想要在按键⾥显⽰上⾯的内容就要变成text=""系统应⽤""
对于初学者来说是⽐较乱的,因为还涉及到字符串本⾝带有的⼀对引号,那么整体看来就好多引号了。
关于引号这部分能明⽩最好,不明⽩也没关系,以后慢慢学吧,接着往下说,表达式text=""(.-)""⾥⾯的括号是⽤来捕获你需要提取出来的内容。
我们想想要提取text=""系统应⽤""⾥⾯的系统应⽤⼏个字,那么对于表达式text=""(.-)"",括号⾥⾯就是我们想要的内容。
在继续分析 .-这两个也是⽐较特殊的符号,点是代表所有字符,减号是代表匹配⼀次或者多次,在之前我们说到加号了,看起来作⽤⼀样,但是区别在于,减号是最少匹配。点代表所有字符,也就是我们匹配text="系统应⽤"引号中的全部内容,如果⽤.+的话,就会匹配到最后⼀个引号位置。
⽐如,text="系统应⽤",text="QQ",
系统应⽤",text="QQ
匹配的结果就是系统应⽤",text="QQ
上⾯的⽅法还有⼀个问题,就是会有很多空⽩内容输出,这是因为,有些text="",本⾝它就是空值,所以就会输出空⽩。
真的这种情况,换⼀种写法。
Import "shanhai.lua"
Dim uixml()
TracePrint m
Dim arr=shanhai.RegexFind(m,"text=""([^""]+)")
For Each k In arr
TracePrint k
Next
这种写法中涉及到 ^ 这个符号是“⾮”的意思,也就说说这段正则表达式,是匹配⾮引号的多个字符,我们看到text=""这种情况,引号⾥⾯没有内容,第⼀个引号后⾯跟的是第⼆个引号,所以不符合我们我说的⾮引号匹配⽅式被排除了。
对于安卓按键的正则匹配,主要是⽤⼭海插件(lua插件),所以属于lua的正则匹配,这⾥把⼭海关于正则的教程发⼀下,⼤家可以去看看,
当然正则还有其他的教程,这个是我当初学习⽹站采集看的正则教程。
lua的正则匹配教程,
本期教程就这些了!

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。