⽕车头使⽤正则匹配模式采集数据
正则表达式很强⼤,利⽤它我们可以获得⼀定格式的数据,⽐如⽹址,E-mail地址,数字,字母等等.可喜的是,从3.2版开始,⽕车采集器就⽀持正则规则的编写了,这给喜欢⽤正则来实现不同需求的朋友带来福⾳。⽕车采集器⾥⽀持两种正则,⼀个纯正则,⼀个参数正则。我们下边分开讲⼀下。
 1.纯正则:
正则采集
先看⼀下图
在标签中⽤正则表达式采内容的格式是这样:
开始代码(?<content>正则表达式)结束代码
其中在开始代码和结束代码中如有需要转义的字符就要⽤\转义。
⽐如我们要获取⽕车论坛的版块,我们从⾸页获取,正则可以这样写
使⽤正则采版块
然后就可以获得我们需要的版块名称了。
参数正则
2.
测试⼀下,是可以获得我们需要的结果了。^_^  。
正则匹配标签
正则基本就这样,主要是写表达式的问题。如果您对这有兴趣,可以下载相关⼀些资料研究⼀下。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。