js正则表达式URL格式匹配详解0、URL格式
protocol :// hostname[:port] / path / [;parameters][?query]#fragment
[;parameters]没见过这⾥就不做相关匹配了
1、代码及运⾏结果
'use strict';
{
// URL地址匹配格式: protocol :// hostname[:port] / path / [;parameters][?query]#fragment
// [;parameters]:这都没见过这东西,就不匹配了。
let url = [
'www.baidu/',
'192.168.1.1',
'192.168.1.1:8080',
'news.163/18/1224/15/E3Q6EJDA0001875N.html#top',
'baidu:80/?wd=wq&url=ksks#ddsx2',
'192.168.1.1/p/#name',
'/subcriberlist?recommendInventoryId=QNZfMjCRQtS4z8MQrFa7qo'
]
, result = null
, matcht = /^(https?:\/\/)([0-9a-z.]+)(:[0-9]+)?([/0-9a-z.]+)?(\?[0-9a-z&=]+)?(#[0-9-a-z]+)?/i
, info = ['完整URL', '协议', '地址', '端⼝', '路径', '查询', '锚点']
url.forEach((value) => {
result = (value);
console.log('---------------------------------------------------------------------------------');
for (let i = 0; i < result.length; i++) {
console.log(`${info[i]} = ${result[i]}`);
}
})
}
2、元字符解释
元字符匹配对象
.    点任意⼀个字符
[...]字符组字符组内的任意⼀个字符
[^...]排除字符组排除字符组内的所有字符
\char转义符转义元字符或反引⽤
提供计数功能的元字符
+加号⾄少⼀次
问号匹配⼀次,但⾮必须的
*星号0次或多次,但⾮必须的
其它元字符
(...)括号    限定或界定符,也⽤于反引⽤
3、协议匹配规则
常见URL协议有http、https等等,所以这⾥就做针对http和https的匹配。
正则匹配 链接 无域名的链接匹配规则:^(https?:\/\/)
4、主机名匹配规则
主机名格式为: 或 2种形式由字母或数字组成。
如:www.baidu  baidu  127.0.0.1
匹配规则为:([0-9a-zA-z.]+)
5、端⼝匹配
端⼝部分是由冒号开头后接数值两部分组成⽽且web默认端⼝80是不显⽰在后⾯的,所以就有2种情况存在或不存在。如:127.0.0.1:8080  127.0.0.0
匹配规则为:(:[0-9]+)?
6、路径匹配
路径是由字母、数字、斜杠、点组成。在访问⽹站⾸页时后⾯没有路径地址,所以这块如果存在就匹配。
如:/xxx/xxxx/xxx.html 、 /xxx/xxx
匹配规则为:([/0-9a-zA-Z.]+)?
7、查询字符串匹配
查询字符串的格式为:?xxx=1&ddd=2 或 ?xx=2。由于这块不是必须项所以在匹配时,如果存在就匹配,不存在就算了。匹配规则为:(\?[0-9a-zA-Z&=]+)?
8、信息⽚断匹配
信息⽚断是由#、字母、数值组成。由于这块不是必须项所以在匹配时,如果存在就匹配,不存在就算了。
匹配规则为:(#[0-9-a-zA-Z]+)?
9:其它

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。