js正则表达式 URL格式匹配详解

摘要:
0.URL格式protocol://hostname[:port]/path/[;parameters][?查询]#fragment[;parametries;{//URL地址匹配格式:protocol://hostname[:port]/path/[;parameters][?query]#fragment//[;param
0、URL格式

protocol :// hostname[:port] / path / [;parameters][?query]#fragment

[;parameters]没见过 这里就不做相关匹配了

1、代码及运行结果
'use strict';
{
    // URL地址匹配格式: protocol :// hostname[:port] / path / [;parameters][?query]#fragment
    // [;parameters]:这都没见过这东西,就不匹配了。
    let url = [
        'https://www.baidu.com/',
        'http://192.168.1.1',
        'http://192.168.1.1:8080',
        'https://news.163.com/18/1224/15/E3Q6EJDA0001875N.html#top',
        'https://baidu.com:80/?wd=wq&url=ksks#ddsx2',
        'http://192.168.1.1/p/#name',
        'https://neets.cc/subcriberlist?recommendInventoryId=QNZfMjCRQtS4z8MQrFa7qo'
    ]
        , result = null
        , matcht = /^(https?://)([0-9a-z.]+)(:[0-9]+)?([/0-9a-z.]+)?(?[0-9a-z&=]+)?(#[0-9-a-z]+)?/i
        , info = ['完整URL', '协议', '地址', '端口', '路径', '查询', '锚点']
    url.forEach((value) => {
        result = matcht.exec(value);
        console.log('---------------------------------------------------------------------------------');
        for (let i = 0; i < result.length; i++) {
            console.log(`${info[i]} = ${result[i]}`);
        }
    })
}

js正则表达式 URL格式匹配详解第1张

2、元字符解释
元字符                               匹配对象                                                                         
.      任意一个字符
[...]字符组字符组内的任意一个字符
[^...]排除字符组排除字符组内的所有字符
char转义符转义元字符 或 反引用
提供计数功能的元字符
+加号至少一次
?问号匹配一次,但非必须的
*星号0次或多次,但非必须的
其它元字符
(...)括号    限定或界定符,也用于反引用
3、协议匹配规则

常见URL协议有http、https等等,所以这里就做针对http和https的匹配。
匹配规则 :^(https?://)

4、主机名匹配规则

主机名格式为:xxx.xxx.xxx 或 xxx.xxx 2种形式 由字母或数字组成。
如:www.baidu.com  baidu.com  127.0.0.1
匹配规则为:([0-9a-zA-z.]+)

5、端口匹配

端口部分是由冒号开头后接数值两部分组成而且web默认端口80是不显示在后面的,所以就有2种情况存在或不存在。
如:127.0.0.1:8080  127.0.0.0
匹配规则为:(:[0-9]+)?

6、路径匹配

路径是由字母、数字、斜杠、点组成。在访问网站首页时后面没有路径地址,所以这块如果存在就匹配。
如:/xxx/xxxx/xxx.html 、 /xxx/xxx
匹配规则为:([/0-9a-zA-Z.]+)?

7、查询字符串匹配

查询字符串的格式为:?xxx=1&ddd=2 或 ?xx=2。由于这块不是必须项所以在匹配时,如果存在就匹配,不存在就算了。
匹配规则为:(?[0-9a-zA-Z&=]+)?

8、信息片断匹配

信息片断是由#、字母、数值组成。由于这块不是必须项所以在匹配时,如果存在就匹配,不存在就算了。
匹配规则为:(#[0-9-a-zA-Z]+)?

9:其它

我的百度经验地址:https://jingyan.baidu.com/article/a24b33cdce7a0519fe002bf9.html

代码分享地址:https://pan.baidu.com/s/1bE5DUP4knVa0ifDs0kNILQ

免责声明:文章转载自《js正则表达式 URL格式匹配详解》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇http请求(get 和 post 请求)与响应倒排表数据结构、通配符查询、拼写纠正详解下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

Qt 调用本地浏览器打开URL

点击Qt某些控件,查找本地浏览器打开前端传递的URL。 方法一:直接写死本地浏览器地址 1 QString programAdress = "C:Program Files (x86)GoogleChromeApplicationchrome.exe" 2 QString m_strWebUrl = "http://www.baidu.com"; 3 QS...

Unicode文件读取 出现隐藏字符 (大坑)

C#读取文件..分析时发现应该15位的.. str.Lenght 却 16位.. 字符串复制出来一位位的数..就是15位.. 纳闷中突然想起来会不会是隐藏字符.. 输出 str[0].ToBytes()  转换成 Byte[] 查看发现第一位 值为 65279   好吧.. 果然躺枪了.. 使用 str = str[0] == 65279 ? str.Re...

9.springMVC中的拦截器

springMVC中的拦截器大概大致可以分为以下几个步骤去学习: 1.自定义一个类实现HandlerInterceptor接口,这里要了解其中几个方法的作用 2.在springMVC的配置文件中添加拦截器的配置 3.了解多个拦截器的执行过程 4.写一个拦截器的demo 1.先来看第一步:自定义一个类实现HandlerInterceptor接口,其中接口中的...

CC攻击工具list

从论文里抠出来的工具列表如下,后面有黑产的工具以及网络上摘录的工具: 分类:(1)有僵尸网络(是否代理服务器)&没有的==》(2)单一url&混合url(多线程,压测为主,demo工具居多) 1. 超强CC攻击器:只要输入攻击目标服务器的IP地址,设置好相关参数即可进行攻击。可设置攻击线程、攻击频率,利用大量代理服务器形成僵尸网络(设置代理...

nodejs下function,new function和this的研究

转:http://www.html5china.com/html5-article-3023-1.html 重点我都高亮了! 由于在使用nodejs之前接触js也比较少,最近一直被js的function和new function所困惑,由于两者都可以呈现出面向对象的样子,不知道两者的差别在哪里,就此问题做了一些研究。在研究的过程中发现this指针是个...

[转]Windows 注册自定义的协议

[转自] http://blog.sina.com.cn/s/blog_86e4a51c01010nik.html 1、注册应用程序来处理自定义协议          你必须添加一个新的key以及相关的value到HKEY_CLASSES_ROOT中,来使应用程序可以处理特殊的URL协议。          新注册的key必须与协议scheme相匹配才可以...