0

0

如何使用正则表达式验证包含斜杠的URL Slug

DDD

DDD

发布时间:2025-10-29 18:48:13

|

892人浏览过

|

来源于php中文网

原创

如何使用正则表达式验证包含斜杠的url slug

本文旨在提供一个实用的教程,指导开发者如何扩展现有的正则表达式,使其能够正确验证包含正斜杠(`/`)的URL slug。通过修改分隔符表达式,我们能够允许像 `my-parent-page/my-child-page` 这样的分层结构slug,同时保持其原有的字母数字和连字符验证规则,确保URL的有效性和规范性。

理解URL Slug及其验证需求

URL slug是URL中用于标识特定页面或内容的短文本字符串,通常由小写字母、数字和连字符组成,以提高可读性和SEO友好性。例如,product-category 或 article-title-123 都是常见的slug形式。

最初的slug验证正则表达式通常会限制字符串只包含字母、数字和连字符,并确保连字符不会出现在开头或结尾,也不会连续出现。一个典型的例子是:

const rule = new RegExp('^[A-Za-z0-9]+(-[A-Za-z0-9]+)*$');

这个正则表达式的含义是:

  • ^: 匹配字符串的开始。
  • [A-Za-z0-9]+: 匹配一个或多个字母或数字。这是slug的起始部分。
  • (-[A-Za-z0-9]+)*: 匹配零次或多次连字符后跟一个或多个字母或数字的组合。这确保了连字符只作为单词的分隔符。
  • $: 匹配字符串的结束。

然而,在某些场景下,我们需要支持具有分层结构的slug,例如 my-parent-page/my-child-page。上述正则表达式会错误地将这种包含斜杠的slug判定为无效,因为它不允许斜杠字符。

扩展正则表达式以支持斜杠

为了允许斜杠字符作为分隔符,我们需要修改正则表达式中定义分隔符的部分。原有的分隔符是连字符 -,现在我们需要允许它也可以是斜杠 /。

关键的修改点在于 (-[A-Za-z0-9]+)* 这个分组。它定义了后续部分的模式:一个分隔符后跟字母数字。我们将分隔符字符集从 [-] 扩展到 [-/]。

修改后的正则表达式如下:

蝉妈妈AI
蝉妈妈AI

电商人专属的AI营销助手

下载
const re = new RegExp('^[A-Za-z0-9]+([-/][A-Za-z0-9]+)*$');

让我们分解这个新的正则表达式:

  • ^: 匹配字符串的开始。
  • [A-Za-z0-9]+: 匹配一个或多个字母或数字。这是slug的起始部分,与之前相同。
  • ([-/][A-Za-z0-9]+)*: 这是一个关键的修改。
    • [-/]: 这是一个字符集,表示匹配一个连字符 - 一个斜杠 /。
    • [A-Za-z0-9]+: 匹配一个或多个字母或数字。
    • (...)*: 整个分组可以重复零次或多次,意味着slug可以有多个由连字符或斜杠分隔的段。
  • $: 匹配字符串的结束。

通过这种方式,my-parent-page/my-child-page 这样的slug现在将被正确验证。

示例代码与测试

以下JavaScript代码演示了如何使用新的正则表达式进行slug验证,并包含了一系列测试用例来验证其行为:

// 新的正则表达式,允许连字符和斜杠作为分隔符
const re = new RegExp('^[A-Za-z0-9]+([-/][A-Za-z0-9]+)*$');

// 测试用例
const egs = [
  'justSlash/justSlash',          // 有效:只包含斜杠
  'just-dash',                    // 有效:只包含连字符
  'dash-and-slash/dash-and-slash',// 有效:混合使用连字符和斜杠
  'my-parent-page/my-child-page', // 有效:原始问题中的示例
  'another-valid-slug',           // 有效:常规slug
  'singleword',                   // 有效:单个单词
  '&crap',                        // 无效:包含非法字符
  '-start-with-dash',             // 无效:以连字符开头
  'end-with-dash-',               // 无效:以连字符结尾
  'double--dash',                 // 无效:双连字符
  'double//slash',                // 无效:双斜杠
  'word/--word',                  // 无效:斜杠后跟双连字符
  'word-/word',                   // 无效:连字符后跟斜杠,但没有字母数字
  'word/-word',                   // 无效:斜杠后跟连字符,但没有字母数字
  'word//word',                   // 无效:双斜杠
  'word/ word',                   // 无效:包含空格
  '123/abc-xyz'                   // 有效:数字和字母混合
];

// 遍历测试用例并输出结果
egs.forEach(eg => {
  console.log(`"${eg}" is ${re.test(eg) ? "match" : "no match"}`);
});

运行上述代码,您将看到以下输出:

"justSlash/justSlash" is match
"just-dash" is match
"dash-and-slash/dash-and-slash" is match
"my-parent-page/my-child-page" is match
"another-valid-slug" is match
"singleword" is match
"&crap" is no match
"-start-with-dash" is no match
"end-with-dash-" is no match
"double--dash" is no match
"double//slash" is no match
"word/--word" is no match
"word-/word" is no match
"word/-word" is no match
"word//word" is no match
"word/ word" is no match
"123/abc-xyz" is match

从输出可以看出,包含单个斜杠的合法slug现在能够被正确匹配,而包含非法字符、以分隔符开头/结尾或连续分隔符的slug依然被拒绝,这符合我们对健壮slug验证的期望。

注意事项与最佳实践

  1. 字符集选择: [A-Za-z0-9] 仅包含英文字母和数字。如果您的应用需要支持其他语言的字符(如中文、日文、韩文或其他Unicode字符),您可能需要扩展这个字符集,例如使用 \p{L}\p{N} (需要启用Unicode属性转义) 或更具体的Unicode范围。
  2. 正则性能: 对于非常长的字符串,复杂的正则表达式可能会影响性能。然而,对于典型的URL slug长度,上述正则表达式的性能影响可以忽略不计。
  3. 语言环境: JavaScript的 RegExp 构造函数和字面量都支持 test() 方法进行匹配。在大多数情况下,使用 RegExp 构造函数来动态构建正则表达式是可行的,尤其当模式字符串来自变量时。
  4. 清晰性与可维护性: 尽管正则表达式简洁强大,但过度复杂的表达式会降低可读性。在必要时,可以添加注释或将正则表达式分解为更小的部分,以提高可维护性。
  5. 前端后端验证: 建议在前端和后端都进行slug验证。前端验证提供即时反馈,改善用户体验;后端验证则确保数据完整性和安全性,防止恶意或不规范的数据进入系统。

总结

通过简单地将斜杠字符添加到正则表达式的分隔符字符集中,我们成功地扩展了URL slug的验证逻辑,使其能够支持分层结构。这种修改既保留了原有规则的严谨性,又增加了灵活性,满足了现代Web应用对URL结构多样性的需求。在实际应用中,务必根据具体需求调整字符集和验证规则,以确保slug的有效性和应用的健壮性。

相关专题

更多
js获取数组长度的方法
js获取数组长度的方法

在js中,可以利用array对象的length属性来获取数组长度,该属性可设置或返回数组中元素的数目,只需要使用“array.length”语句即可返回表示数组对象的元素个数的数值,也就是长度值。php中文网还提供JavaScript数组的相关下载、相关课程等内容,供大家免费下载使用。

544

2023.06.20

js刷新当前页面
js刷新当前页面

js刷新当前页面的方法:1、reload方法,该方法强迫浏览器刷新当前页面,语法为“location.reload([bForceGet]) ”;2、replace方法,该方法通过指定URL替换当前缓存在历史里(客户端)的项目,因此当使用replace方法之后,不能通过“前进”和“后退”来访问已经被替换的URL,语法为“location.replace(URL) ”。php中文网为大家带来了js刷新当前页面的相关知识、以及相关文章等内容

372

2023.07.04

js四舍五入
js四舍五入

js四舍五入的方法:1、tofixed方法,可把 Number 四舍五入为指定小数位数的数字;2、round() 方法,可把一个数字舍入为最接近的整数。php中文网为大家带来了js四舍五入的相关知识、以及相关文章等内容

727

2023.07.04

js删除节点的方法
js删除节点的方法

js删除节点的方法有:1、removeChild()方法,用于从父节点中移除指定的子节点,它需要两个参数,第一个参数是要删除的子节点,第二个参数是父节点;2、parentNode.removeChild()方法,可以直接通过父节点调用来删除子节点;3、remove()方法,可以直接删除节点,而无需指定父节点;4、innerHTML属性,用于删除节点的内容。

470

2023.09.01

JavaScript转义字符
JavaScript转义字符

JavaScript中的转义字符是反斜杠和引号,可以在字符串中表示特殊字符或改变字符的含义。本专题为大家提供转义字符相关的文章、下载、课程内容,供大家免费下载体验。

392

2023.09.04

js生成随机数的方法
js生成随机数的方法

js生成随机数的方法有:1、使用random函数生成0-1之间的随机数;2、使用random函数和特定范围来生成随机整数;3、使用random函数和round函数生成0-99之间的随机整数;4、使用random函数和其他函数生成更复杂的随机数;5、使用random函数和其他函数生成范围内的随机小数;6、使用random函数和其他函数生成范围内的随机整数或小数。

990

2023.09.04

如何启用JavaScript
如何启用JavaScript

JavaScript启用方法有内联脚本、内部脚本、外部脚本和异步加载。详细介绍:1、内联脚本是将JavaScript代码直接嵌入到HTML标签中;2、内部脚本是将JavaScript代码放置在HTML文件的`<script>`标签中;3、外部脚本是将JavaScript代码放置在一个独立的文件;4、外部脚本是将JavaScript代码放置在一个独立的文件。

654

2023.09.12

Js中Symbol类详解
Js中Symbol类详解

javascript中的Symbol数据类型是一种基本数据类型,用于表示独一无二的值。Symbol的特点:1、独一无二,每个Symbol值都是唯一的,不会与其他任何值相等;2、不可变性,Symbol值一旦创建,就不能修改或者重新赋值;3、隐藏性,Symbol值不会被隐式转换为其他类型;4、无法枚举,Symbol值作为对象的属性名时,默认是不可枚举的。

544

2023.09.20

php源码安装教程大全
php源码安装教程大全

本专题整合了php源码安装教程,阅读专题下面的文章了解更多详细内容。

74

2025.12.31

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
React 教程
React 教程

共58课时 | 3.2万人学习

TypeScript 教程
TypeScript 教程

共19课时 | 1.9万人学习

Bootstrap 5教程
Bootstrap 5教程

共46课时 | 2.7万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号