JavaScript正则表达式可通过字面量(/pattern/flags)或构造函数(new RegExp('pattern','flags'))创建,常用标志有g、i、m、s;核心元字符如\d、\w、+、*、?及分组()、(?:…)、(?…)提升匹配精度;高频操作包括验证、提取、替换、分割;需注意lastIndex状态、中文需u标志、避免用正则解析嵌套结构。

JavaScript 正则表达式(RegExp)是处理字符串的强大工具,掌握基础语法和实用技巧能显著提升文本匹配、提取与替换效率。关键不在于死记所有符号,而在于理解常见场景下的组合逻辑和避坑要点。
基础写法与两种创建方式
正则表达式在 JS 中可通过字面量或构造函数创建:
-
字面量写法:
/pattern/flags,如/\d+/g匹配一个或多个数字,全局搜索; -
构造函数写法:
new RegExp('pattern', 'flags'),适合 pattern 来自变量或需动态拼接的场景(注意:反斜杠需双写,如new RegExp('\\d+', 'g'))。
常用 flags(标志):g(全局)、i(忽略大小写)、m(多行模式,使 ^ 和 $ 匹配每行起止)、s(dotAll 模式,让 . 匹配换行符)。
常用元字符与分组技巧
不必背全表,优先掌握高频组合:
立即学习“Java免费学习笔记(深入)”;
JSON(JavaScript Object Notation) 定义:一种轻量级的数据交换格式,具有良好的可读和便于快速编写的特性。业内主流技术为其提供了完整的解决方案(有点类似于正则表达式,获得了当今大部分语言的支持),从而可以在不同平台间进行数据交换。JSON采用兼容性很高的文本格式,同时也具备类似于C语言体系的行为。有需要的朋友可以下载看看
-
\d等价[0-9],\w匹配字母、数字、下划线(含中文需加u标志); -
+(1次以上)、*(0次以上)、?(0或1次),默认贪婪匹配;加?变懒惰,如.*?匹配最短可能; - 用
()捕获分组,match()或exec()返回数组中包含子匹配项;非捕获组用(?:...),避免干扰索引; - 命名捕获组(ES2018+):
/(?,结果可通过\d{4})-(? \d{2})/ result.groups.year直接访问。
实战中高频使用的操作模式
多数需求围绕“找、提、替、验”展开:
-
验证格式:邮箱可简写为
/^[^\s@]+@[^\s@]+\.[^\s@]+$/(生产环境建议用更严谨库,正则校验不能替代后端验证); -
提取内容:URL 中提取域名,
https?:\/\/([^\/\s]+),配合exec()获取match[1]; -
批量替换:用
replace()+ 函数回调,如将驼峰转中划线:str.replace(/([a-z])([A-Z])/g, '$1-$2').toLowerCase(); -
分割兼顾保留分隔符:用括号包裹分隔符,
'a,b;c'.split(/([;,])/)得到['a', ',', 'b', ';', 'c']。
容易踩坑的细节提醒
这些点常导致结果不符合预期:
- 正则对象有 内部 lastIndex 属性,带
g或y标志时多次调用exec()会继续上次位置——重用前记得手动置零或改用match(); -
test()和search()不受lastIndex影响,但test()在全局正则上连续调用可能返回交替结果(因状态残留); - 中文匹配需加
u标志,否则\w、\b等对 Unicode 字符行为异常; - 过度使用正则处理复杂结构(如嵌套 HTML、JSON)易出错,优先考虑专用解析器。
不复杂但容易忽略。









