Go语言中regexp包用于正则匹配,需先编译:Compile返回错误,MustCompile直接panic;常用方法有MatchString、FindAllString、ReplaceAllString等,支持分组捕获与RE2语法,推荐使用反引号避免转义,在循环外编译以提升性能。

在Go语言中,regexp 包提供了对正则表达式的支持,用于字符串的匹配、查找、替换等操作。使用前需要通过 regexp.Compile 或 regexp.MustCompile 编译正则表达式,然后调用相应方法进行匹配。
正则表达式的编译
Go中的正则表达式必须先编译再使用,以提高重复使用时的性能。
两种编译方式:
- regexp.Compile(pattern string) (*Regexp, error):标准方式,返回编译后的正则对象或错误。适合运行时动态构建的正则。
- regexp.MustCompile(pattern string) *Regexp:必须确保正则表达式正确,否则会 panic。适合常量正则,在初始化时使用。
示例:
立即学习“go语言免费学习笔记(深入)”;
re, err := regexp.Compile(`\d+`)
if err != nil {
log.Fatal(err)
}
// 或使用 MustCompile(推荐用于已知正确的表达式)
re := regexp.MustCompile(`\d+`)
常用匹配方法
编译后的 *Regexp 提供多种方法进行匹配操作:
- MatchString(s string) bool:判断字符串是否匹配。
- FindString(s string) string:返回第一个匹配的字符串。
- FindStringSubmatch(s string) []string:返回第一个匹配及其子组。
- FindAllString(s string, n int) []string:返回最多 n 个匹配,n=-1 表示全部。
- ReplaceAllString(s, repl string) string:替换所有匹配项。
示例:
立即学习“go语言免费学习笔记(深入)”;
re := regexp.MustCompile(`\b\w+@\w+\.\w+\b`)
text := "联系我 at john@example.com 或 admin@site.org"
// 判断是否匹配
if re.MatchString(text) {
fmt.Println("包含邮箱")
}
// 提取所有邮箱
emails := re.FindAllString(text, -1)
fmt.Println(emails) // [john@example.com admin@site.org]
// 替换
newText := re.ReplaceAllString(text, "[EMAIL]")
fmt.Println(newText) // 联系我 at [EMAIL] 或 [EMAIL]
子匹配与分组
使用括号 () 定义捕获组,通过 FindSubmatch 系列方法获取分组内容。
re := regexp.MustCompile(`(\d{4})-(\d{2})-(\d{2})`)
text := "日期:2023-12-25"
parts := re.FindStringSubmatch(text)
if len(parts) > 0 {
fmt.Println("完整匹配:", parts[0]) // 2023-12-25
fmt.Println("年:", parts[1]) // 2023
fmt.Println("月:", parts[2]) // 12
fmt.Println("日:", parts[3]) // 25
}
匹配模式与转义
Go的正则语法基于RE2引擎,不支持某些复杂的特性(如后向引用),但足够高效安全。
- 特殊字符如 .+*?()[]{}|^$ 需要使用 \ 转义。
- 使用反引号 `` 定义原始字符串,避免双重转义。
- 支持常用字符类:\d(数字)、\s(空白)、\w(单词字符)。
示例:匹配URL中的协议和域名
re := regexp.MustCompile(`^(https?)://([a-zA-Z0-9.-]+)`)
url := "https://golang.org"
match := re.FindStringSubmatch(url)
if len(match) >= 3 {
fmt.Println("协议:", match[1]) // https
fmt.Println("主机:", match[2]) // golang.org
}
基本上就这些。掌握编译方式和核心方法,就能高效处理大多数文本匹配需求。注意避免在循环内重复编译,应将正则变量定义在外部以提升性能。










